Научная статья на тему 'Интеллектуальные модели на основе нейронных сетей с долгой кратковременной памятью для диагностики состояния станков в машиностроении'

Интеллектуальные модели на основе нейронных сетей с долгой кратковременной памятью для диагностики состояния станков в машиностроении Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
252
51
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИАГНОСТИКА СТАНКОВ / DIAGNOSTICS OF MACHINE TOOLS / РЕКУРРЕНТНЫЕ НЕЙРОННЫЕ СЕТИ / RECURRENT NEURAL NETWORKS / СВЕРТОЧНАЯ НЕЙРОННАЯ СЕТЬ / CONVOLUTIONAL NEURAL NETWORK / ДОЛГАЯ КРАТКОСРОЧНАЯ ПАМЯТЬ / LONG TERM MEMORY

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Масалимов Камил Адипович, Мунасыпов Рустэм Анварович

Предлагается архитектура интеллектуальных моделей для решения задач мониторинга и диагностики станков, в том числе и в режиме реального времени. В качестве основных составляющих интеллектуальных моделей предлагается использовать ансамбль из сверточных нейронных сетей и рекуррентных нейронных сетей с долгой кратковременной памятью. Сверточные нейронные сети используются для извлечения локальных признаков и сжатия данных, обрабатывая информацию, получаемую непосредственно с датчиков. Рекуррентные нейронные сети с долгой кратковременной памятью применяются для кодирования временной информации, фиксируя долговременные зависимости, учитывая последовательный характер данных и выявляя абстрактные признаки.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Масалимов Камил Адипович, Мунасыпов Рустэм Анварович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Intelligent models based on neural networks with long short-term memory for diagnostics of the state of machines in machine-building

In paper we offer the architecture of intellectual models for the decision of problems of monitoring and diagnostics of machine tools, including in a mode of real. As the main components of intelligent models, it is proposed to use an ensemble of convolutional neural networks and recurrent neural networks with long short-term memory. Convolutional neural networks are used to derive local characteristics and data compression, processing information that is obtained directly from sensors. Recurrent neural networks with long short-term memory are used to encode time information, fixing long-term dependencies, taking the consistent nature of the data and revealing abstract characteristics.

Текст научной работы на тему «Интеллектуальные модели на основе нейронных сетей с долгой кратковременной памятью для диагностики состояния станков в машиностроении»

ISSN 1992-6502 (Print)_

2018. Т. 22, № 2 (80). С. 138-145

Вестник УГАТУ

ISSN 2225-2789 (Online) http://journal.ugatu.ac.ru

УДК 004.896

Интеллектуальные модели

на основе нейронных сетей с долгой кратковременной памятью

для диагностики состояния станков в машиностроении

1 2 к. а. Масалимов , р. а. Мунасыпов

1 [email protected], 2 [email protected] ФГБОУ ВО «Уфимский государственный авиационный технический университет» (УГАТУ)

Поступила в редакцию 22.05.2018

Аннотация. Предлагается архитектура интеллектуальных моделей для решения задач мониторинга и диагностики станков, в том числе и в режиме реального времени. В качестве основных составляющих интеллектуальных моделей предлагается использовать ансамбль из сверточных нейронных сетей и рекуррентных нейронных сетей с долгой кратковременной памятью. Сверточные нейронные сети используются для извлечения локальных признаков и сжатия данных, обрабатывая информацию, получаемую непосредственно с датчиков. Рекуррентные нейронные сети с долгой кратковременной памятью применяются для кодирования временной информации, фиксируя долговременные зависимости, учитывая последовательный характер данных и выявляя абстрактные признаки.

Ключевые слова: диагностика станков; рекуррентные нейронные сети; сверточная нейронная сеть; долгая краткосрочная память.

ВВЕДЕНИЕ

Сегодня в машиностроении часто ставится задача получения в качестве результирующего продукта детали сложной формы из высокопрочных дорогостоящих материалов. Обработка подобных сплавов требует от систем управления станками высокой точности, ориентации на производство детали конкретного типа и формы, контроля большого числа параметров технологического процесса обработки. Стоимость ошибки при обработке ценных сплавов достаточно высока и вопрос снижения процента брака является актуальным. Переход на производство новой продукции также требует значительных финансовых ресурсов для исследования и адаптации систем управления станками под новые задачи.

В то же время оснащенность станков датчиками различного рода позволяет регистрировать в реальном времени состояние оборудования, инструмента, обрабатываемых заготовок как в виде числовых значений, так и изображений не только в двумерном, но и трехмерном пространстве. Системы управления станками и оборудованием используют информацию, получаемую в рамках технологического процесса непосредственно для решения текущих задач управления, однако эта же информация сохраняется и в виде трендов, архивных записей, что позволяет использовать ее для реализации интеллектуальных систем диагностики и мониторинга.

Для построения систем диагностики и мониторинга используются 2 основных

Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта №17-48-02036.

принципа: физические модели и модели, основанные на данных. Построение физических моделей требует знания непосредственно предметной области и заключается в переносе физических особенностей процесса и законов в вид математических моделей в совокупности с измеренными данными. Примерами подобных моделей являются классические модели развития усталостных трещин [1].

Однако применение физических моделей для мониторинга и диагностики сопровождается рядом ограничений. Результативность физических моделей сильно зависит от качества и точности знаний о практических механических системах. Фактически это приводит к тому, что, ввиду сложности технологических процессов, для построения достоверных моделей необходимо привлечение определенного числа специалистов различного рода, обладающих необходимым объемом знаний. Другим большим ограничением физических моделей диагностики является невозможность их применения на данных, полученных в реальном времени, в результате получаемые модели являются недостаточно эффективными и гибкими. С другой стороны, модели, основанные на данных, реализуются путем выделения особенностей технологического процесса на основе исторической информации и принятии решений в режиме реального времени, основываясь на фактических показаниях датчиков. Кроме этого, модели, управляемые данными, являются достаточно гибкими в плане обновления в реальном времени при изменении состояния объектов мониторинга.

На рис. 1 представлена базовая архитектура моделей, основанных на данных, состоящая из исследуемого объекта и четырех блоков обработки: сбор информации, извле-

чение и выбор необходимых признаков, обучение модели, проверка модели.

В качестве входных данных используются различные данные с датчиков и выполняется выборка и извлечение признаков, чтобы получить представление о состоянии (признаки состояния) технологического объекта или узла. Затем признаки состояния передаются в алгоритмы обработки, которые обычно состоят из двух частей: одна -это моделирование на основе исторических данных, а другая - моделирование и прогнозирование на основе текущих отобранных данных. Основным этапом в моделях, управляемых данными, является извлечение полезной информации с датчиков. Данные, полученные непосредственно с датчиков, представляют собой временные ряды, которые считываются в реальном времени и выражаются в последовательной форме. Применение таких методов, как частотный анализ, выявление статистических признаков (дисперсия, асимметрия) к последовательным данным неэффективно, поскольку они не позволяют выделить внутреннюю последовательную характеристику данных с датчиков. Другой проблемой является выбор необходимых признаков, что требует большого объема экспертных знаний в исследуемой области. Для построения моделей последовательных данных применимы Марковские модели, фильтры Калмана, однако они не позволяют корректно фиксировать долгосрочные зависимости [2]. Полезный и частотный сигналы с датчиков могут включать в себя информационный шум, что приводит к сбоям в работе диагностических моделей. Одним из способов решения этих проблем является применение двух типов нейронных сетей, широко используемых в последнее время для решения задач геномного анализа, обработки естественных язы-

Сбор информации Отбор признаков Обучение моделей

Рис. 1. Базовая архитектура моделей, основанных на данных

ков и распознавания речи - рекуррентные нейронные сети с долгой краткосрочной памятью (РНСДКП) и сверточные нейронные сети (СНС). РНСДКП способны адресовать последовательности данных разной длины и при этом позволяют фиксировать долгосрочные зависимости. Однако обучение РНСДКП на данных, полученных непосредственно с источников сигналов (датчиков), может привести к получению ненадежных моделей, поскольку «сырые» показания с датчиков обычно являются зашумленными. Поэтому для извлечения локальных признаков из сырых данных предлагается использовать СНС, состоящие из сверточных ядер и узлов объединения. Слои СНС, содержащие сверточные ядра, свертывают необработанные последовательные данные с применением локальных фильтров и таким образом создают однозначные локальные признаки, из которых слои объединения извлекают наиболее значимые признаки в скользящих окнах одинаковой длины.

В данной работе мы предлагаем объединить СНС и РНСДКП для диагностики и мониторинга сложных технологических объектов и систем, таких как электрохимические и металлорежущие станки. СНС используются для извлечения локальных дополнительных признаков, после чего извлеченные признаки передаются РНСДКП, кодирующей временную информацию с выявлением необходимых признаков. Особенностью РНСДКП [3] является моделирование входной информации в прямом направлении, для чего прямая временная последовательность (от начального момента временного окна к конечному). Таким образом, сверточная рекуррентная нейронная сеть с долгой краткосрочной памятью получает полную информацию о состоянии объекта в каждый момент времени с учетом последовательности состояний.

СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ

Архитектура СНС предложена Яном Ле-куном [4], как эффективный инструмент для распознавания изображений и включает в свой состав 2 вида ключевых элементов -сверточные ядра (разделенные веса) и узлы

объединения (субдискретизации). СНС показали свою эффективность не только в обработке двумерных изображений, но и в других задачах по обработке последовательных данных - распознавание речи, обработка естественного языка. Одномерный сверточный слой СНС принимает на вход весь объем последовательных данных и применяет к нему несколько локальных фильтров со сдвигом по последовательности для каждого фильтра. Как результат на выходе этого слоя получаются карты признаков, каждая из которых соответствует локальному фильтру. После чего используются узлы субдискретизации для извлечения наиболее значимых признаков из каждой карты.

В задаче диагностики технических объектов СНС используется для обработки временных рядов, поскольку информация за дискретный момент времени может быть недостаточно информативной. Кроме того, СНС способны кодировать информацию более критически, в сравнении необработанным потоком входных данных с датчиков, а также сжимать входной поток, что позволяет повторно использовать одинаковые сжатые модели при обработке разных потоков входной информации.

РЕКУРРЕНТНЫЕ НЕЙРОННЫЕ СЕТИ И ДОЛГАЯ КРАТКОСРОЧНАЯ ПАМЯТЬ

Рекуррентные нейронные сети (РНС) -это нейронные сети, в которых имеется обратная связь от более дальнего узла сети к ближнему (относительно входа нейронной сети). Наличие обратных связей позволяет запоминать и воспроизводить целые векторы целевых реакций на единичный элемент входной последовательности. РНС обучают с использованием метода обратного распространения ошибки с внедрением задержки по времени и, таким образом, сохраняют информацию по предыдущим входным значениям во внутреннем состоянии сети. Однако обычные РНС не позволяют хранить долгосрочные зависимости, поскольку не способны решить проблему исчезающего градиента. Использование РНСДКП позволяет решить проблему исчезновения гради-

ента или штрафа при использовании метода обратного распространения ошибки во времени. В РНСДКП дополнительно включают элементы долгой краткосрочной памяти (ДКП), запоминающие значения на короткие и длинные промежутки времени. Элементы ДКП не используют функцию активации, в результате значение, которое в них хранится, не размывается во времени при обучении сети методом обратного распространения ошибки. Благодаря способности РНСДКП улавливать долгосрочные зависимости и нелинейную динамику в данных временных рядов, этот тип сетей нашел применение в различных приложениях, включая распознавание речи, подпись к изображениям, распознавание рукописного текста, геномный анализ и обработку естественного языка.

В работе предлагается использование сверточной РНСДКП (СРНСДКП) для моделирования временных рядов. СРНСДКП обрабатывают входные временные последовательности в прямом направлениях, тем самым сохраняется причинно-следственная связь условий протекания процесса во времени.

НЕЙРОННЫЕ СЕТИ В ЗАДАЧАХ ДИАГНОСТИКИ И МОНИТОРИНГА

ТЕХНИЧЕСКОГО СОСТОЯНИЯ ОБЪЕКТОВ

Многослойные нейронные сети широко применяются в задачах мониторинга состояния технических объектов и состояния здоровья. Однако в большинстве работ не учитывается последовательный характер информации с датчиков. Прежде чем подавать необработанные данные в нейронную сеть, сначала выполняют выделение и выбор признаков, что требует определенной экспертной подготовки и не учитывает порядок сигналов. СНС с использованием

вейвлет-преобразования используются для диагностики неисправностей [5]. В данной работе мы предлагаем архитектуру, в которой СНС принимает только необработанные сенсорные данные в качестве входных данных, а СРНСДКП использует СНС для извлечения локальных признаков вместо конечного представления всей временной последовательности.

АРХИТЕКТУРА ДИАГНОСТИЧЕСКОЙ МОДЕЛИ

Проблема диагностики и мониторинга работоспособности технических объектов чаще всего сводится к конкретной задаче проектирования модели предсказания какой-либо определенной величины или набора величин - например, износ инструмента, выдержка определенных зазоров, размерных значений и т.п. В качестве входных данных используются данные с датчиков в технологическом процессе в виде временных рядов.

Пусть ряд наблюдений, выраженный как

хг=[х(1), х(2), - • -,х(1)], обозначает полученные данные для выборки /-го состояния технологического процесса. х/ ЕК представляет собой вектор данных с нескольких датчиков, отобранных на шаге I времени, а й -размерность данных (количество показаний с датчиков), I - длительность сигнала с датчика. Для каждого последовательного значения XI, измеряется и записывается целевое значение у¡. Таким образом, формулируется задача прогнозирования у. на основе последовательных данных с датчиков х .

Предлагаемая архитектура СРНСДКП состоит из двух основных элементов: СНС -для извлечения локальных признаков, РНСДКП - в качестве временного кодировщика. После того, как СНС извлекает локальные и отличительные

2 V —

Информация с датчиков

СВЕРТОЧНАЯ НЕЙРОННАЯ СЕТЬ

Извлечение локальных признаков

Объект диагностики

Рис. 2. Архитектура сверточной рекуррентной нейронной се

Временной кодировщик

Объединение моделей, кодировка результата

и сети с долгой краткосрочной памятью

признаки из входной последовательности, данные с выхода СНС передаются РНСДКП для кодирования временных образов. Выходы обоих сетей ДКП (прямой и обратной) объединяются использованием двух полносвязных слоев и слоя линейной регрессии, выход которой и является желаемой целевой величиной. Вся структура предлагаемой СРНСДКП показана на рис. 2.

ИЗВЛЕЧЕНИЕ ЛОКАЛЬНЫХ ПРИЗНАКОВ СВЕРТОЧНОЙ НЕЙРОННОЙ СЕТЬЮ

Предлагаемая сверточная нейронная сеть состоит из двух слоев: слоя свертки и слоя субдискретизации. Слой свертки применяет фильтры для всей входной временной последовательности для создания карт признаков. Предполагается, что в сверточ-ном слое используется к фильтров для окна последовательности шириной т, после чего слой субдискретизации выполняет сжатие каждой карты признаков для выделения наиболее значимых признаков. Рассмотрим каждую из операций более детально.

Операция свертки определяется как операция умножения вектора фильтра иЕЯт и векторного представления входной последовательности хг.г+т_1, выраженного в виде:

хг: г+т-1 =хг ©хг+1 © • • • ©хг+т- р (1)

где хг:г+т-1 является окном значений входной последовательности из т непрерывных временных шагов, начинающихся с г-го шага времени. Кроме того, в операцию свертки также добавляется смещение Ь, так что свертка задается как:

С = g{uTxг:.г+m-1+Ь), (2)

где *Т обозначает транспонирование матрицы *, а g - нелинейную функцию активации блока нелинейной ректификации в нашей модели.

Каждый вектор и может рассматриваться как фильтр, а единичное значение сг может рассматриваться как активация соответствующего окна.

Операция свертки по всей последовательности применяется путем сдвига окна фильтрации от начального шага времени к конечному.

Таким образом, карта признаков - это вектор, обозначаемый следующим образом:

С=[cЬc2,•••,c/-m+1], (3)

где индексу обозначает у'-й фильтр. Слой субдискретизации может уменьшить длину карты признаков, что может дополнительно минимизировать число параметров модели. Длина субдискретизации обозначается как 5. Для ^ последовательных значений в карте признаков Су применяется операция максимума. Таким образом, получаем сжатый вектор признаков в виде:

А=[А1,А2,-,А/-т+1], (4)

где Иу=тах(с(у-1)5, с^-^+ь •.., с^). Как правило, применяется несколько фильтров с различными весами инициализации для получения вывода уровня СНС.

Размер входной последовательности для СНС равен где п - количество выбо-

рок данных. Размер соответствующих выходов равен пх((/-т)/5+1)хк.

Следовательно, в результате применения операций свертки и субдискретизации длина последовательности может быть сжата от / до ((/-т)/5+1).

В результате работы СНС получаем более сжатое, информативное и абстрактное представление данных размерностью к (число фильтров), по сравнению с входной последовательностью информации с датчиков размерностью ё. Таким образом, СНС извлекает более сжатое представление данных для обработки в дальнейшем РНСДКП. Структура извлечения СНС локальных признаков показана на рис. 3.

ВРЕМЕННОЙ КОДИРОВЩИК: РЕКУРРЕНТНАЯ НЕЙРОННАЯ СЕТЬ С ДОЛГОЙ КРАТКОСРОЧНОЙ ПАМЯТЬЮ

Основная идея РНСДКП заключается в том, что на каждом временном шаге несколько «вентилей» используются для управления передачей информации вдоль всей входной последовательности, тем самым улавливая зависимости на большие периоды времени.

В РНСДКП на каждом временном шаге I скрытое состояние к обновляется текущими данными на том же шаге времени I, скры-

Рис. 3. Извлечение локальных признаков СНС

тым состоянием на предыдущем шаге вре-

7 —1

мени п , входным вентилем /, вентилем забывания /, выходным вентилем о' и ячейкой памяти с1.

Процесс обновления выполняется согласно уравнениям:

?=а(№х' +УИ1-1+Ъ/), ¡1=а(^1х1+У1Ъ1-х+Ъ1), о'=а ( + Уок'-1+Ъо), (5)

С=/0С-1+О гапЪ(^сх1+УсЪ1-х+Ъс), П'=о'О 1апк(с') , где параметры модели, включая ШКйук, уЕКй , а также ЪЕКй, являются постоянными для всех этапов работы модели и получают значения во время обучения модели, а - сигмоидальная активационная функция, О обозначает поэлементное произведение, а к - гиперпараметр, представляющий размерность скрытых векторов. Таким образом, уравнение (5) определяет функцию скрытого слоя Н.

РНСДКП спроектирована непосредственно для обработки последовательных данных, выраженных в виде временного ряда. Кроме того, выходной сигнал на конеч-

ном этапе времени используется для прогнозирования выходного сигнала на слое линейной регрессии, как показано в следующем уравнении.

у=^, (6)

где }^гЕКк2 и г - размерность выхода всей модели. Для обучения модели прогнозируемое значение целевой величины у сравнивается с истинным значением целевой величины у, а в качестве функции потерь вычисляется среднеквадратичная ошибка:

loss= 11 п=1(у-уг.)2, (7)

где п - размер обучающей выборки. Соответствующая архитектура РНСДКП показана на рис. 4.

ЦЕЛЕВОЕ ЗНАЧЕНИЕ

ВХОДНАЯ ПОСЛЕДОВАТЕЛЬНОСТЬ

Рис. 4. Архитектура РНСДКП с дополнительным выходным слоем регрессии

ПОЛНОСВЯЗНЫЕ СЛОИ И ЛИНЕЙНЫЙ СЛОЙ РЕГРЕССИИ

Выход временного кодировщика подается на вход полносвязной сети из нескольких скрытых слоев для выявления представлений более высокого уровня. Каждый узел одного слоя полносвязной сети связан со всеми узлами предыдущего слоя. Вычисления в каждом слое выражаются в виде:

а^(Жгкг+Ь), (8)

где о', к1 обозначают соответственно выходные и входные данные г-го полносвязного слоя, Жг - матрица преобразования, Ьг -смещение г-го полносвязного слоя. Функция g(), так же как и для входной СНС, является функцией линейной ректификации. Выходы последнего слоя полносвязной сети объединяют результаты предыдущих слоев и, таким образом, являются окончательным представлением входной последовательности. И это преобразованное конечное представление входного временного ряда подается в конечный регрессионный слой, на выходе которого и получаем целевое значение.

ОБУЧЕНИЕ И РЕГУЛЯРИЗАЦИЯ СРНСДКП

Для обновления параметров модели при обучении с использованием метода обратного распространения ошибки вычисляется среднеквадратичная ошибка по всей обучающей выборке между предсказанным значением целевой величины и реальным. Метод среднеквадратического отклонения используется в качестве функции оптимизации параметров модели по целевому значению.

Сложные модели, используемые в глубоком обучении, требует для обработки большого объема данных. Однако в задачах диагностики сложных технических объектов не всегда есть возможность получить большой объем данных. Решением является регуляризация обрабатываемого набора данных.

Из-за сложной модели методов глубокого обучения огромные масштабы данных обучения жизненно важны для надежной работы модели. В задачах мониторинга машин трудно получить большой объем дан-

ных обучения. Поэтому для наших предлагаемых моделей применяется метод регуляризации. Для этого в процессе обучения модели исключается (маскируется) случайным образом часть выходов скрытых слоев, как следствие нейроны этих слоев не имеют влияния на текущем этапе обучения модели. При тестировании модели все маскированные нейроны активизируются. Таким образом, можно утверждать об увеличении объема входной выборки, поскольку в результате применения искусственного случайного шума получаем новые образцы данных для каждой эпохи обучения. Применительно к СРНСДКП предлагается ввести 2 исключающих слоя с вероятностью маскирования 0,5: один - между РНСДКП и полносвязной нейронной сетью, другой - в полносвязной нейронной сети между первым и вторым слоями.

ЗАКЛЮЧЕНИЕ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В работе предлагается использование СРНСДКП для решения задач диагностики сложных технических объектов. Для извлечения локальных признаков предлагается использовать СНС, после чего обработать полученные данные с помощью РНСДКП для непосредственного кодирования временной информации. Применение РНСДКП позволяет фиксировать долговременные зависимости как на базе прошлого опыта, так и на базе будущего. Введение дополнительных уровней РНСДКП позволяет выявлять более абстрактные признаки.

Применение СРНСДКП не требует экспертных и инженерных знаний в конкретной предметной области. Архитектура такой сети предназначена для непосредственной обработки сырых данных с датчиков.

СПИСОК ЛИТЕРАТУРЫ

1. Бураго Н. Г., Журавлев А. Б., Никитин И. С. Модели многоосного усталостного разрушения и оценка долговечности элементов конструкций // Известия Российской академии наук. Механика твердого тела. 2011. №6. С. 22-33. [ N. G. Bourago, A. B. Zhuravlev, I. S. Nikitin, "Modeli mnogoosnogo ustalostnogo razrushenija i ocenka dolgovech-nosti jelementov konstrukcij" (in Russian), in Mehanika tver-dogo tela, vol. 46, no 6, p. 828-838, 2011. ]

2. Куликова М. В., Цыганова Ю. В. Численно устойчивые реализации фильтра Калмана для оценивания линейных парных Марковских моделей с гауссовым шумом //

Вычислительные технологии. 2017. T.22, №3. C. 45-60. [ M. V. Kulikova, J. V. Tsyganova "Chislenno ustojchivye real-izacii filtra Kalmana dlja ocenivanija linejnyh parnyh Markov-skih modelej s gaussovym shumom" (in Russian), in Vychislit-el'nye tehnologii, vol.22, no. 3, p. 45-60, 2017. ]

3. Будыльский Д. В. GRU и LSTM: современные рекуррентные нейронные сети // Молодой ученый. 2015. №15(95) С. 51-54. [ D. V. Budylskiy, "GRU i LSTM: sovremen-nye rekurrentnye nejronnye seti" (in Russian), in Molodoj uchenyj, no. 15(95), p. 51-54, 2015. ]

4. Handwritten digit recognition with a back-propagation network. B. B.Le Cun, et. al. // Advances in neural information processing systems 2; Morgan Kaufmann Publishers: San Francisco, CA, USA; p. 396-404.

5. Wang J., Zhuang J., Duan L. A multi-scale convolution neural network for featureless fault diagnosis // Proceedings of the 2016 International Symposium of Flexible Automation (ISFA), Cleveland, OH, USA, 1-3 August 2016; p. 1-6.

ОБ АВТОРАХ

МАСАЛИМОВ Камил Адипович, асп. каф. АТП. Дипл. инженер по специальности «Управление и информатика в технических системах» (УГАТУ, 2014). Готовит дис. об интеллектуальных методах диагностики в машиностроении.

МУНАСЫПОВ Рустэм Анварович, проф. каф. АТП. Дипл. инженер электронной техники. (УАИ, 1982). Д-р техн. наук (2004), проф. (2006). Засл. деят. науки РБ (2010). Иссл. в обл. адаптивных и интеллектуальных систем управления сложными техн. объектами.

METADATA

Title: Intelligent models based on neural networks with long short-term memory for diagnostics of the state of machines in machine-building. Authors: K. A. Masalimov 1, R. A. Munsypov2 Affiliation:

Ufa State Aviation Technical University (USATU), Russia. Email: 1 [email protected], 2 [email protected] Language: Russian.

Source: Vestnik UGATU (scientific journal of Ufa State Aviation Technical University), vol. 22, no. 2 (80), pp. 138-145, 2018. ISSN 2225-2789 (Online), ISSN 1992-6502 (Print). Abstract: In paper we offer the architecture of intellectual models for the decision of problems of monitoring and diagnostics of machine tools, including in a mode of real. As the main components of intelligent models, it is proposed to use an ensemble of convolutional neural networks and recurrent neural networks with long short-term memory. Convolutional neural networks are used to derive local characteristics and data compression, processing information that is obtained directly from sensors. Recurrent neural networks with long short-term memory are used to encode time information, fixing long-term dependencies, taking the consistent nature of the data and revealing abstract characteristics. Key words: diagnostics of machine tools; recurrent neural networks; convolutional neural network; long term memory.

About authors:

MASALIMOV, Kamil Adipovich, Postgrad. (PhD) Student, Dept. of Automation of Technological Processes. Engineer (USATU, 2014).

MUNASYPOV, Rustem Anvarovich, Prof., Dept. of Automation of Technological Processes. Dipl. Engineer of electronic (Ufa Aaviation Inst., 1982). Dr. of Tech. Sci. (USATU, 2004).

i Надоели баннеры? Вы всегда можете отключить рекламу.