УДК 629.113.004.67(045)
Предиктивная аналитика технического состояния систем тепловозов с использованием нейросетевых прогнозных моделей
1 2 М. В. Федотов , В. В. Грачев
1 Акционерное общество «Научно-исследовательский и конструкторско-технологический институт подвижного состава» (АО «ВНИКТИ»), Российская Федерация, 140402, Московская обл., Коломна, ул. Октябрьской революции, 410
2 Петербургский государственный университет путей сообщения Императора Александра I, Российская Федерация, 190031, Санкт-Петербург, Московский пр., 9
Для цитирования: Федотов М. В., Грачев В. В. Предиктивная аналитика технического состояния систем тепловозов с использованием нейросетевых прогнозных моделей // Бюллетень результатов научных исследований. - 2021. - Вып. 3. - С. 102-114. DOI: 10.20295/2223-9987-2021-3-102-114
Аннотация
Цель: Исследование возможности применения для предиктивного анализа технического состояния локомотивного оборудования нейросетевых прогнозных моделей, с помощью которых можно планировать объем работ по обслуживанию оборудования на плановых видах технического обслуживания и ремонта. Методы: Проведена сравнительная оценка точности прогнозов, выполненных с использованием нейронной сети прямого распространения и рекуррентной сети с LSTM-слоем (Long Short Term Memory). Для обучения и тестирования прогнозных моделей применены результаты мониторинга параметров системы смазки дизеля тепловоза 2ТЭ116 средствами бортовой диагностики. Результаты: В существующей системе технического обслуживания локомотивов средний период выполнения профилактических осмотров локомотивов (ТО-3) составляет 25-30 суток, в связи с чем именно этот интервал времени определяет минимальную длительность периода упреждения, которую должна обеспечивать прогнозная модель. Установлено, что модель на базе нейронной сети прямого распространения обеспечивает достаточную точность только кратковременных прогнозов с периодом упреждения не более 1-3 суток. По мере дальнейшего увеличения длительности периода упреждения ошибка отклика модели возрастает до 10-15 %, что не позволяет эффективно использовать ее для решения практических задач, связанных с планированием работы сервисных локомотивных депо. В то же время средняя ошибка отклика прогнозной модели, основанной на использовании рекуррентной сети с LSTM-слоем, на периоде упреждения 30 суток не превышает 3,5-5 %, благодаря чему ее можно применять для планирования объемов и сроков выполнения работ по техническому обслуживанию локомотивов. Практическая значимость: Показана возможность использования методов анализа временных рядов для предиктивной аналитики технического состояния узлов и систем локомотива. Прогнозные модели на базе рекуррентных нейронных сетей с LSTM-слоями обеспечивают точность и упреждение прогноза, достаточные для решения практических задач, которые связаны с планированием объемов и сроков технического обслуживания локомотивов.
Ключевые слова: Техническое состояние систем тепловоза, предиктивный анализ, временной ряд, прогнозирование, прогнозная модель, нейронная сеть прямого распространения, рекуррентная нейронная сеть.
1. Введение
Переход от планово-предупредительной системы ремонта к системе ремонта, когда принимается во внимание фактическое состояние объекта, предусматривает сохранение плановости сроков постановки локомотивов на ремонт и выборочность (персонализированность) в части выполняемых объемов регламентных или ремонтных работ. Принятие управленческих решений по их объему должно осуществляться на основании объективной информации по фактическому состоянию объекта, а также с учетом прогноза его изменения при дальнейшей эксплуатации. Современные бортовые системы локомотивов позволяют практически непрерывно осуществлять накопление и передачу телеметрической информации, а применение в диагностических моделях алгоритмов интеллектуального анализа данных - производить систематическую количественную оценку технического состояния контролируемого оборудования, тем самым формируя ее временной ряд. В этой связи эффективным способом решения задач прогнозной аналитики может стать использование нейросетевых моделей для анализа нестационарных временных рядов.
Временным рядом называется последовательность величин показателя (признака), упорядоченная в хронологическом порядке. Она должна содержать значения времени и соответствующие им параметры, зарегистрированные в периоде наблюдения, а также параметры, рассчитанные на период упреждения, т. е. собственно прогноз.
В практике прогнозирования принято считать, что уровни временных рядов должны содержать тренд, сезонную компоненту, циклическую компоненту и случайную составляющую [1]. Стоит предположить, что временные ряды, характеризующие состояние оборудования локомотива, включают все эти составляющие. Тренд обусловлен износом оборудования (загрязнением фильтра, изменениями зазоров в подшипниках и варьированием свойств масла), сезонная составляющая может быть связана с температурными режимами работы оборудования, циклическая составляющая должна присутствовать из-за цикличности сервисного обслуживания и текущего ремонта.
2. Постановка задачи
кр — рА_ ■ (1)
■*■ н
С целью исследования возможности использования методов прогнозирования временных рядов на основе нейронных сетей для предиктивного анализа технического состояния систем тепловозов были проанализированы результаты регистрации параметров силовых установок тепловозов 2ТЭ116, оборудованных системой АСК ВИС, за 14 месяцев их эксплуатации на полигоне Октябрьской железной дороги. В качестве объекта диагностики была выбрана система смазки дизеля, одним из показателей технического состояния которой является коэффициент передачи по давлению кр [2]:
РФ
°н2
где Рд - давление масла на входе в дизель, МПа; Р^ - давление масла на выходе 2-го масляного насоса, МПа.
Как показали исследования, коэффициент кр зависит от загрязнения фильтра масла и зазора в подшипниках коленчатого вала и может применяться для оценки общего состояния системы смазки дизеля [2]. Полученный временной ряд среднесуточных значений кр (см. (1)), построенный по результатам эксплуатации тепловоза в течение года, представлен на рис. 1. На нем видно, что для данной секции тепловоза 2ТЭ116 четко прослеживаются такие составляющие временного ряда как тренд, цикличность (равная межсервисному интервалу ТО-3), случайные выбросы. Временной ряд был сглажен по методу скользящего среднего с окном фильтрации 7 суток (рис. 1).
Диапазон изменения значений сглаженного ряда кр составил 0,75-0,90. С целью повышения точности моделирования значения ряд кр был нормирован и преобразован к двумерному массиву вида
кр —
кро кр1......... кр_]
кр! ............ кр^+1)
. кр(п-] ) ............ крП
(2)
с количеством столбцов у, равным глубине погружения (количеству входов нейронной сети), и числом строк, равным количеству п элементов временного ряда за вычетом глубины погружения у.
Рис. 1. Временной ряд коэффициента kp тепловоза 2ТЭ116 № 1615А
Построение прогнозной модели с использованием однослойной нейронной сети прямого распространения
Для построения прогнозной модели для временного ряда кр была выбрана однослойная нейронная сеть прямого распространения с 300 нейронами и с глубиной погружения (количеством входов сети) 12 (рис. 2). Создание, обучение и тестирование прогнозной модели проводилось на языке Python 3 с использованием библиотек TensorFlow, Keras и Seaborn [3]. Обучение нейронной сети производилось в цикле из 600 эпох (рис. 3). Объем обучающей выборки составил 177 векторов (строк массива (2)). Для валидации были зарезервированы данные в размере 0,2 от обучающей выборки.
Качество модели оценивалось по средней абсолютной процентной ошибке (Mean Absolute Percentage Error, MAPE):
»=1Я*
к —F-"-pi r i
pi
(3)
где N - число предсказанных элементов ряда; ¥ - предсказанное значение элемента ряда.
Ошибка отклика модели на тестовой выборке составила 2,2 %.
Тестирование прогнозной модели на базе однослойной нейронной сети прямого распространения проводилось в двух режимах.
Model: "sequentialjL"
Layer (type) Output Shape Param if
dense_l (Dense) (None, 300) 3900
dense_2 (Dense) (None, 1) 301
Total params: 4,201
Trainable params: 4,201
Non-trainable params: 0
Рис. 2. Параметры нейросетевой прогнозной модели для коэффициента
2 /
¿S 1
0,30 0,25
s 0,20 х
Ol У
f 0,15 лз
У.
VD
I 0,10
О
0,05 0,00
100
200 300 400
Эпохи обучения
500
600
Рис. 3. Изменение ошибок модели на обучающей (7) и тестовой (2) выборках
в процессе обучения
В первом режиме модель генерировала прогноз на основании фактических данных, т. е. период упреждения прогноза на каждом шаге составляла лишь одни сутки (посуточный прогноз). Во втором режиме на вход модели подавались уже спрогнозированные на предыдущем шаге данные, и, таким образом, глубина прогноза составила 26 суток (рис. 4).
Результаты тестирования приведены на рис. 5. Из них следует, что при посуточном прогнозе модель достаточно точно повторяет основной тренд изменения кр. Но практическая ценность такого прогноза для медленно изменяющихся параметров, очевидно, невысока.
Тестирование модели с периодом упреждения 26 суток показало, что модель достаточно хорошо определила направление дальнейшего тренда изменения прогнозируемой величины, но при этом имеет значительную погрешность, возрастающую по мере увеличения периода упреждения прогноза. Снизить данную погрешность удается лишь за счет сокращения периода упреждения. Тем не менее такая модель реализуется простыми средствами, быстро обучается и может быть применена для предварительного прогнозирования изменения технического состояния оборудования локомотивов.
Рис. 4. Формирование входных данных при построении прогноза: значения: 1 - фактические, 2 - прогнозные, на выходе модели, 3 - прогнозные, подаваемые на вход модели
Рис. 5. Результаты работы прогнозной модели с использованием нейронной сети прямого распространения
3. Построение прогнозной модели с использованием рекуррентной нейронной сети с LSTM-слоями
Рекуррентные нейронные сети (RNN) - это класс нейронных сетей, в которых учитывается последовательный характер входных данных за счет использования внутренних обратных связей, что позволяет эффективно применять их для моделирования временных рядов [4]. К разновидностям рекуррентных нейронных сетей относятся LSTM-сети, которые в настоящее время являются самым популярным классом RNN и разработаны специально, чтобы избежать проблемы долговременной зависимости [5-10].
Любая рекуррентная сеть имеет форму цепочки повторяющихся модулей. В обычной LSTM-сети эти модули (ячейки) имеют вид, представленный на рис. 6. Ячейки LSTM состоят из четырех внутренних слоев и могут принимать различные состояния: пропустить, сохранить, забыть, выбросить из ячейки.
Подготовка исходных данных для рекуррентной нейронной сети производилась описанным выше порядком с увеличением глубины погружения до 14 суток.
Была выбрана структура рекуррентной сети с одним LSTM-слоем, состоящим из 512 нейронов. Параметры прогнозной модели на основе такой сети приведены на рис. 7. Модель строилась на языке Python 3 с помощью библиотек TensorFlow, Keras и Seaborn. Обучение и тестирование модели проводили на тех же данных, что и модели, описанной в п. 3.
Рис. 6. Структура LSTM-ячейки рекурентной нейронной сети
Цикл обучения составлял 150 эпох (рис. 8). Тестирование прогнозной модели, построенной на базе рекуррентной нейронной сети с LSTM-слоем, осуществлялось на выборках размерностью от 21 до 35 суток. Результат построения прогностического тренда при использовании такой нейронной сети применительно к оценке общего состояния системы смазки для тепловоза 2ТЭ116 № 1615Б приведен на рис. 9.
Model: "sequential_8"
Layer (type) Output Shape Param »
lstm_8 (LSTM) (None, 512) 1052672
dense_8 (Dense) (None, 1) 513
Total params: 1,053,185 Trainable params: 1,053,185 Non-trainable params: 0
Рис. 7. Параметры настройки рекуррентной нейронной сети с LSTM-слоем для прогнозирования коэффициента
0,14 0.12 0,10
| 0,08 х
О) £
^В 0,06
га *
\о
I 0,04 О
0.02
0,00
,2
/
I 1
20 40 60 80
Эпохи обучения
100
120
140
Рис. 8. Изменение ошибок модели с использованием рекуррентной нейронной сети с LSTM-слоем на обучающей (7) и тестовой (2) выборках в процессе обучения
Рис. 9. Результаты работы прогнозной модели с использованием рекуррентной нейронной сети с LSTM-слоем
Ошибка MAPE на тестовой выборке размерностью 21 сутки при применении в модели ранее спрогнозированных данных в качестве входных составила 3,5 %. При увеличении периода упреждения выше 30 суток ошибка MAPE возрастает до 5 %.
5. Заключение
Использование методов интеллектуального анализа данных, таких как регрессионные нейросетевые модели, для диагностики сложных узлов и систем локомотива позволяет получать непрерывные оценки их технического состояния. Для предиктивной аналитики технического состояния узлов и систем локомотива могут быть применены методы анализа временных рядов.
Прогнозирование изменения технического состояния оборудования локомотива может осуществляться на базе однослойных нейронных сетей. Однако лучшие результаты можно получить с помощью рекуррентных нейронных сетей с LSTM-слоями.
Исследование показало, что применение методов прогнозирования временных рядов с использованием рекуррентных нейронных сетей с LSTM-слоями для предиктивной аналитики технического состояния может обеспечивать точность и глубину прогноза, достаточные для планирования объемов технического обслуживания и ремонта.
Комплекс нейросетевых регрессионных диагностических моделей и прогнозных моделей на основе рекуррентных нейронных сетей с LSTM-слоями позволяет унифицировать подход к решению задач диагностирования и прогнозирования изменения технического состояния сложных узлов локомотивного оборудования.
Библиографический список
1. Дуброва Т. А. Статистические методы прогнозирования в экономике: учеб. пособие, практикум, тесты, программа курса / Т. А. Дуброва. - М.: Мос. гос. ун-т экономики, статистики и информации, 2004. - 136 с.
2. Патент № 2516995, Российская Федерация: МПК G 01 M 15/05, G 01 M 15/09. Способ диагностирования состояния дизеля локомотива / М. В. Федотов, Ю. И. Беляев, Ю. А. Панин, А. П. Троицкий; заявитель, патентообладатель АО «ВНИКТИ». - Заявл. № 2012156105/06. 25.12.2012 г.; опубл. 27.05.2014 г. - 7 с.
3. Recurrent Neural Networks (RNN) with Keras. - URL: https://www.tensorflow.org/ guide/keras/rnn (дата обращения: 16.04.2021).
4. Осовский С. Нейронные сети для обработки информации / С. Осовский; пер. с польск. И. Д. Рудинского. - М.: Финансы и статистика, 2002. - 344 с.
5. Жерон О. Прикладное машинное обучение с помощью Scikit-Learn и Ten-sorFlow: концепции, инструменты и техники для создания интеллектуальных систем / О. Жерон. - СПб.: Альфа-книга, 2018. - 688 с.
6. Бринк Х. Машинное обучение / Х. Бринк, Дж. Ричардс, М. Феверолф. - СПб.: Питер, 2017. - 336 с.
7. Шолле Ф. Глубокое обучение на Python / Ф. Шолле. - СПб.: Питер, 2018. - 400 с.
8. Сапунов Г. Введение в машинное обучение / Г. Сапунов. - URL: https://ru. linkedin.com/in/grigorysapunov (дата обращения: 10.02.2021).
9. Джулли А. Библиотека Keras - инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow / А. Джулли, С. Пал. - М.: ДМК Пресс, 2018. - 294 с.
10. Нишант Ш. Машинное обучение и TensorFlow / Ш. Нишант. - СПб.: Питер, 2019. - 336 с. - Серия «Библиотека программиста».
Дата поступления: 21.05.2021 Решение о публикации: 13.06.2021
Контактная информация:
ФЕДОТОВ Михаил Владимирович - зав. лабораторией; [email protected] ГРАЧЕВ Владимир Васильевич - д-р техн. наук, доц.; [email protected]
Predictive analytics of the technical condition of diesel locomotive systems using neural network predictive models
M. V. Fedotov1, V. V. Grachev2
1 Joint-Stock Company "Scientific-Research and Design-Technology Institute of Rolling Stock"
(JSC VNIKTI), 410, ul. Oktyabr'skoy Revolyutsii, Kolomna, Moscow Region, 140402, Russian Federation
2 Emperor Alexander I Petersburg State Transport University, 9, Moskovsky pr., Saint Petersburg, 190031, Russian Federation
For citation: Fedotov M. V., Grachev V. V. Predictive analytics of the technical condition of diesel locomotive systems using neural network predictive models. Bulletin of scientific research results, 2021, iss. 3, pp. 102-114. (In Russian) DOI: 10.20295/2223-9987-2021-3-102-114
Summary
Objective: Study of the possibility of carrying out predictive analysis of the technical condition of locomotive equipment using neural network predictive models enabling to plan the scope of equipment maintenance for routine types of maintenance and repair. Methods: A comparative assessment of the accuracy of forecasts made using a feedforward neural network and a recurrent network with an LSTM layer (Long Short-Term Memory) has been carried out. For training and testing of predictive models, we used the results of monitoring the parameters of the lubrication system of the 2TE116 (2ТЭ116) diesel locomotive by means of on-board diagnostics. Results: The average interval for preventive inspections (TO-3) of locomotives in the existing locomotive maintenance system is 25-30 days, and therefore it is this interval that determines the minimum duration of the lead-in pe-
riod, which the predictive model should provide. We have established that a model based on a feedforward neural network provides sufficient accuracy only for short-term forecasts with a lead period of no more than 1-3 days. With a further increase in the lead-in period, the error of the model response increases to 10-15 %, which prevents it from being effectively used for solving practical problems associated with planning the operation of service locomotive depots. At the same time, the average response error of the predictive model based on a recurrent network with an LSTM layer does not exceed 3,5-5 % over a 30-day lead-in period, so it can be used to plan the scope and timing of locomotive maintenance procedures. Practical importance: The possibility of using time-series analysis methods for predictive analytics of the technical condition of units and systems of a locomotive is shown. Predictive models based on recurrent neural networks with LSTM layers provide prediction accuracy and lead-in period sufficient for solving practical problems that are associated with planning the scope and timing of locomotive maintenance.
Keywords: Technical condition of diesel locomotive systems, predictive analysis, time series, forecasting, predictive model, feedforward neural network, recurrent neural network.
References
1. Dubrova T. A. Statisticheskiye metody prognozirovaniya v ekonomike. Ucheb. poso-biye, praktikum, testy, programma kursa [Statistical forecasting methods in economics. Training manual, case study, tests, course program]. Moscow, Moscow State University of Economics, Statistics and Informatics Publ., 2004, 136 p. (In Russian)
2. Patent no. 2516995 Russian Federation, IPC G 01 M 15/05, G 01 M 15/09. Sposob diagnostirovaniia sostoianiia dizelia lokomotiva [A method for diagnosing the condition of a diesel locomotive]. M. V. Fedotov, Yu. I. Belyayev, Yu. A. Panin, A. P. Troitskiy is applicant, JSC VNIKTI is patent holder. Appl. no. 2012156105/06 December 25, 2012; publ. May 27, 2014. Bul. no. 15, 7 p. (In Russian)
3. Recurrent Neural Networks (RNN) with Keras. Available at: https://www.tensorflow. org/guide/keras/rnn (accessed: April 16, 2021).
4. Osowski S. Neyronnyye seti dlya obrabotki informatsii [Neural networks for processing information]. Translated from Polish by I. D. Rudinsky. Moscow, Finance and Statistics Publ., 2002, 344 p. (In Russian)
5. Giraud A. Prikladnoye mashinnoye obucheniye s pomoshch'yu Scikit-Learn i Tensor Flow: kontseptsii, instrumenty i tekhniki dlya sozdaniya intellektual'nykh sistem [Hands-on machine learning with Scikit-Learn and TensorFlow: concepts, tools, and techniques to build intelligent systems]. Saint Petersburg, Alfa-kniga Publ., 2018, 688 p. (In Russian)
6. Brink H., Richards J. & Fetherolf M. Mashinnoye obucheniye [Real-world machine learning]. Saint Petersburg, Piter Publ., 2017, 336 p. (In Russian)
7. Chollet F. Glubokoye obucheniye na Python [Deep learning with Python]. Saint Petersburg, Piter Publ., 2018, 400 p. (In Russian)
8. Sapunov G. Vvedeniye v mashinnoye obucheniye [Introduction to machine learning]. Available at: https://ru.linkedin.com/in/grigorysapunov (accessed: February 10, 2021).
9. Gulli A. & Pal S. Biblioteka Keras - instrument glubokogo obucheniya. Realizatsiya neyronnykh setey spomoshch'yu bibliotek Theano i TensorFlow [Deep learning with Keras. Implement neural networks with Keras on Theano and TensorFlow]. Moscow, DMK Press, 2018, 294 p. (In Russian)
10. Nishant Sh. Mashinnoye obucheniye i TensorFlow [Machine Learning with Tensor-Flow]. Saint Petersburg, Piter Publ., 2019, 336 p. Series Library of the Programmer. (In Russian)
Received: May 21, 2021 Accepted: June 13, 2021
Authors' information:
Mikhail V. FEDOTOV - Head of Laboratory; [email protected]
Vladimir V. GRACHEV - D. Sci. in Engineering, Associate Professor; [email protected]