«Энергетика» Нижневартовского государственного университета; доцент кафедры «Теплоэнергетика» Омского государственного технического университета (ОмГТУ). БРНЧ-код: 8887-0523, ЛиШогГО (РИНЦ): 776613 Адрес для переписки: [email protected] МоСТоВЕНКо Любовь Владимировна, аспирантка, ассистент кафедры «Теплоэнергетика» ОмГТУ. БРНЧ-код: 6690-6134 ЛиШогГО (РИНЦ): 828260 ОЯСГО: 0000-0003-0675-0622
AuthorlD (SCOPUS): 57193122905
ResearcherlD: M-9932-2015
Адрес для переписки: [email protected]
Для цитирования
Белоглазов В. П., Мостовенко Л. В. К вопросу о «рела-миниризации» // Омский научный вестник. 2018. № 4 (160). С. 64-67. DOI: 10.25206/1813-8225-2018-160-64-67.
Статья поступила в редакцию 09.06.2018 г. © В. П. Белоглазов, Л. В. Мостовенко
УДК 656.259.12:004.85:004.896
DOI: 10.25206/1813-8225-2018-160-67-72
Д. в. БОРИСЕНКО И. В. ПРИСУХИНА С. А. ЛУНЁВ
Омский государственный университет путей сообщения, г. Омск
машинная классификация
РЕЖИМА РАБОТЫ ЭЛЕКТРИЧЕСКОЙ РЕЛЬСОВОЙ ЦЕПИ на ОСНОВЕ ЛОГИСТИЧЕСКОЙ РЕГРЕССИИ_
Электрическая рельсовая цепь широко применяется на железнодорожном транспорте в качестве датчика информации о положении подвижных единиц и исправности пути. Повышение эффективности систем мониторинга рельсовых цепей требует решения задачи автоматического анализа информации об их состоянии. В этой статье под такой задачей мы понимаем автоматическую классификацию режима работы электрической рельсовой цепи. Для решения задачи мы разработали алгоритм машинной классификации на основе логистической регрессии. В статье представлены основные этапы разработки алгоритма, выполнено их теоретическое обоснование, продемонстрирована работа алгоритма на синтезированных данных.
Ключевые слова: железнодорожная автоматика, электрическая рельсовая цепь, машинное обучение, классификация, логистическая регрессия.
Введение. На железных дорогах Российской Федерации электрическая рельсовая цепь является основным источником информации о положении подвижных единиц. Ее можно рассматривать как самостоятельную электротехническую систему. Различают три режима работы данной электротехнической системы: нормальный, шунтовой и контрольный [1].
С развитием систем диагностики и мониторинга на железнодорожном транспорте растет объем собираемой и накапливаемой электротехнической информации, в том числе и получаемой от рельсовых цепей. Закономерно возникает задача автоматической обработки этой информации. Решение данной задачи является одним из приоритетных направлений в рамках проекта «Цифровая железная дорога» [2, 3]. Таким образом, актуальность разработки алгоритмов автоматической классификации режима работы электрических рельсовых цепей не вызывает сомнений.
Очевидно, что на современном этапе задача такого рода должна решаться методами машинного обучения. В настоящее время накоплен большой опыт успешного решения подобных задач в различных областях [4 — 8]. Базовым и наиболее простым методом, позволяющим решить задачу машинной классификации, на наш взгляд, является логистическая регрессия [4].
Данные для обучения. Логистическая регрессия относится к семейству алгоритмов машинного обучения с учителем.
Для построения классификатора на основе логистической регрессии требуются данные о параметрах электрических сигналов при работе рельсовой цепи в различных режимах — обучающая и тестовая выборки, содержащие идентификаторы режимов.
Обучающая и тестовая выборки могут быть синтезированы на основе математической модели электрической рельсовой цепи. Теория электрических
Таблица 1
Таблица 2
Параметры модели рельсовой цепи при синтезе обучающей выборки
Параметры модели рельсовой цепи при синтезе тестовой выборки
Режим Параметр модели Начальное значение Конечное значение Шаг
Нормальный й, Ом-км 1 50 0,5
и„. в 140 160 1
й, Ом-км 1 50 1
Шунтовой и„, В 140 160 5
Хш, км 0 2 0,2
й, Ом-км 1 50 1
Контрольный и„, В 140 160 5
X,, км об' 0 2 0,2
Режим Параметр модели Начальное значение Конечное значение Шаг
Нормальный й, Ом-км 0,5 49,5 0,5
и„, В 135 155 1
й, Ом-км 0,5 49,5 1
Шунтовой и„, В 135 155 5
Хш, км 0 2 0,2
й, Ом-км 0,5 49,5 1
Контрольный и„, В 135 155 5
X „, км об' 0 2 0,2
рельсовых цепей к настоящему времени разработана [1, 9—11], апробирована и вполне адекватно описывает предметную область. Применение математической модели, во-первых, позволяет проверить принципиальную возможность решения поставленной задачи машинной классификации, а во-вторых, снимает проблему размера выборок, который будет ограничен лишь ресурсами используемых вычислительных средств.
Для синтеза обучающей и тестовой выборок использована модель кодовой электрической рельсовой цепи 25 Гц, подробно описанная в [12]. Эта модель позволяет рассчитать электрические сигналы на входе и выходе рельсовой цепи при заданных диапазонах изменения ее параметров. Параметрами модели являются сопротивление изоляции рельсовой линии Яаз, напряжение на входе рельсовой цепи ивх, координата поездного шунта Хш и координата обрыва рельсовой нити Хоб. Длина рельсовой цепи фиксирована и составляет 2 км. Диапазоны изменения параметров модели при синтезе обучающей выборки приведены в табл. 1.
Тестовая выборка получена аналогичным образом. Смещение начальных и конечных значений задаваемых диапазонов обеспечивает ее непересечение с обучающей выборкой. Значения параметров модели, использованные при синтезе тестовой выборки, приведены в табл. 2.
При сформулированных условиях синтеза выборок их размер составляет по 7579 примеров.
Визуализация обучающей выборки приведена на рис. 1. Используемая модель рельсовой цепи позволяет построить описание ее электрических сигналов в семимерном пространстве (на входе рельсовой цепи — напряжение, ток, фаза тока; на выходе рельсовой цепи — напряжение, фаза напряжения, ток, фаза тока). Вместе с тем разделимость областей, соответствующих разным режимам ее работы, достигается уже в трех измерениях (модуль и фаза напряжения на выходе, а также модуль тока на входе рельсовой цепи).
Рис. 1 позволяет также предположить линейную разделимость изображенных на нем областей.
Обучающая выборка представлена в виде матрицы данных X и вектора меток (идентификаторов режима работы рельсовой цепи) Y так, как показано формулами (1). В матрице данных обучающие при-
Рис. 1. Визуализация обучающей выборк и
меры содержатся в строках, а признаки обучения — в столбцах. Аналогичным образом представлена и тестовая выборка.
X =
в1 „(1) в 2 „(1) > ве {б(Ч 1
„ (2) в1 „(2) в2 „(2) в е о = б '2)
„(т)
„(т)
(1)
где х1(') — мо дуль напряжения на выход= рельсовой цепи в '-ом о буча ющем примере; х2(') — фаза напряжения на =ыходь рельсовой цепи в 1-ом оббчающем примере; х3(') — модуль тока на входе ревьсовой цепи в '-ом рбучающем примере; у'1 е{0,1,2} — идентификатор режима работы рельсовой цепи (0 — нормальный, 1 — шунтовой, = — контрольный).
Диапазоны взмеренвя признаков обучения в матрвце д=нных различаются. Для повышения эффективности алгоритма обученио классификатора призноки обучения подлежат нормализации [13]. Нормализация выполнена путем приведения значений призкаккв кбугения к интервалу [0, 1] по форму=е (2).
б
2
е
х^ - тт(х1) шах(х]) - шт(х])
(2)
где х {'
нормализованное значение ]-го призна-
г(x) = ^0+^1Х1+ ^3,
(3)
¡^, к, к, к
:} , X = {1,
= xwT
Л . (4)
(5)
ка обучения на г- = строке матрицы данных j п {0,1,2}; Х](') — исходное значение ]-го признака обучения на ''-й строке матх=цы дахных; тт(х), тах(х) — минимальное и максимальное значения -го признака обучения в матрице данных.
Для простоты изложения там, где это следует из контекста, будем опускать верхний индекс, а кортеж значтний <х1, х2, х3>, описывающий электрические сигналы ]зельсовой цепи, по которым требуется выполнить классификацию, Худем обозначать буквой х и еазывать вектором признаков.
Структура задачи классифжкации -ежвма работы рельсовой цепи. К ак показано в [4 — 8], классификация нй основы -огистиченкой рзгрессии сводится к оценке вероятности принадлежности вектора признаков к заданному классу. Таким образом, базовый алгоритм позволяет выполнить бинарное разделение пространктва признаков. Задача классификац ии йежима работы рельс овей еепи является более сножной — о на требует выделения в пространстве признаков трех областей соответствующих нормальному, шунтовому и контрольному режимам. Решить эту зарачу предлагается путем ее декомпозиции в соответствии но схемой, приведенной на рис. 2. При таком подходе для каждого из режимов треПрется еостроить отдельный классификатор, работающий по принципу «один против всех» [14]. Решение о принадлежности вектора признаков к одному из ¿-классов предлагается принимать путем выбора номера классификатора К с наибольшим значением вероятности принадлежности Р^) на его выходе.
Таким образом, для классификации режима работы рельс вой цепи требуется построить три классификатора, каждый и кот рых определяет принадлежность вектора признаков к заданному классу. Эта задача может быть решена с помощью логистической регрессии.
Классификация режима =ебзты рельсовой цепи с помощью логистичеокой регрессии. Исходя из гипотез ы о линейной разделим оста класс кв, соответствуощих режимам работы рельсовой цепи (рис. 1), граница пршгатия ]решенизи о принадлежности вектора признаков к классу описывается линейным полиио м о м (3).
Рис. 2. Декомпозищга закачи классификации режимов работы рельсовой цепи
Ю]х) р
1 + ь
г(х >
(6)
При подстановке (°) в (6) пзлучаем решающую функцию (7), значение котоьой можно интерпретировать как вероятность принадлежности вектора признаков к заданному кеьысу.
юн]х) = ■
1
(7)
1 + ь~
Параметрами функци 1т (а), опредциятнщими решение о принадлежности вектора признаков к заданному классу, являются весовые коэффициенты. Определение весовых коэХФ=циенттв хыпллняесся путем минимизации Кз-ксьси сшибкю (8х на 1буча-ющей выборке [4, 6].
Этот процесс непыраеткя ибучением классификатора.
J(н) спмм М1 -одЫ, ЮКТ-
(п щ ь|!)) -од(1 - (х(!)))] + рр^т мм , 2,
2 т
(8)
>п
где ш2, ш3 — весовые коэффициенты, опре-
деляющие пожожение граниры паиоятия решения в пространстве признаков.
Если сетевою изэффициенты предсхависьв виде вектора, а вектор признаков дополкихь едикирей, так, как сто показх]но в сохончтениях (4), то формулу (3) можно босее компсотно мшкить в векторной форме (5).
Классификация с помощью логистической регрессии выполняется на основе сигмоидальной функции, которая описывается формулой (6) [4].
где т — число еримеров в обучающей выборке; x(') — ''-й пример из пОухающей выборки (строка матрицы X в (1)); и] — ]-й эземент вектора весовых коэффициентов у(') — иден1ификатор режима работы рельсовой цепн, соответствую щий ''-му примеру в обучающей выборке; X — параметр регуляризации, обеспечивающий контроль переоТученря классификатора [4] (сыбрюн ]ывным 1).
Как было отмечено ранюе, pасжматцизает[ый классификатор работает по принципу «один против всех», то есть отделсех в прыстринстве нртзнлков заданный класс от всех остальных.
Таким образом, р° п {к, 1} , причем у(')=1, если x(') соответствует заданному классу, и у(') = 0 в противном случае. Следовательно, при разработке классификатора заданного режима работы рельсовой цепи вектор Y из (1) должен быть соответствующим образом преобразован.
Минимизация функции ошибки классификатора (8) может быть выполнена различными алгоритмами оптимизации [15, 16], применение которых к решению данной задачи рассмотрено в [4-6, 13].
Градиент функции (8), который требуется для применения алгоритма оптимизации, определяется на основе формул (9).
с
1
(с1
н, н, с
р
я 1 m
J(w) = - £ (hw (x(i|) - у « )xf, для j =0 Яw, mi~-,i
. (9)
J(w) = | 1 £ (hw (x(i|) - y'X l+A. w., для j > 1 l m ~¡ ) m
В соответствии с [4] для функции (7), применяемой в качестве решающей, функция ошибки (8) имеет лишь один минимум, то есть является выпуклой [17, 18]. Таким образом, любой примененный алгоритм оптимизации при случайной инициализации начальных значений весовых коэффициентов w будет сходиться к единственной точке. В качестве примера на рис. 3а представлен график функции ошибки (8) при оптимальном значении и ш3 для классификатора нормального режима. На рис. 3б показаны линии уровня функции ошибки.
Минимизация функции ошибки (8) на обучающей выборке для каждого классификатора выполнена методом сопряженных градиентов, что обусловлено доступностью реализации этого алгоритма в Octave (функция fmincg), который использован в качестве вычислительной среды для разработки классификаторов. Формулы, позволяющие построить границы принятия решения для каждого классификатора, получаются путем подстановки найденных весовых коэффициентов в формулу (3), которая приравнивается к нулю. Границы принятия решения для каждого классификатора приведены на рис. 4.
Заключение. Из рис. 4 видно, что полученные классификаторы отделяют области, соответствующие режимам работы рельсовой цепи в пространстве признаков. В составе структуры, приведенной на рис. 2, эти классификаторы позволяют
а)
б)
Рис. 3. График функции ошибки (а) и линии ее уровня (б) для классификатора нормального режима
а)
б)
в)
Рис. 4. Границы принятия решений для классификаторов режимов работы рельсовой цепи (а — нормальный, б — шунтовой, в — контрольный)
реализовать систему машинной классификации режимов.
Для оценки обобщающей способности полученных классификаторов и точности работы системы классификации использована тестовая выборка, структура которой аналогична обучающей выборке и описывается формулами (1).
Тестовые примеры нормализованы по формуле (2) перед началом классификации, а вектор идентификаторов режима использован для контроля результатов классификации. Несовпадение результата классификации тестового примера с идентификатором режима означает ошибку системы классификации.
При запуске системы классификации на тестовой выборке отклонений от заранее известных идентификаторов режимов не выявлено, таким образом, точность работы составила 100 процентов. Это подтверждает предположение о линейной разделимости режимов работы рельсовой цепи в выбранном пространстве признаков (модуль тока на входе рельсовой цепи, модуль и фаза напряжения на ее выходе).
Таким образом, показана принципиальная возможность машинной классификации режимов работы электрической рельсовой цепи при относи-
тельной простоте алгоритмов, выполняющих классификацию. Следует, однако, иметь в виду, что работа этих алгоритмов продемонстрирована лишь на математической модели рельсовой цепи, а логистическая регрессия, лежащая в их основе, является одним из самых простых методов классификации. Очевидно, что проверка представленных алгоритмов в реальных условиях, их доработка, а также исследование возможностей применения более совершенных методов машинной классификации являются перспективами на ближайшее будущее в области автоматического мониторинга и диагностирования состояния рельсовых цепей.
Библиографический список
1. Брылеев А. М. Теория, устройство и работа рельсовых цепей. М.: Транспорт, 1978. 344 с.
2. Розенберг Е. Н., Дзюба Ю. В., Батраев В. В. О направлениях развития Цифровой железной дороги // Автоматика, связь, информатика. 2018. Вып. 1. C. 9-13.
3. Урусов А. В. Цифровая железная дорога // Автоматика, связь, информатика. 2018. Вып. 1. C. 6-8.
4. Murphy K. P. Machine learning: a probabilistic perspective. Cambridge, Massachusetts: MIT Press, 2012. 1067 p. ISBN 0262018020, 978-0262018029.
18. Boyd S. P. Convex optimization. NY: Cambridge University Press, 2004. 716 p. ISBN 0521833787.
БоРИСЕНКо Дмитрий Владимирович, кандидат технических наук, доцент (Россия), доцент кафедры «Автоматика и телемеханика». БРНЧ-код: 9697-9830 ЛиШогГО (РИНЦ): 533908
Адрес для переписки: [email protected] ПРИСУхИНА Илона Вадимовна, аспирантка кафедры «Автоматика и телемеханика». БРНЧ-код: 8429-0259 ЛиШогГО (РИНЦ): 907740
Адрес для переписки: [email protected] ЛУНЁВ Сергей Александрович, кандидат технических наук, доцент (Россия), заведующий кафедрой «Автоматика и телемеханика». БРНЧ-код: 7726-4450 Л^^огГО (РИНЦ): 657495 Адрес для переписки: [email protected]
Для цитирования
Борисенко Д. В., Присухина И. В., Лунёв С. А. Машинная классификация режима работы электрической рельсовой цепи на основе логистической регрессии // Омский научный вестник. 2018. № 4 (160). С. 67-72. БОН 10.25206/1813-82252018-160-67-72.
Статья поступила в редакцию 11.04.2018 г. © Д. В. Борисенко, И. В. Присухина, С. А. Лунёв
« s
Ql
X
О <
S X
2
5
5. Goodfellow I., Bengio Y., Courvrlle A. Deep learning. Cambridge, Massachusetts: MIT Press, 2016. 775 p. ISBN 9780262035613.
6. Flach P. Machine learning: the art and science of algorithms that make sense of data. NY: Cambridge University Press, 2012. 396 p. ISBN 978-1107096394.
7. Mitchel T. M. Machine learning. NY: McGraw-Hill Science, 1997. 432 p. ISBN 0070428077.
8. Hastie T. The elements of statistical learning. NY: Springer, 2009. 745 p. ISBN 0387848576, 978-0387848570.
9. Аркатов В. С. Рельсовые цепи магистральных железных дорог. М.: Миссия-М, 2006. 496 с. ISBN 978-5-903538-01-0.
10. Тарасов Е. М., Железнов Д. В., Белоногов А. С. Принцип инвариантности в системах контроля рельсовых линий: моногр. М.: УМЦ ЖДТ, 2016. 213 с.
11. Котляренко Н. Ф. Электрические рельсовые цепи. М.: Трансжелдориздат, 1961. 327 с.
12. Борисенко Д. В., Присухина И. В., Лунёв С. А. Математическая модель рельсовой цепи для генерации обучающей выборки // Известия Транссиба. 2017. Вып. 4 (32). С. 110-121.
13. Harrington P. Machine learning in action. NY: Manning Publications, 2012. 354 p. ISBN 1617290181, 9781617290183.
14. Bishop C. M. Pattern recognition and machine learning. NY: Springer, 2010. 738 p. ISBN 978-0-387-31073-2.
15. Пшеничный Б. Н., Данилин Ю. М. Численные методы в экстремальных задачах: М.: Наука, 1975. 320 с.
16. Васильев Ф. П. Численные методы решения экстремальных задач. 2-е изд, перераб. и доп. М.: Наука, 1988. 552 с.
17. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация: пер. с англ. М.: Мир, 1985. 509 с.