Научная статья на тему 'Моделирование структуры зависимостей между сбоями устройств железнодорожной автоматики и телемеханики'

Моделирование структуры зависимостей между сбоями устройств железнодорожной автоматики и телемеханики Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
98
23
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
автоматика и телемеханика / техническое диагностирование / интеллектуальный анализ данных / Automation and Remote Control / technical diagnostics / intellectual methods of data analysis

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Горишний Дмитрий Владимирович

Рассматривается проблема моделирования структуры зависимостей между сбоями устройств железнодорожной автоматики и телемеханики, предлагается алгоритм построения модели зависимостей Байесовской сети по диагностическим данным на основе метрики Купера Гершковича. Представлено описание разработанного алгоритма и его программной реализации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

The article is devoted to the problem of structure's modelling of relationships between technical failure diagnosis data of the railway automatics and telemechanics devices by applying the Cooper-Herskovits metric. Algorithm for model synthesis proposed. Descriptions of the algorithm and its software implementation, example and calculation results are provided.

Текст научной работы на тему «Моделирование структуры зависимостей между сбоями устройств железнодорожной автоматики и телемеханики»

УПРАВЛЕНИЕ, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И ИНФОРМАТИКА

УДК 004.942/519.2

МОДЕЛИРОВАНИЕ СТРУКТУРЫ ЗАВИСИМОСТЕЙ МЕЖДУ СБОЯМИ УСТРОЙСТВ ЖЕЛЕЗНОДОРОЖНОЙ АВТОМАТИКИ И ТЕЛЕМЕХАНИКИ

© 2010 г. Д.В. Горишний

Ростовский государственный университет Rostov State Transport

путей сообщения University

Рассматривается проблема моделирования структуры зависимостей между сбоями устройств железнодорожной автоматики и телемеханики, предлагается алгоритм построения модели зависимостей - Байесовской сети - по диагностическим данным на основе метрики Купера - Гершковича. Представлено описание разработанного алгоритма и его программной реализации.

Ключевые слова: автоматика и телемеханика; техническое диагностирование; интеллектуальный анализ данных.

The article is devoted to the problem of structure's modelling of relationships between technical failure diagnosis data of the railway automatics and telemechanics devices by applying the Cooper-Herskovits metric. Algorithm for model synthesis proposed. Descriptions of the algorithm and its software implementation, example and calculation results are provided.

Keywords: automation and remote control; technical diagnostics; intellectual methods of data analysis.

Введение

Техническое диагностирование устройств железнодорожной автоматики и телемеханики (ЖАТ) является одной из важных составляющих процесса обеспечения бесперебойного функционирования железной дороги и повышения уровня безопасности движения поездов. Широкое внедрение автоматизированных систем технического диагностирования и мониторинга (ТДМ) явилось предпосылкой к созданию на сети дорог ОАО «РЖД» ряда центров ТДМ, аккумулирующих информацию о техническом состоянии устройств ЖАТ контролируемых станций и перегонов.

С сентября 2007 г. на Северо-Кавказской железной дороге функционирует дорожный диспетчерский центр технического диагностирования и мониторинга (ДДЦ ТДМ) устройств ЖАТ. Основной задачей ДДЦ ТДМ является централизация работы службы связи и организация взаимодействия с дистанциями связи СКЖД [1].

За время работы ДДЦ ТДМ был накоплен значительный объем информации о диагностических состояниях и измеряемых параметрах устройств ЖАТ, что позволило приступить к решению комплексных задач выявления и анализа зависимостей между сбоями (переходами устройств в состояния, классифицируемые как предотказы и отказы).

Решение данных задач позволит перейти от плановой технологии выполнения работ по техническому обслуживанию устройств (ТО) к технологии ТО по текущему состоянию, а в перспективе - к ТО на основании прогноза технического состояния [2].

Совершенствование технологии ТО приведет к сокращению числа отказов, качественному повышению уровня технического состояния устройств и уровня безопасности движения.

На данный момент в ДДЦ ТДМ функционируют две подсистемы интеллектуального анализа данных, разработанные при непосредственном участии автора, а именно:

- подсистема выявления фактов ТО, использующая продукционные методы;

- подсистема выявления последовательностей смен состояния, использующая методы нечеткой логики.

В статье предлагается метод построения модели зависимостей между сбоями устройств ЖАТ в виде ациклического орграфа (так называемой Байесовской сети [3, 4]), а также эвристический алгоритм построения модели с применением в качестве критерия метрики Купера - Гершковича.

Описание структуры модели

Байесовские сети (БС) объединяют в себе технологии машинного обучения и визуализации и весьма удобны для описания сложных процессов и событий с неопределенностью. БС представляют собой графические модели событий и процессов на основе объединения подходов теории вероятностей и теории графов. Их название связано, прежде всего, с байесовским правилом вероятностного вывода [5].

БС можно определить как двойку < G, В >, в которой первый компонент G является направленным ациклическим графом, вершины которого соответствуют возможным событиям исследуемой предметной области, а ребра - причинно-следственным связям между этими событиями.

Второй компонент двойки - В представляет собой множество параметров, определяющих сеть, - набор таблиц условных вероятностей. Он содержит

параметры © ^ ^ 1 ) = Р (х1 | ра (X' )) для каждого

возможного значения X из X1 и ра (X1) из Ра (X1), где Ра [х11 обозначает набор родителей переменной

X1 в О. Каждая переменная X1 в графе О представляется в виде вершины.

Полная совместная вероятность БС вычисляется по формуле:

РБС (X1,..., Xм ) = ПРв ^^Ра [X1 )) .

С математической точки зрения БС - это модель представления наличия (а также отсутствия) вероятностных зависимостей. При этом связь А ^ В является причинной, когда событие А является причиной возникновения В, т. е. когда есть механизм, в соответствии с которым значение, принятое А, влияет на значение, принятое В. БС называют причинной (каузальной), когда все ее связи являются причинными.

Существует два способа задания структуры БС: экспертный и алгоритмический [6]. Экспертный подход в ряде случаев полезен, но при его использовании велика роль «человеческого фактора» - возможны ошибки и проявление субъективизма эксперта. Алгоритмический подход основывается исключительно на данных выборки, «человеческий фактор» исключен, существенно расширена область применения, но, как показано в работе [7], задача построения структуры по данным является МР-сложной, и для сетей с числом вершин более 10 ее решение занимает весьма существенное время.

В данной работе используется алгоритмический подход, а для снижения уровня вычислительной сложности задачи предлагается эвристический алгоритм синтеза модели зависимостей с применением метрики Купера - Гершковича.

Описание оценочной функции

В процессе построения модели зависимостей необходим критерий, позволяющий оценить степень соответствия структуры модели данным наблюдений. В качестве такого критерия можно использовать оценочную метрику, предложенную в работе [8] Грегори Купером и Эдуардом Гершковичем.

Пусть Z - множество дискретных переменных, где переменная zieZ имеет г1 возможных значений, D -набор данных, содержащий т наблюдений, причем

каждое наблюдение содержит значения каждой из переменных z.eZ (пропущенных значений нет), а Bs - Байесовская сеть (модель зависимостей), вершины которой соответствуют переменным z. Каждой вершине X.eBs соответствует множество родительских вершин к., которое может быть пустым. Пусть фу определяет j-й набор означиваний к. относительно D, и существует qt таких означиваний. Определим N.jk как число наблюдений среди D, при которых вершина Xt означивалась как Vj, а кt - как ф j, rt

тогда N. j = ^ N j k , а расчетная формула метрики k=1

t \ , ч " q' (Г -1) ! r'

P (g, x" ) = P (g )ППт^—nN, j,k KD

.■=i j=1 (N, j + r -1) ! k=1

Сомножитель P(g) в правой части уравнения (1) отражает имеющуюся информацию о структуре модели, например в случае, когда часть зависимостей заведомо известна. Если такой информации нет, данный сомножитель не учитывается.

Описание алгоритма

На рис. 1 приведена блок-схема предлагаемого эвристического алгоритма построения модели зависимостей, соответствующей причинно-следственным связям между наблюдаемыми событиями, с применением метрики Купера - Гершковича.

В начале работы алгоритма выполняется загрузка данных с результатами наблюдений, а также упорядоченного особым образом множества возможных событий. Упорядочивание необходимо для корректной работы алгоритма, и может задаваться различными способами, например с помощью экспертов.

После этого генерируется граф, вершины которого представляют рассматриваемые события и не соединены ребрами. Создается коллекция Parents, в которой будут храниться наборы предков каждой из вершин.

Затем выполняется итерация по вершинам графа согласно заданному порядку. В начале каждой итерации выполняется инициализация значения метрики CHoU = 0, и графа GoU = {V.}. Для каждой вершины V. выделяется список P-вершин, имеющих больший порядковый индекс события.

Далее, выполняется поиск P-вершины, добавление которой в граф God максимизирует значение метрики CHoU, рассчитанной по формуле (1). Если вершина найдена, значение метрики подменяется новым CHold = CHnew, а граф GoU дополняется найденнной вершиной, и поиск продолжается далее, пока количество найденных P-вершин не превысит максимально разрешенного значения M, либо расчетное значение метрики перестанет превышать текущее. Если же вершина не найдена, выполняется переход к итерации по следующей вершине.

По завершении итерации на выход алгоритма подается модель зависимостей - множество событий, для каждого из которых определено множество причинно-следственных связей.

период наблюдения; 1 - наличие ДС в период наблюдения.

Данные технической диагностики рельсовой цепи

№п/п X-2- X® X-4-1 X-5-

1 1 1 1 1 1

2 1 0 0 1 1

3 0 1 1 0 0

4 1 1 1 1 0

5 0 0 0 0 1

6 1 1 1 1 1

7 1 0 0 1 0

8 1 1 1 1 1

9 0 0 0 0 1

10 0 1 1 0 1

11 1 0 0 1 0

12 0 0 1 0 0

13 1 1 0 1 1

14 0 0 0 0 1

15 1 1 1 1 1

16 1 1 0 1 1

17 0 1 1 0 1

18 1 0 0 1 0

19 0 1 1 0 1

20 1 0 0 1 1

21 0 1 1 0 0

22 0 0 0 0 0

23 1 0 0 1 1

24 0 1 1 0 1

25 0 1 1 0 0

26 1 0 1 0 1

27 0 1 1 0 1

28 1 0 0 0 1

29 0 1 1 0 1

30 1 0 0 0 0

Рис. 1. Блок-схема алгоритма синтеза структуры модели зависимостей

Пример применения алгоритма для анализа данных

Рассмотрим пример применения предлагаемого алгоритма синтеза модели зависимостей на примере анализа зависимостей между унифицированными диагностическими состояниями (ДС) одного из наиболее распространенных устройств железнодорожной автоматики и телемеханики - рельсовой цепи.

Пусть задан набор данных из 30 наблюдений (таблица). Каждое наблюдение содержит информацию о составе текущих ДС рельсовой цепи (РЦ).

В таблице использованы следующие обозначения: - неисправность кабеля РЦ (предотказ); X® -пробой изолирующих стыков (предотказ); Х<3) - отсутствие кодирования (предотказ); - ложная занятость РЦ (отказ); X5 - отказ реле; 0 - отсутствие ДС в

Обработаем представленные данные с помощью компьютерной программы, разработанной на объектно-ориентированном языке программирования С# и реализующей вышеописанный алгоритм.

По результатам выполнения алгоритма максимальное значение метрики для обработанных данных равно 3,09^10-31. Граф, соответствующий максимальному значению метрики, представлен на рис. 2.

Рис. 2. Структура модели, соответствующая набору данных в таблице

Таким образом, из исходных данных следует, что пробою изолирующих стыков РЦ и отсутствию кодирования в большинстве случаев предшествует неис-

правность кабеля, а пробой в свою очередь приводит к ложной занятости РЦ или отказу реле.

Выводы

В статье рассмотрена проблема выявления зависимостей между сбоями устройств ЖАТ, предложен эвристический алгоритм синтеза структуры модели зависимостей, представлено описание разработанного алгоритма и его программной реализации. В качестве оценочной функции применена метрика Купера -Гершковича.

Зависимости, выявленные в ходе построения модели, могут быть использованы при создании систем интеллектуального анализа данных о функционировании технических устройств с целью изучения закономерностей, выявления предпосылок и предотвращения сбоев и аварий, а также при создании систем поддержки принятия решений по управлению процессом технического обслуживания и ремонта.

Поступила в редакцию

Литература

1. Сепетый А.А. Диагностика и мониторинг на СевероКавказской дороге // Автоматика, связь, информатика. 2008. № 6. C. 6 - 9.

2. Горишний Д.В. Автоматизация и развитие технологии технического обслуживания устройств ЖАТ / Тр. Всерос. науч.-практ. конф. «Транспорт-2008». Ростов н/Д., 2008. C. 240 - 241.

3. McKay D. Information Theory, Inference, and Learning Algo-

rithms. Cambridge, 2003. 550 p.

4. Тулупьев А.Л. Байесовские сети. Логико-вероятностный подход : науч. изд. СПб., 2006. 607 с.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Шумский С.А. Байесова регуляризация обучения // Лекции по нейроинформатике. М., 2002. Ч. 2. 172 с.

6. Рассел С., Норвиг П. Искусственный интеллект: современный подход. М., 2006. 1408 с.

7. Murphy K. A Brief introduction to graphical models and Bayesian networks Berkeley, 2001. 19 p.

8. Cooper G., Herskovits E. A Bayesian method for the induction of probabilistic networks from data // Machine Learning 9 (1992). Boston. P. 309 - 347.

9 июня 2010 г.

Горишний Дмитрий Владимирович - аспирант, Ростовский государственный университет путей сообщения. Тел. 8-918-557-30-42. E-mail: [email protected]

Gorishny Dmitry Vladimirovich - post-graduate student, Rostov State Transport University. Ph. 8-918-557-30-42. E-mail: [email protected]

i Надоели баннеры? Вы всегда можете отключить рекламу.