Научная статья на тему 'АВТОМАТИЧЕСКИЕ СИСТЕМЫ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ ПЕРЕВОЗОК С РАСШИРЕННЫМ КОНТУРОМ АНАЛИТИКИ ДАННЫХ'

АВТОМАТИЧЕСКИЕ СИСТЕМЫ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ ПЕРЕВОЗОК С РАСШИРЕННЫМ КОНТУРОМ АНАЛИТИКИ ДАННЫХ Текст научной статьи по специальности «Техника и технологии»

CC BY
0
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
интеллектуальный мониторинг / эволюционирующее моделирование / метод главных компонент / нечетко-динамическая модель / технологические процессы железнодорожных перевозок / intelligent monitoring / evolving modeling / principal component method / fuzzy dynamic model / technological processes in railway transport

Аннотация научной статьи по технике и технологии, автор научной работы — Долгий Александр Игоревич, Ковалев Сергей Михайлович

Предлагается новый гибридный подход к автоматизации управления сложными технологическими процессами, протекающими на железнодорожных станциях промышленного транспорта, с привлечением технологий интеллектуального мониторинга. В основу предлагаемого подхода положена концепция эволюционирующего предиктивного моделирования в сочетании с методами многофакторного статистического анализа. В качестве метода многофакторного статистического анализа используется модификация известного метода главных компонент. Идентификация нарушений в поведении технологического процесса осуществляется на основе объединения известного метода анализа вкладов и предложенного авторами метода нечетко-динамического анализа, также базирующегося на методе главных компонент. Принципиальной особенностью гибридного подхода является отображение исходного пространства числовых параметров технологического процесса в новое пространство переменных, образованное нечеткими правилами эволюционирующей системной модели. Путем применения к новым системным переменным технологии многофакторного анализа на основе метода главных компонент образуется ряд промежуточных разносортных переменных. Наличие нескольких групп системных переменных с различной степенью детализации и интерпретируемости, описывающих поведение контролируемого процесса, обеспечивает возможность разработки на их основе математических моделей и алгоритмов решения разнообразных задач мониторинга. Рассматривается пример использования предложенного подхода для постобработки мониторинговых данных с целью выявления расхождений в показателях работы сортировочной станции и обнаружения аномалий в развитии контролируемого процесса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по технике и технологии , автор научной работы — Долгий Александр Игоревич, Ковалев Сергей Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Automatic transportation process control systems with an extended data analytics circuit

A new hybrid approach has been proposed to automate the management of complex technological processes at railway stations of industrial transport using intelligent monitoring technologies. This approach is based on the concept of predictive modeling combined with methods of statistical analysis, including a modification of the principal components analysis method for multivariate statistical analysis and the identification of violations in technological processes using a combination of well-known methods such as contribution analysis and fuzzy dynamic analysis. The principal feature of the hybrid approach is mapping the initial space of numerical parameters of the technological process onto a new space formed by fuzzy rules of an evolving system model. Applying multivariate analysis to new system variables using the principal component method allows for the formation of a few intermediate variables with different degrees of granularity and interpretability, describing the behavior of the controlled process, which makes it possible to develop mathematical models and algorithms for solving various monitoring tasks. An example of using this approach for post-processing monitoring data to identify performance discrepancies in a marshalling yard and anomalies in the controlled process is considered.

Текст научной работы на тему «АВТОМАТИЧЕСКИЕ СИСТЕМЫ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ ПЕРЕВОЗОК С РАСШИРЕННЫМ КОНТУРОМ АНАЛИТИКИ ДАННЫХ»

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ

УДК 656.212.5:004.896

АВТОМАТИЧЕСКИЕ СИСТЕМЫ УПРАВЛЕНИЯ ТЕХНОЛОГИЧЕСКИМИ ПРОЦЕССАМИ ПЕРЕВОЗОК С РАСШИРЕННЫМ КОНТУРОМ АНАЛИТИКИ ДАННЫХ

ДОЛГИЙ Александр Игоревич, канд. техн. наук, генеральный директор1; e-mail: [email protected] КОВАЛЕВ Сергей Михайлович, д-р техн. наук, профессор, научный руководитель2; e-mail: [email protected]

1 АО «Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте» (АО «НИИАС»), Москва

2 АО «Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте» (АО «НИИАС»), Ростовский филиал, Ростов-на-Дону

Предлагается новый гибридный подход к автоматизации управления сложными технологическими процессами, протекающими на железнодорожных станциях промышленного транспорта, с привлечением технологий интеллектуального мониторинга. В основу предлагаемого подхода положена концепция эволюционирующего предиктивного моделирования в сочетании с методами многофакторного статистического анализа. В качестве метода многофакторного статистического анализа используется модификация известного метода главных компонент. Идентификация нарушений в поведении технологического процесса осуществляется на основе объединения известного метода анализа вкладов и предложенного авторами метода нечетко-динамического анализа, также базирующегося на методе главных компонент. Принципиальной особенностью гибридного подхода является отображение исходного пространства числовых параметров технологического процесса в новое пространство переменных, образованное нечеткими правилами эволюционирующей системной модели. Путем применения к новым системным переменным технологии многофакторного анализа на основе метода главных компонент образуется ряд промежуточных разносортных переменных. Наличие нескольких групп системных переменных с различной степенью детализации и интерпретируемости, описывающих поведение контролируемого процесса, обеспечивает возможность разработки на их основе математических моделей и алгоритмов решения разнообразных задач мониторинга. Рассматривается пример использования предложенного подхода для постобработки мониторинговых данных с целью выявления расхождений в показателях работы сортировочной станции и обнаружения аномалий в развитии контролируемого процесса.

Ключевые слова: интеллектуальный мониторинг, эволюционирующее моделирование, метод главных компонент, нечетко-динамическая модель, технологические процессы железнодорожных перевозок.

DOI: 10.20295/2412-9186-2024-10-04-337-359

▼ Введение

Эффективная и надежная работа железнодорожного транспорта является одним из важнейших условий устойчивого развития эконо-Л мики. Особое внимание при этом уделяется станциям как основным объектам исполнения ^ технологических операций, особо значимых т для перевозочного процесса [1]. | В рамках перевозочного процесса суще-

0

Ч ствуют отдельные технологические под-

^ процессы (ТПП), связанные с вариантным

1 планированием поездопотоков, поездообразо-§. ванием, управлением ресурсами инфраструк-© туры, и другие, которые зачастую относятся

к классу слабо формализованных процессов [2]. На практике для таких процессов отсутствуют полноценные математические модели в силу высокой степени неопределенности технологических параметров, наличия нечетко-определенных факторов, неконтролируемых возмущений и существенной внутренней нелинейности объектов автоматизации. Острота проблемы увеличивается из-за высокой степени динамичности ТПП и необходимости упреждающего обнаружения отклонений в контролируемом процессе от стандартных режимов на ранних стадиях развития, когда ТПП является еще управляемым, и представляется

возможным вносить соответствующие коррективы в его функционирование. Все это порождает серьезные препятствия на пути автоматизации управления ТПП, поэтому создание полностью автоматических систем управления слабо формализованными ТПП по-прежнему представляет собой актуальную и сложную задачу, пока еще не нашедшую своего окончательного всеобъемлющего решения.

Для анализа и проектирования такого рода систем широкое распространение получили методы имитационного моделирования [3]. Имитационное моделирование открывает возможности для анализа сложных динамических процессов в условиях отсутствия их аналитических моделей, поэтому оно является достаточно востребованным на сегодня инструментом в научных и практических исследованиях.

Отметим, что имитационное моделирование к настоящему времени нашло отражение во многих программных продуктах, например, в имитационной системе «ИСТРА» (ООО «Транспортный алгоритм»), системе «Аврора» (ПАО «Ленгипротранс»), OpenTrack (Швейцария); Rail Traffic Controller (RTC) (Berkley Simulation, Беркли, США) [4]. Упомянутые системы в качестве исходных данных используют характеристики подвижного состава, инфраструктуры, графика движения поездов. Основные функции программных комплексов практически идентичны друг другу и заключаются следующем: расчет характеристик станций, перегонов, узлов и участков движения; моделирование ТПП в отсутствие нарушений; моделирование сбоев ТПП; представление полученных данных в графической форме. Суть подходов к автоматизации управления ТПП, базирующихся на имитационном моделировании, заключается в оценке взаимного влияния элементов ТПП путем многократной имитации поведения процесса с использованием датчиков случайных чисел.

Однако практика показала, что методы имитационного моделирования не решают всех проблем, возникающих при автоматизации управления сложными ТПП, поскольку в реальных условиях течение исследуемого процесса происходит иначе, чем в рамках симулированной модели. Причина таких различий кроется в неполноте и неточности учета си-

стемных факторов, отсутствии стандартизированных алгоритмов построения имитационной модели, а также в нестационарности случайных процессов, которые сложно воспроизвести в имитационной модели. Причиной ограниченных возможностей традиционных методов имитационного моделирования является также то, что классическая симуляция, полагаясь на обобщенную информацию о моделируемом процессе, может быть полезной только лишь для получения ориентировочных оценок его симулированной динамики. К примеру, она может использоваться для получения приблизительных направлений эволюции процесса на основе линейных прогнозов или для воспроизведения типовых сценариев развития ТПП без учета актуальной информации о поездной обстановке. В реальности такая информация оказывается мало полезной для автоматизации принятия решений, поскольку она лишена подробностей, а, как известно, «все дело в деталях». Детали, представленные в форме технологических бифуркаций, вызванные появлением аномальных состояний и нештатных технологических ситуаций, непредвиденно изменяющейся поездной обстановкой, сбоями и нарушениями в поведении ТПП, встречаются обычно редко, и вероятность их появления в моделируемом процессе с применением случайной, несфокусированной симуляции крайне мала.

Для решения данной проблемы в настоящем исследовании предлагается новый подход, основанный на концепции эволюционирующего предиктивного моделирования с привлечением статистических методов многофакторного анализа.

Суть предлагаемого подхода заключается в разработке интеллектуальной эволюционирующей модели, база знаний (БЗ) которой содержит нечеткие правила, описывающие связь между параметрами моделируемого процесса и состояниями, которые он может принимать по мере своего развития. Изначально БЗ формируется экспертами, а затем в процессе функционирования системной модели непрерывно уточняется по мере поступления новых данных на основе инкрементного механизма онлайн-обучения. Механизм обучения способен в пошаговом режиме адаптировать системную

модель в соответствии с поведением контролируемого процесса как на параметрическом, так и на структурном уровне. При этом на медленные параметрические изменения во входном потоке данных, соответствующие нормальному течению контролируемого процесса, системная модель реагирует плавными параметрическими регуляциями, а на быстрые изменения, вызванные сменой состояний ТПП, нарушениями или иными непредвиденными событиями, модель реагирует структурными изменениями в ее БЗ. В результате инкрементный механизм обучения, управляемый входным потоком данных, обеспечивает синхронизацию поведения системной модели с ходом контролируемого технологического процесса с учетом актуальной информации о ТПП, включая смену состояний, появление нештатных технологических ситуаций, нарушений и отклонений в работе технологического процесса.

Для полной реализации вышеуказанного подхода к автоматизации управления ТПП на основе концепции эволюционирующего предиктивного моделирования в системную модель, помимо имитационных свойств, закладываются прогностические способности. Они обеспечивают возможность решать комплекс задач, связанных с прогнозированием поведения ТПП в условиях сложной предсказуемости, точках технологических бифуркаций, в критических и переходных состояниях ТПП, в преддверии нештатных технологических ситуаций и аномальных событий. Иными словами — в ситуациях, представляющих наибольшую трудность для автоматизации принятия решений, ответственность за которые в настоящее время возлагается на диспетчера. Прогностические способности реализуются в системной модели за счет включения в ее БЗ особой категории правил, способных выявлять в потоке данных предикторные паттерны, предшествующие возникновению целевых состояний ТПП, имеющих важное значение для принятия решений.

Эволюционирующая модель, выступая в качестве инструмента имитационного и преди-ктивного моделирования, составляет основу новой технологии автоматизации управления сложными ТПП с привлечением интеллектуального мониторинга. Интеллектуальный мо-

ниторинг (ИМ) представляет собой технологию интеллектуального анализа данных, основанную на концепции предиктивного эволюционирующего моделирования и многофакторного анализа данных, предназначенную для решения комплекса задач, связанных с оценкой состояний контролируемого процесса, прогнозированием его поведения, диагностированием и идентификацией нарушений, возникающих в ходе технологического процесса, установлением и интерпретацией их первопричин.

Интеллектуальный мониторинг играет ключевую роль при создании нового класса интегрированных систем автоматического управления с расширенным контуром аналитики данных, поддерживающим принципиально новый функционал для подобного рода систем управления, условно названный функционалом контроля и управления аномалиями [5] — Anomaly Monitoring and Management Functionality (AMMF). AMMF-функционал, составляющий основу ИМ, обеспечивает поддержку решения основных мониторинговых задач по прогнозированию, диагностике, идентификации нарушений в ходе технологического процесса и выявлению их первопричин.

Обязательным компонентом ИМ является диагностика. Автоматизация обнаружения и диагностики нарушений в ходе технологического процесса является важным шагом в реализации ИМ, позволяя более точно оценивать состояния системы, выявлять потенциальные риски и выстраивать стратегию управления процессом. Мощным инструментом решения таких задач являются современные методы аналитики данных и, в частности, входящие в нее методы статистического мониторинга, основанные на данных [6]. Практическая полезность таких методов обусловлена тем, что они реализуются без необходимости наличия математической модели процесса; для их применения достаточно эмпирических знаний, которыми обладают эксперты, и определенного объема актуальных данных, касающихся фактических значений параметров и переменных состояния процесса, собранных в ходе его работы. Именно это свойство обеспечивает данному типу моделей большое внимание исследователей и практическую востребованность [6—10].

Важнейшим методом статистического мониторинга является многофакторный анализ данных, использующий метод главных компонент (Principal Component Analysis, PCA), благодаря его способности обрабатывать многомерные, зашумленные и сильно коррелированные данные путем проецирования их на два подпространства переменных — подпространство главных компонент (Subspace of the Principal Components, PCS) существенно меньшей размерности, чем исходные данные, и при этом способных правильно описать основные тенденции в данных [6], и остаточное подпространство (Residual Subspace of the Principal Components, PRS). Далее на базе полученных проекций рассчитываются показатели обнаружения неисправностей, на основе анализа которых осуществляется решение основных мониторинговых задач.

Для детектирования вновь поступающего в систему образца данных он проецируется в пространство PCS, а затем на основе новых переменных (метапараметров ТПП), сформированных в полученном новом пространстве, рассчитываются диагностические критерии. Если один из них выходит за пределы контрольных значений или превышает некоторое пороговое значение, фиксируется нарушение.

Статистический мониторинг на основе PCA выполняется в два этапа: детектирование неисправностей или нарушений, во время которого устанавливается сам факт нарушения в конкретной технологической ситуации, и идентификация нарушения, во время которой изолируется и определяется первопричина нарушения, после чего предпринимаются действия по возвращению процесса к нормальному состоянию.

Несмотря на свою распространенность, традиционный подход на основе PCA сталкивается со значительными ограничениями при его применении к динамическим и нелинейным данным, характерным для описания ТПП. Кроме того, обычный PCA не обладает необходимыми интерпретационными свойствами, имеющими исключительно важное значение для понимания функционирования диагностической модели. Для устранения этих ограничений в рамках ИМ предлагается новая технология нечетко-динамического анализа

многомерных данных, свободная от указанных недостатков, основанная на объединении метода динамического PCA и нечеткой эволюционирующей модели.

Более подробное математическое описание метода PCA применительно к задачам данного исследования будет приведено в п. 4.

Возвращаясь к идее создания полностью автоматических систем управления ТПП, следует отметить, что в рамках рассматриваемого подхода ИМ является ключевым элементом диспетчерского управления, отличающим его от традиционных контрольно-диагностических и мониторинговых систем. Основным отличительным признаком системы ИМ является наличие в ней компоненты знаний в виде БЗ эволюционирующей модели, сопровождающей течение ТПП. Благодаря БЗ интеллектуальный мониторинг позволяет не просто агрегировать, но и интерпретировать исходную информацию о ТПП. Это обеспечивает ему решающее преимущество и способность решения широкого круга задач по прогнозированию поведения ТПП при изменяющихся условиях функционирования объекта автоматизации, своевременному обнаружению нарушений в поведении ТПП, установлению их причин, а также объяснению вырабатываемых системой решений и способов их получения в легко интерпретируемой для человека-пользователя форме.

В настоящем исследовании авторы рассматривают некоторые аспекты практической реализации технологии ИМ применительно к управлению технологическими процессами, протекающими на железнодорожных сортировочных станциях. В частности, рассматривается решение задач, связанных с постобработкой данных мониторинга о показателях работы сортировочной станции с целью выявления несоответствий в данных и установления причин возможных расхождений. Также в рамках организации непрерывного мониторинга ТПП рассматривается задача предиктивного анализа динамики параметров технологического процесса работы станции с целью идентификации различных ее режимов и превентивного обнаружения критических состояний ТПП для принятия мер по регулированию процесса.

Настоящее исследование инициировано проектом «Цифровая железнодорожная

станция» (ЦЖС)1, предполагающим переход от автоматизированного к автоматическому управлению технологическими процессами на станции с использованием технологий искусственного интеллекта.

1. Концепция управляемой имитационной модели технологических процессов на основе эволюционирующего предиктивного моделирования

Основным математическим инструментом ИМ является модель нечеткой эволюционирующей системы. Эволюционирующие нечеткие системы представляют собой особый класс нечетких моделей, способных к саморазвитию в онлайн-режиме под управлением потоковых данных. Саморазвитие нечеткой эволюционирующей модели обеспечивается специальным механизмом инкрементного обучения, способным улавливать концептуальные дрейфы и/или сдвиги в данных, преобразуя их в знания, представленные в виде легко интерпретируемых человеком-пользователем нечетких правил [11—15].

Математическую основу нечеткой эволюционирующей системы (Evolving fuzzy Togaki-Sugeno system, efTS) образует нечеткая система типа Такаги — Сугено — Канга, база знаний которой представлена интуитивными и простыми для интерпретации нечеткими правилами IF-THEN в следующей форме:

к : IF х is a., AND x.t is a.. AND...

l 11 11 21 12

...AND x is a. THEN c„

mt im it'

мере своего развития. Предусловия Л1 нечетких правил являются лингвистическими описаниями классов технологических ситуаций или возможных состояний ТПП, а заключения с, — идентификаторами классов состояний ТПП. В ряде случаев в качестве целевых переменных указываются вместе с классами состояний прогностические оценки х,+1 параметров ТПП, соответствующие данным состояниям.

Входящее в формулу (1) выражение хр is является нечетким предикатом, который для каждого конкретного значения числового параметра Хр е хг принимает конкретное значение истинности, вычисляемое на основе соответствующей функции принадлежности (ФП) цДд^е [0;1]. Для входного вектора параметров х, и нечеткого правила г можно определить величину р(. (хг), называемую активацией нечеткого правила и вычисляемую на основании выражения:

(2)

(1)

где х( = (хи,...,хш) — т-мерный вектор переменных состояния (параметров) ТПП в текущий момент ,; — лингвистические значения (нечеткие термы) переменных хр; си — целевые переменные. Здесь и далее под , понимаются текущие последовательные отсчеты дискретного времени, ^ е N.

Нечеткие правила еЯ^ описывают связь между параметрами исследуемого ТПП и состояниями, которые он может принимать по

1 Концепция «Цифровая железнодорожная станция»: утв. распоряжением ОАО «РЖД» от 07.11.2018 № 1049 (в ред. от 05.06.2020 № 1217/р).

где & — оператор нечеткой конъюнкции, в качестве которого обычно выступает операция «х».

Степень активации рг (х() нечеткого правила г, вычисленная в текущий отсчет времени ,, является мерой соответствия текущего состояния ТПП, описываемого вектором параметров х, ее лингвистическому описанию Л, представленному в антецеденте нечеткого правила г. Тем самым степень активации р(. (хг) указывает на возможность использования нечеткого правила г для оценки текущего состояния ТПП, представленного целевой переменной си. На значение целевой переменной влияет вся совокупность нечетких правил {?;.} (г = 1,2,..., и,), образующая динамическую БЗ КВ(, которая вместе со схемой нечеткого вывода представляет механизм принятия решений еП^-модели. Нечеткая схема вывода для каждого вновь поступившего образца данных х, характеризующего текущее значение параметров ТПП, вычисляет значение целевой переменной с,:

(3)

где п — число нечетких правил в БЗ, сформированной к моменту времени I;

*РЙ — вклад нечеткого правила г1 в результирующую оценку си целевой переменной, вычисляемый на основании формулы:

Ч' =

(4)

Следует отметить, что БЗ еЛБ-модель изначально формируется экспертами и непрерывно уточняется по ходу ТПП. Поэтому еПБ-модель является динамической системой, функционирование которой осуществляется под управлением потока данных (х, | ^ е М), сопровождающего течение ТПП. Управление процессом функционирования еЛБ--модели заключается в пошаговой адаптации параметров и, при необходимости, структуры БЗ еПБ-модели на основе специального механизма инкрементного обучения, рассматриваемого в последующих разделах.

Функционирование еЛ^ осуществляется в пошаговом режиме путем реализации для каждого вновь поступившего образца данных х1 схемы нечеткого вывода (1)—(4). В результате вычисляются значения функций активации рг. (х() нечетких правил г. е КВ.. Поскольку значения целевой переменной с, напрямую связаны через соотношение (3) с активациями нечетких правил р(. (х(), появляется возможность дать формализованное определение нечеткому состоянию ТПП.

Определение. Пусть КВ( — динамическая БЗ, сформированная в процессе эволюционирования efTS-модели к дискретному моменту времени под управлением потока данных (хг | ^ е М). Обобщенным состоянием ТПП в момент времени называется нечеткое множество .К, «активных» нечетких правил:

Д = {(г<,цл(г|))|г<еАВ„ ^(г() = р((х,)}. (5)

В этом случае формализованным представлением нечеткого состояния ТПП в момент времени является вектор активаций нечетких правил р<=<р1(,р2(,...,рй1((>, где р,.Дх()е[0;1]; тI — число нечетких правил в динамической БЗ КВ . Обратим внимание, что здесь, как и везде, под понимаются дискретные моменты времени.

Таким образом, в процессе эволюционирования efTS-модели под управлением потока данных (х, | / е М) происходит непрерывное обновление динамической БЗ КВ , в результате чего синхронно с потоком данных (х, | ^ е М), описывающим динамику ТПП в пространстве числовых параметров Хт а К"1, формируется новый поток состояний ТПП, представленных активациями нечетких правил (р, | г е М). Новый поток данных описывает динамику ТП в семантическом пространстве системных переменных :Гс[0;1р. Иными словами, еЛ^-модель выступает в качестве некоего транслятора:

еГГв: х, рп х( е X,; р, N. (6)

Переход в процессе эволюции системной модели от пространства первичных параметров Хт к семантическому пространству активаций легко интерпретируемых нечетких правил позволяет использовать нечеткие эволюционирующие системы в качестве эффективного инструмента извлечения знаний из потоковых данных с целью решения комплекса мониторинговых и управляющих задач.

2. Инкрементный механизм онлайн-обучения эволюционирующих моделей

Традиционные системы предиктивной аналитики, являясь важнейшим компонентом системы управления ТПП с расширенным контуром ИМ, обычно работают с ретроспективой, то есть с «оглядкой» на опыт, что позволяет получать выводы, основанные на фактах, а не на предположениях. Благодаря этому обеспечивается возможность обобщения ранее полученной информации с целью извлечения из нее стратегических сведений для прогнозирования нештатных технологических ситуаций, аномальных состояний и динамики ТПП. Однако одной из основных проблем управления слабо формализованными ТПП является высокая степень динамичности и непредсказуемости поведения управляемого процесса в точках технологических бифуркаций. Для моделирования процесса в этих условиях необходимо обеспечить адекватную реакцию модели не только на медленные, долговременные

тренды в данных, но и на быстрые изменения, вызванные сменой состояний ТПП, появлением нештатных технологических ситуаций, непредвиденных сбоев и нарушений в поведении ТПП. Отсюда вытекает важнейшее требование адаптируемости системной модели, что достигается специальным инкрементным механизмом онлайн-обучения. Механизм такого обучения придает еГ^-модели способность оперативно в пошаговом режиме подстраиваться под изменяющийся поток данных, не снижая эффективности функционирования. Эффективность функционирования еЛ^-модели оценивается достоверностью вырабатываемых на ее основе диагностических или прогностических решений в соответствии с типом целевой переменной.

Основная проблема онлайн-обучения заключается в том, что для реализации онлайн-алгоритмов не подходят традиционные методы пакетного офлайн-обучения, поскольку они не удовлетворяют главному требованию потоковой обработки данных — способности непрерывно, по мере поступления входных данных, интегрировать новую информацию в постоянно обновляемую БЗ системной модели. Для решения этой проблемы требуется сдвиг парадигмы обучения в сторону инкре-ментной обработки потоковых данных, в соответствии с которой при каждом поступлении нового образца данных он сразу «встраивается» в процесс обучения с целью пополнения или корректировки динамической БЗ системной модели. В такую потоковую схему естественным образом вписывается парадигма инкре-ментного онлайн-обучения. В соответствии с данной парадигмой инкрементное обучение определим как оператор F¡nc, который для потока обучающих данных (и( | и, = (хг, с(); £ е М)„ поступающего на вход системной модели, генерирует сопровождающую его последовательность моделей еЯ^, еЛ^2, ..., еЛ^ , [16]:

^c:efTSi+1=^c(efrS,);

ct+1

= efTSf+1 (xf+1); £(сг,с,) —»min,

(7)

зать; efTS (— эволюционирующая модель, сформированная к текущему отсчету времени ; с,, с, — реальное и теоретическое значение целевой переменной С (соответственно) в момент времени I; £(с,,с() — критерий, характеризующий потери предсказания целевой переменной, то есть мгновенные потери точности, вычисляемые для текущего входного вектора параметров и, = (х,, Сг) на основе среднеквадратичного критерия (с, -с,)2.

Таким образом, эффективность функционирования efTS-модели оценивается достоверностью вырабатываемых на ее основе диагностических или прогностических решений в зависимости от типа целевой переменной С.

В общем виде критерий точности обучения можно формализовать в виде:

Е =

1

t к ,=,

(8)

где [7 -к,{\ — интервал анализа.

Критерий точности обучения еЯБ-модели, представленный выражением (5), не полностью удовлетворяет требованиям, предъявляемым к системной модели. Необходимо соблюсти еще ряд условий, среди которых особо важным является условие «стабильной пластичности» [17], характеризующее способность системной модели к прогнозированию состояний х |+1 ТПП, как в условиях быстро изменяющихся данных, вызванных сменой состояний или режимов функционирования ТПП, так и в условиях медленно дрейфующих данных, вызванных плавными параметрическими регуляциями в ТПП. Для выполнения этих условий предлагается ряд частных критериев.

Условие, обеспечивающее быструю реакцию еЛБ-модели на динамичные дрейфы в потоке данных, учитывается в частном критерии мгновенной точности, обозначим:

Acct = C(cj,Cj).

(9)

где х( = (х1( ,х21,..., хт() — вектор входных параметров, характеризующих текущее состояние х1 контролируемого процесса; с1 — целевой параметр, который модель пытается предска-

Способность эволюционирующей модели стабильно отвечать на медленные тренды в потоке данных в значительной мере связана с ее возможностью обобщения ранее полученной информации. Обобщающие свойства модели выражаются в так называемом критерии

«минимальности», согласно которому среди множества моделей при прочих равных лучшими обобщающими свойствами обладает наиболее простая или минимальная из них [18]. Для поддержки обобщающих свойств системной модели предлагается частный критерий «минимальности»:

М =

\кв.\

КВ+с

(10)

кв

где \КВ,\ — число правил в БЗ на текущий

отсчет времени \КВ\ =

У \щ\

г

— усред-

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ненное число правил в базе знаний; сКВ — среднеквадратичное отклонение случайной величины, характеризующей число правил в БЗ еГГ8-модели.

Критерий точности обучения (8) частных критериев минимальности (10) и мгновенной точности (9) с целью интеграции в основной расширим путем добавления к нему «штрафного» поправочного члена, который будет «наказывать» варианты решений, плохо соответствующие дополнительным частным критериям. Поправочный член сформируем путем агрегирования частных критериев Лсс1 и М( в единый показатель на основе среднегеометрического:

¿Аим = ^Асс,М,.

(11)

Поправочный член JAиМ, будучи добавленным к основному критерию (6), образует интегральный критерий для инкрементного обучения еЯ^-модели:

I = aE + (\-a)J

АиМ'

(12)

3. Извлечение знаний из потоковых данных на основе инкрементного механизма структурного обучения

В процессе эволюционирования системной модели поток данных, сопровождающий течение ТПП, содержит информацию, указывающую на изменение условий эксплуатации, возникновение нарушений, появление нештатных режимов и иных существенных для принятия решений событий. Информация о состояниях ТПП, согласно определению, отображается в структуре БЗ, поэтому для извлечения знаний о ТПП необходимо соответствующим образом организовать механизм структурного обучения еГГ8-модели. Для этого он должен обеспечивать возможность в пошаговом режиме осуществлять формирование и обновление БЗ системной модели, подстраивая ее поведение под поведение контролируемого процесса.

Одна из первых эффективных техник структурной идентификации (обучения) нечетких систем в режиме онлайн была предложена в [19]. В ее основе лежит идея субтрактивной кластеризации [20], которая до сих пор является наиболее популярным подходом к структурному обучению нечетких систем в онлайн-приложениях.

Процедура субтрактивной кластеризации [21] использует поступающие в систему обучающие данные, представленные точками xi е X в признаковых пространствах ввода-вывода в качестве возможных центров кластеров, из которых в дальнейшем извлекаются нечеткие правила для БЗ системной модели. Возможность того, что точка х; может быть центром кластера, оценивается через ее потенциал Р( = Р(хг), характеризующий усредненную меру близости текущей точки х; ко всем другим точкам данных х1 е X:

где а — коэффициент, отражающий значимость основного критерия Е относительно вспомогательного, частного критерия

С учетом интегрального критерия (12) процесс инкрементного обучения сводится к разработке оператора инкрементного обучения F¡nc, определенного в соответствии с (5), отвечающего интегральному критерию I:

^ = ЕехРГа

м

хг-ху

(14)

/ = аЕ + (1 - а) 1АиМ тт.

(13)

где = Р(х,.) — потенциал ¡-й точки данных, п — количество обучающих данных.

Чем плотнее расположены точки рядом с х, тем выше значение ее потенциала Р1 и тем более предпочтительной она является для выбора в качестве кластерного центра. Следовательно, центром первого кластера назначают точку с наибольшим потенциалом. Далее

значения потенциалов для всех оставшихся возможных центров кластеров пересчитыва-ются путем вычитания от текущих потенциалов вклада потенциала только что найденного центра кластера. Итерационная процедура пересчета потенциалов продолжается до тех пор, пока максимальное значение потенциала не достигнет некоторого заранее установленного порога.

Существенным достоинством метода суб-трактивной кластеризации является возможность при формировании кластеров учитывать как пространственную информацию о евклидовых расстояниях, содержащуюся в значениях потенциалов Р (х.), так и другие свойства данных, полезные для формирования кластеров в контексте организации механизма обучения с целью извлечения знаний. Такой информацией являются поддержка кластеров, время их существования, активность, полнота покрытия признакового пространства и др. [22].

Для применения метода субтрактивной кластеризации к обучению еЯ^-модели с целью извлечения знаний необходимо несколько видоизменить постановку задачи обучения, переводя ее на язык нечеткого гранулирования признаковых пространств с использованием лингвистических термов.

Предварительно заметим, что каждое нечеткое правило г, представленное формулой

т

п- ПМ*/)

м

определяет нечеткое отображение между признаковыми пространствами:

^:Х=>С„ (15)

где X = Х1 • Х2 •...• Хт — пространство входных переменных, характеризующих параметры ТПП; т — размерность пространства X, — функция принадлежности; С1 — целевой параметр.

Антецедент Л1 нечеткого правила г1 представлен в пространстве X нечетким кластером

т

с ФП Ц^П^а--, а консеквент С1 представлен

' М "

на шкале целевого параметра нечетким интервалом с ФП цс,.. Заменяя оператор импликации

«^» в формуле (15) произведением ФП, нечеткое правило г.. можно представить нечетким кластером в пространстве ввода-вывода X • С. с обобщенной ФП ц = Мц.Цс..

С учетом сделанных преобразований структурное обучение efTS-модели можно сформулировать в терминах кластеризации пространства ввода-вывода X • С 1 с последующим извлечением из полученных кластеров нечетких правил для БЗ efTS-модели. Центры кластеров транслируются в фокальные точки предусловий нечетких правил efTS-модели, а размеры кластеров — в значения дисперсий ФП соответствующих нечетких термов. Антецедентные части нечетких правил еЛ^, полученные на основе субтрактивной кластеризации, приобретают следующую форму:

АЖ>х2=х°2 ЛЫБ....АЯБхт - х-т.

Для полной формализации онлайн-алгоритма структурного обучения еЯБ-модели необходимо конкретизировать условия образования новых кластеров в процедуре субтрак-тивной кластеризации.

Здесь следует отметить, что кластеризация признакового пространства с целью проектирования и обучения нечетких систем отличается от цели обычной кластеризации [23]. Последняя направлена на поиск естественных группировок данных таким образом, чтобы размещаемые в одном кластере данные располагались по возможности наиболее компактно, а сами кластеры были хорошо разделяемыми. В нашем же случае при использовании кластеризации с целью формирования БЗ для нечетких систем кластеры могут пересекаться и не обязательно должны быть взаимоисключающими. Кроме того, efTS-модель, являясь моделью представления знаний в системах ИМ, должна удовлетворять требованиям интерпретируемости [24].

С этой целью в основу разработки алгоритма субтрактивной кластеризации положим ряд принципов формирования кластеров, направленных на оптимизацию интегрального критерия (14) с одновременным учетом интерпретационных требований:

— выбор в качестве кластерных центров точек данных с наибольшими значениями

потенциалов для улучшения обобщающих свойств кластеров и минимизации БЗ, что ведет к оптимизации индекса минимальности системной модели в обобщенном критерии обучения;

— выбор в качестве кластерных центров точек данных с наименьшими значениями потенциалов с целью формирования кластеров в удаленной области признакового пространства для оперативной реакции системной модели на быстрые дрейфы в данных, что ведет к оптимизации индекса мгновенной точности в обобщенном критерии;

— избежание использования излишних пороговых значений, искусственно вводимых пользователями без должного объективного обоснования при формализации условий обновления кластеров;

— минимизация числа кластеров с целью минимизации БЗ системной модели и оптимизации индекса минимальности путем удаления из текущей БЗ нечетких правил, которые:

1) являются устаревшими (по возрастному ограничению);

2) имеют низкую поддержку, то есть фокус правила (центр ФП) смещен из-за высокой динамичности процесса;

3) являются малополезными.

Рассмотрим формальные условия, обеспечивающие реализацию выше сформулированных принципов в механизме обучения, основанном на субтрактивной кластеризации:

1. Первый принцип обеспечивается за счет выбора точек данных с максимальной плотностью данных (с наибольшим значением потенциала). Обозначим число внешних точек данных (точек, выпадающих из 2ст^-зоны ¡-го кластера) к моменту времени , (после считывания , образцов данных) через:

N

х' -х'с > jt t

2а;С},

(16)

где х]с — центр ¡-го кластера, сформированного к моменту х'^ — ]-я точка в ¡-м кластере; а]с — разброс точек в ¡-м кластере.

Формальным условием обеспечения первого принципа является условие:

PI: IF yP(xt) > maхР(х'Л THEN KBt = = (KBt - KBt и rt);

(17)

где

Y - i

1, если (x,) > e 1, Vi,j e N;

Nt- 3

logi t = 2,3,...,n

, если if \ij(xt)<e 2;

(18)

— нормализованное количество «внешних» точек.

Из приведенного выражения очевидно следует, что чем больше значение у, тем легче создать новый кластер.

2. Второй из вышеприведенных принципов формирования кластерных центров обеспечивается за счет выбора точек данных с минимальной плотностью (с наименьшим значением потенциала) с целью обеспечения как можно более полного покрытия кластерами данных обучения, а также возможности оперативно реагировать на быстрые дрейфы в потоке данных. Формальным условием, обеспечивающим выполнение данного принципа, является выражение:

Р1: IF P(xt) < minP(xj() THEN KBt =

4 (19)

=^^.(1,), (KBt=KBt + ri).

3. Третий принцип формирования кластерных центров автоматически обеспечивается при использовании вместо пороговых значений, искусственно вводимых пользователем, среднеквадратичных отклонений af случайных величин, однозначно определяемых и вычисляемых на основе евклидовых расстояний. В частности, вместо искусственного порога при определении числа внешних точек N, входящего в формулу (18), используется среднеквадратичное отклонение af.

4. Четвертый принцип обеспечивает непрерывный мониторинг качества кластеров в механизме онлайн-обучения с целью оптимизации БЗ системной модели. Для этого в процессе формирования кластеров постоянно контролируется ряд параметров, среди которых важнейшими являются поддержка, возраст и полезность.

Поддержка St 1 /-го кластера (нечеткого правила г) на текущий отсчет времени t определяется количеством образцов данных, связанных с кластером [19]:

VieN, Vf = N\l

P. = P

jt

>{Sit = Sit_1 +1).

(20)

Параметр поддержки характеризует мощность обобщения, которую обеспечивает нечеткое правило г, ассоциированное с /-м кластером.

Возраст Аи /-го кластера показывает накопленный темпор (время) активации кластера [19; 25]:

ys, j

4 = \KB\t,teN, (21)

где I обозначает дискретный момент времени поступления 1-го образца данных, «захваченного» /-м кластером.

Параметр возраста показывает, насколько актуальна информация, обобщенная соответствующим нечетким правилом. Полезность и и /-го кластера отражает накопленный относительный уровень активации нечеткого правила Г, ассоциированного с /-м кластером:

Uu =

t-t:

где tt — время создания /'-го нечеткого правила.

Параметр полезности показывает, как часто правило было использовано после его создания.

Контроль вышеприведенных параметров поддержки S ,, возраста A и полезности Ц в механизме структурного обучения осуществляется на основе проверки соответствующих условий S, A и U, формализованное представление которых дано ниже:

S: IF Sit (3 AND t)tf +10 THEN KBt = = Щ\г, {KBt=KBt-rt)\

A: IF Ait >Д + Од THEN KB, = KBt \r;

U: IF Uit < U, - aUt THEN KBt= KBt\rt,

где Д. и и1 — усредненные значения параметров возраста и полезности /-го нечеткого правила соответственно, вычисленные по t отсчетам; аА: и ои. — стандартные отклонения параметров возраста и полезности /-го нечеткого правила соответственно, вычисленные по t временным отсчетам.

Реализация базовых принципов 1 и 2 в алгоритме структурного обучения осуществляется через проверку условий Р1 и Р2, при срабатывании которых происходят соответствующие изменения в БЗ системной модели, заключающиеся в добавление к БЗ системной модели новых нечетких правил. Реализация базового принципа 4 в алгоритме осуществляется через проверку условий S , А и и, при срабатывании которых происходят соответствующие изменения в БЗ системной модели, заключающиеся в исключении из БЗ системной модели нечетких правил. Таким образом, условия Р1 и Р2 способствуют расширению БЗ, а условия S , А и и способствуют минимизации БЗ.

Формализованное описание инкрементно-го алгоритма структурного обучения, обеспечивающего непрерывное функционирование предиктивной еГГ8-модели под управлением потока данных, не приведено авторами с целью сокращения объема статьи. Отметим, что в данном алгоритме традиционные для эволюционирующих систем этапы обучения и рабочего функционирования взаимосвязаны между собой и регулируются предложенной системой критериев и условий, обеспечивающих структурное обновление предиктивной модели в онлайн-режиме.

4. Многофакторный анализ потоковых данных с использованием нечетких эволюционирующих систем

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Многофакторный анализ данных — это мощный инструмент статистического мониторинга, способный сжимать исходные данные, уменьшая их размерность таким образом, что наиболее важная информация сохраняется в виде небольшого числа новых переменных, которые намного легче анализировать, чем исходный большой набор данных. Важнейшим методом многофакторного анализа является упомянутый выше метод РСА благодаря его способности обрабатывать многомерные,

зашумленные и сильно коррелированные данные путем проецирования исходного пространства измерений.

Математическую основу РСА составляет преобразование исходного множества многомерных данных, представленных в виде матрицы наблюдений Х"хт, содержащей п строк-наблюдений х1 е Хт по т столбцов-переменных в каждой строке, в новую матрицу преобразованных переменных:

угДХИ _

(22)

г^шт _ ^пхт

• Гр "

рс

х(т-д

грс - х ■ ррс,

7 = X • Р

'-'гег хгег<»

РСА (ёРСА) и нечеткой эволюционирующей модели (еБТ8).

Организация ёРСА базируется на принципе скользящего окна, в соответствии с которым исходный поток данных (параметров ТПП) х, | ^ е N путем сканирования «скользящим окном» Д£( = (х(_я,х,_и+1,...,х() размера п преобразуется в последовательность матриц наблюдений Х"хт, сформированных из векторов х,_г(г = 1,2,...,и) скользящего окна А5Г Путем применения к матрицам Х"*т процедуры РСА, основанной на формулах (22) и (23), формируются два новых пространства переменных

Ртхт

— матрица нагрузок, являющаяся новым базисом для исходного пространства.

Преобразование (22) можно представить в виде:

' и Ж^с!

р т-д.

(25)

>], (23)

где [р^"1*9 Р^"1^"1-^] — объединенная матрица нагрузок, столбцы которой упорядочены по убыванию собственных значений ковариационной матрицы С0у(ххт).

В объединенной матрице первые q столбцов и оставшиеся (т — q) столбцов образуют соответственно матрицы и Ргег, участвующие в формировании новых пространств переменных:

(24)

где =) Ърс — редуцированное пространство переменных, аппроксимирующее исходное пространство X с Кт; Ъгю — остаточ-

ное пространство.

Несмотря на свою распространенность, традиционный подход на основе РСА сталкивается со значительными ограничениями при его применении к динамическим и нелинейным данным, характерным для описания ТПП. Кроме того, обычный РСА не обладает интерпретационными свойствами, принципиально необходимыми для формирования на их основе моделей знаний. Для устранения этих ограничений предлагается новая гибридная технология нечетко-динамического анализа многомерных данных (е1РСА), свободная от указанных недостатков, основанная на объединении метода динамического

В результате синхронно с входным потоком т-мерных переменных (хг | * е М) образуются два новых потока переменных (грс1 и (гГК!( I е %т~я), из которых особый интерес представляет поток редуцированных q-мерных переменных грс1 е Ъчрс1

Нечетко-динамическая модель е1РСА является вариантом динамического ёРСА, однако применяемого не к исходному потоку данных (х, | ^ е М), описывающему поведение ТПП в пространстве числовых параметров х, е Хт, а к сформированному на основе (6) потоку векторов активаций нечетких правил (р, | £ е М), описывающему динамику ТП в семантическом пространстве системных переменных рг е 3™'. В результате одновременно с двумя ранее рассмотренными потоками данных (хг | х( е Хт) и (р, | р, е формируется новый поток метапараметров (а, | <о, е ), имеющих существенно меньшую размерность, нежели размерности пространств Хт и У*. Логика е1РСА-преобразования представлена композицией отношений-импликаций Р:

' е/ТБ ' " да "

г-^-1 гЧ

о

(26)

Таким образом, е1РСА является вариантом нелинейного РСА-анализа, выполняющим нелинейное преобразование пространства первичных параметров Хт в пространство активаций нечетких правил 0"' эволюционирующей

е1Т8-модели, и последующей редукции полученного пространства активаций в ограниченное множество метапараметров со, е с использованием (25). В реальных приложениях пространство метапараметров О^ содержит одну-две переменные, что упрощает модель принятия решений для системы управления, а для системы ИМ дает возможность на основе визуального анализа человеком-оператором графиков изменения переменных юи выполнять аналитику потоковых данных с целью решения мониторинговых задач.

5. Диагностирование состояний

в системах управления с расширенным контуром аналитики данных

Автоматизация диагностики состояний и нарушений в ходе ТПП является важным шагом проектирования нового класса автоматических систем с расширенным контуром аналитики данных. Одним из важных инструментов решения этих задач является ИМ на основе технологии е1РСА-анализа. Интеллектуальный мониторинг на основе е1РСА выполняется в два этапа: детектирование состояний или нарушений в ходе ТПП, во время которого устанавливаются факты смены состояний или возникновения нарушений в поведении ТПП, и идентификация состояний или нарушений, во время которой устанавливаются классы состояний или первопричины нарушений, после чего предпринимаются действия по нормализации ТПП.

Первый этап ИМ выполняется на основе анализа так называемых диагностических индексов 1М, выполняющих роль критериев принятия решений. Обычно в качестве диагностических индексов выступают квадратичные функции от обобщенных переменных состояния типа Г2-статистики и SPE ^ )-статистики. Для обобщенных переменных со, е (метапараметров ТПП), полученных в результате реализации е№СА, такие функции определяются следующим образом:

SPE{Q)= (/-Р,сР;с)<о,

(27)

При поступлении на вход системной модели «дефектного» вектора параметров х* или паттерна данных, сопровождающих целевое событие (смена состояний, возникновение нарушений, появление аномалий и т. п.), происходит превышение диагностическим индексом Ind (ю/) порогового значения ©. В этом случае логика детектирования целевых событий оказывается чрезвычайно простой:

Ind(ia)>®=> fault.

(28)

Важный класс мониторинговых задач составляют задачи, связанные с обнаружением противоречивой информации или аномальных событий во входном потоке данных, вызванных рассинхронизацией источников первичной информации, нарушениями коррелиро-ванности или иных структурных отношений в данных, получаемых от нескольких разных источников первичной информации. Для такого рода задач в качестве диагностического критерия предлагается использовать новый тип диагностического индекса — статистику у:

У-"

Srt

100%,

(29)

где I— нечетко-динамическое PCA-преобра-зование.

где е — вектор собственных значений матрицы факторных нагрузок; етах — наибольшее собственное значение.

Выбор выражения (29) в качестве диагностического индекса обусловлен следующими соображениями.

В процессе реализации е!РСА при возникновении вышеописанных нарушений возникает рассогласованность или колебательная динамика активаций нечетких правил в динамической БЗ еЯ^-модели, сопровождающая переходный процесс смены состояний ТПП. Рассогласование данных в окне анализа (матрице наблюдений) X/""" (см. формулу (26)) неминуемо сказывается на параметрах окна анализа и, в частности, на собственных значениях матрицы факторных нагрузок Р тхт, играющей основную роль в формировании нового пространства системных переменных. При этом изменение коррелированности данных проявляется в изменении отношения величины дисперсии главной компоненты к дисперсиям

остальных компонент, что неминуемо приводит к выходу значения критерия у за пределы

контрольного диапазона

1 ^ 1 '

где у

и о — первый и второй моменты у-статистики соответственно. Логика детектирования нарушений на основе у-статистики имеет вид:

' 1 Л ( 1 ^

у(^)>у*+-ст V у(^)<у*—а =>/аиН. (30) . 2 I \ 2 у

Идентификация типа нарушения или связанного с ним нештатного состояния выполняется на основе анализа обратного преобразования Г_1, логика которого представлена выражением:

0>тМю ' Ф ' Г е/гс 1

/г"1: Ый(со() => (о1 о «>г=>Рг о

. (31)

где М обозначает матрицу квадратичного преобразования Г2-статистики или SPE (Q )-статистики. Для у-статистики матрица М заменяется квадратичной разностью между у ^) и нижней либо верхней границей контрольно-

го интервала

1

1

УГ+2°

в зависимости от

уменьшения либо увеличения критерия у; Ф — обратное преобразование, обеспечивающее переход от вектора метапараметров к вектору активации.

Алгоритм идентификации нарушений базируется на подходе, основанном на методе анализа вкладов [26].

6. Постобработка мониторинговых данных

В данном разделе исследуется применение новой технологии ИМ для решения одной из задач, касающейся постобработки мониторинговых данных. Целью анализа является выявление противоречивой информации в данных мониторинга о ТПП и установление причин имеющихся несоответствий.

Входной информацией для ИМ являются данные, получаемые от системы контроля

и подготовки информации (СКПИ), разработанной в рамках проекта ЦЖС. Система СКПИ ПВЛ РВ предназначена для сбора первичной информации о ходе ТПП, получаемой от датчиков фиксации прохода осей и устройств технического зрения, которые в дальнейшем объединяются с данными, полученными от информационных систем верхнего уровня — АСУ СТ, КСАУ СП, ППСС и др. [27]. Объединенные данные могут содержать расхождения и противоречивые сведения о ходе ТПП, поскольку информация о местоположении подвижных единиц и технологических операциях, на основе которой формируются показатели работы станции, заносится в АСУ СТ методом ручного ввода. Между тем данные, полученные от СКПИ и также используемые для формирования показателей работы станции, представляют объективную информацию «от колеса», которая может не совпадать с данными ручного ввода. Данная проблема была подробно рассмотрена в работе [27]. В указанной статье для установления расхождений в данных «от колеса» с данными, полученными от АСУ СТ, была сформирована таблица показателей работы станции (см. табл. 4 в [27]) и проанализированы данные, полученные от СКПИ, с данными, полученными от АСУ СТ. В качестве показателей работы станции были выбраны основные ее параметры, такие как вагонооборот, простои вагонов, объемы рабочих парков с переработкой и без переработки и др. Авторами было установлено, что наибольшие отклонения выявляются в показателе «Простой вагонов без переработки» (на величину от одного до двух часов). С целью углубленного анализа причин расхождения были проверены конкретные случаи прибытия, перемещения и отправки вагонов. Анализ показал, что основным источником несоответствий является время фиксации прибытия вагона на станцию. Согласно утвержденному техпроцессу работы станции это время регистрируется и передается в АСУ СТ по факту прибытия вагона в парк отправления. Между тем любой транзитный состав неизбежно входит на станцию через парк прибытия и по различным причинам может там задержаться до перемещения в парк отправления (см. рис. 4 в [27]). Это приводит к тому, что реальное время нахождения (простоя)

транзитного вагона на станции оказывается большим по сравнению с тем временем, которое было зафиксировано в АСУ СТ.

С целью автоматизации процесса выявления несоответствий в данных о показателях работы станции и объяснения возможных расхождений целесообразно обратиться к технологии нечетко-динамического РСА-анализа.

6.1. Построение нечеткой модели и режимы мониторинга

Рассмотрим симуляцию вышеописанного сценария с использованием модели еЯБ на основе РСА. Для построения еЛ^-модели введем ряд системных переменных, сопоставленных с параметрами исследуемого ТПП.

Обозначим В1 переменную, характеризующую показатель интенсивности (плотности) вагонопотока. Значение переменной d(t) е В/ характеризует среднее число вагонов, проследовавших через /-ю счетную точку к текущему моменту времени t.

В рассматриваемой модели переменная В / имеет две разновидности Вп и Вои, характеризующие соответственно интенсивности ваго-нопотоков, прошедших через счетные точки на входе и выходе станции. Также введем дополнительно две системные переменные Т и характеризующие соответственно среднее время обработки вагона на станции и средний объем рабочего парка вагонов, вычисленные к текущему дискретному отсчету времени t. Введенные системные переменные образуют пространство первичных параметров ТПП А« ' А>и( -Т, из которых формируется поток данных мониторинга в виде временной последовательности:

^М). (32)

Нечеткие правила в БЗ еЯБ-модели оперируют приблизительными оценками параметров ТПП, представленными в виде лингвистических (нечетких) переменных. В качестве лингвистических значений системной переменной В1 выступают нечеткие термы — малая (интенсивность), М—средняя и В — большая. Для переменной Ж в качестве лингвистических значений выступают нечеткие термы Ь — незначительная (загрузка парка) и Н — высокая.

Для переменной Т в качестве лингвистических значений выступают нечеткие термы St — малое (время простоя), Mt — стандартное и С — критическое. Системная переменная В определена на шкале В = [25;3000] ваг./ч, переменная Ж — на шкале Ж = [1500; 5000] ваг, а переменная Т — на шкале Т = [1,5; 4,5] ч.

Примечание. Диапазоны изменения указанных параметров получены из баз данных, собранных на станции Челябинск-Главный в период с 06.01.2024 по 29.06.2024. Данные относятся к транзитным поездам, следующим по станции без обработки.

Нечеткие правила в БЗ еЛ^-модели описывают связь между лингвистическими параметрами ТПП, числовые значения которых указаны в векторе р„ и теми состояниями ТПП, которые, по мнению экспертов, соответствуют данным параметрам. Сортировочная станция может работать в трех основных режимах, соответствующих нормальному, критическому и нештатному состоянию ТПП. Нормальный режим характеризуется своевременным выполнением технологических операций при отсутствии простоев вагонов; критический режим при тех же условиях характеризуется увеличением вагонного парка; нештатное состояние характеризуется существенным увеличением вагонного парка и времени переработки вагонов. В зависимости от состояний ТПП решаются разные задачи по управлению СС. Наиболее сложным является управление в нештатных состояниях, поэтому мониторинг ТПП, протекающих на СС, с целью обнаружения нештатных состояний и их предвестников исключительно важен для принятия превентивных решений. Проводимые эксперименты были направлены на оценку эффективности решения данных задач.

Одно из очевидных правил, определяющих оптимальное состояние ТПП, заключается в том, что при малой загрузке парков и малом времени простоя вагонов выходной вагоно-поток ВоШ ведет себя практически синхронно с входным потоком Вп. Причем синхронность проявляется с временным лагом т, соответствующим времени задержки (обработки) вагона на станции. На рис. 1 приведены реальные графики изменения интенсивности вагонопо-токов на входе-выходе станции в различных режимах ее работы.

Рис. 1. Графики изменения интенсивности вагонопотоков на входе-выходе станции

в различных режимах ее работы

Для решения поставленной задачи, касающейся постобработки мониторинговых данных с целью выявления в них противоречивых данных, сформируем базу знаний еГГ8, описывающую нормальный режимы работы станции. Как было отмечено, нормальное состояние ТПП характеризуется синхронностью вагонопотоков на входе и выходе станции. Условие приблизительной синхронности выражается следующим образом:

(33)

Данному условию соотвествует следующая система нечетких условий, сформированная с использованием нечетко-лигнгвистических значений S, М и В системной переменной В¡:

'(Д-ДО^АЖ^Дг + т) = ,!?);

< (Д.„(0 = М)АКВ(ЯоиД* + т) = М); (34)

где 5, М и В — нечеткие термы системной переменной В ¡.

С учетом (34) нормальный режим работы станции, который обозначим Ыг, описывается

следующей системой нечетких правил, положенных в основу БЗ efTS-модели:

rRx :IF(W=Ins)AND{T = St)AND(Din(t)=B)

AND{DBUt (t + x) = B)^Nr, R2:IF(W=Ins)AND(T = St)AND(Dln(t) = M) I AND(Dout(t + x) = M)^Nr; (35)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

R3:IF(W = Ins) AND (T = St) AND (D* (t)=B) AND(Dout(t + x) = B)^Nr,

где R1, R2, R3 — нечеткие правила определения режимов работы станции.

Статистический мониторинг выполняется в двух режимах: онлайн и офлайн.

В режиме онлайн статистический анализ данных производится путем измерения переменных состояния ТПП по мере их поступления на вход системной модели через равные промежутки времени с использованием метода «скользящего окна». «Скользящее окно», представленное в виде матрицы наблюдений, перемещается по потоку данных путем сдвига вправо на один временной такт. В каждом фиксированном положении окна осуществляется статистический анализ содержащихся в нем данных с использованием PCA. Результатами

PCA-анализа данных в «скользящем окне» являются матрица факторных нагрузок, новые системные переменные состояний ТПП и вектор собственных значений, содержащий величины дисперсий для новых переменных.

Принципиальное отличие нечетко-динамического PCA, реализуемого с использованием efTS-модели, от выше рассмотренного PCA на основе «скользящего окна» состоит в первоначальном отображении исходного пространства числовых параметров ТПП в новое линеаризующее пространство с помощью нечетких правил БЗ efTS. В результате «движущееся» окно, состоящее из числовых параметров ТПП, преобразуется в новое окно интерпретируемых системных переменных, состоящее из активаций нечетких правил. Далее к новому окну системных переменных применяется процедура PCA-анализа.

В режиме офлайн осуществляется постобработка заранее собранных данных путем симуляции вышеописанного процесса онлайн-мониторинга с использованием efTS-модели, база знаний которой сформирована для различных состояний ТПП в зависимости от решаемой задачи. В нашем случае БЗ efTS описывает нормальный режим работы станции.

6.2. Постобработка данных мониторинга

Постобработка данных выполняется в режиме офлайн в два этапа путем симуляции процесса онлайн-мониторинга с использованием efTS-модели. На предварительном этапе формируется база знаний efTS-модели с использованием обучающих данных, относящихся к нормальному режиму работы станции. В процессе обучения, выполняемого путем перемещения «скользящего окна» по массиву обучающих данных, для каждого нового положения окна анализа вычисляются его параметры: вектор новых системных переменных w(t), вектор собственных значений e(t), а также значения диагностических критериев T1 и Q. Значения параметров окна анализа являются случайными величинами, для которых формируются соответствующие статистики в виде средних значений параметров окна m (t) и интервалов их разброса о (t). В соответствии с правилом «трех сигм» (3-sigma rule, 3о) вы-

числяются пороговые значения для диагностических критериев, на основе которых в процессе мониторинга выявляются различного рода нарушения в ходе ТПП, нештатные состояния и аномалии, включая несогласованности в данных мониторинга. На этом предварительный этап заканчивается.

Основной этап постобработки данных выполняется путем симуляции онлайн-мониторинга применительно к предварительно собранным и упорядоченным во времени данным, образующим псевдопоток, имитирующий течение реального ТПП:

U\={vt,ct)\vteDin-D0Ut-W-T-с, е С; t € N,

где р(0 = (din(t), dout(t), W{t), Г(0) - вектор числовых параметров, характеризующих текущие значения переменных состояния ТПП; ct — значение целевой переменной C, в качестве которой выступает индекс состояния процесса, характеризующий три основных режима работы станции ct е {Nr,Cr,An}.

В процессе симуляции онлайн-мониторинга текущие параметры окна анализа сравниваются с соответствующими пороговыми значениями статистик, вычисленными на предварительном этапе мониторинга для оптимального режима работы станции. При превышении хотя бы одной из статистик ее порогового значения принимается гипотеза о возникновении в ТПП нештатной ситуации или нарушения, или детектируется факт несогласованности в данных мониторинга.

Для выявления несогласованности в данных мониторинга обратимся к ранее рассмотренному сценарию, объясняющему расхождение в данных мониторинга из-за неверной фиксации времени прибытия транзитного вагона на станцию. Как было показано, в описанной ситуации транзитный состав, прибывший на станцию во время t, задерживается в парке приема и не выйдет со станции через ожидаемый интервал времени т. В этом случае, очевидно, нарушается синхронность ваго-нопотоков на входе и выходе станции, соответствующая нормальному режиму, условия которого описаны системой нечетких правил (32). Нарушение синхронности вагонопотоков

приводит к уменьшению и «рассогласованности» истинностных значений (активаций) нечетких правил, описывающих оптимальный режим. Рассогласование данных в окне анализа приводит к нарушению их коррелированности, что неминуемо сказывается на параметрах окна анализа и, в частности, на собственных значениях вектора е ^). При этом снижение корре-лированности данных проявляется в уменьшении величины дисперсии главной компоненты по отношению к остальным системным переменным. Поэтому в качестве статистики для выявления несоответствий в данных мониторинга выбрана величина:

у = ,

Ял

где е — вектор собственных значений;

етах — наибольшее собственное значение.

В нормальном режиме статистика у^) варьируется возле значений, близких к у^) ~ 0,997, что означает согласованность данных мониторинга. При появлении несогласованности в данных, полученных от СКПИ и АСУ СТ, значения критерия у^) снижаются до величины у^) < 0,9 (нижний предел интервала в правиле 3 а).

7. Экспериментальное исследование

Процесс мониторинга проиллюстрируем на примере реальных данных, полученных от СКПИ и АСУ СТ, часть из которых содержит противоречивую информацию. На рис. 2 приведен фрагмент реального сценария развития поездной обстановки, представленный в виде двух графиков вагонопотоков на входе (синий цвет) и выходе (красный цвет) станции, содержащий переход между оптимальным и утяжеленным режимом работы станции, который спровоцировал разногласие в данных мониторинга. Здесь на интервале Д^ наблюдается оптимальное развитие процесса, которому соответствует синхронная динамика вагонопо-токов на входе и выходе станции. Интервал Д^2 соответствует критическому режиму, когда при нарастании входного потока интенсивность выходного потока снижается и ее рост прекращается, что приводит к рассогласованию графиков.

На рис. 3а представлено окно анализа, содержащее значения первичных параметров ТПП, измеренные на интервале нормального развития ТПП Д^. Здесь же на рис. 3б показано преобразованное окно первичных параметров в новое окно системных переменных в пространстве активаций нечетких правил

Рис. 2. Динамика изменения вагонопотоков на входе-выходе сортировочной станции Челябинск-Главный в период с 01.05.2024 по 11.05.2024

В

б

а

Рис. 3. Скользящее окно анализа, содержащее 10 наблюдений на интервале АС1, соответствующих нормальному состоянию ТПП.

Данные собраны на станции Челябинск-Главный в период с 04.05.2024 по 11.05.2024

с использованием БЗ еЛБ-модели, а на рис. 3в приведен вектор собственных значений е, содержащий величины дисперсий новых переменных.

По мере перемещения окна анализа по данным мониторинга изменяются его параметры. На рис. 4а представлено окно анализа, содержащее значения первичных параметров ТПП, измеренных на стыке интервалов АtI и А^, соответствующим переходному режиму работы станции от нормального к нагруженному. Справа на рис. 4б показано преобразованное окно анализа, состоящее из активаций нечетких правил, сформированное на стыке интервалов А^ и Аt2. Здесь же для данного окна на рис. 4в приведен вектор собственных значений, показывающий разброс новых системных переменных.

На основе векторов собственных значений е^ и е(2 вычисляются статистические критерии и у^2):

/ ч 0,1861 1

гЫ=

0,1861 + 0

0,0981 0,0981 + 0,0129

= 0,88.

Значение критерия у(?2) < 0,95 сигнализирует о нарушении либо о наличии разногласий в данных мониторинга, появившихся в момент

времени t, когда график статистики у ^) опустился ниже значения 0,95.

Таким образом, результаты постобработки, полученные путем симуляции онлайн-мониторинга данных, иллюстрация которых приведена на рис. 3, подтвердили наличие нарушения либо содержащейся в данных мониторинга противоречивой информации. Для идентификации аномалии необходим анализ результатов мониторинга, приведенный ниже.

Данные матрицы наблюдений, содержащей активации нечетких правил для переходного состояния (рис. 4б), показывают, что, начиная с наблюдения (0,45; 0,5 0,0), выделенного красным цветом, значения активаций цЙ2 нечеткого правила R2 перестают возрастать и начинают снижаться, что вызвало снижение коррелированности данных и привело к нарушению статистики у^ 2) = 0,88 < 0,95. Обратное преобразование вектора активаций (0,45; 0,5; 0,0) в исходный вектор первичных параметров (2 500; 2 320; 2580; 3,1) показывает существенное увеличение времени обработки вагонов с предыдущего значения t = 2,3 ч до текущего значения t = 3,1 ч и снижение роста интенсивности выходного потока с предыдущего значения АВоШ = 2280—2075 до текущего значения АВоШ = 2280—2075. Такая динамика изменения параметров однозначно означает смену состояний ТПП. Между тем данные о параметрах

1.1 Эе+03 * £>ш

1 .5100 1 .4900 2 .5900

1 .7200 1 .7150 2 .6000

1 .9400 1 .9050 2 .5950

2 .1000 2 .0750 2 .6100

2 .2950 2 .2800 2 .6200

2 .5000 Гз20<Г) 2 .5800

2 . 6500 2 .3500 2 .6250

2 .8200 2 .3800 2 .6250

3 .0000 2 .4500 2 .6350

3 .1650 2 .3800 2 .6500

0.0021 0.0022 0.0021 0.0022 0.0023

ГГооз Г

0.0033 0.0038 0.0041 0.0041

О

0.9000 0. .1000

0.8500 0. .1500

0.8000 0. .2000

0.7500 0. .2500

0.5000 0. .5000

<Г[Г4500 0. .500]£>

0.4000 0. .4000

0.3500 0. .3000

0.2500 0. .3500

0.1000 0. .3000

0 0. .2500

= е(/2)

0.0981 0.0129 0

а

б

в

Рис. 4. Преобразованное окно параметров ТПП в окно активаций нечетких правил БЗ efTS на стыке интервалов ДС1 и ДС2 вместе с вектором собственных значений е

ТПП, полученные от АСУ СТ, не указывают на смену состояний, что свидетельствует о несогласованности данных мониторинга, полученных от СКПИ, с данными, полученными от АСУ СТ.

Выводы

В данном исследовании была поставлена задача разработки нового подхода к созданию нового класса автоматизированных систем с расширенным контуром аналитики данных, предназначенных для автоматического управления сложными технологическими процессами, протекающими на железнодорожных станциях. Показано, что традиционные методы, основанные на технологиях имитационного моделирования, не решают поставленную задачу в силу невозможности воспроизведения в реальном ТПП особых состояний, представленных в форме технологических бифуркаций. Последние обусловлены непрерывно изменяющейся поездной обстановкой, сбоями и нарушениями в поведении ТПП, появлением критических состояний и нештатных технологических ситуаций, являющихся наиболее сложными для автоматизации принятия решений.

Для решения обозначенной проблемы предложен новый подход, основанный на концепции эволюционирующего предиктив-ного моделирования с привлечением ги-

бридной технологии нечетко-динамического анализа потоковых данных и инкрементного машинного обучения. Разработанный подход обладает рядом существенных достоинств и преимуществ перед известными классическими методами контроля и управления сложными ТПП:

— инкрементный механизм обучения, заложенный в эволюционирующую модель, обеспечивает синхронизацию поведения системной модели с ходом контролируемого ТПП с учетом актуальной информации о развитии процесса, что обеспечивает возможность решения комплекса контрольно-диагностических и управляющих задач в онлайн-режиме;

— разработанный в рамках предложенного подхода новый класс нечетких эволюционирующих моделей обеспечивает возможность непрерывного извлечения знаний из потока данных для решения задач, связанных с идентификацией и интерпретацией нарушений, описанием причин их возникновения, а также обеспечивает возможность представления результатов работы системы пользователю в виде лингвистических описаний;

— предложенный метод нечетко-динамического многофакторного анализа обеспечивает отображение исходного

пространства числовых параметров ТПП в новое пространство системных переменных, с различной степенью детализации и интерпретируемости описывающих поведение ТПП, что обеспечивает возможность автоматизации решения сложных задач, связанных с детализацией комплексных нарушений и прогнозированием поведения ТПП в точках технологических бифуркаций.

Практическая полезность предложенной технологии проиллюстрирована на примере ее использования для решения одной из задач, касающейся постобработки мониторинговых данных с целью выявления в ней противоречивой информации. Эффективность решения задач постобработки данных была подтверждена на реальных данных, собранных по станции Челябинск-Главный в период с 06.01.2024 по 29.06.2024.

В дальнейшем исследовании предполагается использование технологии ИМ для идентификации различных режимов работы станции и превентивного обнаружения критических состояний ТП в моделях автоматического управления. А

Библиографический список

1. Стоянова Н. В. Основные этапы стратегического развития железнодорожного транспорта // Транспорт: наука, образование, производство («ТРАНС-ПОРТ-2022»). 2022. С. 268-272.

2. Рыков Ю. Г. К вопросу развития гибридного аналитического подхода к моделированию сложных систем, содержащих как слабо структурированные, так и хорошо структурированные подсистемы // Информационные и математические технологии в науке и управлении. 2022. № 4(28). С. 234-247.

3. Кудрявцев Е. GPSS World. Основы имитационного моделирования различных систем. Litres, 2022.

4. Никитин А. Б., Грошев В. А. Автоматизация контроля хода технологического процесса станции в режиме реального времени // Известия Петербургского университета путей сообщения. 2016. № 2(47). С. 229-238.

5. A review of process fault detection and diagnosis: Part I: Quantitative model-based methods / V. Ven-katasubramanian [et al.] // Computers & Chemical Engineering. 2003. Т. 27. No. 3. P. 293-311.

6. A review of data mining technologies in building energy systems: Load prediction, pattern identification, fault detection and diagnosis / Y. Zhao [et al.] // Energy and Built Environment. 2020. T. 1. No. 2. P. 149-164.

7. Large language models for software engineering: A systematic literature review / X. Hou [et al.] // ACM Transactions on Software Engineering and Methodology. 2023.

8. Zheng S. A new unsupervised data mining method based on the stacked autoencoder for chemical process fault diagnostics // Computers & Chemical Engineering. 2020. Vol. 135. P. 106755. Russian.

9. An unsupervised data mining strategy for performance evaluation of ground source heat pump systems / X. Zhou [et al.] // Sustainable Energy Technologies and Assessments. 2021. Vol. 46. P. 01255.

10. Development of the intelligent monitoring system for water parameters / A. A. Bezgin [et al.] // 2020 Wave Electronics and its Application in Information and Telecommunication Systems (WECONF). IEEE, 2020.

11. Kasabov N., Filev D. Evolving intelligent systems: methods, learning, & applications // International symposium on evolving fuzzy systems. IEEE, 2006. P. 8-18.

12. Lughofer E. On-line assurance of interpretability criteria in evolving fuzzy systems — Achievements, new concepts and open issues // Information Sciences. 2013. Vol. 251.

13. Angelov P., Filev D. An approach to online identification of Takagi-Sugeno fuzzy models // IEEE Transactions on Systems, Man and Cybernetics, Part B: Cybernetics. 2004. Vol. 34(1).

14. Leite D., Skrjanc I., Gomide F. An overview on evolving systems and learning from stream data. URL: https:// doi.org/10.1007/s12530-020-09334-5

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

15. Incremental Structure-Evolving Intelligent Systems with Advanced Interpretational Properties // Kuznetsov S. O., Panov A. I., Yakovlev K. S. (eds) Artificial Intelligence. RCAI 2020. Lecture Notes in Computer Science. Vol. 12412. Springer, Cham.

16. Temporal Prediction Models for Technological Processes Based on Predictive Analytics / Dolgiy A. [et al.] // Lecture Notes in Networks and Systems / eds. S. Kovalev [et al.]. T. 777. LNNS Springer Science and Business Media Deutschland GmbH, 2023. P. 179-194.

17. Abraham W. C., Robins A. Memory retention — the synaptic stability versus plasticity dilemma // Trends in Neurosciences. 2005. Vol. 28(2). P. 73-78.

18. Lazar N. Ockham's razor // Wiley Interdisciplinary Reviews: Computational Statistics. 2010. T. 2. No. 2. P. 243-246.

19. Angelov P., Filev D. On-line design of Takagi-Sugeno models // International fuzzy systems association world congress. Berlin, Heidelberg: Springer Berlin Heidelberg, 2003. P. 576-584.

20. Chiu S. Fuzzy Model Identification Based on Cluster Estimation // Journal of Intelligent and Fuzzy Systems. 1994. Vol. 2(3). P. 267-278.

21. Пологов В. В. Комплексирование метода субтрак-тивной кластеризации и метода K-средних для сегментации изображений // Лучший исследовательский проект. 2020. С. 180-187.

22. Долгий А. И., Ковалев С. М., Колоденкова А. Е. Нечетко-динамический метод анализа главных компонент в системах интеллектуального мониторинга // 21-я Национальная конференция по искусственному интеллекту с международным участием (КИИ-2023): труды конференции (Смоленск, 16-20 октября 2023 года): в 2 т. Смоленск: Принт-Экспресс, 2023. С. 66-76.

23. Долгий А. И., Ковалев С. М., Колоденкова А. Е. Интерпретируемость и дизайн нечетких интерпре-

тируемых систем // Гибридные и синергетические интеллектуальные системы. 2022. С. 359-364.

24. Долгий А. И., Колоденкова А. Е., Ковалев С. М. Интерпретируемая модель классификатора на основе нечеткой логистической регрессии // Интегрированные модели и мягкие вычисления в искусственном интеллекте: сборник научных трудов XI Международной научно-практической конференции (ИММВ-2022, Коломна, 16-19 мая 2022 г.): в 2 т. М.: РАИИ, 2022. Т. 1. С. 53-60.

25. Angelov P., Zhou X. Evolving fuzzy systems from data streams in real-time // 2006 International Symposium on Evolving Fuzzy Systems. P. 29-35.

26. Hallgrimsson A. D., Niemann H. H., Lind M. Improved process diagnosis using fault contribution plots from sparse autoencoders // IFAC-PapersOnLine. 2020. Т. 53. No. 2. P. 730-737.

27. Формирование объективных показателей грузовой станции на основе данных «от колеса» / А. Е. Хатламаджиян [и др.] // Автоматика на транспорте. 2024. Т. 10, № 3. С. 254-268.

TRANSPORT AUTOMATION RESEARCH. 2024. Vol. 10, no. 4. P. 337-359 DOI: 10.20295/2412-9186-2024-10-04-337-359

Automatic transportation process control systems with an extended data analytics circuit

Information about authors

Dolgiy A. I., PhD in Engineering, General Director1. E-mail: [email protected] Kovalev S. M., Doctor in Engineering, Professor, Scientific Director2. E-mail: [email protected]

1 JSC "NIIAS", Moscow

2 JSC "NIIAS", Rostov Branch, Rostov-on-Don

Abstract: A new hybrid approach has been proposed to automate the management of complex technological processes at railway stations of industrial transport using intelligent monitoring technologies. This approach is based on the concept of predictive modeling combined with methods of statistical analysis, including a modification of the principal components analysis method for multivariate statistical analysis and the identification of violations in technological processes using a combination of well-known methods such as contribution analysis and fuzzy dynamic analysis. The principal feature of the hybrid approach is mapping the initial space of numerical parameters of the technological process onto a new space formed by fuzzy rules of an evolving system model. Applying multivariate analysis to new system variables using the principal component method allows for the formation of a few intermediate variables with different degrees of granularity and interpret-ability, describing the behavior of the controlled process, which makes it possible to develop mathematical models and algorithms for solving various monitoring tasks. An example of using this approach for post-processing monitoring data to identify performance discrepancies in a marshalling yard and anomalies in the controlled process is considered.

Keywords: intelligent monitoring, evolving modeling, principal component

method, fuzzy dynamic model, technological processes in railway transport.

References

1. Stoyanova N. V. Osnovnye etapy strategicheskogo razvitiya zheleznodorozh-nogo transporta // Transport: nauka, obrazovanie, proizvodstvo («TRANS-PORT-2022»). 2022. S. 268-272. (In Russian)

2. Rykov Yu. G. K voprosu razvitiya gibridnogo analiticheskogo podhoda k mo-delirovaniyu slozhnyh sistem, soderzhashchih kak slabo strukturirovannye, tak i horosho strukturirovannye podsistemy // Informacionnye i matematicheskie tekhnologii v nauke i upravlenii. 2022. No. 4(28). S. 234-247. (In Russian)

3. Kudryavcev E. GPSS World. Osnovy imitacionnogo modelirovaniya razlichnyh sistem. Litres, 2022. (In Russian)

4. Nikitin A. B., Groshev V. A. Avtomatizaciya kontrolya hoda tekhnologichesko-go processa stancii v rezhime real'nogo vremeni // Izvestiya Peterburgskogo universiteta putej soobshcheniya. 2016. No. 2(47). S. 229-238. (In Russian)

5. A review of process fault detection and diagnosis: Part I: Quantitative modelbased methods / V. Venkatasubramanian [et al.] // Computers & Chemical Engineering. 2003. T. 27. No. 3. P. 293-311.

6. A review of data mining technologies in building energy systems: Load prediction, pattern identification, fault detection and diagnosis / Y. Zhao [et al.] // Energy and Built Environment. 2020. T. 1. No. 2. P. 149-164.

7. Large language models for software engineering: A systematic literature review / X. Hou [et al.] // ACM Transactions on Software Engineering and Methodology. 2023.

8. Zheng S. A new unsupervised data mining method based on the stacked autoencoder for chemical process fault diagnostics // Computers & Chemical Engineering. 2020. Vol. 135. P. 106755. Russian.

9. An unsupervised data mining strategy for performance evaluation of ground source heat pump systems / X. Zhou [et al.] // Sustainable Energy Technologies and Assessments. 2021. Vol. 46. P. 01255.

10. Development of the intelligent monitoring system for water parameters / A. A. Bezgin [et al.] // 2020 Wave Electronics and its Application in Information and Telecommunication Systems (WECONF). IEEE, 2020.

11. Kasabov N., Filev D. Evolving intelligent systems: methods, learning, & applications // International symposium on evolving fuzzy systems. IEEE, 2006. P. 8-18.

12. Lughofer E. On-line assurance of interpretability criteria in evolving fuzzy systems — Achievements, new concepts and open issues // Information Sciences. 2013. Vol. 251.

13. Angelov P., Filev D. An approach to online identification of Takagi-Sugeno fuzzy models // IEEE Transactions on Systems, Man and Cybernetics, Part B: Cybernetics. 2004. Vol. 34(1).

14. Leite D., Skrjanc I., Gomide F. An overview on evolving systems and learning from stream data. URL: https://doi.org/10.1007/s12530-020-09334-5

15. Incremental Structure-Evolving Intelligent Systems with Advanced Interpretatio-nal Properties / Kuznetsov S. O., Panov A. I., Yakovlev K. S. (eds) Artificial Intelligence. RCAI 2020. Lecture Notes in Computer Science. Vol. 12412. Springer, Cham.

16. Temporal Prediction Models for Technological Processes Based on Predictive Analytics / Dolgiy A. [et al.] // Lecture Notes in Networks and Systems / eds. S. Kovalev [et al.]. T. 777. LNNS Springer Science and Business Media Deutschland GmbH, 2023. P. 179-194.

17. Abraham W. C., Robins A. Memory retention — the synaptic stability versus plasticity dilemma // Trends in Neurosciences. 2005. Vol. 28(2). P. 73-78.

18. Lazar N. Ockham's razor // Wiley Interdisciplinary Reviews: Computational Statistics. 2010. T. 2. No. 2. P. 243-246.

19. Angelov P., Filev D. On-line design of Takagi-Sugeno models // International fuzzy systems association world congress. Berlin, Heidelberg: Springer Berlin Heidelberg, 2003. P. 576-584.

20. Chiu S. Fuzzy Model Identification Based on Cluster Estimation // Journal of Intelligent and Fuzzy Systems. 1994. Vol. 2(3). P. 267-278.

21. Pologov V. V. Kompleksirovanie metoda subtraktivnoj klasterizacii i metoda K-srednih dlya segmentacii izobrazhenij // Luchshij issledovatel'skij proekt. 2020. S. 180-187. (In Russian)

22. Dolgij A. I., Kovalev S. M., Kolodenkova A. E. Nechetko-dinamicheskij metod analiza glavnyh komponent v sistemah intellektual'nogo monitoringa // 21-ya Nacional'naya konferenciya po iskusstvennomu intellektu s mezhdunarodnym uchastiem (KII-2023): trudy konferencii (Smolensk, 16-20 oktyabrya 2023 goda): v 2 t. Smolensk: Print-Ekspress, 2023. S. 66-76. (In Russian)

23. Dolgij A. I., Kovalev S. M., Kolodenkova A. E. Interpretiruemost' i dizajn ne-chetkih interpretiruemyh sistem // Gibridnye i sinergeticheskie intellektual'nye sistemy. 2022. S. 359-364. (In Russian)

24. Dolgij A.I., Kolodenkova A. E., Kovalev S. M. Interpretiruemaya model' klassifikatora na osnove nechetkoj logisticheskoj regressii // Integriro-vannye modeli i myagkie vychisleniya v iskusstvennom intellekte: sbornik nauchnyh trudov XI Mezhdunarodnoj nauchno-prakticheskoj konferencii (IMMV-2022, Kolomna, 16-19 maya 2022 g.): v 2 t. M.: RAII, 2022. T. 1. S. 53-60. (In Russian)

25. Angelov P, Zhou X. Evolving fuzzy systems from data streams in real-time // 2006 International Symposium on Evolving Fuzzy Systems. P. 29-35.

26. Hallgrimsson A. D., Niemann H. H., Lind M. Improved process diagnosis using fault contribution plots from sparse autoencoders // IFAC-PapersOnLine. 2020. T. 53. No. 2. P. 730-737.

27. Formirovanie ob"ektivnyh pokazatelej gruzovoj stancii na osnove dannyh "ot kolesa" / A. E. Hatlamadzhiyan [i dr.] // Avtomatika na transporte. 2024. T. 10, no. 3. S. 254-268. (In Russian)

i Надоели баннеры? Вы всегда можете отключить рекламу.