Culish Olga Aleksandrovna - Branch of the Military Academy of Communications, Krasnodar; e-mail: [email protected]; 4, Krasin street, Krasnodar, 350035, Russia; phone: +79615213577; the department of cryptographic systems for information protection and mathematical foundations of cryptology; senior lecturer; cand. of phis.-math. sc.; associate professor.
Khisamov Frangiz Gilfanetdinovich - Branch of the Military Academy of Communications, Krasnodar; e-mail: [email protected]; phone: +78612523031; the department of special communications; dr. of eng. sc.; professor.
УДК 621.03
А.Н. Шабельников
ИНТЕЛЛЕКТУАЛЬНЫЙ ПРЕПРОЦЕССИНГ ТЕМПОРАЛЬНЫХ ДАННЫХ В СИСТЕМАХ ЖЕЛЕЗНОДОРОЖНОЙ АВТОМАТИЗАЦИИ*
Разрабатывается новая гибридная технология интеллектуального препроцессрнга темпоральных данных на основе гибридных нейро-нечетко-стохастических моделей. Предлагаемые методы базируются на идеи интеграции нечетких технологических знаний в модель порождения первичной информации. Разрабатывается модель, имитирующая процессы порождения первичных данных на выходе системы сбора информации. Первичная обработка информации основывается на объединении традиционных аналитических моделей и интеллектуальных моделей, базирующихся на знаниях о технологическом процессе. Аналитическая модель строится путем идентификации нелинейной динамической системы.
Интеллектуальный препроцессинг; нейронечеткая система; гибридная модель; нечеткая динамическая система; стохастическая модель.
А-N. Shabelnikov
INTELLECTUAL PREPROCESSING TEMPORAL OF DATA IN SYSTEMS
RAILWAY
A new hybrid technology is developed in the article. The technology provides a new way of temporal data intellectual preprocessing based on hybrid neural-fuzzy-stochastic models. Proposed methods are based on the notion of integration of fuzzy technological knowledge into the model of original information generation. The model simulating processes of generation of primary data on an exit of system of gathering of the information is developed. The information preprocessing is based on association of traditional analytical models and the intellectual models which are based on knowledge of technological process. The analytical model is under construction by identification of nonlinear dynamic system.
Intellectual preprocessing; neural-fuzzy system; hybrid model; fuzzy dynamical system; stochastic model.
Введение. Современные системы железнодорожной автоматизации, являясь высоко интегрированными системами распределенного типа, должны обладать не только развитыми средствами сбора первичной информации (ССПИ), рассредоточенными на объекте автоматизации, но и эффективными средствами ее первичной обработки. Причем, в связи с возрастающими требованиями к надежности и безопасности создаваемых систем, предобработка информации должна сводится не только к очистке “сырых” данных от различного рода помех, шумов и искажений, но также к их корректировке, частичному или полному восстановлению данных в базах данных (БД) в случаях возникновения существенных искажений или потери
* Работа выполнена при поддержке РФФИ (проекты №№10-01-00058, 10-07-00158, 11-07-00075.
фрагментов информации на выходе СПИ. Один из подходов к решению этой проблемы заключается в построении модели, имитирующей процессы порождения первичных данных на выходе ССПИ, и на основе этой модели корректировка первичной информации или ее восстановление в БД. Первичная обработка информации на основе объединения традиционных аналитических моделей препроцессинга и интеллектуальных моделей, базирующихся на знаниях о характере технологических процессов, порождающих первичную информацию, называется интеллектуальным препроцессингом (ИП).
Модели гибридной системы ИП. Объектом препроцессинга является последовательность данных, полученных путем физических измерений и представленная в виде дискретного временного ряда (ВР):
I = (гк\к = 1,2, ...,п).
Для простоты будем считать ВР одномерным, то есть элементы Є й.
Предполагается, что значения 2^ получены в результате взаимодействия трех типов процессов, включая, физические и шумовые процессы, протекающие непосредственно в аппаратуре ССПС и окружающей среде, и технологические процессы, протекающие на ОА. Для реализации интеллектуального препроцессин-га необходимо располагать всеми тремя типами моделей.
В качестве базовой выберем модель технологического процесса, инициирующего появление первичной информации на выходе ССПИ, и заявим ее в форме нечеткой динамической системы (НДС) типа Сугено, представленной набором нечетких правил вида:
если xk _1 = МАЛОЕ, то Ьжк = а ■ xk _1,
ЕСЛИ xk_1 = СРЕДНЕЕ , ТО Дxk = ~2 ■ xk_1,
ЕСЛИ xk_1 = БОЛЬШОЕ , ТО Дxk = а ■ xk_1. (1)
В левых частях правил через обозначены обобщенные фазовые переменные, интерпретируемые в качестве параметров технологических событий, инициирующих появление данных на выходе ССПИ. В правых частях правил указаны приращения переменных за один такт временного моделирования, вычисляемые путем умножения значений фазовых переменных на нечеткие числовые коэффициенты й^. Путем известных преобразований на основе схем нечеткого вывода НДС приводится к аналитическому представлению в виде нечеткого отображения:
Р: хк ^ хк+1. (2)
Выбор НДС в качестве модели технологического процесса обусловлен следующими соображениями. Во-первых, нечеткое отображение как конечное аналитическое представление НДС, являющееся обобщением нелинейного дискретного отображения, представляет собой универсальную модель для широкого круга дискретных временных процессов и ВР, включая псевдо-хаотические процессы. Во-вторых, модель технологического процесса в виде НДС допускает естественную интеграцию в нее нечетких экспертных знаний о технологических особенностях процессов, порождающих первичную информацию. В третьих, представление НДС в виде модели Сугено имеет ряд известных достоинств: универсальная аппроксимация данных, возможность параметрической и структурной адаптации, возможность обучения на основе экспериментальных данных.
Модель измерительной системы представляется функциональным отображением 5: Е ^ X, выраженным через аналитическую зависимость:
г = 5(х). (3)
Зависимость (3) описывает логику преобразования скрытых от наблюдения
внутренних состояний системы Xк в наблюдаемые состояния Z]c в любой ^й момент времени и строится на основе известных физико-математических законов, описывающих работу аппаратуры ССПИ.
Модель шумовых процессов в измерителе представляются многозначным отображением 5: 2 ^ 2^ и строится на основе законов плотности распределения вероятностей. Для Гауссового распределения эта модель имеет вид:
5: 7*7* = Р№к) =1=ех?- , (4)
где гк - наблюдаемое значение, - зашумленное наблюдаемое значение; тЕ -
математическое ожидание, - дисперсия.
Выражение (4) допускает несколько отличающуюся от обще принятых интерпретаций в качестве распределения оценок условных возможностей. А именно, для любых значений гк и величина Р(гк |г^ имеет смысл оценки возможно-
сти трансформации значения 2^ в значение при воздействии шума 5.
Гибридная композиционная система ИП. На основе приведенных выше моделей можно построить цепочку преобразований, описывающих процесс трансформации наблюдаемого значения ВР гк в значение гк+1 для произвольного момента времени k в предположении, что структура и параметры НДС Р, измерительной системы Б и шумового процесса 5 являются известными [1]. Каждый акт в цепи преобразований представляется отображением одних значений переменных состояния процесса в другие, реализуемым согласно соответствующей модели процесса. Тогда композиция отображений даст результирующее отображение текущего значения гк в множество возможных последующих значений гк+1 с соответствующими оценками этих возможностей. Рассмотрим подробно цепь преобразований, описывающих процесс порождения наблюдаемых состояний гк на заданном временном интервале.
Предположим, что в некоторый момент времени к система Р находится в состоянии Xк, которому соответствовал наблюдаемый сигнал на выходе системы гк (наблюдаемое состояние системы). Зная наблюдаемое значение гк, используя модель наблюдателя г = 5(х), можно на основе обратного отображения 5_1 определить состояние системы в ^й момент времени хк = Б~г(гк). Располагая значением Xк, используя нечеткое отображение Р, описывающее модель НДС, можно определить нечеткое распределение состояний системы в последующий k+1-й момент времени ^р(хк+1). На основе нечеткого распределения ^р(хк+1), используя модель наблюдателя г = Б(х), можно определить нечеткое распределение наблюдаемых состояний системы №р(2к+1) к моменту времени k+1. И, наконец, зная статистические параметры шума измерителя 5, можно определить нечеткостохастическое распределение наблюдаемых состояний системы к (]с+1)-ому моменту времени Р^(гк+1) с учетом шума измерителя. Распределение Р^(гк+1) = Р^-(2к+1)/2к) , фактически, является условным нечетко-стохастическим распределением наблюдаемых состояний НДС к моменту времени k+1 при условии наблюдения в момент k .
Аналитически описанная цепь преобразований представляется в виде композиции соответствующих отображений:
Р^(гк+1)/гк) =Zk *5~1*Р*Б* <5. (5)
Поскольку в исходном ВР Z реально наблюдаемое значение гк+1 известно, то на основе нечетко-стохастического распределения Р^.(гк+1)/гк) путем подстановки в него вместо всех прогнозируемых значений гк+1 разностей между ними и реальным , г^+1 возведенные в квадрат (гк+1 — гк+1) 2, можно определить распределение ошибки предсказания:
РК&Ю = РК(2к+1 4+д 21г’к) .
Просуммировав по всем гк+1, приходим к интегральному выражению:
1 = Ъгк+1егРК2к+1 — 4+1) 2|4+1) , (6)
являющимся критерием качества композиционной модели, на основе которого осуществляется оптимизация ее параметров. Оптимизация параметров НДС является завершающим этапом построения порождающей модели для ИП. Два замечания относительно решения этой оптимизационной задачи.
Во-первых, для ряда частных случаев, строго оптимальное решение данной задачи может быть найдено аналитическим путем. В частности, для переменных состояния системы и наблюдаемых состояний, определенных на непрерывных шкалах, и для треугольных функций принадлежности и плотности вероятности композиционная схема (5), порождающая нечетко-стохастическое распределение Ру.(гк+11гк), преобразуется в интегральную свертку, в которой подинтегральное выражение является полиномом, а, следовательно, интегрируется в аналитическом виде. Будучи поставленным в интегральный критерий мы вновь приходим к аналитически интегрируемому выражению, результатом которого является также полином более высокого порядка. Поиск экстремума полиномиальных функций не является проблемой.
Второе замечание связано с решением более общей задачи дискретного вида, для произвольных зависимостей ФП нечетких термов и плотностей распределения вероятностей. В этом общем случае аналитическое решение задачи получить не представляется возможным и предлагается использовать адаптивную сетевую модель в виде гибридной нейро-нечетко-стохастической системы (ГНСС). Архитектура ГНСС получается в результате отображения выше описанной цепи преобразований в вычислительную структуру.
Описание адаптивной ГНСС. В основу построения адаптивной ГНСС положена композиционная схема (5), представленная в виде композиции двудольных графов (рис. 1).
Р:Хк^Хм
Рис. 1. Графовая модель композиционной схемы (5)
Каждый подграф соответствует определенному типу отображения, реализуемого в гибридной системе. Причем, многозначным по своей природе нечеткостохастическим отображениям соответствуют полно связные двудольные графы с помеченными дугами. Веса дуг характеризуют вероятности или возможности трансформации одних значений переменных в другие. Детерминированным процессам соответствуют однозначные переходы в композиционном графе, характеризующие однозначные функциональные преобразования значений переменной.
Цепочку выше описанных преобразований отобразим в структуру ГНСС (рис. 2). Структура ГНСС идентична структуре последовательной вычислительной сети с прямым распространением сигнала (ґеесіусялуагсі).
Рис. 2. Укрупненная структура ГНСС
В приведенной на рисунке (см. рис. 2) структуре ГНСС каждый слой сети реализует отдельный этап выше описанной цепочки преобразований.
1. Первый элемент реализует преобразование числового значения наблюдаемой переменной zfe в числовое значение состояния системы хк на основе выражения хк = Б~1(гк).
2. Второй, третий и четвертый слои сети реализуют известную схему нечеткого вывода Сугено и преобразует текущее состояние системы хк в нечеткое множество последующих состояний ^(хк+1).
5. Пятый элемент реализует модель измерителя и преобразует нечеткое распределение состояний системы в нечеткое распределение наблюдаемых состояний путем подстановки гк+1 = Б (хк+1).
6. Шестой элемент накладывает на нечеткое распределение наблюдаемых состояний шум 5 с условной плотностью распределения \гк ) и преобразует их в условное нечетко-стохастическое на основе композиции (свертки):
Р^{г1+1\гк+1) = ^{гК+1)оР{г^+1\гк )= | ^{гК+1) • Р{г^+1\гк+1)йгк+1.
4
7. Седьмой элемент сети вычисляет значение нечетко-стохастического критерия вероятностного критерия:
7= X р^(2к+1-4+1) 2|г^+1) ■
2к+1^
В ГНСС основные функции по обучению и адаптации НДС, основанной на методах эволюции [2], возлагаются на второй, третий и четвертый слои сети, реализующие схему нечеткого вывода Сугено. Обучению в ГНВС также могут подлежать и параметры шумовых процессов тЕ , 0Е, т§, Оц .
Экспериментальная оценка результатов. В рамках исследования практической полезности предложенной технологии интеллектуального препроцессинга была проведена серия экспериментов по обработке экспериментальных данных, имитирующих поведение различных временных процессов. В частности, в одном из экспериментов осуществлялась идентификация порождающей модели по ВР, синтезированному на основе логистического отображения хк+1 = хк • щ •(! — хк) со зна-
чениями коэффициента из диапазона [3, 4], к которому был добавлен шум с заданными статистическими параметрами. При таких значениях коэффициента щ с учетом шумовой составляющей ВР максимально приближен к хаотическому процессу. На рис. 3 приведена диаграмма Ламерея для одного из ВР, порожденных данным логистическим отображением.
Рис. 3. Диаграмма Ламерея для логистического отображения
Фрагмент ВР, построенного на основе выше приведенной диаграммы, к которому была добавлена шумовая составляющая, показан на рис. 4 в виде красной линии.
Рис. 4. Фрагменты синтезированного псевдохаотического ВР (красная линия) и восстановленного в результате ИП (синяя линия)
Идентификация порождающей модели осуществлялась на основе обучения адаптивной нейро-нечетко-стохастической сети с использованием алгоритма обратного распространения. В результате обучения была построена НДС, содержащая три нечетких правила Сугено первого порядка, заключения которых представлены прямыми линиями, приведенными ниже на рис. 5, на котором в виде параболы изображена порождающая модель для синтезированного ВР, аппроксимируемая нечеткими правилами.
Рисунок (рис. 5) показывает, что три нечетких правила Сугено первого порядка, с высокой точностью аппроксимируют параболу, порождающую экспериментальный ВР, что подтверждает возможность построения адекватных моделей в виде адаптивных гибридных сетей, порождающих хаотические процессы. Рисунок
(рис. 5) также иллюстрирует практически полное совпадение экспериментальных данных с данными, полученными на основе восстановленной модели на первых 20 отсчетах и качественное совпадение экспериментального хаотического ВР с восстановленным ВР в течение последующих 50 отсчетов.
Рис. 5. Порождающая модель на основе логиситического отображения и прямые линии, представляющие заключения нечетких правил Сугено НДС
Заключение. Представленная в работе новая гибридная технология интеллектуального препроцессрнга темпоральных данных на основе гибридных нейро-нечетко-стохастических моделей обладает рядом достоинств. Во-первых, предлагаемая гибридная модель позволяет естественным образом интегрировать в нее нечеткие экспертные знания о технологии процессов, порождающих первичную информацию. Во-вторых, интеллектуальный препроцессинг первичной информации, осуществляемый с привлечением экспертных технологических знаний, позволяет повысить достоверность обработки информации за счет более точного описания ее источника, а также позволяет восстанавливать частично потерянные первичные данные в БД. В третьих, на основе описанной технологии интеллектуального препроцессинга, позволяющей строить адаптивные модели порождения первичной информации, появляется возможность разработки новых классов моделей извлечения знаний в темпоральных базах данных для широкого круга интеллектуальных и экспертных динамических систем.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Ковалев С.М. Интеллектуальные модели анализа временных рядов на основе нечеткодинамических систем // Труды Международных научно-технических конференций “Интеллектуальные системы” (Д18’06) и “Интеллектуальные САПР” (СДБ-2006). Научное издание в 3-х томах.- М: Физматлит, 2006. - Т. 1.
2. Курейчик В.В., Курейчик В.М., Сороколетов П.В. Анализ и обзор моделей эволюции // Известия РАН. ТиСУ. - 2007. - № 5.
Статью рекомендовал к опубликованию д.т.н., профессор С.М. Ковалев.
Шабельников Александр Николаевич - Ростовский филиал Открытого акционерного общества “Научно-исследовательский и проектно-конструкторский институт информатизации, автоматизации и связи на железнодорожном транспорте”; e-mail: [email protected]; 344032, г. Ростов-на-Дону, Ленина, 44/13; тел.: 88632188877; директор; д.т.н.
Shabelnikov Aleksander Nikolaevich - The Rostov Branch JSC "Research and Development Institute of Information Technologies, Automation and Communication of Railway Transport"; e-mail: shabelniko [email protected]; 44/13, Lenin, Rostov-on-Don, 344032, Russia; phone: +78632188877; director; dr. of eng. sc.