Научная статья на тему 'Использование деревьев событий для представления знаний в динамических прецедентных интеллектуальных системах'

Использование деревьев событий для представления знаний в динамических прецедентных интеллектуальных системах Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
122
17
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Шерстюк В.Г.

Исследованы теоретические основы построения динамических прецедентных ИС на основе правдоподобных деревьев событий. Представлена расширенная модель событий, допускающая неполную и неточную входную информацию. Предложена модель дерева событий, основанная на иерархическом представлении потоков событий, используемая для формализации частично упорядоченных совместно происходящих совокупностей событий. Получена модель правдоподобия, использующая различные комбинации временных меток, вероятностных, нечетких и приближенных оценок правдоподобия.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Using the event trees for knowledge representation in the dynamic case-based intelligent systems

The theoretical bases of the dynamic case-based IS construction based on plausible event trees are investigated. The extended event model that assuming incomplete and imprecise source information is presented. The event tree model, based оn hierarchical presentation of event streams, and used for formalization the jointly happens partial-ordered event's sets, is offered. The likelihood model using different combinations of temporal marks, probabilistic, fuzzy and rough plausible estimations is presented.

Текст научной работы на тему «Использование деревьев событий для представления знаний в динамических прецедентных интеллектуальных системах»

УДК656.612

В.Г. Шерстюк

ИСПОЛЬЗОВАНИЕ ДЕРЕВЬЕВ СОБЫТИЙ ДЛЯ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ В ДИНАМИЧЕСКИХ ПРЕЦЕДЕНТНЫХ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ

Постановка проблемы. В сложных динамических системах (СДС) зачастую возникает необходимость решения задач диагностики либо предсказания нежелательных (критических или аварийных) ситуаций. Состояние СДС и поведение объектов в ней, как правило, оценивается в процессе непрерывных наблюдений (мониторинга), при этом исходная информация о состоянии СДС представляет собой упорядоченную во времени последовательность событий. Каждое событие интерпретируется как составной объект, состоящий из множества количественных или качественных оценок параметров, получаемых путем прямых либо косвенных измерений. Присутствие или отсутствие во временной последовательности событий определенного класса может быть основанием для выводов о возможном переходе СДС в то или иное состояние, о вероятных будущих событиях или поведении объектов.

Однако, ограниченная точность средств измерений в автоматизированных системах реального времени, наличие препятствий, нескольких независимых каналов наблюдения, присутствие шумов и искажений приводит к неполноте, неточности и противоречивости информации о событии. Как следствие, в наблюдаемой последовательности событий могут присутствовать шумовые события, пропуски событий, искажения их параметров и т.д.

Выявление причинно-следственных зависимостей между событиями и комбинациями событий в СДС является нетривиальной задачей, и зачастую возможно только после наработки определенной статистики наблюдений, при этом требуется непрерывное участие человека - оператора или эксперта. В условиях неполноты и неточности информации, при значительных объемах вычислений и существенных ограничениях во времени в некоторых предметных областях для оператора складываются информационно сложные ситуации [1], возникают серьезные риски и угрозы.

Актуальным способом снижения зависимости от «человеческого фактора» является автоматизация процессов принятия решений с использованием современных методов искусственного интеллекта. Значительный интерес на сегодняшний день представляет внедрение автоматизированных систем управления морскими подвижными объектами (МПО) в сложных навигационных условиях, включающих интеллектуальную систему (ИС) диагностики и предсказания ситуаций, а создание теоретических основ и формальных моделей функционирования такой ИС является одной из важнейших научно-технических задач.

Анализ публикаций по теме исследования.

Вопросы использования для решении задач диагностики и предсказания в СДС ИС, основанных на правилах, рассматривались в [2,3]. В этих работах предложено использовать компилированные знания экспертов о взаимозависимости различных событий, представленные в виде систем продукционных правил. Данный подход имеет очевидные недостатки: во-первых, в СДС задача априорного построения исчерпывающего множества правил практически неосуществима; во-вторых, построенные множества правил весьма сложно адаптировать к динамическим изменениям условий наблюдения; в-третьих, системы правил требуют постоянного сопровождения и поддержки, что делает процесс их создания в значительной степени трудоемким и подверженным влиянию ошибок. Но главный недостаток предложенного подхода в том, что требуется верификации построенного множества правил на практике, - во многих открытых предметных областях, например при управлении подвижными объектами в сложных навигационных условиях, подобная верификация в принципе неосуществима.

Использование при решении поставленной задачи ИС, основанных на моделях, в открытых предметных областях также представляет значительную проблему ввиду сложности построения адекватных математических моделей для нестационарных и нелинейных процессов, происходящих в СДС, а упрощение используемых моделей приводит к существенному снижению точности [4,5].

Наиболее подходящим инструментом в решении задачи разработки ИС диагностики и предсказания событий в СДС могли бы стать системы, основанные на прецедентах, которые действуют на основе принципов: «ситуациям свойственно повторяться» и «в подобных ситуациях могут быть приняты подобные решения» [6]. Однако, существующие наработки в области построения прецедентных ИС приводят к статическим системам, которые основываются на четко заданных и определенных через множество достоверных и статичных свойств проблемной ситуации прецедентов с четко обозначенными границами. Более того, независимые друг от друга проблемные ситуации никогда не перекрываются во времени - т.е. в каждый момент времени ИС рассматривает только один прецедент, а сам прецедент не допускает возможности развития проблемной ситуации, т.е. является статическим «снимком» значений

свойств в некоторый начальный момент времени (момент инициирования) [7].

В [8] предложена концепция «непрерывных» прецедентных ИС (Continuous CBR), как развитие данного класса ИС для работы с ситуациями, развивающимися во времени. Важной особенностью этих ИС является циклическая, безостановочная организация процесса принятия решений, учитывающая динамику изменения внешней среды. Однако, «непрерывные» прецедентные ИС ACBARRS и SINS, нашедшие применение для управления перемещением роботов, рассматривают входную и выходную информацию как векторы аналоговых величин, динамика ситуации в них отражается упрощенно посредством изменения значений параметров, а прецеденты содержат зависимости между значениями входных сигналов и соответствующими значениями выходных управляющих сигналов. Тем не менее, рассматриваемые ИС работают в реальном времени. В [9] предложены некоторые дополнения к концепции [8], связанные с обработкой пространственно-временных параметров, однако суть подхода осталась неизменной.

В [10] предложена концепция «беспрерывной» прецедентной ИС (Ceaseless CBR), работающей в квазиреальном времени, и предназначенной для обработки распределенного во времени непрерывного потока событий, формируемого внешней средой. Особенности ИС Alba и SOID, разработанных на основе рассматриваемой концепции, связаны с решением узкой задачи обнаружения вторжений в компьютерные сети, в них использованы статистические методы сравнения последовательностей событий, отдающие приоритет при анализе слабо схожим «редким» последовательностям событий в противовес сильно схожим «частым» последовательностям, что препятствует применению данного подхода в других предметных областях. В то же время, к положительным сторонам концепции следует отнести ее ориентированность на обработку неточной и неполной исходной информации.

В [11] предложен подход к обработке протяженных во времени ситуаций, в котором для моделирования динамики используются совокупности временных рядов, включающих неточные и зашумленные данные. Рассматриваемый подход позволяет представить эволюцию состояний мира с помощью последовательности статических снимков числовых параметров во времени, на которые накладываются определенные ограничения. В основе подхода лежит теория временных интервалов Аллена [12], причем для зависимых во времени событий требуется наличие числовых оценок, которые не всегда могут быть получены на практике. Использование данного подхода в ИС Creek для управления бурением скважин и в ИС MNAOMIA для решения задач диагностики в психиатрии показало его низкую эффективность в открытых системах, имеющих высокую динамику процессов и отличающихся неточностью и неполнотой исходной информации.

В ряде других работ также рассматривались вопросы анализа динамики различных процессов в прецедентных ИС, например, в [13] - распределения нагрузки в электрических сетях, в [14] -прогнозирования погоды, в [15] - предсказания действий пользователя при просмотре Web-магазинов, в [16] - диагностики лабораторного оборудования. Общий анализ состояния работ в рассматриваемой области показывает, что вопросы анализа динамики процессов, проистекающих в СДС, и связанные задачи диагностики либо предсказания нежелательных ситуаций исследовались фрагментарно, а полученные модели являются узкоспециализированными, малоэффективными и слабо приспособленными к работе в реальных условиях, свойственных большинству технических и организационно-технических СДС.

В динамической прецедентной ИС прецедент необходимо трактовать как развивающийся во времени процесс, и рассматривать все множество проистекающих в СДС процессов одновременно. Это означает, что прецеденты могут быть зависимыми, могут быть «растянутыми», могут пересекаться во времени, а наблюдения могут поступать из различных источников, возможно, с некоторым запаздыванием относительно момента свершения реального события. Рассмотрение всего множества наблюдаемых в СДС событий должно производиться параллельно, при этом необходимо учитывать возможное изменение наблюдаемых параметров проблемной ситуации непосредственно в ходе обработки прецедента. Также важным моментом является ослабление временных зависимостей между связанными событиями, например, вместо четкой информации о временных интервалах желательно использовать нечеткую оценку либо установить порядок появления событий на качественном уровне (впротивовес количественной оценке Аллена).

Таким образом, вопросы построения динамических прецедентных ИС для решения задач диагностики и предсказания ситуаций в СДС требуют глубокого исследования и соответствующего теоретического обоснования.

Цель данной работы состоит в теоретическом исследовании сценарно-прецедентных динамических ИС как особого класса ситуационных ИС, в построении событийной модели предметной области и обоснования использования модели правдоподобных деревьев событий как формализма для представления знаний в ИС данного класса при неполной и неточной исходной информации. В качестве реальной предметной области рассматривается проблема управления МПО в сложных навигационных условиях, в том числе решение задач диагностики и предсказания нежелательных ситуаций.

Основная часть. Совместное перемещение множества МПО А на некотором заданном пространстве Н с системой координат X07 при воздействии внешней среды Ж образует открытую СДС 2 [17]. Позиция движущегося МПО в пространстве Н описывается парой координат (¿¡,%), где ^ - координата по оси 0Х, % - координата по оси 07. Оперирующий (т.е. тот, с позиции которого ведется рассмотрение ситуации) МПО А0 движется, строго придерживаясь заранее установленного маршрута ЭТ0 е Н и назначенного времени прибытия в конечную точку Тк.

Запланированный маршрут передвижения МПО ЭТ представляет собой ломаную линию пути р (рис. 1), начинающуюся в некоторой стартовой точке (^0, %0)еЭТ, заканчивающуюся в некоторой конечной точке (к, %к)еЭТ, и состоящей из последовательности элементарных сегментов ,I = 1..п , чаще всего прямолинейных, соединяющихся между собой в точках пути ^ауро1Шз, WP) (, %).

¥ ! — "1

W

--—.Л, —Р ¡+2

✓ — >1 ъ 1+1 ^ " " ^1+2 - Л \ \

г г юр 1+1 \ \ \ \ \ \

X» / ✓ ✓ ......

Л Ао г ** Ч .

0 1 \ '•ч X

Рис. 1. Графическое представление маршрута передвижения ЭТ и линии пути р

Передвигаться по заданному маршруту МПО А0 должен безопасно, избегая различных навигационных опасностей и уклоняясь в движении от других (окружающих) МПО. Начальная и конечная точки маршрута установлены свыше, в то время как точки пути планируются оператором и зависят от многих факторов, в том числе известных на момент планирования характеристик МПО и внешней среды Ж . Запланированный маршрут передвижения ЭТ может динамически изменяться при появлении различных неизвестных на момент планирования навигационных либо ситуационных возмущений.

Поскольку каждый из А^, I = 0..т еН реализует целенаправленное движение по

запланированному маршруту ЭТА , СДС Н является полиэргатической системой [18]. Это означает, что

каждый оператор МПО А^ принимает решения по изменению маршрута ЭТА, на основании своей схемы

целей, критериев и оценок состояния СДС, которые в общем случае неизвестны операторам окружающих МПО. Согласование схем принятия решений по радио или с использованием аппаратуры АИС в условиях дефицита времени практически нереализуемо. Соответственно, действия операторов окружающих МПО являются во многом непредсказуемыми, а траектории движения МПО - зачастую непрогнозируемыми.

Чем стесненнее пространство Н и плотнее движение в нем (т.е. чем больше т), чем значительнее воздействия внешней среды и чем интенсивнее влияние навигационных и ситуационных возмущений, тем сложнее оператору производить корректные изменения маршрута МПО.

В динамических сценарно-прецедентных ИС, предназначенных для информационной поддержки операторов МПО, процесс изменения маршрута ЭТ моделируется с помощью планов, сценариев и управляющих воздействий [19].

План 8 включает описание целей (точек пути) и сценариев 2 их достижения, и может быть сопоставлен с множеством операций изменения параметров движения МПО:

5=^{т ^ ¡ие1..«>, (1)

где WPs - исходная точка пути, WPs = , );

Т, - сценарий;

WPki - конечная (целевая) точка пути в случае выполнения сценария Т,,

т, , );

М - оценка возможности достижения целевой точки ак, при выполнении плана 5 .

Сценарий Т может рассматриваться как кортеж, состоящий из текущей точки пути, целевой точки пути и множества векторов управляющих воздействий для достижения целевого состояния:

Т = { и а}-}; WP]+1 = а}. ) а}. = и.. (2)

В общем случае, вектор управляющих воздействий и. имеет вид:

_ I

и. = и^-,, (3)

,=1

где ^ - момент времени установления значений;

Дм, - относительное изменение значения управляемой переменной и,. Элементарным фрагментом сценария является управляющее воздействие и, и е © , где © -множество допустимых воздействий.

Уместный план и сценарии выбираются ИС исходя из степени близости текущей ситуации а к некоторому прецеденту а,. Для оценки близости текущей ситуации и имеющихся прецедентов необходимо оценить текущее состояние СДС Е.

Фазовыми координатами СДС х, для каждого МПО А,, , = 0..т е Е , являются:

X =( 1 2 3 4 5 6 7 8 9).

х1 = , = Ж, , х, = ,

(4)

х4 = ф , х5 = К, х6 = Д, х7 = , х8 = н, х9 = а,,

где , х, - пространственные координаты А, относительно осей 0Х и 07

соответственно;

К, - скорость движения А,; К, - курс движения А,; фi - угловая скорость А,;

- угол сноса А, под влиянием ветра, течения и т.д.;

- заданная скорость вращения винта А,; Н, - заданный шаг вращения винта А,;

а, - установленный угол кладки пера руля А,. Все переменные состояния ограничиваются заданными предельными значениями. Управляемыми переменными СДС и, являются:

(1 2 3 \

и,, и, , и, ;

1 2 , 3 (5)

и = , и = н,, и = а.

Для оперирующего МПО А0 , с позиций которого оценивается состояние СДС Е , переменные состояния х0 ... х0 наблюдаемы, их значения измеряются техническими средствами с различной

на их основе косвенно вычисляемы параметры х3 ... х5

х1 , х2

степенью точности, значения всех управляемых переменных также известны.

Для окружающих МПО А,, , = 1..т значения управляющих переменных неизвестны,

наблюдаемыми переменными являются х,1 , х,2 ,

Заметим, что точность наблюдения переменных х\ , х,2 подвержена влиянию ряда факторов

стохастической природы, например погодных. Сложность достоверной оценки переменной состояния х,6 обусловлена стохастической природой явления сноса МПО с маршрута ЭТ под воздействием ветра, течения и волн.

Отслеживая изменения во времени х1 , х2, ИС решает задачу мониторинга [20]. Результатом мониторинга являются фиксируемые в СДС Е события, например «изменение направления движения А,», «изменение скорости движения А,». Поскольку мониторинг ведется с определенной дискретностью (например, каждые 30 сек.), в ИС формируется поток событий, являющийся основанием для дальнейшего анализа динамики ситуации с целью предсказания возможных действий операторов и, соответственно, возможных изменений маршрутов окружающих МПО.

При этом, основываясь на наблюдении изменений параметров движения МПО А,, можно на основе имеющихся в ИС прецедентов установить сценарий ТА, выполняемый данным МПО, предположить возможный план 5А, и, оценив WPAi, спрогнозировать маршрут ЭТА .

Любое зафиксированное таким образом событие может трактоваться в зависимости от точности его наблюдения как более конкретное либо более абстрактное, придерживаясь некоторой установленной иерархии абстракций (рис. 2). Уровень 21 является абстракцией «движение вправо», 211 конкретизирует его как «поворот вправо», а 212 - как «разворот вправо». Далее, 21112 является конкретным событием «поворот на 12,3° вправо», а 2111 - его абстракцией «поворот на один румб вправо».

Аналогично можно построить множественную иерархию абстракций, например на рис. 2 211=Х11 отражает и «поворот вправо» из иерархии 2, и «движение вперед-вправо» в иерархии X, при этом абстракция Х1 имеет смысл «движение вперед».

ДУ=0 ДК=[0°,15°

ДУ=0 ДК=12,3°

ДУ=0

ДК=[90°,180°]

У>0

ДК=[-90°,90°]

У>0

ДК=[-90°,0°]

Рис. 2. Фрагмент схемы иерархии абстракций

Отношения между уровнями иерархий имеют вид «абстракция-конкретизация» и представляют собой таксономию классов типа «СЬА88-ОР» [21], где 21 является классом для 2ц, 2ц - классом для 2111, и далее вниз по иерархии.

В то же время, любое зафиксированное событие входит как составная часть в один или несколько возможных сценариев, которые в свою очередь формируют предполагаемые планы (маршруты) движения (рис. 3). На рис. 3 С1 представляет собой сценарий класса «обгон справа», и состоит из пяти последовательных событий, которые происходят упорядоченно во времени исключительно в порядке обхода С11 - С15 слева-направо. Отношения между событиями, сценариями и планами являются агрегатными («РАЯТ-ОР»), а формируемая ими структура представляет собой иерархию включения [22].

Задача нахождения предполагаемого плана 5 на основе потока событий Е1-Е2-Еп является нетривиальной. Так, наблюдаемое событие Е1 через его абстрактный класс С11 может соответствовать началу сценария С1, а может представлять простой сценарий Б1 («отворот вправо»). Событие Е2 класса С12 также может быть либо частью сценария С1, либо частью (началом) сценария Ь1 («уклонение влево»). Сам сценарий С1 может быть составной частью нескольких планов (на рис. 3 51 и 52 ).

Если известна последовательность наблюдаемых событий длины п, [е1,Е2,...,Еп], указанная задача может быть сведена к задаче поиска событий [Еп+1,Еп+ 2...], продолжающих имеющуюся

последовательность. Чем больше хранится в ИС прецедентов возможных сценариев и планов, тем больше требуется времени на осуществление такого поиска. Эффективно решать поставленную задачу в реальном времени можно, используя в ИС специализированные модели представления знаний.

Рис. 3. Фрагмент схемы иерархии включения

Учитывая, что в современных ИС, как правило, используется объектное представление предметной области [23] в виде совокупности объектов-экземпляров классов и отношений между ними, формализуем базовые понятия события, событийной модели, потока событий на основе [10].

Пусть событийная модель Л является упорядоченной парой:

Л = (и, О), (6)

где и - множество переменных;

0 - сигнатура.

Сигнатура О представляет собой кортеж:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

О = (с,X, 1, х) , (7)

где С - множество классов событий;

X - множество параметров событий;

х - частичный порядок на С ;

1 - наименьший элемент последовательности х .

Отношение х является по определению отношением информационной упорядоченности, поэтому с1 х с2 означает, что с1 несет в себе меньше информации, чем с2. Таким образом, с1 является абстракцией с2, а с2 - конкретизацией с1, т.е. отношение х задает на С таксономическую иерархию классов. Минимальный элемент 1 порядка х имеет семантику «любой» и выражает минимум информации, т.е. Vc е 2.С 1х с. Если значение некоторого параметра неизвестно либо недоступно, его представляют значением 1.

Событие может быть представлено как:

<//::= 7 : с[х = Ч,,...^ = ^ ], (8)

где 7 - переменная, 7 е и;

с - класс события, с е С ;

х1,...хп - параметры события, х1,...хп е X ;

Ч - переменная либо связанное событие (другого уровня абстракции).

Таким образом, событие является сложным объектом, имеющим некоторый класс c и множество параметров x1,...xn различной степени точности, имеющих количественную либо качественную природу. Множество параметров представляет собой кортеж X = {xj,x2,...,xn} над декартовым произведением D х Dx2 х ...х Dx , где Dx, - область возможных значений параметра xi. Каждый экземпляр события означен параметрами, которые являются, по сути, фазовыми координатами СДС xi. Переменная Y называется начальной точкой события ц .

При n = 0 событие не имеет параметров. Множество переменных, изменяющихся при возникновении события ц, обозначим и.. Зададим также функцию root(ц), возвращающую класс начальной точки события.

В заданной модели Л путь p(Y, xi) является последовательностью, ведущей от переменной Y к параметру xi. Два пути p(Y, xi) и p(z, xi) являются эквивалентными, если они ссылаются на одно и то же значение xi .

Далее, в заданной модели Л поток событий S представляет собой упорядоченную совокупность событий вида:

S = [ц!,Ц2,..Цп ], (9)

такую, что для всех Si е Л существует по крайней мере один общий параметр t е QX , значения которого полностью упорядочены, т.е. [.t < [2.t <... < цп.t.

Длина потока событий S (обозначается |S|) определяется его мощностью (п). Любые два потока

событий могут быть связаны посредством оператора • .

И наконец, в заданной модели Л поток классов T представляет собой упорядоченную совокупность классов вида:

T = [cj, C2,...Cn ] , (10)

такую, что Ti е Л.О.С .

Длина потока классов T (обозначается |T|) определяется его мощностью (n). Любые два потока классов могут быть связаны посредством оператора о .

Для любого заданного потока событий S может быть определен соответствующий поток классов T, такой что Ti = root(§i).

Пусть заданы модель Л и потоки классов U = [м1,и2,...un] и V = [v1,v2,...vm], Vi ui еЛ.О.С , V/ Vj е Л.О..С , n = |U|, m = , m < n . Поток классов U включает поток классов V (обозначается U с V), если существует последовательность индексов 1 < i1 < i2 <... < im < n , такая что

и1 ■< Vi 1,и2 ^ Vi2 ,...Um ■< Vim .

Пусть заданы модель Л и потоки событий S = [1,[2,...[n] и R = [j',..['m\, n = , m = |R|,

m < n . Поток событий S включает поток событий R (обозначается S с R), если для потоков классов U = root(s) и V = root(r) выполняется условие U с V. Поток событий R входит в поток событий S, если S с R .

Представленное определение вхождения потоков позволяет далее ввести понятие совмещения потоков событий, необходимое для сопоставления потоков событий и их фрагментов в случае неполного (частичного) совпадения.

Пусть задана модель Л, а в ней потоки событий S = [ц1, ц2,.. [п ] и R = [j, .2,.. W'm ], S, R е E. Совмещением потоков S и R является пара ^S',R^ , полученная вставкой пустых элементов (±) в оба

потока таким образом, что S' = R' и для всех 1 < i < S' элемент S'[i] совмещен с элементом R'[i], при

S'[г] и Л'[г] .

Для потока событий S = Цц, ц2,..ц/п] длины п , заданного на модели Л, сегментация 8 (?, т) степени т представляет собой последовательность из т +1 точек разрыва в диапазоне [1,п], таких что:

S(S, т)= ^2,...^т , ^+1 ] , (:1)

1 = < ¿2 < ... < ¿т < ¿т+1 = п + 1.

Очевидно, что т -сегментация приводит к разбиению потока £ на т сегментов S2,...Sm]:

Ц1,...,Ц,2-1 Мц*2,,ц*з-1] - '[ц ,,Цп ]=1ц ,.»,Ц,+1 Ь , (12)

таких что £= п . В общем случае, для любого заданного потока событий может быть

определено множество возможных сегментаций.

Сегментация потока событий может быть использована для нахождения последовательностей событий, схожих с хранимыми в прецедентах ИС сценариями и планами. С целью решения данной задачи введем формализм, основанный на представлении иерархии абстракций и иерархии включений в виде дерева событий [24].

Пусть имеется ориентированный связный граф О = {V, Е}, не содержащий циклов, имеющий одну

или несколько вершин наивысшего уровня Н с V (корней), множество концевых вершин R с V, элементы которого г е R называются листьями, а также множество дуг Е .

Для заданной модели Л и потока событий Ч = Цц, ц2 ,..цп ], таких что ц е Л, дерево событий (ДС) определяется как

Г = (О, /л,г,к, <), (13)

где G - ациклический граф, в котором множество вершин V разбито на три

непересекающихся множества: множество листьев R, множество узлов B и множество корней, содержащих наивысшие вершины H ;

¿и : R ^ Ч - отображение каждого концевого узла ДС в событие из Ч; т: B u H ^ {p, 5} - отображение каждого неконцевого узла ДС в класс 5 (последовательный) или p (параллельный) в зависимости от ожидаемого порядка появления событий-потомков данного узла;

к: B u H ^ 2qx - отображение каждого неконцевого узла ДС в подмножество параметров (ограничений) из QX ;

< - отношение порядка, устанавливаемое между элементами множества R .

Корни ДС определяют множество последовательностей (потоков), состоящих из всех событий из R , упорядоченных согласно < и удовлетворяющих ограничениям, налагаемым к .

Неконцевые узлы B u H представляют значимые потоки событий, отображенных в R . Каждый узел ДС соответствует последовательности событий, представленной H , потомки каждого узла представляют сегмент родительской последовательности.

Дерево событий является инъективным, если отображение т является отношением «один-к-одному» между концевыми узлами ДС и классами событий в Ч, т.е. для каждого c е C существует по крайней мере один r е R , для которого т(г л root(¡у^ ) = c. В дальнейшем будем рассматривать именно инъективные ДС.

ДС может использоваться для формализации частично упорядоченных совокупностей событий, происходящих одновременно и совместно. Концевые узлы отображают элементарные (наблюдаемые) события, неконцевые - соответствуют агрегатным событиям (последовательностям элементарных событий, т.е. сценариям либо планам). Другими словами, концевые узлы хранят наблюдаемые события, а неконцевые узлы - ограничения на своих потомков, включая временные (темпоральные). Дуги ДС выражают имеющиеся между узлами отношения CLASS-OF и PART-OF.

На основе предложенной формализации ДС возможно:

- классифицировать каждое событие Л, т.е. определить его класс c е C;

- установить порядок < появления событий, соответствующих возможному сценарию Е ;

- установить ограничения на параметры событий, определяющие принадлежность события ветви, ведущей к некоторому корню Н ;

- определить соответствие наблюдаемой последовательности событий некоторому пути р ;

- установить сходство потоков событий с помощью заданных отношений включения (вхождения) и совмещения потоков;

- производить вывод от концевых узлов к корню.

Для заданного ДС Г выводом может являться любая возможная комбинация концевых узлов г е Я , удовлетворяющая установленному темпоральному порядку т и ограничениям, налагаемым к .

Поскольку исходная информация является неточной и неполной, возникает необходимость осуществлять правдоподобный вывод на ДС. Для этого требуется задать модель правдоподобия, которая размечала бы дуги ДС некоторым коэффициентом, выражающим интенсивность отношения, определяемого данной дугой, либо степень доверия к присутствию данного отношения.

Введем соответствующий формальный аппарат. Зададим непустое множество Ь с двумя бинарными операторами ® и ©, где ® - мультипликативный оператор, © - аддитивный оператор.

Если введенные нами операторы для любых х,у, 2 е Ь удовлетворяют условиям:

а) идемпотентности (х ® х = х, х © х = х),

б) коммутативности (х ® у = у ® х, х © у = у © х),

в) ассоциативности ((х ® у) ® 2 = х ®(у ® 2), (х © у )© 2 = х ©(у © 2) ),

г)дистрибутивности ( х ® (у © 2) = (х ® у )© (х ® 2) , (х © у)® 2 = (х ® 2)© (у ® 2) ),

образуется дистрибутивная квазирешетка Я = (Ь,®,©) .

Задавая две дополнительные нуль-арные операции (0 и 1) и условия поглощения:

а) х ® 0 = 0 ® х = 0;

б) х ®1 = 1 ® х = 1;

в) х © 0 = 0 © х = х ,

получаем ограниченную дистрибутивную решетку, не замкнутую относительно объединения:

Р = (Ь,®,©,0,1), (14)

где (Ь,®1 - моноид, (Ь,©,0) - коммутативный моноид.

Важными свойствами полученного полукольца Р являются:

1) КМ) = х;

2) 1(0)= 0; 3) !(ь)= 1.

Учитывая идемпотентность аддитивного оператора на Ь и с учетом свойств полукольца Р, определим на полукольце отношение частичного порядка

Ух, у, 2 е Ь х -< Р у -о х © 2 = у, (15)

обладающее важными свойствами рефлексивности, транзитивности и антисимметричности.

Порядок — Р дает возможность сравнивать различные элементы множества Ь . Очевидно, что при

х - Р у у предпочтительнее, чем х .

Предложенная нами модель полукольца Р и отношение частичного порядка — Р могут служить своеобразным каркасом, над которым с помощью выбора исходного множества Ь и переопределения аддитивного и мультипликативного операторов надстраивается некоторая модель правдоподобия £ .

На основе модели правдоподобия £ дугам ДС приписываются определенные оценки степени доверия I, выражающие степень уверенности в наличии отношения между двумя узлами, соединяемыми данной дугой.

Детерминированный аппарат позволяет определить наличие (1) или отсутствие (0) дуги (перехода). Используя математический аппарат теории вероятности, можно оценивать вероятность перехода от узла к узлу, на основе аппарата нечетких множеств можно оценивать возможность такого перехода, а используя различные темпоральные теории, можно оценить ожидаемое время перехода. Аддитивный оператор © позволяет оценивать уверенность при наличии множества переходов из одного узла, мультипликативный оператор ® - для транзитивных замыканий переходов.

Важно отметить, что наличие перехода (дуги) между узлами ДС является отражением таксономического отношения включения между событиями, изображаемыми данными узлами, таким образом, используя выбранную модель правдоподобия £, можно осуществить правдоподобный вывод на ДС, что имеет важное значение для реализации различных методов анализа потока событий.

В табл. 1 показаны варианты построения некоторых моделей правдоподобия - простых (Б, Т, Р, Я, Р) и композиционных (РТ, ¥Т, ЯТ). Композиционные модели построены на основе простых моделей, их полукольца являются результатами декартовых произведений исходных полуколец.

Таблица 1.

Варианты реализации модели правдоподобия £ на основе полукольца Р

Модель правдоподобия, £ L ® © 0 1

Детерминирован ная, Б {0,1} Л V 0 1

Вероятностная, Р [0,1] 1 -П ( - Pi ) i=1 0 1

Нечеткая, Р [0,1] min f=1 (Л, ) max к=1 (м, ) 0 1

Приближенная, Я [0,1] X [0,1] г к к П d,, П d- Vi=1 i=1 у Г к к л Ud,, U d, V i=1 i=1 у M U U

Временная, Т [0, ж[ + min ,=1 (t,) 0 ж

Вероятностно-временная, РТ [0,1] х[0, ж[ г к к Л П а , X t, v ,-=1 ,=1 У Г к Л 1 -П( - P, ),min к=1 ((,) V ,=1 У (0,0) (1, ж)

Нечетко-временная, РТ [0,1] х[0, ж[ Г к Л mm k=1 (л ) X ti V 2=1 (max к=1 (Л,),min к=1(t,)) (0,0) (1, ж)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Приближенно-временная, ЯТ [0,1] X [0,1] X X [0, ж[ Г V Г к к Л к Л П d,, Пd-, X ^ V 2=1 i=1 У i=1 у ГГ к к Л ^ U d,, U d, ,minк=1 () VV i=1 i=1 У «0,0>,0) (( U U, ж)

Используя модель правдоподобия £, можно расширить определение ДС для реализации возможности правдоподобных выводов и предсказания возможных дальнейших событий входного потока.

Для модели Л и потока событий Ч = ]^l,^2,...\j/n], таких что еЛ, правдоподобное дерево событий (ПДС) представляет собой кортеж

Г = (Г,£,)) , (16)

где Г - ДС;

£ - модель правдоподобия;

):E ^ £ - отображение, помечающее каждую дугу из множества E оценкой правдоподобия на модели £ .

На рис. 4 представлен фрагмент FT-ПДС На рисунке видно, что агрегатное событие Z111 представляет собой последовательность из события Z1111 и возможно (с нечеткой оценкой 0,7) следующего за ним с допустимым интервалом от 4 до 6 минут события Z1112. Если Z111 является составной частью агрегатного события Z11, то возможно (с нечеткой оценкой 0,8) в течение интервала от 1 до 5 минут должно произойти событие Z112. Следует заметить, что для оценки допустимых временных интервалов могут также использоваться нечеткие (T ) либо приближенные (T^) темпоральные теории, а модель правдоподобия £ может быть расширена соответствующими композициями.

Предложенную модель ПДС можно рассматривать как высокоуровневую абстракцию известной модели сети доверия (Belief Network) [25]. Так, в случае использования нечетких оценок доверия имеется

определенная аналогия с нечеткими Байесовскими сетями, в случае вероятностных оценок - с вероятностными Байесовскими сетями. Композиционная модель правдоподобия может быть сопоставлена с метасетью Байеса, например, на основе подхода, изложенного в [26].

Существенно, что сложность точного вывода на ПДС линейно зависит по времени от размера имеющейся ПДС [3], что допускает реализацию на его основе ИС реального времени. Другой важной особенностью формальной модели ПДС является возможность построения на основе данной модели гибридных динамических ИС, использующих различные формализмы представления и обработки знаний в различных структурных подсистемах, но интегрируемые относительно модели ПДС. Так, возможность использования ЛГ-модели правдоподобия дает возможность совместного применения известных методов ассоциативного либо эпизодного извлечения знаний, а использование РГ-модели позволяет интегрировать соответствующие методы обучения.

Выводы и перспективы дальнейших исследований. В результате проведенных исследований получены теоретические основы построения динамических прецедентных ИС на основе правдоподобных деревьев событий. В работе представлена расширенная модель событий, в основу которой положены иерархии абстракций и иерархии включения, и которая допускает события, характеризуемые неполными и недостоверными векторами параметров. При недостаточности или неточности информации о событии последнее может быть отнесено к более абстрактному классу иерархии.

Сформулированы понятия потока событий и потока классов, для которых формализованы отношения вхождения и включения. Определены операции совмещения и сегментации потоков событий, необходимые для сопоставления двух потоков событий и их фрагментов в случае неполного (частичного) совпадения. Предложена формальная модель дерева событий, основанная на иерархии абстракций и иерархии включений потоков событий, и используемая для формализации частично упорядоченных совокупностей совместно происходящих событий.

На основе ограниченной дистрибутивной решетки создана модель правдоподобия, лежащая в основе построения правдоподобных деревьев событий. Модель допускает использование временных меток, вероятностных, нечетких и приближенных оценок правдоподобия и их различных комбинаций.

Использование полученной модели правдоподобных деревьев событий в качестве основы представления знаний о динамике процессов, происходящих в СДС, дает возможность разработки эффективных динамических прецедентных ИС реального времени, в частности для решения задач диагностики и предсказания нежелательных ситуаций в СДС.

ЛИТЕРАТУРА:

1. Сиек Ю.Л. Принципы синтеза интеллектуальных систем управления морскими динамическими объектами / Ю.Л. Сиек, Соэ Мин Лвин // Искусственный интеллект. - 2009. - №4. - С.448-456.

2. Hellerstein J.L. Discovering Actionable Patterns in Event Data / J. L. Hellerstein, S. Ma, C. S. Perng. // IBM Systems Journal. - 2002. - Vol. 41. - №3. - Pp. 475-492.

3. Рассел С. Искусственный интеллект: современный подход / С. Рассел, П. Норвиг. - М.: Вильямс, 2006. - 1408 с.

4. Люгер Дж. Искусственный интеллект: стратегии и методы решения сложных проблем / Дж. Ф. Люгерю. - М.: Вильямс, 2003. - 864 с.

5. Wu S. Model selection for dynamic processes / S. Wu, P.A. Flach // In ECML/PKDD'02 workshop on Integration and Collaboration Aspects of Data Mining, Decision Support and Meta-Learning. - University of Helsinki, 2002. - Pp. 168-173.

Рис. 4. Фрагмент РГ-правдоподобного дерева событий

6. Aamodt A. Case-based reasoning: foundational issues, methodological variations, and system approaches / A. Aamodt, E. Plaza // AI Communications. - 1994. - Vol. 7. - №1. - Pp. 39-59.

7. Pal S. K. Foundation of Soft Case-Based Reasoning / S. K. Pal, S. C. K. Shiu. - New Jersey: J. Viley & Sons, 2004. - 274 P.

8. Ram A. Continuous Case-Based Reasoning / A. Ram, J.C. Santamaria // Proceedings of the AAAI-93 Workshop on Case-Based Reasoning, 1993. - Pp. 86-93.

9. Likhachev M. Spatio-Temporal Case-Based Reasoning for Behavioral Selection / M. Likhachev, R.C. Arkin // Proceedings of International Conference of Robot Applications (ICRA). - 2001. - Pp.1627-1634.

10. Martin F.J. Case-Based Sequence Analysis in Dynamic, Imprecise, and Adversarial Domains / F. J. Martin: Tesi doctoral by Universitat Politecnica De Catalunya, 2004. - 285 P.

11. . Jaere M.D. Representing temporal knowledge for case-based prediction / M. D. Jaere, A. Aamodt, P. Skaalle // Advances in case-based reasoning: Lecture Notes in Artificial Intelligence. - Springer, 2002. -No. 2416. - Pp. 174-188.

12. Allen J.F. Maintaining Knowledge About Temporal Intervals / J. F. Allen // Communications of the ACM. - 1983. - Vol. 26. - №11. - Pp. 832-843.

13. Melendez J. Refinement of Electric Load Forecasting Reusing Past Instances and Contextual Based Adaptation / J. Melendez, R. Vilcahuaman // Proc. Of Workshop on Applying CBR to Time Series Prediction. - The Fifth International Conference on Case-Based Reasoning, 2003. - Pp. 242-251.

14. Hansen B.K. Weather Prediction Using Case-Based Reasoning and Fuzzy Set Theory / B.K. Hansen // CS Master Thesis. - Technical University of Nova Scotia, 2000. - 269 P.

15. Zehraoui F. CBR System for Sequence Prediction CASEP / F. Zehraoui // Proc. Of Workshop on Applying CBR to Time Series Prediction. - The Fifth International Conference on Case-Based Reasoning, 2003. -Pp. 260-269.

16. Stan S. Toward Accurate Dynamic Time Warping In Linear Time And Space / S. Stan, C. Philip // Intelligent Data Analysis. - 2007. - Vol. 11. - № 5. - Pp. 561-580.

17. Мальцев А.С. Система управления движением судна / А.С. Мальцев // Судовождение. - 2001. -Вып. 3. - С.106-121.

18. Шерстюк В.Г. Логико-вероятностный подход к оцениванию состояния динамической системы / В.Г. Шерстюк // Вестник Херсонского национального технического университета. - 2010. - №3(39). -С.514-520.

19. Шерстюк В.Г. Сценарно-прецедентный подход к формированию управляющих воздействий в системе управления морского подвижного объекта / В.Г. Шерстюк // Проблемы информационных технологий. - 2009. - №2(6). - С.69-77.

20. Шерстюк В.Г. Мониторинг навигационных ситуаций в интеллектуальной системе управления движением судна / В.Г. Шерстюк // Проблемы информационных технологий. - 2009. - №1(5). -С.74-80.

21. Clarke P. A Taxonomy of Classes to Identify Changes During Maintenance / P. Clarke, B. Malloy // Proceedings of the 1st Annual International Conference on Computer and Information Science (ICIS '02), Seoul, 2002. - Pp. 631-636.

22. Brachman R.J. What IS-A is and isn't. An Analysis of Taxonomic Links in Semantic Networks / R. J. Brachman // IEEE Computer. - 1983. - Vol. 16. - № 10. - Pp. 30-36.

23. Борисов В.В. Реализация ситуационного подхода на основе нечеткой иерархической ситуационно-событийной сети / В.В. Борисов, М.М. Зернов // Искусственный интеллект и принятие решений. -2009. - №1. - С. 17-30.

24. Luckham D. The Power of Events: An Introduction to Complex Event Processing in Distributed Enterprise Systems / D. Luckham. - Addison-Wesley Professional, 2002. - 400 P.

25. Kocka T. Effective Dimensions of Partially Observed Polytrees / T. Kocka, N. L. Zhang // Proc. Of The European Conference on Symbolic and Quantitative Approaches to Reasoning with Uncertainty, 2003. -Pp. 311-322.

26. Терзиян В.Я. Вероятностные метасети для решения задач интеллектуального анализа данных / В.Я. Терзиян, А.В. Витько // Искусственный интеллект. - 2002. - №3. - С. 188-197.

ШЕРСТЮК Владимир Григорьевич - к.т.н., доцент кафедры информационных технологий ХНТУ

Научные интересы: интеллектуальные системы принятия решений реального времени, принятие

решений по прецедентам, мультиагентные системы, мультимодальные и комбинированные логические

системы представления знаний

i Надоели баннеры? Вы всегда можете отключить рекламу.