Научная статья на тему 'Методы многошагового предсказания аномалий в темпоральных данных'

Методы многошагового предсказания аномалий в темпоральных данных Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
443
81
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ТЕМПОРАЛЬНЫЕ ДАННЫЕ / ОБНАРУЖЕНИЕ АНОМАЛИЙ / МАРКОВСКАЯ МОДЕЛЬ / ТЕМПОРАЛЬНО-РАЗНОСТНОЕ ОБУЧЕНИЕ / АДАПТИВНАЯ НЕЧЕТКАЯ СИСТЕМА / TEMPORAL DATA / ANOMALY DETECTION / MARKOV MODEL / TEMPORAL-DIFFERENCE LEARNING / ADAPTIVE FUZZY SYSTEM

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ковалев Сергей Михайлович

Предлагается новая методология обнаружения аномалий в темпоральных данных на основе методов многошагового предсказания. Предлагаемая методология базируется на анализе динамики развития вероятностных значений аномалии с поступлением каждого нового отсчета паттерна в потоке данных. Приводится оригинальная модель задачи многошагового предсказания. В качестве средства вычисления вероятностных значений аномалий предлагается использовать функции истинности стохастических Марковских моделей с доходами. Приводится теоретическое обоснование корректности предлагаемого подхода. Для преобразования реального процесса к Марковскому предлагается использовать нечеткую адаптивную систему, осуществляющую отображение совокупностей точечных состояний исходного процесса на гранулированную шкалу нечеткого интегрального признака.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ковалев Сергей Михайлович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

THE METHOD OF MULTISTEP PREDICTION OF ANOMALIES IN TEMPORAL DATA

In this paper, we develop a new method for the detection of anomalies in the temporal data on the basis of a multi-step methods for prediction. The proposed method is based on the analysis of the dynamics of the probability values of the anomaly on the input model. As a means of calculating the probability values of the anomaly, we suggest using truth functions of stochastic Markov models with income. We prove a theorem which is the rationale for the use of the method. To convert to a real process of Markov, we propose to use an adaptive fuzzy system that can show a set of point states of the initial process on a granular scale fuzzy integral feature. To convert to a real process of Markov, we propose to use an adaptive fuzzy system that can show a set of point states of the initial process on a granular scale fuzzy integral feature.

Текст научной работы на тему «Методы многошагового предсказания аномалий в темпоральных данных»

Запорожец Дмитрий Юрьевич - Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Южный федеральный университет»; e-mail: [email protected]; 347928, г. Таганрог, пер. Некрасовский, 44; тел.: 88634371651; кафедра систем автоматизированного проектирования; аспирант.

Курейчик Владимир Викторович - e-mail: [email protected]; кафедра систем автоматизированного проектирования; зав. кафедрой; д.т.н.; профессор.

Zaporozhets Dmitry Yurevich - Federal State-Owned Autonomy Educational Establishment of Higher Vocational Education “Southern Federal University”; e-mail: [email protected]; 44, Nekrasovskiy, Taganrog, 347928, Russia; phone: +78634371651; the department of computer aided design; postgraduate student.

Kureichik Vladimir Victorovich - e-mail: [email protected]; the department of computer aided design; head of department; dr. of eng. sc.; professor.

УДК 519.816.

С.М. Ковалев

МЕТОДЫ МНОГОШАГОВОГО ПРЕДСКАЗАНИЯ АНОМАЛИЙ В ТЕМПОРАЛЬНЫХ ДАННЫХ*

Предлагается новая методология обнаружения аномалий в темпоральных данных на основе методов многошагового предсказания. Предлагаемая методология базируется на анализе динамики развития вероятностных значений аномалии с поступлением каждого нового отсчета паттерна в потоке данных. Приводится оригинальная модель задачи многошагового предсказания. В качестве средства вычисления вероятностных значений аномалий предлагается использовать функции истинности стохастических Марковских моделей с доходами. Приводится теоретическое обоснование корректности предлагаемого подхода. Для преобразования реального процесса к Марковскому предлагается использовать нечеткую адаптивную систему, осуществляющую отображение совокупностей точечных состояний исходного процесса на гранулированную шкалу нечеткого интегрального признака.

Темпоральные данные; обнаружение аномалий; Марковская модель; темпоральноразностное обучение; адаптивная нечеткая система.

S.M. Kovalev

THE METHOD OF MULTISTEP PREDICTION OF ANOMALIES IN TEMPORAL DATA

In this paper, we develop a new method for the detection of anomalies in the temporal data on the basis of a multi-step methods for prediction. The proposed method is based on the analysis of the dynamics of the probability values of the anomaly on the input model. As a means of calculating the probability values of the anomaly, we suggest using truth functions of stochastic Markov models with income. We prove a theorem which is the rationale for the use of the method. To convert to a real process of Markov, we propose to use an adaptive fuzzy system that can show a set of point states of the initial process on a granular scale fuzzy integral feature. To convert to a real process of Markov, we propose to use an adaptive fuzzy system that can show a set ofpoint states of the initial process on a granular scale fuzzy integral feature.

Temporal data; anomaly detection; Markov model; temporal-difference learning; adaptive fuzzy system.

Введение. Обнаружение аномальных событий и аномальных паттернов в темпоральных данных является важной областью Data Mining, имеющей отношение к различным приложениям. Традиционно, под обнаружением аномалий пони-

* Работа выполнена при поддержке РФФИ, грант 13-07-00183-а, 12-07-00012-а.

мается поиск “новинок”, “сюрпризов”, “выбросов” и иных особых событий в темпоральных данных, существенно отличающихся от паттернов нормального поведения. В большинстве известных приложений задача детектирования аномалий и методы их обнаружения рассматриваются в статическом варианте как распознавание полностью сформировавшихся паттернов на входе классификатора, не учитывая особенности развития подлежащего распознаванию темпорального паттерна в потоке данных. Однако существует широкий круг задач, в которых требуется максимально быстрое распознавание аномалий на основе непрерывного анализа поступающего на вход системы потока данных и упреждающего вынесения гипотез о наличии в нем аномальных событий.

В настоящей статье речь пойдет об одном из приложений задачи поиска аномалий, представленной в виде задачи многошагового предсказания нештатных ситуаций, возникающих в ходе развития технологических процессов. Для таких задач являются характерными три особых признака:

♦ полезная информация о состоянии процесса поступает на вход системы последовательными порциями в виде развитий темпоральных паттернов;

♦ каждая новая порция данных, являясь предвестником потенциальной аномалии, уточняет информацию о возможности ее появления, содержащуюся в предшествующих данных;

♦ принятие решений должно осуществлять в упреждающем режиме, не дожидаясь появления аномального события или момента окончания развития аномального паттерна на входе классификатора.

Характерным примером задачи многошагового предсказания является прогнозирование сбоев в движении поездов на основе анализа развития поездной обстановки в течение определенного временного интервала. Входной информацией в этой задаче являются данные о временах запаздывания поездов по каждой станции, категории поездов, особенности путевого развития станций и ряд других параметров поездных ситуаций. Поездной диспетчер должен заблаговременно предсказать такую ситуацию с целью принятия превентивных мер по нормализации техпроцесса. Данная и другие аналогичные задачи обуславливают новую постановочную модель задачи многошагового предсказания.

Модель многошагового предсказания. Модель многошагового предсказания включает три следующих основных компонента.

1. Входная информация представляется в виде векторов наблюдений за развитием процесса

X (?) = х(^),..., x(ti),..., х^), 2 , где х(^.) характеризует состояние процесса в ьй момент времени. Здесь особо выделены конечные значения 2 в качестве результатов, “1” или “0”, характеризующих факты принадлежности вектора X (?) к классу аномальных паттернов.

2. Шейп предсказания, полученный на основе вычислений вектор

Р( X) = р(х(0),..., р(х^()),..., р(х(?к )^

элементы которого являются оценками результата 2. Каждое из значений р( х(^ )) характеризует вероятность того, что i-е значение паттерна х(^) является предвестником аномального события в конце паттерна.

3. Способ вычисления шейпа предсказания на основе векторов наблюдений и конечного множества модифицируемых параметров Ш. Этим способом может быть алгоритм, оператор или некоторая функциональная зависимость:

р( х(?,.)) = Е (х ,Ж).

Очевидно, что в представленном варианте модель многошагового предсказания является обучающейся и ее построение сводится к подбору значений вектора управляющих параметров Ж так, чтобы при поступлении на вход модели аномальных паттернов вероятностные значения вектора предсказаний р(х(^)) вели

себя неким должным образом.

Методология многошагового предсказания. В идеальном случае вероятностные значения р(х(ґ.)) в векторе предсказаний при поступлении на вход модели

аномальных паттернов должны стремиться к “1”, причем желательно при минимальных индексах і с тем, чтобы на как можно более ранних стадиях обнаруживать аномалии. В этом случае шейп изменения вероятностных значений в векторе предсказаний должен выглядеть так, как показано на рис. 1,б).

_Г 'О 500 ЮСЮ 1500 2СОО 2500 3000

а

іі рЫ

б

Рис. 1. График наблюдаемого процесса (а), идеальный шейп предсказаний (б)

Получить идеальный шейп предсказания в результате обучения на реальных данных не представляется возможным, поэтому для реализации упреждающего детектирования предлагается использовать иной тип шейпа, приведенный на рис. 2.

Данный шейп имеет пилообразный характер, обладающий двумя достоинствами. Во-первых, он достижим на реальных данных обучения, а, во -вторых, позволяет эффективно осуществлять упреждающее детектирование аномальных паттернов на основе анализа характера поведения шейпа предсказания в начальной стадии развития аномального паттерна. Особенность заключается в затухании колебаний вероятностных значений в преддверии аномалии и переходе к монотонному возрастанию шейпа предсказаний с поступлением новых отсчетов аномального паттерна.

Доходные Марковские модели. Ключевым элементом в методологии многошагового предсказания на основе анализа динамики развития шейпов предсказаний является выбор способа вычисления вероятностных значений аномалий в векторах предсказаний. В качестве такого средства предлагается использовать особый тип функций, имеющих отношение к специальному классу стохастических моделей Марковских процессов с доходами [1, 2] (МЯ-модели).

В общем виде МЯ-модель представляет собой триплет:

МЯ =<X,|| Р ||, Ж >,

X - множество состояний наблюдаемого процесса, || Р || - матрица переходных вероятностей между состояниями, ж: х ^ К - доходная функция.

Введем для MR-модели ряд вспомогательных определений.

б

Рис. 2. График наблюдаемого процесса (а), реальный шейп предсказаний (б)

Определение 1. Маршрутом МЯ-модели называется любая последовательность состояний X = X ,X ,...,X .

Ч7 г27 7 гк

Заметим, что любому темпоральному паттерну X = X , X ,..., X наблюдае-

Ч г2 гк

мого процесса в MR-модели соответствует определенный маршрут.

Определение 2. Вероятностью маршрута X = x1, X,...,X MR-модели называется величина:

Р(Х) = Р12 • Р 23 • ... • Рк-1к , где рг; - переходные вероятности матрицы || Р || .

Определение 3. Доходом маршрута X = X,X,...,X MR-модели называется величина:

Ж (X) = ю(^ ) + ю( X ) +... + а(хк ),

где 0)(X) - значения доходной функции.

Базовым понятием, относящимся к MR-модели, является понятие истинностной функции.

Определение 4. Функцией истинности MR-модели называется вещественная функция Е: X ^ К, сопоставляющая каждому состоянию X е X величину Е(X), равную математическому ожиданию дохода по всем маршрутам, исходящим из X/

Е( X) = X Р( X) Ж (X),

X=x1 ^^.^к е© / x1=x

где © - множество всех маршрутов в МЯ-модели.

Фактически, функция истинности сопоставляет каждому состоянию средний доход по всем маршрутам, исходящими из состояния X. или, иначе, прогнозирует доход, полученный в результате реализации Марковского процесса, стартующего из состояния X.

Приведенное общее определение МЯ-модели допускает различные конкретизации в разных приложениях в зависимости от свойств доходной функции. Применительно к рассматриваемой задаче поиска аномалий предполагается заданными два множества примеров аномальных A и нормальных N темпоральных паттернов, и два типа связанных с ними ограничений на доходную функцию:

к

VX = (X,X,...,X) е А 'XJю(xi) = 15

г=1

к

VX = (X,X,...,X) е N Х®(X) = 0. (1)

г=1

Определение 5. Целевой вероятностью р (X) состояния X е X называется

вероятность появления аномального паттерна в множестве всех темпоральных паттернов ©О = А ^ N, начинающегося с состояния X :

Р(*) = Р{Ц, ^,...,X,) е А | xi = x}.

Следующая теорема устанавливает связь между значениями функции истинности доходной Марковской модели и вероятностями появления аномальных паттернов.

Теорема. Для любого состояния X е X МЯ-модели, удовлетворяющей ограничениям (1), значение функции истинности Е^) равно целевой вероятности состояния X/

Е( X) = Р!1 (X).

На основе данной Теоремы можно предложить конструктивный способ вычисления вероятностных значений вектора предсказаний через вычисления функции истинности МЯ-модели. Истинностная функция МЯ-модели с достаточно высокой точностью аппроксимируется линейным выражением:

Е(^ ) = Х Ри ). (2)

]

Выражение (2) представляет эффективное средство вычисления вероятностных значений предсказывающего вектора в рассматриваемой методологии многошагового предсказания аномалий в темпоральных данных.

Другим важным выводом из данной теоремы является возможность использования нового подхода к обучению модели многошагового предсказания, через обучение предсказанию значений функции истинности МЯ-модели. Для этого можно использовать методы эволюционного моделирования [3]. Однако более эффективной является специальная методология темпорально-разностного обучения (ТБ-обучение) [4].

Нечеткая система преобразования процесса. При практической реализации методологии многошагового предсказания на основе МЯ-моделей возникает проблема, обусловленная Марковскими ограничениями на переходные вероятности между состояниями наблюдаемого процесса:

рК+11 X, x^-l,..., x^-k}=^+11 X}.

В реальных задачах это ограничение далеко не всегда выполняется. И, тем не менее, данную проблему можно решить путем преобразования исходного процесса к квази-Марковскому путем соответствующего выбора пространства состояний МЯ-модели, опираясь на положения известной теории “русел и джокеров” [5].

Теория “русел и джокеров”, основывается на классе динамических моделей с “джокерами”, в которых “джокеры” представляют собой особые области фазового пространства, где поведение системы становится непредсказуемым. В этих областях “джокер” может “забросить” траекторию процесса в любую точку фазового пространства. Естественно предположить, что вероятность этого скачкообразного перехода зависит исключительно от феномена “джокера” и не зависит от истории перехода процесса к “джокеру”. Тогда, исходя из данной гипотезы, можно в качестве состояний MR-модели выбирать не точечные состояния исходного наблюдаемого процесса х е X, а совокупности этих состояний Q(x), агрегированные на новой шкале Q и определенные на временных интервалах длительностью, перекрывающей длительность “русел”. Наличие “джокера” в каждом из гранулированных состояний нового процесса будет обеспечивать независимость вероятностных переходов, придавая преобразованному процессу характер Марковского процесса.

Для преобразования исходного процесса в квази-Марковский процесс предлагается использовать нечеткую систему, осуществляющую отображение совокупностей точечных состояний исходного процесса X на новую шкалу нечеткого интегрального признака, индуцируя на ней новый процесс в виде нечеткого временного ряда. В задачах предсказания сбоев в расписании движения поездов такой шкалой может быть виртуальная шкала “Напряженности”, на которую отображаются точечные состояния исходного процесса, такие как, время задержки поезда, категория поезда, особенности путевого развития станции и др. Для того, чтобы полученный новый временной процесс приближался к Марковскому необходимо обеспечить адаптируемость нечеткой системы по ширине захвата области определения гранулированных состояний в исходном процессе. Для этого используется специальный класс параметрических нечетких систем, с группой модифицируемых параметров V, обеспечивающих такую настройку. Включение такой адаптивной нечеткой системы в МЯ-модель, приводит к гибридной системе многошагового предсказания с двумя группами модифицируемых параметров IV и Р\ приведенной на рис. 3.

Рис. 3. Гибридная система многошагового предсказания с двумя группами модифицируемых параметров

Первая группа параметров Ж обеспечивает адаптацию системы под “пилообразный” характер шейпа предсказаний, а вторая - преобразование исходного процесса к квази-Марковскому. Поскольку оба критерия являются разносортными и не конфликтующими, процесс адаптации гибридной системы можно проводить независимо по обеим группам параметров в едином цикле обучения.

Заключение. В статье предложена новая методология упреждающего детектирования аномальных паттернов в темпоральных данных на основе метода многошагового предсказания с использованием адаптивных Марковских моделей. Предлагаемый подход может найти широкое применение в задачах распознавания аномалий во ВР, автоматического извлечения типовых паттернов в потоках данных, формирования темпоральных баз знаний и др.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1 Yeung D.Y., Ding Y.X. Host-based intrusion detection using dynamic and static behavioral models, Pattern Recognition. - 2003. - № 36. - С. 229-243.

2 Ковалев С.М. Упреждающее распознавание нечетких темпоральных паттернов в потоковых данных // Тринадцатая национальная конференция по искусственному интеллекту с международным участием КИИ-2012: Тр. конференции. Т. 2. - М.: Физматлит, 2012. - С. 313-322.

3 Курейчик В.В., Курейчик В.М., Сороколетов П.В. Анализ и обзор моделей эволюции. Известия РАН // Теория и системы управления. - 2007. - № 5.

4 Sutton R. Learning to predict by the method of temporal differences // Machine Learning. - 1988. - № 3 (1). - С. 9-44.

5 Малинейкий Г.Г., Потапов А.Б. Русла и джокеры: о новых методах прогноза поведения сложных систем // Препринт ИМП ИИ. им. М.В. Келдыша РАН. 2001.

Статью рекомендовал к опубликованию д.т.н., профессор А.Н. Шабельников.

Ковалев Сергей Михайлович - Ростовский государственный университет путей сообщения; e-mail: [email protected]; 344038, г. Ростов-на-Дону, пл. Ростовского Стрелкового Полка Народного Ополчения, 2, г; тел.: 89612687722; д.т.н.; профессор кафедры автоматики и телемеханики на ж. д. транспорте.

Kovalev Sergey Mihailovich - Rostov State University of Transport; e-mail: [email protected];

2, g, pl. Rostov Rifle Regiment of the People's Militia, Rostov-on-Don, 344038, Russia; phone: +79612687722; dr. of eng. sc.; professor the department of automation and remote control at the railway on transport.

УДК 681.3

Ю.О. Чернышев, Н.Н. Венцов, С.А. Мухтаров

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ПРИМЕНЕНИЕ ЛОГИК ЛУКАСЕВИЧА И ЗАДЕ ПРИ РЕАЛИЗАЦИИ МЕТОДА ОТРИЦАТЕЛЬНОГО ОТБОРА*

Описан метод отрицательного отбора. Приведен пример использования метода отрицательного отбора для анализа процесса передачи данных. Проанализирована целесообразность использования операций импликации и эквивалентности на основе логик Лукасевича и Заде при нечетком анализе информационных процессов. Приведены примеры сравнения декодера, описывающего критическое состояние процесса передачи данных, с кортежами описывающими текущее состояние процесса передачи данных при помощи операций импликации и эквивалентности. Установлено что для поставленной задачи анализа процессов передачи данных применение операции импликации является более предпочтительным. При выполнении операции импликации целесообразно использовать как логику Лукасевича так и логику Заде.

Вычислительные ресурсы; отрицательный отбор; интеллектуальные системы; оптимизация.

Yu.O. Chernyshev, N.N. Vencov, S.A. Mukhtarov

APPLICATION LOGICS LUKASIEWICZ AND ZADEH IN THE METHOD OF ADVERSE SELECTION*

The paper describes a method of adverse selection. An example using the method of adverse selection for the analysis of the data transfer process. Analyzed the implications of the use of operations and equivalence based on the logics of lukasiewicz and Zade when fuzzy analysis of informational processes. Examples of comparison decoder, describing the critical state of the data

* Работа выполнена при финансовой поддержке РФФИ (проекты: 12-01-00474, 13-01-00343).

i Надоели баннеры? Вы всегда можете отключить рекламу.