Научная статья на тему 'ОБОБЩЕННАЯ СТРАТЕГИЯ ДЛЯ РОБАСТНОГО МЕТОДА ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ'

ОБОБЩЕННАЯ СТРАТЕГИЯ ДЛЯ РОБАСТНОГО МЕТОДА ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
52
10
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛОЖНАЯ ТЕХНИЧЕСКАЯ СИСТЕМА / НЕОПРЕДЕЛЕННОСТЬ / МАШИННОЕ ОБУЧЕНИЕ / РОБАСТНЫЙ МЕТОД / COMPLEX TECHNICAL SYSTEM / UNCERTAINTY / MACHINE LEARNING / ROBUST METHOD

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Гоголевский Анатолий Сергеевич, Трепков Роман Евгеньевич, Романов Андрей Владимирович

Рассматривается проблема обоснования выбора стратегии принятия решения, по которой выбирается оптимальное распределение из множества M(e) в робастном методе обнаружения аномальных измерений в сложных технических системах (СТС).

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Гоголевский Анатолий Сергеевич, Трепков Роман Евгеньевич, Романов Андрей Владимирович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

GENERALIZED STRATEGY FOR A ROBUST METHOD OF DETECTION OF ANOMALOUS MEASUREMENTS

The article considers the problem of justifying the choice of a decision-making strategy, according to which the optimal distribution is selected from the set M (s) in the robust method for detecting anomalous measurements in complex technical systems.

Текст научной работы на тему «ОБОБЩЕННАЯ СТРАТЕГИЯ ДЛЯ РОБАСТНОГО МЕТОДА ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ»

Тобин Дмитрий Сергеевич, научный сотрудник, dtobin@mail. ru, Россия, Москва, Академия военных наук

INFORMA TION AND LOGIC MODEL OF PROCESSES SOFTWARE PLA TFORM DEVELOPMENT IN MILITARY MANAGEMENT BODIES

D.S. Tobin

The article presents the statement of the problem of developing a unified software platform for collecting and processing information in military command and control agencies, taking into account the specifics of the problem being solved, the importance of the initial stage of development is shown - a structural system analysis of the subject area, which provides specification of the requirements of numerous potential users of the software platform form and allows to ensure consideration of these requirements from the perspective of potential users and developers. The results of informational cal modeling of the development of the software platform in the organic-nah military control.

Key words: structural system analysis, logical information modeling, data flow diagram, software platform design.

Tobin Dmitriy Sergeyevich, researcher, dtobin@,mail.ru, Russia, Moscow, Academy of Military Sciences

УДК 004.891.3

ОБОБЩЕННАЯ СТРАТЕГИЯ ДЛЯ РОБАСТНОГО МЕТОДА ОБНАРУЖЕНИЯ АНОМАЛЬНЫХ ИЗМЕРЕНИЙ

А.С. Гоголевский, Р.Е. Трепков, А.В. Романов

Рассматривается проблема обоснования выбора стратегии принятия решения, по которой выбирается оптимальное распределение из множества M(s) в ро-бастном методе обнаружения аномальных измерений в сложных технических системах (СТС).

Ключевые слова: сложная техническая система, неопределенность, машинное обучение, робастный метод.

Внедрение методов и средств автоматизированного управления в сложные технические системы реального времени обусловлено применением СТС в экстремальных условиях эксплуатации и обслуживания, а также в условиях, где от человека требуется оперативное принятие решения. В процессе эксплуатации сложной технической системы очевидно снижается ее надежность, что приводит к увеличению доли отказов. В результате отказов появляются различного рода последствия: потеря информации, простои сопряженных с СТС других устройств и систем и т.д.

Для решения данной проблемы в исследование, проводимом в рамках статьи, предлагается модификация методики обнаружения отказов сложных технических систем [1], основанная на методе статистической робастности, а именно модели е - засорения.

348

Одним из условий построения робастного метода обнаружения аномальных измерений является определение стратегии, по которой выбирается оптимальное распределение из множества М(е).

При статистическом обучения сложной технической системы необходимо учитывать ошибки, вызванные помехами, выбросами и т.п. в процессе измерения параметров. Одним из способов данного учета используются методы статистической робастности. Сформулируем формальную задачу робастности (устойчивости) [2, 3].

Пусть имеется обучающая выборка (х^Ух), (х2,у2), ■ ■ (хп,уп) е Яп. Здесь щ -вектор параметров СТС, имеющие строгую последовательность, зависящую от времени, с определенным шагом измерения. Параметры снимаются с устройств и аппаратуры сложной технической системы, которые имеют точностную характеристику, т.е. имеют погрешность.

Также обучающая выборка имеет малую размерность. Из этого следуют, что каждый параметр имеет неточную величину. В свою очередь, это приводит к тому, что вектор параметров является неточным.

Требуется разработать метод устойчивости методики обнаружения отказов [1] к неточной (неопределенности) обучающей выборке. Для решения данной проблемы предлагается модификация данной методики, а именно, модификация примененного в ней метода одноклассовой классификации с Гауссовым ядром, за счет использования робастной модели е-засорения. Идея данного метода заключается в «размытии» вероятности точек (вектор параметров СТС) в соответствии с робастной моделью е-засорения [3,6].

Пусть р=(р1,... ,рп) - оценка некоторого распределения вероятностей состояния (вектор параметров СТС в определенный момент времени) сложной технической системы.

Модель е-засорения образует множество распределений вероятностей М(е) = {(1 — е)р1 + £qi}, где qi - произвольные вероятности, на которые накладывается единственное ограничение цг+...+цп = 1. Другими словами, ц = ..., дп) является произвольным распределением вероятностей из единичного симплекса, обозначенного 8(1,п).

Параметр засорения е отражает количество неопределенности в р. Множество М(е) есть множество всех распределений вероятностей с элементами, ограниченными нижней границей (1 — и верхней границей (1 - £}р; + £.

Перепишем задачу одноклассовой классификации [4] в общем виде, как минимизацию функционала риска

= ¡лтЬ(уг,р,х) <ЦГ(х). (1)

Здесь функция потерь является петлевой, т.е.

Ь(х\г,р,х) = тах{0,р — (х\г,ф(х))} — ру. (2)

349

Стандартная техника метода опорных векторов предполагает [4], что распределение вероятностей F является эмпирическим, что приводит к эмпирическому функционалу

Детр (W,p) (3)

Предположение об эмпирическом распределении вероятностей означает, что каждая точка хг имеет вероятность pi = 1 /п. Это слишком строгое предположение, так как число точек обучающей выборки мало.

В итоге, имеется некоторое неизвестное истинное распределение вероятностей в множестве М{е). А известно только то, что оно принадлежит М(е). В итоге необходимо определить правило или стратегию, по которой выбирается оптимальное распределение из множества М{е).

Одной из распространенных стратегий при принятии решения является стратегия, выбора наихудшего распределения. Данная стратегия получила называние минимаксной (пессимистической) стратегией.

Согласно этой стратегии выбирается такое распределение вероятностей из М(е), что функционал риска R(w, р) достигает максимума для каждого фиксированного набора w, р. Следует отметить, что оптимальное распределение вероятностей может быть различным для различных параметров w и р.

Другой противоположной стратегией является миниминная или оптимистическая стратегия. Согласно которой выбирается распределение вероятностей из М(с), минимизирующее функционал риска R(w, р) для различных параметров w и р.

В статье предлагается общая стратегия, являющаяся линейной комбинацией двух представленных ранее стратегий, с некоторым коэффициентом у, который называется параметром «осторожности». Эта стратегия в литературе называется осторожной [5-7]. А обе вышеприведенные стратегии являются крайними случаями ее. Из этого следует, что «осторожная» стратегия является общей или обобщенной стратегией для выбора оптимального распределения из множества М(с).

Пусть h =(hi, ... ,К) - распределение вероятностей из М(с). Тогда «осторожная» стратегия принятия решений с параметром у определяет функционал риска при фиксированных значениях w и р как

Rr(w,p) = ymaxR(w,p) + (1 -у) min R(w,p). r5\

' heM(e) АеМ(е) \ s

Функционал риска для «осторожной» стратегии принимает вид:

Oopt, Popi) = min Rr( w, p) =

= mim 7 max R(w,p) + (l-y) min

w ,p l h€M(£) heM(e) ]

(6)

Минимаксный функционал риска может быть найден при помощи следующей задачи линейного программирования:

max R(w,p) = max Yfy ■ - pv

п

= Ж 2 ((1" +) ~Ру= (7)

7=1

П

= (1 - + £ • тах^ • ,р,<К*,)) -1ОУ,

при ограничениях

Полученная задача является линейной с переменными оптимизации ¿/7, ... , с/п, но целевая функция зависит от м и р. Поэтому, непосредственно нельзя ее решить известными численными методами. Однако заметим, что все значения д принадлежат симплексу 8(1,п) в пространстве конечной размерности, так как являются вероятностями. В соответствии с некоторыми положениями теории линейного программирования [8-11], оптимальное решение данной задачи достигается на крайних точках симплекса,

(1.0,...,0). (0Д.....0),..., ни......и ЧИСЛ0 К0Т°Р"Х Равно п- КраЙние т04"

ки 4 у 4 у 4 у симплекса 8(1,п) имеют простои вид

Отсюда следует, что

п

шах те,р) = (1 - £)п 1У /(те, р, ф{хг)) +

+£-тах1(ху,р,0(хг))- ру. ^

Таким же образом можно найти нижнюю границу функционала

риска

min R(w,p) = (\-£)n + min/(w,/7,^(x;))-/7V. (9)

AeM(e) i=l,...,n

2=1

Отсюда получаем

п

Rr(w,p) = (1 - £)nl £ Kvr ,P, ))-pv +

(10)

+£^max/(w,yO,^(x;)) + £(l- y) min /(w,yp,0(x;)).

Следующая задача - минимизация функционала риска Ry (w, р) по параметрам w и р. Задача будет решена в рамках метода обнаружения аномальных измерений.

В статье в качестве метода обнаружения аномальных измерений используется модификация метода опорных векторов [1]. Используя данный метод для вычисления параметров w и р, добавим член регуляризации

^ (w, w) к целевой функции и введем новые переменные

^ =max{O,/?-(w,0(x))j, (т = in ах ^.

Это приводит к задаче квадратичного программирования

(11)

+eyG - pv + е{\ - у) mm £ -» mm ,

при ограничениях

£>/?-(w,^(x)), £>0, г = 1,...,и, G>i, i = l,...,n. Очевидно, что целевая функция может быть записана как множество локальных целевых функций

2 " tr (12)

- р v + £(1 - min ,

так что функционал риска определяется как

^r(wopt,/?opt) = minH „ Ryk (13)

Таким образом, необходимо решить п задач оптимизации. Оптимальные параметры wopt и рорt соответствуют наименьшему значению функционалов Ryк = 1 ,...,п.

Вместо минимизации целевой функции Ry k можно записать двойственную задачу оптимизации [12], называемую лагранжианом. Целевая функция двойственной задачи, обозначаемая Ly должна быть максимизирована

+ +£yG-pv + £(l-r)Ü-

2* ft 1

(14)

-¿4S -±<p1(i1-p + (w,ф(хг)))-£ц(0-$).

2=1 2=1 2=1

Здесь А.1,г]1,(р1, z'=l,...,w - множители Лагранжа. Следовательно, они удовлетворяют условиям rfo > 0,(pi > 0,Я£ > 0 для всех i=l,...,n. Вычислим производные

ЭLyJc / Эp = -v + fj(pi= 0, ЪЬ7Л / 3G = уЕ - ¿77,= 0,

¿=1 ¿=1

дь7Л / э£ = (1 - ¿-к1 - Д - я + ц + £(\ - г)h (0 = о,

а*,,, / Эил = w7 - X щ ■ ф(х^) = 0, J = 1,

¿=1

Здесь lk(i) - индикаторная функция, принимающая значение 1, если / к. Используя полученные равенства, мы упрощаем целевую функцию

^ п п

Lk <Pi-<Pj-K(*i>Xjl (15)

1 /=1 У=1

при ограничениях

0 < q>x. < (1 - е)п1 + 77,. + f (1 - (/),/ = 1,..., и,

¿=1 ¿=1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В результате данная целевая функция не отличается от целевой функции, полученной в стандартном методе опорных векторов с эмпирическим распределением вероятностей [4]. Однако, основное отличие содержится в ограничениях.

Функция /(х) может быть переписана в терминах множителей Jla-

гранжа

/(x,w) = ¿^(x;,x)-/7. (16)

2=1

Отсюда находим оптимальное значение р, принимая f(x,w) = О,

т.е.

п 2=1

В статье рассматривается два частных крайних случая.

При первом случае имеется одно распределение вероятностей и £ — 0. Отсюда г]i = 0 и ограничения для (pt принимают вид:

п 2=1

В результате опыта при данных параметрах решается стандартный метод опорных векторов [4].

В другом случае рассматривается полная неопределенность, когда £ — 1. В этом случае только одна из точек обучающей выборки с наибольшей функцией потерь L(w, р, 0(x¡)) определяет решающую функцию.

Оба случая (при £ = 1 и £ = 0) нельзя использовать в робастной модели обнаружения аномальных измерений. Так как, в первом случае при £ — 1, исходные данные полностью определяются, как аномальные измерения, а во втором случае система становиться не чувствительной к ошибкам в обучающей выборке. Поэтому, в рамках статьи эмпирическим методом решается задача нахождения оптимального параметра £.

В рамках экспериментальных исследований были сгенерированы 100 модельных обучающих выборок с 100 состояниями СТС. Каждое состояние системы имеет вид x¿ = {xf, xt2}, где х\ - показание параметра системы, a xf - приращение данного параметра [13]. Для метода обнаружения отказов [1] были выбраны следующие параметры ядра: о =0,07; С=0,8. Параметр £ для робастного метода изменяется в диапазоне [0,1] с шагом 0,2.

По результатам исследований наиболее эффективным методом обнаружения отказов СТС по LOO является робастный метод с параметром £ равным 0,4.

На рис. 1 представлены графические решения робастной модели при разных стратегиях для робастного метода обнаружения аномальных измерений. На рис. 2 синей линией «standard» показана замкнутая прямая, отделяющая область нормальных значений, которая является графическим отображением решающей функции, полученной с помощью метода [1]. Зеленой линей «minimin» - отображение решающей функции,

353

полученной с помощью робастной модели с применением минимаксной стратегии. Красной линией «пиштах» - отображение решающей функции, полученной с помощью робастной модели с применением минимаксной стратегии.

Рис. 1. Графические решения робастной модели при разных стратегиях для робастного метода обнаружения аномальных

измерений

В таблице представлены результаты сравнения робастных моделей при трех случаях: минимаксная и миниминная стратегии, и метод [1]. В последней строчке приводиться усредненный относительный коэффициент LOO по моделям.

X(xf,xf)

standard minimin minimax

1 0,686 0,686 0,781

2 0,797 0,757 0,868

100 0,810 0,786 0,798

ACCloo ср 0,764 0,743 0,816

Рис. 2. Результаты анализа разработанных робастных моделей обнаружения аномальных измерений

Случаи, приведенные выше, являются обобщением всех многочисленных опытов, проведенных в рамках исследования. Результаты, приведенные в таблице, закономерны для различных случаев.

Анализ результатов показал, что эффективным робастным методом для обнаружения аномальных измерений СТС признана робастная модель одноклассовой классификации с Гауссовым ядром с применением минимаксной стратегии для выбора распределения М(е) с оценками по кросс-валидации равными 0,816.

В итоге, принято решение в качестве обобщенной стратегии использовать крайний вариант «осторожной» стратегии при у=1 для выбора оптимального распределения из множества М(е), другими словами, использовать минимаксную стратегию. Это обусловлено тем, что использовать «осторожную» стратегию с неизвестным параметром у в реальных условиях, по условиям поставленной задачи, не представляется возможным, так как этот процесс выбора оптимального параметра осторожности у является трудоемким и неоднозначным. Также нельзя использоваться ми-ниминную стратегию, так как система будет полностью не устойчива к ошибкам в исходных данных.

В рамках статьи анализировалась статическая система, т.е. рассматриваются процессы, которые не изменяются в течение времени. Хотя сложная техническая система такой не является. В следствии чего, если оценивать значения векторов параметров СТС по математическому ожиданию, то математическое ожидание новых (поступающих) значений будет различным от математического ожидания измерений, по которым система обучалась.

Таким образом, «в прямую» применять робастный метод для непрерывного потока данных не представляется возможным. Поэтому, стоит задача оптимизации системы обнаружения отказов СТС путем разработки метода обучения с определенным обучаемым окном значений.

Список литературы

1. Методика обнаружения отказов сложных технических систем на основе алгоритмов машинного обучения / A.C. Гоголевский, A.B. Романов, P.E. Трепков, В.А. Соколова // Системы. Методы. Технологии. Братск: ФГБОУ ВО «БрГУ», 2019. № 4 (44). С. 54-60.

2. Хампель Ф. Робастность в статистике. М.: Мир, 1989. 512 с.

3. Хьюбер П. Робастность в статистике. М.: Мир, 1984. 304 с.

4. Мерков А.Б. Введение в методы статистического обучения. М.: Эдиториал УРСС, 2011. 256 с.

5. Майстров JI.E. Теория вероятности. Краткий очерк. М.: Наука, 1967. 321 с.

6. Уткин JI.B. Анализ риска и принятие решений при неполной информации. СПб.: Наука, 2007. 404 с.

7. Хьюбер П. Робастность в статистике. М.: Мир, 1984. 304 с.

8. Ашманов С.А. Линейное программирование. М.: Наука. Главная редакция физико-математической литературы, 1981. 340 с.

9. Банди Б. Основы линейного программирования: пер. с англ. Ши-хеевой О.В. / под ред. Волынского В.А. М.: Радио и связь, 1989. 176 с.

10. Барсов A.C. Что такое линейное программирование. Государственное издательство физико-математической литературы. М.: Наука. Государственное издательство физико-математической литературы, 1959. 104 с.

11. Лунгу К.Н. Линейное программирование. Руководство к решению задач. М.: ФИЗМАТЛИТ, 2005. 128 с.

12. Поляк Б. Т. Введение в оптимизацию. М.: Наука. Главная редакция физико-математической литературы, 1983. 384 с.

13. Гоголевский А.С. Метод преобразования данных для обнаружения аномального поведения системы // Материалы международной конференции по мягким вычислениям и измерениям. СПб: ЛЭТИ, 2013. С. 164166.

14. Mullin M., Sukthankar R. Complete Cross-Validation for Nearest Neighbor Classifiers // Proceedings of International Conference on Machine Learning. 2000. P. 1137-1145.

Гоголевский Анатолий Сергеевич, канд. техн. наук, старший научный сотрудник, vka@mil.ru, Россия, Санкт-Петербург, Военно-космической академии им. А. Ф. Можайского,

Трепков Роман Евгеньевич, канд. техн. наук, преподаватель, vka@mil.ru, Россия, Санкт-Петербург, Военно-космической академии им. А. Ф. Можайского,

Романов Андрей Владимирович, начальник лаборатории, vka@mil.ru, Россия, Санкт-Петербург, Военно-космической академии им. А. Ф.Можайского

GENERALIZED STRATEGY FOR A ROBUST METHOD OF DETECTION OF ANOMALOUS MEASUREMENTS

A.S. Gogolevsky, R.E. Trepkov, A. V. Romanov

The article considers the problem of justifying the choice of a decision-making strategy, according to which the optimal distribution is selected from the set M (e) in the robust methodfor detecting anomalous measurements in complex technical systems.

Key words: complex technical system, uncertainty, machine learning, robust method.

Gogolevsky Anatoly Sergeevich, candidate of technical sciences, senior researcher, vka@mil.ru, Russia, St. Petersburg, Military Space Academy named after A.F. Mozhaisky,

Trepkov Roman Evgenievich, candidate of technical sciences, lecturer, vka@mil.ru, Russia, St. Petersburg, Military Space Academy named after A.F. Mozhaisky,

Romanov Andrey Vladimirovich, head of the laboratory, vka@mil.ru, Russia, St. Petersburg, Military Space Academy named after A.F. Mozhaisky

i Надоели баннеры? Вы всегда можете отключить рекламу.