Научная статья на тему 'НЕПАРАМЕТРИЧЕСКИЙ МЕТОД ОБНАРУЖЕНИЯ РАЗЛАДКИ ВРЕМЕННÓГО РЯДА С ИСПОЛЬЗОВАНИЕМ МЕХАНИЗМА СЛУЧАЙНЫХ БЛУЖДАНИЙ'

НЕПАРАМЕТРИЧЕСКИЙ МЕТОД ОБНАРУЖЕНИЯ РАЗЛАДКИ ВРЕМЕННÓГО РЯДА С ИСПОЛЬЗОВАНИЕМ МЕХАНИЗМА СЛУЧАЙНЫХ БЛУЖДАНИЙ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
124
34
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАЗЛАДКА ВРЕМЕННóГО РЯДА / ОБНАРУЖЕНИЕ РАЗЛАДКИ / НЕПАРАМЕТРИЧЕСКИЙ АЛГОРИТМ ОБНАРУЖЕНИЯ / МЕХАНИЗМ СЛУЧАЙНЫХ БЛУЖДАНИЙ / ТЕОРИИ СЕРИЙ "УСПЕХОВ" / ВЕРОЯТНОСТНЫЕ ХАРАКТЕРИСТИКИ АЛГОРИТМА / ЭФФЕКТИВНОСТЬ АЛГОРИТМА / СИСТЕМЫ МОНИТОРИНГА / TIME SERIES BREAKDOWN / BREAKDOWN DETECTION / NONPARAMETRIC DETECTION ALGORITHM / RANDOM WALK MECHANISM / THEORY OF SUCCESS RUNS / PROBABILISTIC CHARACTERISTICS OF THE ALGORITHM / ALGORITHM EFFICIENCY / MONITORING SYSTEMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Филаретов Геннадий Федорович, Бучаала Зинеддин

Рассмотрена задача оперативного обнаружения внезапного изменения вероятностных свойств временнóго ряда, обычно трактуемая как задача обнаружения разладки наблюдаемого стохастического процесса. Отмечается актуальность развития исследований по данной тематике, что обусловлено появлением всё новых прикладных задач, где методы и алгоритмы обнаружения разладки могут успешно использоваться - в частности, при создании мониторинговых систем в промышленности, экологии, медицине и др. Обсуждаются две основные разновидности методов обнаружения разладки: параметрические и непараметрические. Отмечено, что, хотя непараметрические методы при прочих равных условиях уступают параметрическим по эффективности (быстроте обнаружения разладки), но зато обладают и рядом преимуществ, не требуя, в частности, контролируемого процесса. Это принципиально важно при построении мониторинговых систем, когда детальная информация об этих свойствах может либо полностью отсутствовать и тогда необходимо проводить достаточно трудоемкое его предварительное исследование, либо быть малодостоверной. Предложен оригинальный последовательный непараметрический алгоритм обнаружения разладки на основе реализации механизма случайных блужданий или, более конкретно, с использованием теории серий «успехов». Объяснен принцип работы контролирующего алгоритма и дано его описание. Приведены результаты исследования основных статистических характеристик алгоритма, включая определение его эффективности, и результаты сопоставления с известными параметрическими методами. Выделена область возможного практического использования предложенного алгоритма, где его эффективность остается достаточно высокой. Отмечена перспективность применения предложенного алгоритма в составе программно-алгоритмического обеспечения систем мониторинга различного назначения.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Филаретов Геннадий Федорович, Бучаала Зинеддин

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NON-PARAMETRIC METHOD FOR DETECTING BREAKDOWN OF TIME SERIES USING THE RANDOM WALKS THEORY MECHANISM

The task of the on-line detection of a sudden change in the probability properties of a time series is considered, which is usually interpreted as the detecting task of change point the characteristics (breakdown) in the observed stochastic process. The actuality of the development of research on this topic is noted, which is due to the emergence of ever new applied problems where methods and algorithms for breakdown detecting can be successfully used - in particular, when creating monitoring systems in industry, ecology, medicine, etc. Two main varieties of methods for breakdown detecting are discussed: parametric and nonparametric. It is noted that, although nonparametric methods, ceteris paribus, are inferior to parametric methods in terms of efficiency (the speed of breakdown detecting), they also have a number of advantages, without requiring, in particular, for their application detailed information about the probabilistic properties of the controlled process. This is fundamentally important for building monitoring systems, when detailed information about these properties may either be completely absent and then it is necessary to conduct a rather laborious preliminary study of it, or to be unreliable. An original sequential nonparametric algorithm for detecting discord is proposed based on the implementation of the random walk mechanism or, more specifically, using the theory of success runs. The operating principle of the control algorithm is explained and its description is given. The results of the study of the basic statistical characteristics of the algorithm, including the determination of its effectiveness, and results of comparison with known parametric methods, are given. The area of possible practical use of the proposed algorithm is highlighted, where its effectiveness remains quite high. The prospects of using the proposed algorithm as part of the software and algorithmic support of monitoring systems for various purposes are noted.

Текст научной работы на тему «НЕПАРАМЕТРИЧЕСКИЙ МЕТОД ОБНАРУЖЕНИЯ РАЗЛАДКИ ВРЕМЕННÓГО РЯДА С ИСПОЛЬЗОВАНИЕМ МЕХАНИЗМА СЛУЧАЙНЫХ БЛУЖДАНИЙ»

24. Zloba E., Yatskiv I. Statisticheskie metody vosstanovleniya propushchennykh dannykh [Statistical methods for recovering missing data], Computer Modelling & New Technologies, 2002, Vol. 6, No. 1, pp. 51-61.

25. Sorokin A.A., Kovalenko R.A., Yakovleva E.A. Prognozirovanie stoimosti arendy skladskikh pomeshcheniy na osnove statisticheskikh dannykh [Forecasting the cost of rental warehouse based on statistical data], Evraziyskiy soyuz uchenykh [Eurasian Union of Scientists], 2018, No. 12 (57), pp. 59-62.

26. Ryzhenkova K.V. Metody vosstanovleniya propuska dannykh pri provedenii statisticheskikh issledovaniy [Methods for recovering data gaps in statistical studies], Intellekt. Innovatsii. Investitsii [Intelligence. Innovation. Investments], 2012, No. 3, pp. 127-133.

Статью рекомендовал к опубликованию д.т.н. С.В. Колесниченко.

Сорокин Алексей Андреевич - Ивангородский гуманитарно-технический институт (филиал) Санкт-петербургского государственного университета аэрокосмического приборостроения; e-mail: A.A.Sorokin@ifguap.ru; 188491, Ивангород, ул. Котовского, 1; кафедра прикладной математики, информатики и информационных таможенных технологий; старший преподаватель.

Дагаев Александр Владимирович - e-mail: adagaev@list.ru; кафедра прикладной математики, информатики и информационных таможенных технологий; к.т.н.; доцент.

Бородянский Илья Михайлович - Южный федеральный университет; e-mail: iborodyanskiy@sfedu.ru; 347928, г. Таганрог, пер. Некрасовский, 44; тел.: +79185027169; кафедра информационных измерительных технологий и систем; доцент.

Sorokin Aleksei Andreevich - St. Petersburg University of Aerospace Instrumentation; e-mail: A.A.Sorokin@ifguap.ru; 1, Kotovskogo street, Ivangorod, 188491, Russia; the department of applied mathematics, computer science and customs information technologies; senior lecturer.

Dagaev Aleksandr Vladimirovich - e-mail: adagaev@list.ru; the department of applied mathematics, computer science and customs information technologies; cand. of eng. sc.; associate professor.

Borodyansky Ilya Mikhailovich - Southern Federal University; e-mail: iborodyanskiy@sfedu.ru; 44, Nekrasovskiy lane, Taganrog, 347928, Russia; phone: +79185027169; the department of information measuring technologies and systems; associate professor.

УДК 519.27 DOI 10.18522/2311-3103-2020-4-107-117

Г.Ф. Филаретов, З. Бучаала

НЕПАРАМЕТРИЧЕСКИЙ МЕТОД ОБНАРУЖЕНИЯ РАЗЛАДКИ ВРЕМЕННОГО РЯДА C ИСПОЛЬЗОВАНИЕМ МЕХАНИЗМА СЛУЧАЙНЫХ БЛУЖДАНИЙ

Рассмотрена задача оперативного обнаружения внезапного изменения вероятностных свойств временного ряда, обычно трактуемая как задача обнаружения разладки наблюдаемого стохастического процесса. Отмечается актуальность развития исследований по данной тематике, что обусловлено появлением всё новых прикладных задач, где методы и алгоритмы обнаружения разладки могут успешно использоваться - в частности, при создании мониторинговых систем в промышленности, экологии, медицине и др. Обсуждаются две основные разновидности методов обнаружения разладки: параметрические и непараметрические. Отмечено, что, хотя непараметрические методы при прочих равных условиях уступают параметрическим по эффективности (быстроте обнаружения разладки), но зато обладают и рядом преимуществ, не требуя, в частности, контролируемого процесса. Это принципиально важно при построении мониторинговых систем, когда детальная информация об этих свойствах может либо полностью отсутствовать и тогда необходимо проводить достаточно трудоемкое его предварительное исследование, либо быть малодостоверной. Предложен оригинальный последовательный непараметрический алгоритм обнаружения разладки на основе

реализации механизма случайных блужданий или, более конкретно, с использованием теории серий «успехов». Объяснен принцип работы контролирующего алгоритма и дано его описание. Приведены результаты исследования основных статистических характеристик алгоритма, включая определение его эффективности, и результаты сопоставления с известными параметрическими методами. Выделена область возможного практического использования предложенного алгоритма, где его эффективность остается достаточно высокой. Отмечена перспективность применения предложенного алгоритма в составе программно-алгоритмического обеспечения систем мониторинга различного назначения.

Разладка временного ряда; обнаружение разладки; непараметрический алгоритм обнаружения; механизм случайных блужданий; теории серий «успехов»; вероятностные характеристики алгоритма; эффективность алгоритма; системы мониторинга.

G.F. Filaretov, Z. Bouchaala

NON-PARAMETRIC METHOD FOR DETECTING BREAKDOWN OF TIME SERIES USING THE RANDOM WALKS THEORY MECHANISM

The task of the on-line detection of a sudden change in the probability properties of a time series is considered, which is usually interpreted as the detecting task of change point the characteristics (breakdown) in the observed stochastic process. The actuality of the development of research on this topic is noted, which is due to the emergence of ever new applied problems where methods and algorithms for breakdown detecting can be successfully used - in particular, when creating monitoring systems in industry, ecology, medicine, etc. Two main varieties of methods for breakdown detecting are discussed: parametric and nonparametric. It is noted that, although nonparametric methods, ceteris paribus, are inferior to parametric methods in terms of efficiency (the speed of breakdown detecting), they also have a number of advantages, without requiring, in particular, for their application detailed information about the probabilistic properties of the controlled process. This is fundamentally important for building monitoring systems, when detailed information about these properties may either be completely absent and then it is necessary to conduct a rather laborious preliminary study of it, or to be unreliable. An original sequential nonparametric algorithm for detecting discord is proposed based on the implementation of the random walk mechanism or, more specifically, using the theory of success runs. The operating principle of the control algorithm is explained and its description is given. The results of the study of the basic statistical characteristics of the algorithm, including the determination of its effectiveness, and results of comparison with known parametric methods, are given. The area ofpossible practical use of the proposed algorithm is highlighted, where its effectiveness remains quite high. The prospects of using the proposed algorithm as part of the software and algorithmic support of monitoring systems for various purposes are noted.

Time series breakdown; breakdown detection; nonparametric detection algorithm; random walk mechanism; theory of success runs; probabilistic characteristics of the algorithm; algorithm efficiency; monitoring systems.

Введение. Рассматривается задача оперативного обнаружения внезапного изменения вероятностных свойств временного ряда. Данная задача обычно трактуется как задача обнаружения, так называемой, разладки наблюдаемого стохастического процесса [1] или как задача анализа его статистической стабильности c помощью контрольных карт [2]. Методы и алгоритмы ее решения относятся к категории последовательных, пригодных для работы в реальном времени и в любом варианте по сути остаются одними и теми же, разве что функционирование контрольных карт, обычно, сопровождается графическим дополнением.

Хотя первые работы по указанной тематике появились достаточно давно [3, 4], интерес к ней с годами не только не уменьшается, а скорее, наоборот, увеличивается, о чем говорят данные библиометрического анализа [5], зафиксировавшего экспоненциальный рост числа публикаций за последние годы. Это, по всей видимости, связано с появлением всё новых прикладных задач, где такого рода алгоритмы могут успешно использоваться - в частности, при создании мониторинговых систем в промышленности, экологии, медицине и др.

К настоящему времени разработано весьма большое число различных методов обнаружения разладки. Все их можно подразделить на две большие группы: методы параметрические и непараметрические.

Параметрические методы базируются на предположении, что наблюдаемый (контролируемый) процесс имеет априори известную функцию распределения вероятностей, входящую в некоторое параметрическое семейство распределений, причем разладка связана с изменением одного или нескольких параметров этого распределения. Чаще всего предполагается, что процесс гауссовский с некоррелированными отсчетами, а разладка связана со скачкообразным изменением математического ожидания или дисперсии в одномерном варианте или вектора математических ожиданий или ковариационной матрицы в многомерном.

Среди параметрических методов обнаружения разладки наиболее хорошо изученными и получившими наибольшее распространение являются различные варианты методов и алгоритмов, базирующихся на видоизменённом последовательном анализе. Чаще всего их называют алгоритмами кумулятивных сумм (АКС) или CUSUM-алгоритмами [1]. Доказано [6], что эти алгоритмы обладают определенными оптимальными свойствами в смысле максимизации показателя эффективности

Е = Тлт / Тзап, где Тлт - среднее время между ложными тревогами, когда контролирующий алгоритм подает сигнал о наличии разладки, когда на самом деле она отсутствует, тзап - среднее время запаздывания в обнаружении номинальной разладки d , т.е.

разладки, которую необходимо как можно быстрее обнаружить.

Непараметрические методы не требуют какой-либо существенной информации о виде функций распределения контролируемого процесса. Поэтому их часто именуют процедурами «свободными от распределения».

Их главная отличительная черта - они оперируют не с самими измеренными значениями, а с их знаковыми, ранговыми или порядковыми представлениями. Такие методы в настоящее время развиваются весьма интенсивно, поскольку у непараметрического подхода, как оказалось, имеется еще ряд преимуществ по сравнению с параметрическим [7-10]. Важнейшими из них являются: простота реализации контролирующего алгоритма, одинаковые характеристики эффективности для целого семейства процессов с непрерывными, возможно различными функциями распределения вероятностей, большая устойчивость результатов, отсутствие необходимости в оценке дисперсии для определения параметра разладки d .

Перечисленные преимущества имеют принципиально важный характер при построении мониторинговых систем, когда детальная информация о свойствах контролируемого процесса может либо полностью отсутствовать и тогда необходимо проводить достаточно трудоемкое его предварительное исследование, либо быть малодостоверной.

Как следует из рассмотрения и анализа имеющихся публикаций (см., например, [11-18]), подавляющее большинство известных на данный момент непараметрических методов обнаружения разладки базируется на модификации одного из стандартных непараметрических критериев проверки статистических гипотез. Дальнейшее изложение посвящено рассмотрению другого способа построения непараметрического алгоритма обнаружения разладки, а именно с использованием элементов теории случайных блужданий [19].

1. Постановка задачи. Впервые идея использования механизма одномерных случайных блужданий как средства решения задачи обнаружения разладки была высказана в работе [20], опубликованной в 1975 г. В ней рассматривалась классическая схема одномерных случайных блужданий, когда на каждом шаге в некото-

рый дискретный момент времени п текущая координата точки 2п, отображающей процесс блуждания, с вероятностью р получает приращение +1 или с вероятностью q = 1 -р - приращение -1 в соответствии с соотношением:

+1, х„ >Ме(X) , п = 1, 2, ... (1)

[-1, хя <Ме(X)

где Ме (X) - значение медианы наблюдаемого временного ряда в состоянии «норма» (без разладки). Отметим, что в этом случае справедливо равенство р = q =1/2; однако при наличии разладки эта симметрия нарушается. Можно, например, считать, что разладка приводит к сдвигу медианы в положительную сторону и, следовательно, тогда будем иметь вероятность р > 1/2. Исходная идея, к сожалению, не была затем доведена до уровня, позволяющего выработать четкие рекомендации по синтезу соответствующей контролирующей процедуры, оценить ее эффективность, а также возможности практического применения. Далее рассматривается одно из возможных направлений развития методов обнаружения разладки на базе применения механизма случайных блужданий, а именно с использованием теории серий «успехов» [19].

В соответствии с определением, приведенным в [19], под успехом понимается появление в последовательности испытаний Бернулли события, приводящего к движению отображающей точки случайного блуждания в положительную сторону, т.е. когда приращение равно +1. Тогда под серией успехов подразумевается появление нескольких следующих друг за другом значений +1, а под длиной серии - их количество к .

Целью данной работы является построение на этой основе непараметрического метода обнаружения разладки, исследование его основных статистических характеристик и анализ эффективности, в том числе при сопоставлении с известными параметрическими методами.

2. Непараметрический метод обнаружения разладки на основе теории серий успехов. Контролирующая процедура предлагаемого метода очень простая и сводится на каждом п-ом такте работы к вводу очередного значения контролируемого процесса хп, его преобразованию в значение приращения гп в соответствии с соотношением (1), подсчету кп - текущей длины серии из следующих подряд значений 2п = +1: кп = кп-1 +1, если 2п = +1 и кп = 0, если 2п = -1 , фиксации номера такта п* , на котором будет выполнено условие кп* = кп = к , где к - заранее заданное пользователем значение, выбранное исходя из необходимости обеспечения желательного среднего времени между ложными тревогами Тлт . Фактически

п* фиксирует момент первого появления серии из +1 выбранной длины к.

Появление серии успехов длины к трактуется в [19] как рекуррентное событие. Для таких событий там приведены формулы, позволяющие найти математическое ожидание и дисперсию первого от начала осуществления испытаний появления серии длины к :

т = 1-Р' ■ ^ =_1___2к + 1___(2)

к (1 - р)рк ' к [(1 - р)рк ] (1 - р)рк (1 - р)2

При отсутствии, разладки вероятность р = 1/2, а зафиксированное значение п* отвечает моменту появления сигнала ложной тревоги. Полагая в соотношении для тк вероятность р = р0= можно определить средний интервал между ложными тревогами Т ш :

Т =

1 ЛТ

1 - (1/2)* а/2)*

- 2^2* -1) •

(3)

В табл. 1 приведены значения Тлт, соответствующие разным величинам длин серий к, а также соответствующие значения ак .

Таблица 1

Зависимость Тлт и ак от длины серий успехов к

к 4 5 6 7 8 9 10 11 12

Т 1 ЛТ 30 62 126 254 510 1022 2046 4094 8190

а* 27,09 58,22 121,3 248,3 503,4 1014,4 2037,5 4084,5 8179,5

Для оценки среднего времени запаздывания в обнаружении разладки тзап также можно воспользоваться вышеприведенной формулой для тк, если положить в ней значение p = p\ > У . При этом для получения общего представления о быстродействии алгоритма обнаружения выбор конкретных значений p может быть осуществлен пользователем достаточно произвольно, исходя из его собственных представлений о величине разладки, подлежащей обнаружению. Однако здесь целесообразнее выбирать p\ с учетом их последующего использования для сопоставления предложенного метода с известными параметрическими методами обнаружения. В качестве таковых предлагается использовать наиболее изученные варианты С^иМ-алгоритмов, предназначенных для обнаружения разладки гауссовского случайного процесса по математическому ожиданию и дисперсии. Для таких алгоритмов известны расчетные величины

Тзап для фиксированных Тлт и типовых наборов значений, характеризующих

величину разладки d.

Для случая разладки по математическому ожиданию такой типовой набор обычно включает следующие значения dm: 0,25; 0,5; 1,0; 1,5; 2,0; 2,5, где = \т — т0\<х , да0 и - значения математических ожиданий процесса xn до и

после разладки соответственно.

Для случая разладки по дисперсии типовой набор содержит следующие значения = сгЦ<2; <2 и а12 - значения дисперсий процесса xn до и после разладки: 1,5; 2,0; 2,5 - разладка в сторону увеличения дисперсии () и 1/1,5; 1/2,0;

1/2,5 - разладка в сторону уменьшения дисперсии (¿а )

Каждому из перечисленных типовых значений разладки могут быть сопоставлены значения вероятности p\. Соответствующая информация приведена в табл. 2 и табл. 3.

Таблица 2

Значения показателя разладки йт и соответствующие им вероятности р^

¿ш 0,25 0,5 1,0 1,5 2,0 2,5

Р1 0,599 0,692 0,841 0,933 0,977 0,994

Таблица 3

Значения показателей разладки ^ , da и вероятности р^, рх

dt 1,25 1,5 2,0 2,5 3,0

P+ 0,546 0,582 0,634 0,669 0,697

dt 1/1,25 1/1,5 1/2,0 1/2,5 1/3,0

Pi 0,550 0,592 0,659 0,718 0,758

Далее при получении и анализе статистических характеристик рассматриваемого непараметрического алгоритма будет использованы именно значения рх из табл. 2 и табл. 3.

3. Статистические характеристики алгоритма обнаружения. Искомыми статистическими характеристиками алгоритма обнаружения разладки являются

значения среднего времени запаздывания тзап и показателя эффективности Е, найденные для значений р\, р^, р 1 , соответствующих всем типовым вариантам параметров йт , d * , dа и различным к . Полученные расчетные значения приведены в табл. 4 - 6 и отображены на рис. 1.

Таблица 4

Значения среднего времени запаздывания Гзап для различных р1

dm XipO k \ 0,25 (0,599) 0,5 (0,692) 1,0 (0,841) 1,5 (0,933) 2,0 (0,977) 2,5 (0,994)

4 16,88 10,94 6,28 4,77 4,24 4,06

5 29,84 17,27 8,66 6,19 5,36 5,09

6 51,49 26,42 11,49 7,70 6,51 6,13

7 87,64 39,66 14,85 9,33 7,69 7,17

8 147,97 58,81 18,84 11,07 8,90 8,22

9 248,70 86,51 23,59 12,94 10,13 9,28

10 416,87 126,57 29,24 14,94 11,39 10,34

11 697,61 184,51 35,96 17,08 12,68 11,42

12 1166,29 268,31 43,95 19,38 14,00 12,48

Таблица 5

Значения среднего времени запаздывания Гзап для различных р^, р1

dt С

1,5 2,0 2,5 1/1,5 1/2,0 1/2,5

к (Pi+ = (Pi+ = (P+ = (Pi = (Pi = (Pi =

0,582) 0,634) 0,669) 0,592) 0,659) 0,718)

8 176 101 72 277 80 47

9 310 162 107 268 122 66

10 532 254 163 466 185 94

11 907 406 244 781 284 134

E 600

Pl

5 6 7 8 9 10 11 12

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

*

о 0,599

□ 0,692

О 0,841

д 0,933

• 0,977

■ 0,9938

Рис. 1. Зависимости показателя эффективности Е непараметрической контролирующей процедуры от k для различных вероятностей p1

Таблица 6

Значения показателя эффективности контролирующей процедуры Ек для

различных , р—

¿а ¿а

1,5 2,0 2,5 1/1,5 1/2,0 1/2,5

к (Р1+ = (Р\ = (Р1+ = (Р— = (Р— = (РГ =

0,582) 0,634) 0,669) 0,592) 0,659) 0,718)

8 2,9 5,0 7,1 1,8 6,4 11,0

9 3,3 6,3 9,5 3,8 8,4 15,5

10 3,8 8,0 12,6 4,4 11,1 21,8

11 4,5 10,1 16,8 5,2 14,4 30,5

Ясно, что эффективность всех рассматриваемых процедур увеличивается с ростом вероятности р (т.е. с ростом величины разладки) и возрастанием значения k (т.е. с ростом значения Тлт).

4. Сопоставление с параметрическим сшит-алгоритмом. С точки зрения практического использования большой интерес представляет определение относительной эффективности данного непараметрического алгоритма по сравнению с известными параметрическими алгоритмами частности - с упомянутыми ранее вариантами Си^ЦМ-алгоритма. Для проведения такого сопоставления используем коэффициент относительной эффективности С, определяемый как отношение эффективности Е непараметрического алгоритма к эффективности СЦ8ЦМ-алгоритма

Есшшш для фиксированных значений Тлт и d:

С=Е

Е„

г

— сшит/

(4)

где Гси8ит - значение запаздывания в обнаружения разладки гауссовского процес-

са при использовании СЦ8ЦМ-алгоритма.

200

60

20

Результаты сравнения эффективности непараметрического алгоритма с классическим CUSUM-алгоритмом при обнаружении разладки по математическому ожиданию представлены на диаграмме рис. 2.

0,25 0,5 1,0 1,5 2,0 2,5

dm

Рис. 2. Сравнение эффективности непараметрического алгоритма с СПБПЫ-алгоритмом (разладка по математическому ожиданию)

В итоге можно выделить некоторую область значений йт и Тлт, в которой

рассматриваемый непараметрический алгоритм имеет достаточно высокую эффективность - не менее 35% по сравнению с классическим CUSUM-алгоритмом.

Аналогичный анализ был произведении для варианта разладки, связанной с изменением дисперсии. Его результаты приведены в табл. 7.

Таблица 7

Значения коэффициента относительной эффективности € (разладка по дисперсии)

Т Т ЛТ dt dt

1,5 (= 0,582) 2,0 (Pi = 0,634) 2,5 (Pi = 0,669) 1/1,5 (= 0,592) 1/2,0 (P1 = 0,659) 1/2,5 (P1 = 0,718)

500 0,28 0,22 0,20 0,24 0,44 0,54

1000 0,20 0,16 0,16 0,31 0,35 0,45

2000 0,14 0,12 0,12 0,22 0,28 0,37

4000 0,10 0,09 0,09 0,15 0,21 0,29

Очевидно, то относительная эффективность данного контролирующего алгоритма:

♦ различна для разладок в сторону увеличения или уменьшения дисперсии, причем большую эффективность имеет процедура обнаружения разладки в сторону уменьшения дисперсии, что прямо противоположно свойствам классического CUSUM-алгоритма [1];

♦ выше для малых значений Тлт и увеличивается с ростом величины разладки;

♦ заметно меньше по сравнению с аналогичной процедурой для случая разладки по математическому ожиданию; действительно, если выделить 35 %-ый уровень относительной эффективности, то ему соответствует всего несколько значений из табл. 6 (все они выделены шрифтом).

В целом, как и ожидалось, предложенный непараметрический метод обнаружения разладки уступает по эффективности параметрическим методам. Тем не менее, в силу своей простоты он вполне может найти свое применение для целей оперативного контроля за текущим состоянием различного рода объектов, выявления нарушений установленных режимов их функционирования, а также в мониторинговых системах.

Заключение. В статье рассмотрена задача оперативного обнаружения спонтанного изменения (разладки) вероятностных характеристики временного ряда. Для ее решения в условиях дефицита априорной информации о свойствах контролируемого процесса предложен последовательный непараметрический алгоритм обнаружения разладки на основе реализации механизма случайных блужданий или, более конкретно, с использованием теории серий «успехов». Приведено описание контролирующего алгоритма, результаты исследования его основных статистических характеристик. Проведен анализ его эффективности, в том числе при сопоставлении с известными параметрическими методами. Выделена область возможного практического использования предложенного алгоритма, где его эффективность остается достаточно высокой. Отмечена перспективность применения предложенного алгоритма в составе программно-алгоритмического обеспечения систем мониторинга различного назначения.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Никифоров И.В. Последовательное обнаружение изменения свойств временных рядов.

- М.: Наука, 1983. - 200 с.

2. ГОСТ Р. ИСО 7870-2-2015 Национальный стандарт Российской Федерации. Статистические методы. Контрольные карты. - Стандартинформ, 2016.

3. PageE.S. Continuous inspection schemes // Biometrika. - 1954. - Vol. 41, No. 1. - P. 100-115.

4. Lorden G. Procedures for Reacting to a Change in Distribution // Annalsof Mathematical Statistics. - 1971. - Vol. 42,6. - P. 1897-1908.

5. Shafid Ahmad. Bibliometric Analysis of EWMA and CUSUM Control Chart Schemes // ITEE Journal. - April 2018. - Vol. 7, Issue 2. - P. 1-11.

6. Ширяев А.Н. Задача скорейшего обнаружения нарушения стационарного режима // Доклады АН СОСР. - 1961. - Т. 138, № 5. - С. 1039-1042.

7. Chakraborti S., Laan van der P., Bakir S.T. Nonparametric Statistical Process Control: An Overview and Some Results. (Memorandum COSOR; Vol.9908). Eindhoven: Technische Universiteit Eindhoven. - 1999.

8. Chakraborti S., Van der Laan P., & Bakir S.T. Nonparametric statistical process control: an overview and some results // Journal of quality technology. - 2001. - Vol. 33 (3). - P. 304-315.

9. Saad Bakir. Classification distribution-free quality control charts // Proceedings of the Annual Meeting of the American Statistical Association. - August 5-9, 2001. - 15 p.

10. Chakraborti S., Graham M.A. Nonparametric Statistical Process Control. - John Wiley & Sons Ltd, 2019. - 429 p.

11. Bakir S.T. and Reynolds Jr. M.R. A nonparametric procedure for process control based on within-group ranking // Technometrics. - 1979. - No. 21 (2). - P. 175-183.

12. Amin R.W., Reynolds Jr. M.R., and Bakir S.T. Nonparametric quality control charts based on the sign statistic // Communications in Statistics: Theory and Methods. - 1995. - No. 24 (6).

- P. 1597-1623.

13. Janacek G.J. and Meikle S.E. Control charts based on medians // The Statistician. - 1997.

- Vol. 46 (1). - P. 19-31.

14. McDonald D. A CUSUM procedure based on sequential ranks // Naval Research logistics.

- 1999. - Vol. 37. - P. 627-646.

15. Bakir S.T. A distribution-free Shewhart quality control chart based on signed-ranks // Quality Engineering. - 2004. - No. 16 (4). - P. 613-623.

16. Chakraborti S. and Van de Wiel M.A. A nonparametric control chart based on the MannWhitney statistic. IMS Collections // Beyond Parametrics in Interdisciplinary Research: Festschrift in Honor of Professor Pranab K. Sen. - 2008. - No. 1. - P. 156-172.

17. Human S.W., Chakraborti S., and Smit C.F. Nonparametric Shewhart-type sign control charts based on runs // Communications in Statistics: Theory and Methods. - 2010b. - Vol. 39 (11). - P. 2046-2062.

18. Zhou Chunguang, Zou Changliang, Zhang Yujuan, Wang Zhaojun. Nonparametric control charts based on change-point model. Statistical Papers, 2009. - Vol. 50. - P. 13-28.

19. Феллер У. Введение в теорию вероятностей и ее приложения. Т. 1. - М.: Изд-во «Мир», 1970. - 499 с.

20. Mc. Gilchrist C.A., Woodyer K.D. Note on a distribution-free CUSUM technique // Technometrics. - 1975. - Vol. 17, No. 3. - P. 321-325.

REFERENCES

1. Nikiforov I.V. Posledovatel'noe obnaruzhenie izmeneniya svoystv vremennykh ryadov [Sequential detection of changes in the properties of time series]. Moscow: Nauka, 1983, 200 p.

2. GOST R. ISO 7870-2-2015 Natsional'nyy standart Rossiyskoy Federatsii. Statisticheskie metody. Kontrol'nye karty [GOST R ISO 7870-2-2015 national standard of the Russian Federation. Statistical technology. Control card]. Standartinform, 2016.

3. Page E.S. Continuous inspection schemes, Biometrika, 1954, Vol. 41, No. 1, pp. 100-115.

4. Lorden G. Procedures for Reacting to a Change in Distribution, Annalsof Mathematical Statistics, 1971, Vol. 42,6, pp. 1897-1908.

5. Shafid Ahmad. Bibliometric Analysis of EWMA and CUSUM Control Chart Schemes, ITEE Journal, April 2018, Vol. 7, Issue 2, pp. 1-11.

6. Shiryaev A.N. Zadacha skoreyshego obnaruzheniya narusheniya statsionarnogo rezhima [The problem of early detection of violations of the stationary regime], DokladyANSSSR [Doklady Akademii Nauk USSR], 1961, Vol. 138, No. 5, pp. 1039-1042.

7. Chakraborti S., Laan van der P., Bakir S.T. Nonparametric Statistical Process Control: An Overview and Some Results. (Memorandum COSOR; Vol.9908). Eindhoven: Technische Universiteit Eindhoven, 1999.

8. Chakraborti S., Van der Laan P, & Bakir S.T. Nonparametric statistical process control: an overview and some results, Journal of quality technology, 2001, Vol. 33 (3), pp. 304-315.

9. Saad Bakir. Classification distribution-free quality control charts, Proceedings of the Annual Meeting of the American Statistical Association, August 5-9, 2001, 15 p.

10. Chakraborti S., Graham M.A. Nonparametric Statistical Process Control. John Wiley & Sons Ltd, 2019, 429 p.

11. Bakir S.T. and Reynolds Jr. M.R. A nonparametric procedure for process control based on within-group ranking, Technometrics, 1979, No. 21 (2), pp. 175-183.

12. Amin R.W., Reynolds Jr. M.R., and Bakir S.T. Nonparametric quality control charts based on the sign statistic, Communications in Statistics: Theory and Methods, 1995, No. 24 (6), pp. 1597-1623.

13. Janacek G.J. and Meikle S.E. Control charts based on medians, The Statistician, 1997, Vol. 46 (1), pp. 19-31.

14. McDonald D. A CUSUM procedure based on sequential ranks, Naval Research logistics, 1999, Vol. 37, pp. 627-646.

15. Bakir S.T. A distribution-free Shewhart quality control chart based on signed-ranks, Quality Engineering, 2004, No. 16 (4), pp. 613-623.

16. Chakraborti S. and Van de Wiel M.A. A nonparametric control chart based on the MannWhitney statistic. IMS Collections, Beyond Parametrics in Interdisciplinary Research: Festschrift in Honor of Professor Pranab K. Sen, 2008, No. 1, pp. 156-172.

17. Human S.W., Chakraborti S., and Smit C.F. Nonparametric Shewhart-type sign control charts based on runs, Communications in Statistics: Theory and Methods, 2010b, Vol. 39 (11), pp. 2046-2062.

18. Zhou Chunguang, Zou Changliang, Zhang Yujuan, Wang Zhaojun. Nonparametric control charts based on change-point model. Statistical Papers, 2009, Vol. 50, pp. 13-28.

19. Feller U. Vvedenie v teoriyu veroyatnostey i ee prilozheniya [Introduction to probability theory and its applications]. Vol. 1. Moscow: Izd-vo «Mir», 1970, 499 p.

20. Mc. Gilchrist C.A., Woodyer K.D. Note on a distribution-free CUSUM technique, Technometrics, 1975, Vol. 17, No. 3, pp. 321-325.

Статью рекомендовал к опубликованию д.т.н., профессор Э.К. Лецкий.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Филаретов Геннадий Федорович - Национальный исследовательский университет «МЭИ»; е-mail: gefefi@yandex.ru; 111141, Москва, Красноказарменная, 14; тел.: +79255176319; кафедра управления и интеллектуальных технологий; профессор.

Бучаала Зинеддин - е-mail: bouchaala.zinouzin@gmail.com; тел.: +79663039794; кафедра Управления и интеллектуальных технологий; аспирант.

Filaretov Gennady Fedorovich - National Research University "MPEI"; е-mail: gefefi@yandex.ru; 14, Krasnokazarmennaja, Моscow, 111141, Russia; phone: +79255176319; the department of control systems and intellectual technology, professor.

Boiichaala Zineddine - е-mail: bouchaala.zinouzin@gmail.com; phone: +79663039794; the department of control systems and intellectual technology; postgraduate student.

i Надоели баннеры? Вы всегда можете отключить рекламу.