Korneev Konstantin Glebovich, scientific supervisor, [email protected]. Russia, Tula, Tula State
University
УДК 519.27
DOI: 10.24412/2071-6168-2024-8-368-369
ewma-АЛГОРИТМ обнаружения разладки гауссовского процесса АВТОРЕГРЕССИИ 1-ГО ПОРЯДКА ПО МАТЕМАТИЧЕСКОМУ ОЖИДАНИЮ
Г.Ф. Филаретов, Цинь Юйдэ
Рассматривается задача обнаружения в реальном масштабе времени разладки гауссовского процесса авторегрессии 1-го порядка , обусловленной скачкообразным изменением его математического ожидания, с помощью контролирующего алгоритма на основе экспоненциально взвешенного скользящего среднего или EWMA-алгоритма (EWMA - Exponentially Weighted Moving Average). Целью данной работы является всестороннее исследование статистических характеристик EWMA-алгоритма, обеспечивающее в конечном итоге синтез оптимальной процедуры обнаружения разладки со свойствами, заданными пользователем.
Ключевые слова: обнаружение разладки по математическому ожиданию; алгоритм экспоненциально взвешенного скользящего среднего; процесс авторегрессии 1-го порядка.
Постановка задачи исследования. Предметом исследования в настоящей работе является алгоритм экспоненциально взвешенного скользящего среднего ( EWMA-алгоритм), входящий в список трех наиболее популярных последовательных алгоритмов обнаружения разладки, в который, наряду с EWMA-алгоритмом, входят также алгоритм кумулятивных сумм (CUSUM-алгоритм) и алгоритм скользящего среднего (МА-алгоритм) [1, 2].
Все указанные алгоритмы предназначены для обнаружения разладки в реальном времени и основаны на вычислении по наблюдаемым дискретным отсчетам контролируемого процесса Xi (i = 1,2,...,«,...) в темпе с их поступлением значений некоторой решающий функции gi = gi (xi, Xi-i, Xi-2,...), которые затем сравниваются с фиксированным решающим порогом h. Если gi < h, то считается, что разладка отсутствует и процесс контроля продолжается; если же gi > h, то подаётся сигнал о наличии разладки (сигнал тревоги). При этом важно, чтобы алгоритм обнаружения обладал некоторыми оптимальными свойствами - например, в смысле минимизации среднего времени запаздывания в обнаружении разладки тзап при фиксированном среднем интервале между
ложными тревогами Глт.
Свойства любого алгоритма обнаружения разладки в первую очередь зависят от вида его решающей функции. Для EWMA-алгоритма решающая функция имеет следующий вид:
gi = (1 - X)g i - 1 + X Xi , (1)
где X - параметр сглаживания.
К настоящему времени перечисленные выше алгоритмы изучены достаточно подробно, что в ряде случаев дает возможность использовать полученную в них информацию для целей синтеза рабочей контролирующей процедуры с учетом конкретных требований пользователя (см., например, [3, 4].
Вместе с тем, отметим, что в большинстве работ по данной тематике предполагается, что наблюдаемые значения контролируемого временного ряда Xi некоррелированы. Варианты с коррелированными отсчетами Xi рассматривались или относительно редко, или несистематично [5 - 7]. Лишь в последнее время этой проблеме стали уделять большее внимание [8 - 10]. В частности, в [10] подробно исследованы свойства МА-алгоритма обнаружения разладки процесса авторегрессии 1 -го порядка, когда, как и в данной работе, разладка связана со скачкообразным изменением значения математического ожидания гауссовского процесса. В этой связи настоящую работу можно рассматривать как в определенном смысле продолжение исследований, начатых в [10], но уже применительно к EWMA-алгоритму.
Целью данной работы является всестороннее исследование характеристик EWMA-алгоритма наискорейшего обнаружения момента изменения математического ожидания, если контролируемый процесс является гауссов-ским процессом авторегрессии 1-го порядка АР(1), т.е. когда его значения Xi можно считать сформированными с помощью соотношения:
Xi = a Xi-i + s i , i = 1, 2, ... (1)
Здесь a - коэффициент авторегрессии, определяющий степень коррелированности значений Xi , s i - некоррелированные гауссовские случайные числа с единичной дисперсией. Нормированная автокорреляционная функция такого
2
процесса, как известно, равна рхх(k) = ak , к = 0, 1, 2, ..., а дисперсия = (1 - a2 )-1.
Метод исследования - имитационное моделирование, в рамках которого осуществляется L - кратное повторение работы EWMA-алгоритма при различных комбинациях значений решающего порога h, параметра сглаживания X , коэффициента авторегрессии a и величины относительного изменения (разладки) математического ожидания 5 = \mi - ш1/сх , где ш - значение математического ожидания контролируемого процесса при отсутствии разладки, а mi Ф m0 - при ее возникновении.
На практике при задании указанных параметров использовались типовые значения Тлт, равные 100,250,500,1000, типовые значения X из диапазона от 0,1 до 1 с шагом 0,1 и коэффициентов авторегрессии a из диапазона 0,1 - 0,9 с шагом 0,2 плюс a = 0,8 и a = 0 (отсутствие корреляции) а также стандартизованные значения 5:
0,5; 1,0; 1,5; 2,0; 2,5; 3,0. Важно подчеркнуть, что значения всех перечисленных параметров точно такие же, что использовались ранее и в работе [10] при исследовании МА- алгоритма , обеспечивая тем самым возможность корректного сопоставления характеристик EWМА- и МА-алгоритмов. Для получения высокоточных результатов число повторных опытов Ь в каждом имитационном эксперименте выбрано весьма большим (Ь = 105 - 106).
Первоочередной целью имитационного моделирования является получение набора справочных данных в
виде зависимостей вида Н = ф( Тлт ) и Тзап = у( Тлт ), учитывающих также влияние параметров X, 5 , а . В конечном итоге с помощью этих данных и может быть синтезирован контролирующий алгоритм с учетом конкретных требований пользователя.
Результаты имитационного моделирования и их обсуждение. Процесс имитационного моделирования можно разбить на ряд последовательных этапов.
Первый этап моделирования посвящен определению значений решающего порога Н, обеспечивающих
получение необходимой величины Тлт для каждой заданной комбинаций параметров X, 5 , а. Эта задача была решена с помощью специальной процедуры многомерного статистического поиска. Полученные с ее помощью зависимости Н = ф( Тлт ; а, X) сначала были зафиксированы в табличной форме, на основе которой затем были получены соответствующие расчетные формулы для Н в виде квадратичного полинома от у = 1п X (см. табл. 1).
Таблица 1
Зависимости решающего порога h от X для различных а и Тлт
а Тлт = 100 Тлт = 500
0 Н = 2,3256 + 0,0329 у - 0,0964 у2 Н = 2,8773 + 0,0044 у - 0,0668 у2
0,1 Н = 2,3208 + 0,0472 у - 0,1001 у2 Н = 2,8739 + 0,0034 у - 0,0780 у2
0,3 Н = 2,2999 + 0,1121 у - 0,0774 у2 Н = 2,8642 + 0,0452 у - 0,0616 у2
0,5 Н = 2,2618 + 0,1727 у - 0,0543 у2 Н = 2,8517 + 0,0937 у - 0,0428 у2
0,7 Н = 2,1449 + 0,1881 у - 0,0518 у2 Н = 2,7841 + 0,0945 у - 0,0485 у2
0,8 Н = 2,0251 + 0,1966 у - 0,0516 у2 Н = 2,7137 + 0,1007 у - 0,0554 у2
0,9 Н = 1,7209 + 0,1561 у - 0,0562 у2 Н = 2,5039 + 0,0717 у - 0,0585 у2
а Тлт = 250 Тлт =1000
0 Н = 2,6522 + 0,0052 у - 0,0791 у2 Н = 3,0874 - 0,0164 у - 0,0592 у2
0,1 Н = 2,6471 + 0,0106 у - 0,0878 у2 Н = 3,0843 - 0,0179 у - 0,0730 у2
0,3 Н = 2,6359 + 0,0695 у - 0,0677 у2 Н = 3,0799 + 0,0273*у - 0,0578 у2
0,5 Н = 2,6123 + 0,1226 у - 0,0473 у2 Н = 3,0747 + 0,0798*у - 0,0368 у2
0,7 Н = 2,5286 + 0,1288 у - 0,0496 у2 Н = 3,0174 + 0,0623*у - 0,0505 у2
0,8 Н = 2,4392 + 0,1345 у - 0,0546 у2 Н = 2,9614 + 0,0705*у - 0,0574 у2
0,9 Н = 2,1935 + 0,1019 у - 0,0586 у2 Н = 2,7741 + 0,0444*у - 0,0601 у2
Второй этап имитационного моделирования предназначен для оценки быстродействия EWМА-алгоритма в условиях коррелированности наблюдений контролируемого процесса. В ходе исследования осуществлялось определение среднего времени запаздывания в обнаружении разладки тзап как функции параметра решающей функции X, величины относительной разладки 5 для всех вариантов значений Тлт и коэффициента авторегрессии а. Всего насчитывается, как это имело место и в [10], 28 таких вариантов.
Анализ полученных данных показал, что для каждой комбинации значений Тлт , а и 5 существует такое X из числа рассматриваемых возможных значений X, которое минимизирует тзап . Это значение X можно считать оптимальным (\ор?) в смысле обеспечения при прочих равных условиях наибольшей быстроты в обнаружении разладки заданной величины. Сводная информация о значениях \орг для различных Тлт , а , 5 приведена в табл. 2.
Третий этап моделирования посвящен анализу эффективности различных вариантов оптимизированного EWMA-алгоритма и оценке влияния на неё коэффициента авторегрессии а. При проведении подобного анализа
сначала вычислялись показатели эффективности оптимизированных алгоритмов Еор1 = Тлт / тзап для различных комбинаций Тлт , а и 5 . Установлено, что эффективность алгоритма обнаружения возрастает с ростом значений Тлт и 5 , но уменьшается при увеличении коэффициента а.
Для более наглядной количественной оценки степени влияния коррелированности наблюдений на эффективность EWMA-алгоритмов использован показатель относительной эффективности С , который по определению равен отношению эффективности двух сопостовляемых алгоритмов обнаружения. Здесь это эффективности EWMA-алгоритмов при а > 0 и EWMA-aлгоритмa для а = 0, когда наблюдения некоррелированы. Соответствующие значения С приведены в табл. 3.
Интегрально влияние коррелированности наблюдений на эффективность алгоритма обнаружения можно
оценить, усредняя для различных комбинаций Тлт и а значения С из табл. 3 по всем 3 . Еще более общее представление об этом можно получить путем усреднения С по всем Тлт (показатель С ). Итоговый результат представлен в табл. 4.
Таблица 2
Оптимальные значения в зависимости от Тлт , а , б
а Т ^ лт = 100 Т лт 250
5=0,5 5=1,0 5=1,5 5=2,0 5=2,5 5=3,0 5=0,5 5=1,0 5=1,5 5=2,0 5=2,5 5=3,0
0 0,1 0,2 0,4 0,6 0,7 0,8 0,1 0,2 0,3 0,5 0,6 0,8
0,1 0,1 0,2 0,3 0,5 0,7 0,9 0,1 0,2 0,3 0,4 0,6 0,8
0,3 0,1 0,1 0,3 0,5 0,7 0,9 0,1 0,1 0,3 0,4 0,6 0,8
0,5 0,1 0,1 0,3 0,5 0,6 0,9 0,1 0,1 0,2 0,3 0,6 0,7
0,7 0,1 0,1 0,2 0,5 0,7 1 0,1 0,1 0,1 0,3 0,5 0,8
0,8 0,1 0,1 0,2 0,7 0,9 1 0,1 0,1 0,1 0,3 0,5 0,8
0,9 0,1 0,1 0,7 0,7 1 1 0,1 0,1 0,1 0,4 0,8 0,9
а Т -1- лт = 500 Т лт = 1000
5=0,5 5=1,0 5=1,5 5=2,0 5=2,5 5=3,0 5=0,5 5=1,0 5=1,5 5=2,0 5=2,5 5=3,0
0 0,1 0,2 0,3 0,4 0,6 0,7 0,1 0,1 0,3 0,4 0,5 0,7
0,1 0,1 0,1 0,3 0,4 0,5 0,7 0,1 0,1 0,2 0,3 0,5 0,6
0,3 0,1 0,1 0,2 0,3 0,5 0,7 0,1 0,1 0,2 0,3 0,4 0,6
0,5 0,1 0,1 0,2 0,3 0,4 0,6 0,1 0,1 0,1 0,2 0,4 0,5
0,7 0,1 0,1 0,1 0,2 0,4 0,6 0,1 0,1 0,1 0,2 0,3 0,4
0,8 0,1 0,1 0,1 0,2 0,4 0,6 0,1 0,1 0,1 0,1 0,2 0,5
0,9 0,1 0,1 0,1 0,2 0,5 0,8 0,1 0,1 0,1 0,1 0,2 0,6
Таблица 3
Значения показателя относительной эффективности С оптимизированного ЕИМЛ-алгоршпма_
Тлт = 100 Тлт = 250
\ 5 а 0,5 1,0 1,5 2,0 2,5 3,0 \ 5 а \ 0,5 1,0 1,5 2,0 2,5 3,0
0 1 1 1 1 1 1 0 4 1 1 1 1 1 1
0,1 0,89 0,89 0,89 0,88 0,87 0,88 0,1 0,88 0,88 0,88 0,88 0,87 0,87
0,3 0,70 0,69 0,67 0,67 0,66 0,67 0,3 0,67 0,66 0,65 0,65 0,64 0,64
0,5 0,55 0,52 0,49 0,49 0,48 0,49 0,5 0,49 0,48 0,47 0,46 0,46 0,46
0,7 0,41 0,36 0,33 0,32 0,32 0,32 0,7 0,34 0,32 0,30 0,29 0,29 0,29
0,8 0,34 0,28 0,25 0,24 0,24 0,24 0,8 0,27 0,24 0,22 0,21 0,21 0,21
0,9 0,27 0,20 0,18 0,16 0,15 0,15 0,9 0,20 0,16 0,14 0,13 0,13 0,12
Тлт = 500 Тлт = 1000
\5 0,5 1,0 1,5 2,0 2,5 3,0 \8 а 0,5 1,0 1,5 2,0 2,5 3,0
0 1 1 1 1 1 1 0 1 1 1 1 1 1
0,1 0,86 0,87 0,87 0,87 0,87 0,86 0,1 0,84 0,87 0,87 0,87 0,87 0,86
0,3 0,62 0,65 0,64 0,64 0,64 0,63 0,3 0,59 0,64 0,64 0,64 0,64 0,63
0,5 0,44 0,46 0,45 0,45 0,45 0,44 0,5 0,39 0,43 0,43 0,44 0,44 0,44
0,7 0,29 0,29 0,28 0,28 0,28 0,27 0,7 0,24 0,26 0,27 0,27 0,27 0,27
0,8 0,22 0,21 0,20 0,20 0,20 0,19 0,8 0,18 0,18 0,19 0,19 0,18 0,18
0,9 0,16 0,13 0,12 0,12 0,12 0,11 0,9 0,12 0,10 0,11 0,11 0,11 0,10
Таблица 4
Средние значения показателей относительной эффективности £(а)_
^^ Т лт а ^^^ 100 250 500 1000 С
0 1 1 1 1 1
0,1 0,88 0,87 0,87 0,86 0,870
0,3 0,68 0,65 0,64 0,63 0,650
0,5 0,5 0,47 0,45 0,43 0,463
0,7 0,34 0,3 0,28 0,26 0,295
0,8 0,26 0,23 0,2 0,18 0,218
0,9 0,19 0,15 0,13 0,11 0,145
Очевидно, что с ростом коэффициента авторегрессии а эффективность Е'ММА-алгоритма постепенно снижается, причем весьма существенно (примерно в 6,9 раза при а = 0,9) по сравнению со случаем некоррелированных наблюдений.
Сопоставление эффективности оптимизированных МА- и Ewma- алгоритмов. Для проведения сопоставительного анализа алгоритмов воспользуемся данными, содержащимися в табл. 4 для EWMA- алгоритма (Eewma), и данными табл. 7 из публикации [10] для MA- алгоритма (Ema). Сопоставление производилось путем вычисления показателя обобщенной относительной эффективности двух указанных алгоритмов Се/m = EeWMA/Ema . В результате установлено, что практически во всех вариантах показатель Се/m очень близок к единице, т.е. с позиций эффективности оба этих алгоритма можно считать равноценными.
Выводы.
1. Рассмотрена задача построения алгоритма экспоненциально взвешенного скользящего среднего (EWMA-алгоритма), предназначенного для обнаружения спонтанного изменения (разладки) гауссовского процесса авторегрессии 1 -го порядка.
2. Методом имитационного моделирования проведено полномасштабное исследование его статистических характеристик. Показано, что EWMA-алгоритм может быть оптимизирован путем надлежащего выбора параметра сглаживания X, обеспечивающего минимальную задержку в обнаружении разладки для фиксированного значения интервала между ложными тревогами, заданной величины разладки 5 и определенного значения показателя коррелированности наблюдений а.
3. Установлено, что эффективность EWMA-алгоритма обнаружения разладки при наличии корреляции существенно уменьшается по сравнению с вариантом некоррелированных отсчетов, что необходимо учитывать при синтезе соответствующей контролирующей процедуры.
4. Проведено сопоставление EWMA- и МА-алгоритмов с точки зрения их эффективности и чувствительности к коррелированности наблюдений временного ряда, выявившее их практическую равноценность.
Список литературы
1. Roberts S.W. A Comparison of Some Control Chart Procedures. Technometrcs. 1996. Vol. 8, №3. P. 411 -
430.
2. Shafid Ahmad. Bibliometric Analysis of EWMA and CUSUM Control Chart Schemes. ITEE Journal, Volume 7, Issue 2, 2018. P. 1 - 11.
3. Филаретов Г.Ф., Ларин A.A., Локтюшов В.А. Параметрический МА-алгоритм обнаружения разладки гауссовского временного ряда по математическому ожиданию // Вестник МЭИ. 2022. №5. C. 112 - 120.
4. Ларин А.А., Филаретов Г.Ф. Исследование и разработка EWMA-алгоритма обнаружения разладки гауссовского временного ряда по математическому ожиданию. Датчики и системы. 2022. №6. С. 9 - 16.
5. Bagshaw M., Johnson R.A. The effect of serial correlation on the performance of CUSUM tests.II // Techno-metrics. 1975. V.17, №1. P. 73-80.
6. Липейка А. Определение моментов изменения свойств авторегрессионных последовательностей с неизвестными параметрами // Статистические проблемы управления. 1982. Вып. 54. С. - С. 9-28.
7. C.-W. Lu, M. Reynolds Jr. EWMA control charts for monitoring the mean of autocorrelated processes // J. Qual. Technol., 2018. Vol. 31, no. 2. P. 166-188.
8. Annie Cherian. Process Monitoring Schemes for Correlated Data. Journal of Research in Applied Mathematics. 2021. Volume 7 ~ Issue 4. P. 28-33.
9. Silpakob K., Areepong Y., Sukparungsee S., & Sunthornwat R. A New Modified EWMA Control Chart for Monitoring Processes Involving Autocorrelated Data. Intelligent Automation and Soft Computing, 2023. 36(1). P. 281-298.
10. Филаретов Г.Ф., Цинь Юйдэ. Алгоритм оперативного обнаружения момента изменения математического ожидания процесса авторегрессии 1-го порядка // Известия Тульского государственного университета. Технические науки, 2023. Вып. 11. С. 237 - 242.
Филаретов Геннадий Федорович, д-р техн. наук, профессор, [email protected], Россия, Москва, Национальный исследовательский университет «МЭИ»,
Цинь Юйдэ, аспирант, qyd38160@163. com., Россия, Москва, Национальный исследовательский университет «МЭИ»
EWMA-ALGORITHM FOR DISORDER DETECTION OF A GAUSSIAN A UTOREGRESSIVE PROCESS OF THE 1-ST
ORDER IN MATHEMATICAL EXPECTATION
G.F. Filaretov, Qin Yude
The problem of real-time disorder detection of a Gaussian 1st order autoregressive process caused by an abrupt change in its mathematical expectation is considered. It is proposed for solving this problem to use a controlling algorithm based on an exponentially weighted moving average or EWMA- algorithm. The aim of this work is a comprehensive study of the statistical characteristics of the EWMA-algorithm, ultimately ensuring the synthesis of an optimal disorder detection procedure with properties specified by the user.
Key words: detection of discord by mathematical expectation; an exponentially weighted moving average or EWMA- algorithm; 1-st order autoregressive process.
Filaretov Gennady Fedorovich, doctor of technical sciences, professor, gefefi@yandex. ru, Russia, Moscow, National Research University "MPEI",
Qin Yude, postgraduate, [email protected]. Russia, Moscow, National Research University "MPEI"