Научная статья на тему 'Обнаружение момента разладки процесса авторегрессии первого порядка'

Обнаружение момента разладки процесса авторегрессии первого порядка Текст научной статьи по специальности «Математика»

CC BY
419
129
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Воробейчиков Сергей Эрикович, Кабанова Татьяна Валерьевна

Рассматривается задача обнаружения момента изменения среднего значения процесса авторегрессии первого порядка. Предлагается последовательная процедура обнаружения как положительного, так и отрицательного сдвигов среднего наблюдаемого процесса. Получены формулы для среднего времени между ложными тревогами и среднего времени запаздывания в обнаружении разладки. Приведены результаты численного моделирования.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Воробейчиков Сергей Эрикович, Кабанова Татьяна Валерьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

There is considered the problem of detecting of change in mean of the the first orders autoregressive process. The procedure for detecting both of increasing and decreasing of the processes mean is proposed. The formulae for the mean time between false alarms and mean delay time are found. The simulation results are given.

Текст научной работы на тему «Обнаружение момента разладки процесса авторегрессии первого порядка»

№ 280

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

Декабрь

2003

ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА

УДК 681.142.2

С.Э. Воробейников, Т.В. Кабанова

ОБНАРУЖЕНИЕ МОМЕНТА РАЗЛАДКИ ПРОЦЕССА АВТОРЕГРЕССИИ

ПЕРВОГО ПОРЯДКА

Рассматривается задача обнаружения момента изменения среднего значения процесса авторегрессии первого порядка. Предлагается последовательная процедура обнаружения как положительного, так и отрицательного сдвигов среднего наблюдаемого процесса. Получены формулы для среднего времени между ложными тревогами и среднего времени запаздывания в обнаружении разладки. Приведены результаты численного моделирования.

Одной из актуальных задач статистики является определение момента изменения свойств наблюдаемого процесса (момента разладки процесса). Существуют различные подходы к решению данной проблемы в зависимости от исходных предположений о модели наблюдений. Наиболее изученной является ситуация, когда известны начальная и конечная модели процесса [1-3]. В этом случае для обнаружения момента изменения разладки используется алгоритм кумулятивных сумм (АКС), представляющий собой многократно возобновляемую процедуру Вальда последовательной классификации двух простых гипотез. Лорденом в [4] было установлено, что эта процедура в схеме независимых наблюдений является оптимальной в смысле минимума среднего времени запаздывания при фиксированном среднем времени между ложными тревогами. В [5] было показано, что АКС является оптимальным при обнаружении моментов переключения между двумя авторегрессионными моделями.

Большой интерес на практике представляет случай, когда распределения наблюдаемого процесса до и после разладки не известны. Подобная ситуация рассмотрена в работах [6-8], где устанавливаются асимптотические соотношения между средним временем запаздывания и средним временем между ложными тревогами. При этом для оптимальных процедур обнаружения [6] имеет место логарифмическая зависимость среднего времени запаздывания от среднего времени между ложными тревогами. В [9] была предложена последовательная непараметрическая процедура обнаружения увеличения среднего значения в последовательности независимых наблюдений, для которой найдены основные характеристики.

В данной работе рассматривается задача обнаружения скачка среднего процесса авторегрессии с неизвестными параметрами. При этом на первом этапе производится оценивание неизвестных (мешающих) параметров авторегрессионной части. Далее осуществляется преобразование наблюдаемого процесса для ослабления влияния этих параметров. К полученному процессу применяется модифицированная процедура [10]. Исследуются свойства процедуры обнаружения.

ПОСТАНОВКА ЗАДАЧИ. ПОСТРОЕНИЕ ПРОЦЕДУРЫ ОБНАРУЖЕНИЯ

Пусть наблюдается процесс авторегрессии первого порядка

х,+1 -М = Х(Х{ -М) + | ¡+1, I = 0, 1, ... , (1)

где М - неизвестное среднее значение наблюдаемого процесса; X - неизвестный параметр процесса авто-

регрессии; > 0 - последовательность независимых

случайных величин, распределенных по нормальному закону с М%, = 0 и = 1.

В некоторый момент 9 происходит изменение среднего значения наблюдаемого процесса на неизвестную величину а. Требуется по наблюдениям процесса оценить момент разладки 9.

Представим уравнение (1) в виде

Х+1 =Ц + ХХ- +1, (2)

где ц = М (1 -X). (3)

В момент времени 9 происходит изменение значения ц на величину

а = а(1 -X). (4)

Поскольку X в данной модели является мешающим параметром, чтобы уменьшить его влияние на качество процедуры обнаружения, по первым наблюдениям процесса строится оценка этого параметра X, предложенная в [11], обладающая свойством равномерной ограниченности среднеквадратичекого уклонения при любых распределениях шумов

М< Н, (5)

где Н - порог процедуры оценивания.

На основе исходных наблюдений с использованием полученной оценки строим новую вспомогательную последовательность

У+1 = Х+1 -XХ =Ц + (X-X) Х + ^+1. (6)

Рассмотрим сначала случай положительного сдвига среднего, когда параметр а > 0.

Построим процедуру обнаружения увеличения среднего (а>0) для процесса авторегрессии, аналогичную случаю независимых наблюдений, рассмотренному в [9]. Определим последовательность г) по формулам

г] = 51яп(у - у-к -е) • I- т £0 = I + т, = шах(/ + т, г) + ^г-1).

Здесь I, т, к - натуральные числа (т < I), параметр е используется для компенсации погрешности в

оценивании параметра X. Решение о наличии разладки принимается при достижении суммой Si порога к.

Для обнаружения уменьшения среднего значения наблюдений, то есть для случая а < 0, используется вторая процедура АКС, в которой величины х, заменяются на - х, :

г2 = ®1ёп(уг-к- у,- е) • I- т (8)

= I + т, = шах(/ + т, г, + -1).

Процедуры АКС будем применять последовательно [10], изменяя номер ] последовательности г/ , если значение Si становится меньше I + т.

РАСЧЕТ ОСНОВНЫХ ХАРАКТЕРИСТИК ПРОЦЕДУРЫ

Рассмотрим последовательности (7) и (8). Будем считать ту последовательность, в которой после разладки среднее значение наблюдений увеличивается, первой, а ту, в которой среднее уменьшается, - второй. Это означает, что при увеличении в момент разладки среднего значения наблюдений первой процедурой считается процедура (7), а при уменьшении -

процедура (8). Обозначим через г, статистики г,, используемые в текущий момент времени , в АКС; Р0 -распределение величин г^ до момента разладки, а через Р1 и Р2 - распределения этих величин после разладки соответственно в первой и второй последовательностях. Основными характеристиками построенной процедуры являются среднее время между ложными тревогами Тж и среднее время запаздывания Тзап1, Тзап2 при наблюдении первой и второй последовательности соответственно.

Теорема 1. Пусть существует такое р0, для которого выполнено следующее условие:

Р0(г, > °1 г,-1) < Р0 < 1+5. (9)

Тогда среднее время между ложными тревогами растет экспоненциально при увеличении порога к :

(10)

Тлт = Ь V к + ¿2к + Ьз + о (1),

Т0 (к) = 0, к = к,..., к +1 - т -1; 70 (к) = Т0(1 + т), к = 0,..., I + т -1.

(12)

Составим характеристический многочлен для уравнения (11):

Р (у) = Р0у 21 -у1+т + 40.

Данный многочлен имеет два положительных вещественных корня, один из которых равен единице. В силу условия

I + т

Р0 <------

0 21

имеем р'0(1) = 21р0 -(/ + т)< 0,

следовательно, второй вещественный корень характеристического многочлена (обозначим его X) будет больше единицы. Тогда, решая уравнение (11) аналогично [10], получаем

Тлт = Ь V к + Ь2 к + Ьз + о (1), (14)

где Ь1, Ь2, Ь3 - известные константы. Теорема доказана.

Покажем далее, что при соответствующем выборе параметров процедуры Н, е могут быть выполнены

условия теоремы 1. Обозначим Д, = (X - XXх, - х,-к) и Р(Д >е) = Рд .

Теорема 2. Пусть параметры процедуры Н (5) и е такие, что выполняется условие

1 + 5

Ф(72е)+8рд

2

где Ь1, Ь2, Ь3 ,\^ - известные константы, V > 1.

Доказательство. Обозначим через Т0 (]) — среднее число шагов, оставшихся для принятия решения о наличии разладки, если текущее значение Si = ] и разладка еще не произошла. Если выполнено условие Р0 (гi > 01 гi-1) < р0 и д0 = 1 - р0, нижняя граница для среднего времени между ложными тревогами находится из уравнения

Т)(У) = 1 + Р0 • Т(у +1-т) + 40 • Т(у-1-т) (11)

с граничными условиями

где Ф(х) - функция стандартного нормального распределения.

Тогда для условных вероятностей Р0 (г, > 01 г,-1) выполнены условия теоремы 1, где

Р0 = Ф(л/-е) + 8Рд.

Доказательство. Оценим сверху условную вероятность Р0 (г, > 01 г,-1 > 0):

РЛг, > 01 г, > 0) = Р0( Р г-'> 0). (15)

Р>( г, -1 > 0)

Построим оценку сверху для числителя (15) и оценку снизу для знаменателя.

Обозначим t = ^^), е, = Ъ - Ъ-к , х = х, - х,-к. Учтем тот факт, что разность (^ -1 - Ъ - к-1) распределена нормально с нулевым средним и дисперсией 2 , а (х, - х,-к) - нормально с нулевым средним и диспер-

2

сией-------—. Получаем

1 -X2

Р0 (гг-1 < 0) =

ОТ

= | Р^ + е, < е^^ = t)/^)Л =

(16)

= 1Ф

При этом для среднего времени между ложными тревогами Т0 имеет место неравенство

Тлт > Т0(/ + т). (13)

где

<

Аналогично находим

Р0(¿і-1 > °) =

= | Р(іх + єі > є | X - X = і)/(і)Ж =

—ад

ад

= | Р(іх + єі >є)/(і~)йі =

(17)

= 1Ф

)/211+пт)

/(і)Л >ФІ-

Р0(¿і > 0 1 ¿і-1 > 0) <-

ФІ -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(19)

'72

Р0(¿і > 0 гі-1 < 0) =

= Р0 (¿і > 0 4-1 < Є ¿і-1 < 01 4-2 |<є) +

+Р0(¿і > 0,4-1 <є; ¿і-1 < 0,14-2 |>є)+

+Р0(¿і > 0,4-1 >є; ¿і-1 < 0,14-2 |<є)+

+Р0(¿і > ° 4-1 >є; ¿і-1 < °14-21>є) <

< Р(| - |-к > 0; ||-!-к < 0, | Ді-2 |> є) + +Р0 (| Ді-2 |> є) + Р0 (Ді-1 > є) +

+Р0 (Ді-! > Є) < 1 Р(|і-1 - Іі-1-к < 2є) + 4Рд .

(20)

Р0(¿і > 0 1 ¿і -1 < 0) < 1 Ф(72є)+4РД

1

2

1 + 3РД 4

= Ф(72є) + 8РД.

(21)

ФІ -

Д 1 + 5 <---------

'72

Ф(72є) + 8РД

1+5

(22)

(23)

Можно показать, что 1

4

- + 3РД

Д

ФІ -

'72

<Ф(72є)+8РД,

выполнено и условие (22). Окончательно получаем:

1+5

Р0(2, > 01 ¿і-!) <Ф(72є) + 8Рд <-

(24)

Получим далее оценку для совместной вероятности Р)(г, > 0, г, - > 0):

Р0(г, > 0, г,-1 > 0) =

= Р0(г, > 0,Д,-1 <е;г,-1 > 0,Д,-2 <е) +

+Р(г, > 0, Д,-1 <е; г,-1 > 0, Д,-2 >е)+

+Р (г, > 0, Д,-1 > е; г,-! > 0, Д,-- <е) + (18)

+Р(г > 0, Д-1 >е; г,-1 > 0 Д,-2 >е) <

< Р(Ъ -Ъ-к > 0,Ъ-1 4,-1-к > 0) + 3Рд =

=4+р

С учетом ()5),()6) и (18) получаем оценку условной вероятности (19):

Выбирая в (9) в качестве р0 величину

Ф(72е)+8РД, получаем условие теоремы 1. Теорема

2 доказана.

Теоремы 1,2 показывают, что при подходящем выборе параметров процедуры имеет место экспоненциальный рост среднего времени между ложными тревогами при увеличении порога к.

Теорема 3. Пусть существует такое д1, для которого выполнено следующее условие:

1-5

Р1(¿і < 0 1 ^і-1) < Ъ < ■

(25)

Тогда среднее время запаздывания растет линейно при увеличении порога к :

Тзап1 = Кк + К + О (1), (26)

где К, К1 - известные константы.

Доказательство. Введем следующее обозначение: Т (у) - среднее число шагов, оставшихся для принятия решения о наличии разладки. Если разладка произошла, текущее значение Si = у и наблюдается первая последовательность. Если выполнено условие Р (г, < 01 г,-1) < 41, верхняя граница для среднего времени запаздывания находится из уравнения

Т\(у) = 1 + Р1 • Тх(у +1 - т) + 41 • Т( У -1 - т) (27)

с граничными условиями

Т1(к) = 0, к = к,..., к +і - т -1;

(28)

Т1(к) = Б(1 + т) + Т1(1 + т), к = 0,..., I + т -1,

Здесь Б(у) - среднее время до окончания наблюдения второй последовательности, если текущее значение Si = у . Эта величина находится из уравнения

Б(у) = 1 + 41 • Б(у +1 - т) + р • Б(у -1 - т) с нулевыми граничными условиями

В(к) = 0,к = 0,...,і + т -1,к = к,...,к +і -т -1; (29)

Тзап1 < ^(і + т). (30)

Составим характеристический многочлен для уравнения (27)

Р (у) = 21 -Vі+т + ъ.

Данный многочлен имеет два положительных вещественных корня, один из которых равен единице. Для

і - т

имеем

і - т і + т

следовательно при выполнении условия (23) будет

21 21

При выполнении последнего условия Р'1(1) = 2ір1 - (і + т) > 0,

и следовательно, второй вещественный корень характеристического многочлена будет меньше единицы.

Тогда, решая уравнение (27) с граничными условиями (28) аналогично [9], получаем

Тзап1 = Кк + К1 + О (1), (31)

где К, К1 - известные константы. Теорема доказана.

Теорема 4. Пусть сдвиг а (4) и параметры процедуры Н (5) и е такие, что выполняется условие

2є- а

+ 6 Рд

1-5

Ф

'є-« ^

72

(32)

у V ^ у

где а - параметр сдвига, определенный в (4).

Тогда для условных вероятностей Р (г1 > 01 г,-1) выполнены условия теоремы 3, где

Ґ

Ф2

2є-а

\

+ 6Рд

Ф

72

= | Р(іх + єп < є - а)/(і~)йі =

(35)

= 1Ф

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

' Л

є-а

/(і)Л >Ф

є-а

72

^2 (1+А)

Р(¿і-! > 0) =

ад

= І Р(іх + єі > є - а | X - X = і)/(і~)йі =

-ад

ад

= | Р(іх + єі > є - а)/(і~)йі =

(36)

= 1Ф

^і2 (1 +1-х2 ^

/(і)йі > -,

при условии, что е< а .

Построим оценку совместной вероятности с учетом соотношений

Р (Ъ, - Ъ-к + я > 01, >9,, - к < 9) =

( ~ \ л

= р = Ф

Р(Іі -Іі-к + а < 01 і > 0,і -к < 0) =

/'"Лі

= д = 1 - = Ф

я

72

Р1(Іі -Іі-к + « < 2є) = Ф

2є-а

"7Г

> д.

Аналогично рассуждениям теоремы 2 получаем

Р( ¿і < 0, ^- > 0) <Ф

Ф

2є- а

+ 4Рд ; (38)

г

Р(¿і < 0, - < 0) <Ф

2є- а

"ТТ

+ 6Рд. (39)

С учетом (38), (36) и (39), (35) окончательно получаем оценки условных вероятностей

Р(г, < 01 г,-1 > 0) <

Ф

(

Ф

2є- а

\

+ 4Рд

1/2

(40)

V V ^ у

Доказательство. Оценим сверху условные вероятности р (г{ < 0 | г{-1 > 0) и Р(г{ < 0 | г{-1 < 0).

Р (г, < 0 | г,-1 > 0) = Р(гр <0, гг-10>0), (33)

Р>(г, -1 > 0)

Р(г, <0| г,-1 <0) = Р(р <°’г-10<0). (34)

Р>( г,-1 < 0)

Построим оценки сверху для числителя и оценки снизу для знаменателя:

Р( г,-1 < 0) =

ОТ

= | Р(tx + е, < е - а | X - X = t)/(t)Л =

= 2Ф

Ф

2є-а

+ 8Рд ;

г

Р1(¿і < 01 ¿і-1 < 0) <-

2є-а

+ 6Рд

Ф

'є-а л 72

(41)

По условию теоремы выполнено условие

г

Ф2

2є-а

~7Т

+ 6Рд

1 -5

Ф

'є-а л

(42)

72

V 4 /

Можно показать, что

г

Ф

2є-а

Ф2

+ 8Рд <■

2є-а

"7Т

+ 6РД

Ф

С ~Л є-а

72

у V ^ у

следовательно, при выполнении условия (32) будет выполнено и условие

Г ~ Л

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Ф

2є- а

ч721 1 72

Окончательно получаем

+ 8РД <■

1 -5

(43)

Ф

Р1( ¿і < 0| ¿і-1) <■

2є-а

"7Т

+ 6Рд

1-5

Ф

'є-а л

(44)

72

Выбирая в (25) величину

2є-а

(

Л

+ 6Рд

Ф

Г

є-а

72

V * ■“ /

в качестве д1, получаем условие теоремы 3. Теорема 4 доказана.

<

Теоремы 3, 4 показывают, что при подходящем выборе параметров процедуры имеет место линейный рост среднего времени запаздывания при увеличении порога к.

Аналогичные рассуждения справедливы для среднего времени запаздывания при наблюдении второй последовательности.

Результаты использования полученных формул для расчета основных характеристик процедуры представлены в таблицах.

Т аблица 1

X = 0,7 Х=0,71104 а = 1

Здесь Клт - количество ложных тревог.

Из таблиц видно, что при увеличении порога запаздывание увеличивается, а количество ложных тревог уменьшается, причем среднее время запаздывания растет линейно, а среднее время между ложными тревогами растет экспоненциально при увеличении порога.

Табл. 1 - 4 показывают, что, чем больше сдвиг среднего значения наблюдений, тем лучше процедура его обнаруживает.

Таблица 4

X = 0,7 X=0,71104 а = -2

й-порог T 1 зап Клт

150 270 0

100 194 1

80 152 5

50 50 22

30 7 119

20 5 298

Т аблица 2

Я = 0,7 Я=0,71104 a =-1

й-порог T 1 зап Клт

150 219 1

100 184 2

80 90 5

50 61 24

30 14 118

20 7 299

Т аблица 3

Я = 0,7 Я=0,71104 a = 2

й-порог T 1 зап Клт

150 111 1

100 62 2

80 58 4

50 23 22

30 8 123

20 4 294

й-порог T 1 зап Клт

150 94 1

100 58 3

80 28 4

50 24 22

30 16 123

20 3 302

Таблица 5

Я, = -0,7 X = -0,69256 a = 1

й-порог T 1 зап Клт

150 26 1

100 19 2

80 13 4

50 6 22

30 4 113

20 3 280

Таблица 6

Я = -0,7 Я = -0,69256 a =-1

й-порог T 1 зап Клт

150 23 1

100 14 2

80 13 5

50 10 20

30 3 114

20 2 293

ЛИТЕРАТУРА

1. PageE.S. Continuous inspection schemes // Biometrika. 1954. No. 1. P. 141-145.

2. Ширяев А.М. Статистический последовательный анализ. М.: Наука, 1976.

3. Сосулин Ю.Г., ФишманМ.М. Теория последовательных решений и ее применения. М.: Радио и связь, 1985.

4. Lorden G. Procedures for reacting to a change of distribution // Annals Math. Statistics. 1971. V.42. No.6. P.1897-1908.

5. Моттль В.В., Мучник И.Б., Яковлев В.Г. Оптимальная сегментация экспериментальных кривых // Автоматика и телемеханика. 1983. № 8. С.84-95.

6. Дарховский Б. С.,Бродский Б.Е. Непараметрический метод скорейшего обнаружения изменения среднего случайной последовательности // Теория вероятностей и ее применение. 1987. Т.32. №4. С.703-711.

7. Драгалин В. Асимптотические решения задачи обнаружения разладки при неизвестном параметре // Статистические проблемы управления. Вильнюс: Институт математики и кибернетики АН ЛитССР, 1988. Вып. 83. С.47-51.

8. Yakir B. On the average run length to false alarm in surveillance problems which possess an invariance structure // Annals Math. Statistics. 1998. V.26. No.3. P. 1198-1214.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

9. Воробейчиков С.Э. Об обнаружении изменения среднего в последовательности случайных величин // Автоматика и телемеханика. 1998. № 3. С. 50-56.

10. Воробейчиков С.Э., Кабанова Т.В. Обнаружение момента разладки последовательности независимых случайных величин // Радиотехника и электроника. РАН, 2002. Т.47(10). С.1198-1203.

11. Воробейчиков С.Э. О последовательной идентификации параметров случайных процессов рекуррентного типа // Математическая статистика и ее приложения. Томск: Изд-во Том. ун-та, 1983. Вып.9.

12. Бассвиль М., Вилски А., Банвенист и др. Обнаружение изменения свойств сигналов и динамических систем. М.: Мир, 1989.

Статья представлена кафедрой высшей математики и математического моделирования Томского государственного университета, поступила в научную редакцию 5 июня 2003 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.