Научная статья на тему 'Функция подавления неравномерной статистической выборки нестационарного случайного процесса'

Функция подавления неравномерной статистической выборки нестационарного случайного процесса Текст научной статьи по специальности «Математика»

CC BY
475
59
i Надоели баннеры? Вы всегда можете отключить рекламу.
i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Функция подавления неравномерной статистической выборки нестационарного случайного процесса»

Секция высшей математики

УДК 519.226

А.Н. Каркищснко

ФУНКЦИЯ ПОДАВЛЕНИЯ НЕРАВНОМЕРНОЙ СТАТИСТИЧЕСКОЙ ВЫБОРКИ НЕСТАЦИОНАРНОГО СЛУЧАЙНОГО ПРОЦЕССА

Проблема вычисления числовых характеристик статистических данных, полученных в результате наблюдения нестационарных случайных процессов, возникает в самых различных задачах. В большом количестве работ, посвященных этой проблеме, делается предположение о локальной стационарности случайного процесса в широком смысле [1], и задача сводится к обнаружению точек переключения стационарных участков. После этого вычисление числовых характеристик до второго порядка включительно для эргодического процесса трудностей не представляет.

Существуют различные методы локализации точек переключения [2]. Однако большинство из них, будучи почти статистически оптимальными, как следствие, являются вычислительно очень трудоемкими. Другие подходы к оценке динамически меняющихся числовых характеристик статистической выборки связаны с вычислением тренда [3] случайной последовательности. Эти методы также требуют значительного количества вычислений и предполагают апостериорный анализ выборки.

Между тем, во многих случаях, когда объем выборки мал, а сами выборочные значения не могут считаться точным отражением наблюдаемого процесса, известные методы не могут показать свою эффективность. К этому можно добавить, что не всегда возможен апостериорный анализ.

Ниже рассматривается метод подавления статистической выборки, позволяющий при вычислении числовых характеристик в условиях нестационарности уменьшать влияние части выборки, полученной при "старых" распределениях вероятностей и, как следствие, уменьшать "переходной процесс". Можно сказать, что данный метод в некоторой степени моделирует присущий человеку процесс забывания старой информации.

Основные определения. Пусть цХ,ХбГ2сЯ , - векторная случайная величина с математическим ожиданием т и дисперсией компонент СТ(‘, ? = 1,2,..., П . Рассмотрим выборку

Х„=(х1,х2У...,х„), (1)

состоящую из N независимых реализаций Хк величины X, на основе которой вычисляется оценка математического ожидания.

Обозначим через {,?.у(А)}у , последовательность дискретных финитных функций таких, что gN(k)- 0 при к <0, к > N и gN(k)>0 при 1 < к < N . Пусть

N

™ = У£<8Ак)хк - (2)

оценка неизвестного математического ожидания т. Следующая лемма устанавливает условия, налагаемые на последовательность {#лг(£)}у при которых эта оценка будет несмещенной и состоятельной. Обозначим через || • || эвклидову метрику в .

Лемма_1. Оценка (2) является несмещенной, если для любого N N N

справедливо У. 8 к (к) — 1; если при этом 11Ш У (А) = 0 , то она и £I Й

состоятельна.

В приложениях для оценки математического ожидания, как правило, используется последовательность = {лг}л._| • Широкое

применение такой оценки связано с тем, что, будучи несмещенной и состоятельной, для большинства вероятностных распределений она близка к эффективной (а для нормального распределения в точности является эффективной [4]), т.е. дает близкий к минимально возможному разброс значений. Требование минимальности дисперсии оценки обеспечивает единственность решения задачи отыскания последовательности

делая ее, таким образом, корректной. Если же отказаться

от требования эффективности, то в классе несмещенных и состоятельных оценок, определяемых леммой_1, можно решать другие оптимизационные задачи. Разумеется, такой подход оправдан, если возникают требования к оценкам более важные, чем ее эффективность.

Рассмотрим одну из таких задач, связанную с вычислением математического ожидания в случае нестационарности распределения случайной величины X. Исходя из смысла функций gN(k ) в этом случае, будем называть их функциями подавления статистической выборки. Для простоты примем, что изменение закона распределения осуществляется скачком.

Рассмотрим дискретный метод построения функции подавления для случая, когда статистическая выборка Xк формировалась неравномерно во времени. В отличие от случая равномерной выборки игнорирование этого факта может приводить к очень грубым ошибкам при построении функции подавления. Действительно, пусть на отрезке [0,7"] имеется два стационарных участка. Тогда можно гипотетически рассмотреть два случая. Предположим, первый элемент выборки Х| был сформирован при первом распределении, а остальные Хт,...,Хд, - при

втором, и наоборот, другой случай, когда элементы X,,..., X;V_, образованы при первом распределении, a \N при втором. Иными словами, в первом случае выборочные значения группируются в основном в начале отрезка [о, г] , а во втором - в конце.

Очевидно, методы, разработанные для равномерной выборки, "не различают" таких особенностей. В то же время понятно, что функция подавления должна вести себя в этих условиях совершенно различным образом. Для того, чтобы учесть неравномерность появления выборочных значений, необходимо ввести в рассмотрение параметр времени. •

Будем считать, что в выборке (1) Хк = х(1к ), где tк - это момент времени, в который получено выборочное значение ХА. Положим t к = tk_ j +А tk , к = 2,3,..., N , причем /, = 0 и ts=T . Иными словами, Т — это период времени, в течение которого была сформирована выборка XN.

Обозначим через г, единственный пока на отрезке [0,7 ] момент смены стационарных вероятностных распределений. Тогда наилучшей оценкой математического ожидания на последнем стационарном участке

1 А

будет т(г,) = ——— у хк , где iV, = max к.

N-Nt *^+1

Предположим теперь, что - непрерывная случайная величина,

»

распределенная на [0,71] с плотностью р{тх). Тогда в качестве оценки математического ожидания на последнем стационарном участке возьмем математическое ожидание оценок in (г, ), т.е.

ш.

Т т 1 *

= f ш(г, )р( т] )</г, = J X Хкр(т, )drx.

iV - TV, k = N.*\

Поменяем в последнем выражении местами знаки интеграла и суммы in, =yff ^ W

Хк . Отсюда сразу следует, что Кт^к ) = 1# 1 — </г, . Полученное выражение можно преобразовать

Жг,)

N-N.

следующим образом:

/с—1 *<♦! \ Л-1 */♦! п( - \ к-1

*1

(3)

Весьма простое выражение для функции подавления получается в предположении равномерного на [0,7”] распределения точки переключения Г,, т.е. р( г, ) = на [0, Т]:

М;

^N-1 Т " N-1

Предположим теперь, что на отрезке времени [О, Г] наблюдается Г стационарных в широком смысле участков, причем точками переключения являются Г|,72,...,Гг_|. Тогда функция gт(/Л,Г) должна подавлять статистическую выборку на первых г — 1 участках, т.е. на отрезке [О, Гг_, |. Поскольку задача снова сводится к случаю двух стационарных участков, то функция подавления будет иметь вид, аналогичный (3), т.е.

I

8ЛЬ^)=%-г—.\р{тг_, ,

Ы М 1 ,

Ч

где р(тг_, ) _ плотность распределения последней точки переключения.

В предположении, ЧТО ТОЧКИ переключения Г,, Г2,..., Тг | образуют координаты равномерно распределенной в (Г — 1 )-мерной области О

К — 1 г_2

случайной величины, нетрудно установить, что р(,Тг_])= ^ г ■ Тгг Х . Воспользовавшись этой формулой, получаем для рассматриваемого случая

‘1 1 , 1 44с! -/Г1

8г^к'г) { Тг~х Г"' Ах'л Тг ' I? N - /

(4)

Будем теперь считать, что число точек переключения на отрезке [О, Т] — величина случайная, подчиняющаяся закону распределения

Пуассона Р^{Т) = Г — 11 — '' . Тогда можно показать, что функ-

ция подавления gr ((к ) может быть найдена как математическое ожидание функций gт(tk,r) при пуассоновском распределении параметра х , т.е.

8т((к) = 'Еёт(.(к^)^ге-хт .

Г=1

Здесь при Г = 1 учитывается случай, когда точек переключения на отрезке времени [О,Т] нет. Полагаем при этом gт(tk,\) = Подставляя в последнюю формулу выражение (4) и принимая во внимание сделанное замечание, получаем

е-*г _ - 1 цту-'

gт(tk) =-----+ е ЛГУ—г2,——-—-— — •

т к N Т & Л^ -1 (г-1)!

Поменяем порядок суммирования

После простых упрощений второй суммы окончательно получаем

Найденное выражение для функции подавления допускает очень простую рекуррентную процедуру вычисления, которая описывается следующими соотношениями:

1. Справочник по теории вероятностей и математической статистике // B.C. Ко-ролюк, Н.И. Портенко, А.В. Скороход, А.Ф. Турбин. М.: Наука, 1985.

2. Клигенс Н., Телъкенис JI. Методы обнаружения изменения свойств случайных процессов (обзор) // АиТ. 1983. №10. С.5 - 56.

3. Андерсон Т. Статистический анализ временных рядов. М.: Мир, 1976.

4. Пугачев B.C. Теория вероятностей и математическая статистика. М.: Наука,

ЛИТЕРАТУРА

1979.

i Надоели баннеры? Вы всегда можете отключить рекламу.