Научная статья на тему 'Анализ и применение обобщенного sechk распределения'

Анализ и применение обобщенного sechk распределения Текст научной статьи по специальности «Физика»

CC BY
51
19
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ / РОБАСТНОСТЬ / ОЦЕНКА

Аннотация научной статьи по физике, автор научной работы —

Проведен анализ робастных свойств обобщенного sech k распределения. Показана возможность получения естественно-сниженных оценок максимального правдоподобия параметра смещения этого распределения. Получена нестационарная плотность процесса, описываемого СДУ со случайной структурой при сосредоточенных переходах из одного состояния в другое. Приведены примеры применения обобщенного sech k распределения в статистических и технических задачах.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS AND APPLICATION OF GENERALIZED DISTRIBUTION SECHk

The analysis of the robust properties of the generalized sechk-distribution is made. The possibility of producing natural-reduced maximum likelihood estimates of the offset parameter of the distribution is shown. Time-dependent density of the process described by the SDE with random structure centered at the transitions from one state to another is obtained. Examples of application of the generalized sech k distribution in statistical and technical problems are given.

Текст научной работы на тему «Анализ и применение обобщенного sechk распределения»

Доклады БГУИР

2013 № 8 (78)

УДК 519.246

АНАЛИЗ И ПРИМЕНЕНИЕ ОБОБЩЕННОГО SECH* РАСПРЕДЕЛЕНИЯ

А.В. ОВСЯННИКОВ, В.М. КОЗЕЛ

Белорусский государственный университет Независимости, 4, Минск, 220030, Беларусь

Белорусский государственный университет информатики и радиоэлектроники П. Бровки, 6, Минск, 220013, Беларусь

Поступила в редакцию 2 июля 2013

Проведен анализ робастных свойств обобщенного sectf распределения. Показана возможность получения естественно-сниженных оценок максимального правдоподобия параметра смещения этого распределения. Получена нестационарная плотность процесса, описываемого СДУ со случайной структурой при сосредоточенных переходах из одного состояния в другое. Приведены примеры применения обобщенного sech^ распределения в статистических и технических задачах.

Ключевые слова: плотность распределения, робастность, оценка.

Введение

Адекватное вероятностное описание сложных помеховых ситуаций в задачах статистической радиотехники, описание случайных составляющих статистических данных при их обработке требует использования в этих целях универсальных, обобщенных, многопараметрических моделей. Одной из таких моделей, введенной в [1], является обобщенное sech^-распределение (generalized secant hyperbolic k distribution - GSHK модель) с плотностью:

Pk (x, u) = uC(k)sechk (ux), k = v / u, u, v > 0, (1)

где C(k) = Г((1+k)/2)r_1(k /2)/Vrc , Г(x) - гамма функция. Отметим, известны и другие модели такого класса: GHS-модель (W. L. Harkness, M. L. Harkness, 1968) и GSH-модель (David C. Vaughan, 2002). Однако, применение этих моделей в технических задачах затруднено в связи со сложностью получающихся на их основе нелинейных преобразований в алгоритмах обработки и существенными трудностями, возникающими при идентификации параметров моделей. В то же время для плотности (1) нелинейное преобразование имеет простой и легко реализуемый в технических задачах вид Z(x) = -dlnр(x,u)/dx = vth(ux) . Распределение с плотностью (1) включает в себя, как частные случаи, распределение Чампернауна [2] P (x, u) = usech(wx) / л и логистическое распределение с плотностью P2 (x, u) = usech2 (ux) / 2.

Коэффициент эксцесса плотности (1) ограничен: limy(k) = 3 (соответствует лапласовской

k ^0

плотности P(x) = (v/2)exp(-v|x|)/2)) и limy(k) = 0 (соответствует гауссовской плотности

P (x) = V vu / nexp(-vux2) / 2). Описание ряда основных свойств и характеристик GSHK модели приведено в [3].

Цель работы - анализ робастных свойств плотности (1); формирование нестационарной плотности процесса, описываемого стохастическим дифференциальным уравнением (СДУ) использующим (1); исследование применения модели плотности GSHK.

Робастные свойства GSHK модели

Следующая теорема устанавливает основное свойство плотности (1), которое может быть использовано при построении робастных процедур оценивания скалярного параметра смещения 0е0 (0 - интервал на действительной оси) при аддитивном шуме х и модели наблюдения r = 0 + x, P = P(r 10).

Теорема. Плотность (1) Pk(x, u) = P минимизирует количество информации Фишера

I = J Zg Pdr, Z0 = P0 / P = — P / P = Z на классе параметрических, регулярных, не финитных на

носителе x е (—да; да), гладких плотностей P, для которого существует и конечна величина

J Z*2Pdr, где Z* = — P* / P*, в условиях Z*(0) = 0 , P*(0) = s > 0.

Доказательство. Функция Лагранжа изопериметрической задачи с учетом нормировки

J Pdx = 1 имеет вид L = Px2 / P + X0P + A Z 2P , где A, A - множители Лагранжа.

Соответствующее функции L уравнение Эйлера —2Zx ' + Z2 — A — AZ 2 = 0 . Поскольку

минимум I достигается при Z = Z , то имеем — 2Z*' + (1 — A )Z 2 — A = 0 . Рассмотрим при каких значениях A . Ф 0, j = 0,1 нетривиальные решения уравнения Эйлера будут удовлетворять условиям теоремы.

1. X, > 0. Z* = —/A(A — 1) 'tg^A (A — 1)х/ 2).

2. X, < о. z* =^/a (A +1) 'tg(VA (A + 1)X / 2).

3. Xo > o. Xi < о. z * = —/a (a +1) 'th^ a (A +1)x /2).

4. Xo < 0. Xi > 0. Z* = (A — 1) 1th^A (A — 1)x /2) .

« Г /---1+2/(^+1)

В случаях 1 и 2 плотности имеют вид Pl2=z cos(J А (А + 0х/ 2) • Однако эти

плотности с учетом нормировки финитны и не удовлетворяют условиям теоремы. В случаях 3

» Г /--3 4

и 4 плотности имеют вид Р34= s ch(y А (А — 0х/ 2) . Выберем А' = +2vi/,

A'4=+1 + 2m/v, тогда Р34 =в[сЬ(мх)] ' " = ssech''(ux). k = vlu. Эта плотность удовлетворяет условиям теоремы . Окончательно, с учетом нормировки, получаем распределение (1), т. е. P*4 = P (x, u), s = uC(k) . Нелинейная функция Z* = vth(ux) . Таким образом, теорема доказана.

Количество информации Фишера относительно параметра смещения I (u, k) = u2 k 2/(1 + k). Оценка максимального правдоподобия (ММП-оценка) параметра

смещения, имеющая вид J ZPdx = 0, состоятельна по Фишеру, асимптотически нормальна и

эффективна [4, 5]. ММП-оценке присущи следующие свойства.

1. Является В-робастной и качественно робастной с пороговой точкой 1/2, поскольку функция Z и, следовательно, функция влияния IF(x, P) = I l(u, k)Z(x) ограничена с предельной чувствительностью р* (u, v) = sup IF(x, P)| = (1 + k) / v.

2. Является V-робастной, т. к., согласно [5], для неубывающей функции Z понятия V-робастности и В-робастности эквивалентны. Существует и конечна величина чувствительности к изменению асимптотической дисперсии: при P = P* имеем X* (u, v) = 1 + р*2 (u, v)I(u, k) = 2 + k .

3. Имеет не только конечные чувствительности р их, но и является наиболее робастной, сходящейся при u ^да к медианной [5].

Следует заметить, что модификация приведенной ММП-оценки Jw d x = 0, где

^ = Zx Z, есть естественно-сниженная ММП-оценка [5], сходящаяся к сниженной:

lim ¥(x) = 0 . Действительно, поскольку i (Z 2)x' P d x = (Z2P) +f Z3P d x, но в симметричных

|x| ^да J 1-го J

2 l°° Г 3

пределах (Z P) = 0 и аналогично стандартной ММП-оценке имеет место I Z Pdx = 0,

1-го J

следовательно, |Zx'ZPdx = 0. Графики плотности P(x,u) и функции ^(x) = Z 'x (x)Z(x)

изображена на рис. 1 и рис. 2.

0.45 0.4 0.35 ■■ 0.3

i /1

м у 2

/3

/

Ч____Д-

Рис. 1. Плотность (1) с параметрами u, v, к: 1 - u = 10, v = 1 (k = 0,1); 2 - u = 0,5, v = 1 (k = 2);

3 - и = 0,1. v = 1 (k = 10)

о.а

11 .1

0.2 0 l/v 2

-О Я X

Рис. 2. Функция 1 - u = 2 (k = 0,5); 2 - и = 1 (k = 1); 3 - u = 0,5 (k = 2)

СДУ процесса со стационарной плотностью GSHK

При известной стационарной плотности скалярного процесса x(t) его СДУ:

x(t) + bZ(x)/2 = n(t), x(tn) = xn, (2)

где n(t) - нормальный белый шум с нулевым средним (n(t)j = 0 и дельтообразной корреляционной функцией (n(t)n(t')) = N5(t'-1), b = N - коэффициент диффузии. Перепишем СДУ в виде y{t) + cth(y) = un(t), где y(t) = wc(t), с = vub / 2 и рассмотрим непрерывную кусочно-линейную аппроксимацию функции cth(y) . Тогда получим

Я*,*)+4-и +A,A^S) = МО, y(t0,s0)=y0, (3)

где As = с [ th(y) - seah2( ys) y J, As = cseah2(y ), {y} - множество заданных точек в области

определения Z(y) = cth( y). .v е S - индекс структуры, .v = \,ns . ns - нечетное число структур, причем структурам с номерами 1 и ns соответствует Z(y) = +с, а структуре с номером s = med(ns) функция Z(y) = cy . Таким образом, уравнение (3) описывает СДУ со случайной структурой при сосредоточенных переходах из одного состояния в другое [6]. Поскольку функция Z(y) ограничена, то задаваясь абсолютной погрешностью непрерывной кусочно-линейной

аппроксимации As участка структуры, соответствующего индексу 5 из условия - y| < As, число ns однозначно определяется методами этой аппроксимации. Решение (3) имеет вид

у(г, ,) = - (4, / А )(1 - )+иЦв*- ^п^т. (4)

При достижении и пересечении ординарным процессом у(г,,) границ у ±Д5 происходит смена структуры 5 на , ± 1. На границах у ± Д происходит поглощение реализации процесса у (г,,) и восстановление реализации у(г,, -1) (или у (г,, +1)) с начальным условием у(г0,) = у — Д (у(г0,) = у +Д), т.е. конечные условия процесса в состоянии 5 совпадают с начальными в состоянии 5-1 (или 5+1).

Локальные характеристики - снос и диффузия - определяются выражениями а(г,,) = —Аз — АяУ^,,), Ь = и2N; математическое ожидание и дисперсия имеют следующий

вид: М(г,,) = у0е~л' — (А0, / А1х)(1 — в~А*г) , Б(г,,) = и2N(1 — в'2^')/2Д,,. Уравнения для стационарных вероятностей состояния структуры:

р(1) = |У2—Д2 рк (у, и)ёу = Р (у 2 —Д2, к), р(1) = р(п), (5)

—ад

ÍУs +Д,

, _д Рк (у, и)йу = Р(у, + Д,, к) — Р(у, — Д,, к) . (6)

Таким образом, если плотность начальной координаты Р(0, у |,) = 5(у—у0), граничные условия Р(г, ±ад | ,) = 0, то условная нестационарная плотность

P(t,y | 5) = [2*D(t, s)]-1'2 exp[-(y -M(t, s))2 / 2D(t, s) которая является решением уравнения Фоккера-Планка-Колмогорова

(7)

т':y|s) = -VO,, <ф = a(t, s)P(t,y | s) -1 V(bP(t,y | s)), V = S / dy . (8)

at 2

Для структур s = 1, ns из (7) с учетом того, что lim M(t, s) = y0 - Ast и lim D(t, s) = bt,

Aj ^ —>0 ' Aj ^ —>0

получаем плотность Pit,у \ s = l,ns) = \nbt\l2exp -(y-y0 +ctf Ibt , Zl ns(y) = +c . Для медианной структуры s = med(ns), т.к. ys = 0 также получим

P(t,y | s) = [2таз2 (1 - )]"1/2 expГ-(y - )2 / 2a2(1 - ^)

a2 = b /2c, Zs (y) = cy.

Условная нестационарная плотность P(t, y | s) для остальных индексов структур определяется общей формулой (7) для конкретных значений ys. Таким образом, совместная нестационарная плотность процесса {y(t), s(t)} принимает вид

P(t, y, s) = 1 P(t, У | s) p(s)5(S - s).

Например, если ns = 3, что соответствует кусочно-линейной аппроксимации функции Z(у) = {су,|У ^ 1; csign(у),|У > l} = max {-c;min(cy; с)} в виде нелинейности с насыщением, получаем условные нестационарные плотности P(t, у | s = 1), P(t, у | s = ns = 3) , P(t, у | s = med(ns) = 2) и стационарные вероятности структур p(1) = p(3) = F(-1, к), p (2) = 1 - 2p (1) .

Применение GSHK модели и результаты моделирования

Применение GSHK модели р (х, и), к = 1, 2 в практике статистического анализа достаточно широко. Так, например, плотности р (х,и) (распределение Чампернауна), Р2 (х, и) (логистическое распределение) получили распространение в социальных и финансово-экономических исследованиях. Кроме того, известны применения логистического

распределения в описательной статистике биосферы и технических областях, например, для описания прочностных характеристик усталости металлов. В математической статистике источником возникновения логистического распределения является асимптотическая теория экстремальных значений. Вместе с тем, обобщенное 8еоЬ^-распределение, за счет дополнительного параметра к = V / и, представляет более гибкий инструмент в анализе и решении теоретических и прикладных задач. Приведем некоторые области применения свойств и характеристик исследуемого распределения.

1. Обобщенное 8ееЬ^-распределение относится к хьюберовскому классу [4] приближенно гауссовских распределений, которые можно представить как

Р(х) = (1 - а) N (х) + аО(х) или Р(х) = {(1 -а)^х),|х| <Дх; аС(х),|х| >Дх}, где 0 <а<1, Д -

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ширина участка, описываемого плотностью N (х), N (х) = N (х;0, а2) - гауссовская плотность, 0(х) - произвольная плотность. В практике применения робастных процедур статистической обработки данных при наличии «утяжеленных хвостов» экспериментальных гистограмм, для их описания, в качестве плотности О(х) используется лапласовская плотность G(x) = X exp(-X | х |)/2. Показано [4,5], что ММП-оценка параметра смещения 0 при

использовании функции с насыщением 2(х) = max{-X;min(х/а2;X)}, где а2 =Д /2Х,

определяет оптимальную робастную оценку Хьюбера. В этой связи обобщенной робастной ММП-оценкой параметра смещения 0 является алгоритм с функцией 2(х) = ^Ь(их) , х = г—0 . ММП-оценка, в этом случае, оказывается более гибкой, учитывающей возможности адаптации к параметрам V и и [1].

2. Распределение с плотностью (1) может быть использовано в анализе финансовых рядов. Так, например, адекватное вероятностное описание логарифмической доходности индекса РТС в период с 02.02.2009 по 29.01.2013 N = 1000 отсчетов временного ряда, источник http://www.rts.ru) может быть получено с использованием плотности (1) (к = 0,70; и = 1,02; 0* = 0,11).

В таблице представлены сравнительные значения критерия Пирсона для трех распределений и различным числом интервалов группирования данных при построении гистограммы. Величина т (ближайшее нечетное число) определялась: для столбца №1 формулой Старджеса т = ^2(^х)+1, для столбца №2 формулой [7] т = (у* + 4,5)Nx0A /6, для

столбца №3 формулой т = , где у*= 2,34 - выборочный коэффициент эксцесса. В строке

№4 таблицы приведены критические значения для соответствующих величин т-2 степеней свободы и уровня значимости 1 %. Выборочная оценка параметра X лапласовской плотности

вычислялась по формуле X || .

Сравнительные значения критерия Пирсона

Распределение № 1, т = 11 № 2, т = 19 № 3, т = 31

№ 1 гауссовское 47,2 88,7 131,2

№ 2 лапласовское 31,2 28,9 42,1

№ 3 sechk 8,1 12,5 17,9

№ 4 критич. значение 21,7 33,4 49,6

На рис. 3 приведена гистограмма данных логарифмической доходности индекса РТС в сравнении с теоретическими кривыми плотностей (строки № 1 -№ 3 таблицы) для случая, приведенного в столбце №3 таблицы. Представленные результаты показывают, что гипотеза о принадлежности выборочных данных модели обобщенного sechk-распределения не отвергается, тогда как гауссовскую модель следует отвергнуть. Модель в виде лапласовского распределения, согласно критерию, также не отвергается, но показатель критерия хуже, чем у распределения р (х,и). Визуализация (рис. 3) показывает, что модель р (х,и) адекватно описывает выборочные данные и находится между лапласовской и гауссовской моделью.

Таким образом, плотность р (х, и) представляет гибкий инструментарий анализа финансовых рядов.

ЯЛ) 1

2 3

9 fi » к V

¿А /л \ % Vv V\ Л*

Рис. 3. Гистограмма и аппроксимации (таблица): 1 - строка № 2; 2 - строка № 3; 3 - строка № 1

3. В области статистической радиотехники распределение р (x,u) удобно использовать для описания шума с медленными, нестационарными изменениями интенсивности и амплитуды [1]. В этом случае эффективным оказывается применение адаптивных процедур для настройки параметров функции Z(x) = v th(u x), например, таких как совместные ММП-оценки u* = argmax р (x,u), v* = argmax р (x, v / k). Уравнения аналоговой и последовательной

ueU veV

дискретной ММП-оценки (фильтрации в случае 0 = 0(f) ) параметра 0 принимают вид {Vth [u>(0 -0)] dt^^ = 0, 0*+1 =0* - Klvth[u(r -0*)], где 0*(О) = 0О - предварительно заданное начальное значение оценки, K - коэффициент, определяемый конкретным видом стохастической аппроксимации | v th[u*(r -0*)] = 0.

Заключение

Проведен анализ робастных свойств GSHK модели плотности (1). Показано, что ММП-оценка параметра смещения для этой плотности распределения качественно робастна, В- и V-робастна. Простая модификация ММП-оценки приводит к формированию естественно-сниженных ММП-оценок. Исследована возможность получения нестационарной плотности, описываемого СДУ процесса со случайной структурой при сосредоточенных переходах из одного состояния в другое. Приведены примеры применения GSHK-модели.

ANALYSIS AND APPLICATION OF GENERALIZED DISTRIBUTION SECH*

A.V. AUSIANNIKAU, V.M. KOZEL Abstract

The analysis of the robust properties of the generalized sechk-distribution is made. The possibility of producing natural-reduced maximum likelihood estimates of the offset parameter of the distribution is shown. Time-dependent density of the process described by the SDE with random structure centered at the transitions from one state to another is obtained. Examples of application of the generalized sech distribution in statistical and technical problems are given.

Список литературы

1. Овсянников А.В. // Радиотехника. 2011. № 3. С. 85-89.

2. Вадзинский Р.Н. Справочник по вероятностным распределениям. СПб., 2001.

3. Овсянников А.В. // Докл. БГУИР. 2012. № 5. С. 58-64.

4. Хьюбер Дж. П. Робастность в статистике. М., 1984.

5. Хампель Ф., Рончетти Э., Рауссеу П. и др. Робастность в статистике. Подход на основе функций влияния. М., 1989.

6. Казаков И.Е., Артемьев В.М., Бухалев В.А. Анализ систем случайной структуры. М., 1993.

7. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов наблюдений. Ленинград, 1985.

i Надоели баннеры? Вы всегда можете отключить рекламу.