Научная статья на тему 'Оценивание индекса устойчивости альфа-устойчивых распределений методом дробных моментов'

Оценивание индекса устойчивости альфа-устойчивых распределений методом дробных моментов Текст научной статьи по специальности «Математика»

CC BY
100
25
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УСТОЙЧИВЫЕ РАСПРЕДЕЛЕНИЯ / ОЦЕНКА ИНДЕКСА УСТОЙЧИВОСТИ / ДРОБНЫЕ МОМЕНТЫ / АСИМПТОТИЧЕСКАЯ ДИСПЕРСИЯ ОЦЕНОК / STABLE DISTRIBUTIONS / ESTIMATION OF STABILITY FACTOR / FRACTIONAL MOMENTS / ASYMPTOTIC VARIANCE OF ESTIMATES

Аннотация научной статьи по математике, автор научной работы — Шергин В. Л.

Рассмотрена задача оценивания индекса устойчивости альфа-устойчивых распределений. Для её решения предложено использовать метод дробных моментов. Получены оценки искомого индекса в точной и приближённой формах. Доказана состоятельность и асимптотическая несмещённость этих оценок, рассчитана их асимптотическая дисперсия. Проведено численное моделирование, подтвердившее полученные результаты

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Шергин В. Л.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Estimation of the stability factorof alpha-stable distributions using fractional moments method

The problem of estimating the stability factor of alpha-stable distributions was considered. Such distributions are widely used in models of stochastic processes, describing a wide class of processes and phenomena.The analysis of existing methods of the estimation of parameters of stable distributions was carried out. It was noted that stable distributions do not have moments of the second and higher orders. This makes it impossible to use such classical statistical method for the estimation of parameters as the method of moments.The use of the method of fractional moments for the estimation of parameters of stable distributions is proposed in the paper. The mathematical basis of the method of fractional moments is the theory of Mellin transforms.The estimates of the required factor were obtained in the exact and approximate forms. The consistency and asymptotic unbiasedness of these estimates were proved, and their asymptotic variance was calculated.The values of the moments, which minimize the asymptotic variance of estimates of the stability factor, were found. These values depend on the value of the estimated stability factor.The numerical modeling, which confirmed the obtained results, was conducted

Текст научной работы на тему «Оценивание индекса устойчивости альфа-устойчивых распределений методом дробных моментов»

Розглядається задача оцінювання индекса стійкості альфа-стійких розподілів. Для її розв’язку запропоновано використати метод дрібних моментів. Отримано точну та наближену оцінки індексу стійкості. Доведено конзистентність та асимптотичну незміщеність цих оцінок, обчислено їхню асимптотичну дисперсію. Проведено чисельне моделювання, яке підтвердило отримані результати

Ключові слова: стійки розподіли, оцінювання індексу стійкості, дрібні моменти, асимптотична дисперсія оцінок

□---------------------------------□

ятельность и асимптотическая несмещённость этих оценок, рассчитана их асимптотическая дисперсия. Проведено численное моделирование, подтвердившее полученные результаты

Ключевые слова: устойчивые распределения, оценка индекса устойчивости, дробные моменты, асимптотическая дисперсия оценок --------------------□ □-----------------------

УДК 519.217.3, 519.233.22

ОЦЕНИВАНИЕ ИНДЕКСА УСТОЙЧИВОСТИ АЛЬФА-УСТОЙЧИВЫХ РАСПРЕДЕЛЕНИЙ МЕТОДОМ ДРОБНЫХ МОМЕНТОВ

В. Л. Шерги н

Кандидат технических наук, доцент Кафедра искусственного интеллекта Харьковский национальный университет радиоэлектроники пр. Ленина, 14, г. Харьков, Украина, 61166 E-mail: sherginvl@mail.ru

Рассмотрена задача оценивания индекса устойчивости альфа-устойчивых распределений. Для её решения предложено использовать метод дробных моментов. Получены оценки искомого индекса в точной и приближённой формах. Доказана состо-

1. Введение

Оценивание параметров случайных величин является одной из основных задач математической статистики.

Среди бесчисленного множества разнообразных законов распределения случайных величин особое место занимают а-устойчивые распределения. Это обусловлено тем, что эти и только эти законы могут быть пределом по распределению сумм независимых одинаково распределённых случайных величин [1].

Альфа-устойчивые случайные величины широко используются в моделях случайных процессов, описывающих временные ряды в различных предметных областях (например, финансовые и биржевые индексы, сток рек, медицинские приложения).

В общем случае а-устойчивая случайная величина характеризуется четырьмя параметрами [2], задающими индекс устойчивости 0<а<2 , смещение, масштаб и меру симметрии.

Оценивание этих параметров является сложной задачей. Отчасти это обусловлено тем, что за редким исключением плотности и функции распределения устойчивых законов не выражаются через элементарные функции.

Несмотря на множество методов и алгоритмов решения этой задачи, разработанных за последние полвека, ни один из них не обеспечивает статистической эффективности получаемых оценок (в смысле достижения границы Крамера-Рао). Кроме того, многие из методов обладают высокой вычислительной сложностью, либо другими недостатками. Таким образом, разработка новых методов оценивания параметров

a-устойчивых распределений является актуальной научной и практической задачей.

2. Анализ проблемной области

Исторически первой группой методов оценивания параметров устойчивых распределений являются методы, основанные на порядковых статистиках [3 - 5]. Эти методы характеризуются низкой вычислительной сложностью, однако и их эффективность (точность оценивания) также невысока. Особенно это относится к оценкам индексов устойчивости и асимметрии. Кроме того, такие методы весьма чувствительны к усечению выборки. Тем не менее, в силу своей простоты эти методы используются наиболее часто, и самостоятельно, и для получения начальных приближений оценок в составе других, более сложных методов [6].

Другой распространённый класс методов оценивания индекса устойчивости основан на исследовании поведения «хвостов» распределений [7, 8]. Фундаментальным свойством устойчивых распределений является асимптотически степенной характер функции распределения: Р(Х > х) ~ х-а при X , а^ 2. Основным недостатком методов является смещённость получаемых оценок. Кроме того, эффективность таких методов существенно зависит от объёма выборки.

Наибольшую точность оценок параметров устойчивых распределений даёт метод максимального правдоподобия [9]. Однако его вычислительная сложность весьма высока, что обусловлено как свойствами самого метода, так и вычислительной сложностью расчёта

Е

©

плотностей устойчивых распределений. В силу этого данный подход применяется весьма редко.

Наибольшее распространение в настоящий момент получили методы оценивания параметров устойчивых распределений, основанные на переходе в частотную область [10, 11]. То есть оцениваются параметры р не самих плотностей распределений ^х;р), а характеристических функций ф(1;р) = М(е11х) =| е1Ь^(х;р^х.

Это связано с тем, что характеристические функции устойчивых распределений, в отличие от плотностей, имеют относительно простой вид. Такие методы обеспечивают достаточно высокую точность оценивания параметров, однако также являются достаточно трудоёмкими в вычислительном плане.

4. Получение оценок индекса устойчивости

Абсолютный момент порядка s случайной величины с плотностью распределения ^х) , рассматриваемый как функция от s, называется двусторонним преобразованием Меллина [12]

(М ^х))(я) = }|х|Ч(хМх.

(1)

Известно [2], что а-устойчивая случайная величина обладает моментами порядка -1 < s < а .

Для строго устойчивых случайных величин преобразование Меллина имеет аналитическое выражение в виде

3. Постановка задачи исследования

Классическим методом получения точечных оценок параметров распределений является метод моментов. Он характеризуется низкой вычислительной сложностью.

Однако область его применения фактически ограничена классом распределений, подчинённых нормальному, т.е. имеющих индекс устойчивости а = 2. Это связано с тем, что при а< 2 случайная величина не имеет моментов порядка а и выше.

В работе [2] для оценивания параметров устойчивых распределений предложен метод логарифмических моментов. Он является простым в реализации, однако по эффективности получаемых оценок уступает методам, основанным на переходе в частотную область.

В то же время, понятие момента случайной величины можно обобщить на случай sеК, т. е. использовать дробные моменты. Известно [12], что при любом значении а существует бесконечное множество таких значений s, при которых момент порядка s существует.

Как показал проведённый анализ проблемной области, оценка параметров устойчивых распределений с помощью дробных моментов обладает научной новизной.

Имеется несколько способов параметризации а-устойчивых законов [2, 13], однако во всех из них основным и неизменным параметром является именно индекс устойчивости 0<а<2 . В работе рассматривается частный случай, когда случайная величина является несмещённой, симметричной и имеет единичный масштаб ( SаS -распределение). Для такой случайной величины единственным параметром является индекс устойчивости.

Целью настоящей работы является получение оценок индекса устойчивости а-устойчивых распределений с помощью метода дробных моментов и исследование их статистических свойств.

В разделе 4 строятся оценки индекса устойчивости (точная и приближённая). В разделе 5 исследуются статистические свойства полученных оценок (состоятельность, несмещённость, асимптотическая дисперсия). В разделе 6 проводится экспериментальная проверка этих свойств путём численного моделирования.

(Мg(x••a,p, Х))(я) = Х

s со8(пР(2р-1))Г(1-8/а)

соя( п^)-Г(1-з)

(2)

где Г(х) - гамма-функция.

В рассматриваемом случае, когда случайная величина симметрична ( р = У2) и имеет единичный масштаб ( Х = 1)выражение(2) принимает вид

^(х;а))(я) =

Г(1-я/а) Г(1-я/а)

соя( Пр)*Г(1-я) х(б) ’

(3)

где обозначено %(я) = соя( у)-Г(1 — я) > 1.

Заменяя в этом соотношении теоретическое значение момента (Мg(x•• а))(я) его выборочным значением

1^

ад—ЦхкГ,

П к=1

можно получить оценку индекса устойчивости а :

(4)

а(п,я)=1—г—г

1-г-1(х(з)^(8))

(5)

Очевидно, что случай я = 0 следует исключить как вырожденный. В выражении (5) Г-1(у) означает функцию, обратную к гамма-функции у = Г(х) на интервале х е(0;1), у е(1,,). Из приближённого соотношения Г(х) = X , справедливого при 0 < х < 1, следует, что Г-1(у) = у . Таким образом, оценку (5) можно заменить приближённой:

а(п,я)г

(1 + х^11(я)-^ .

- = я(1 +

(6)

5. Статистические свойства оценок

Состоятельность оценок (5) - (6) при я е(-1;0)и(0;а) следует из непрерывности соответствующих функций. Очевидно, что точные оценки смещения и дисперсии величин (5) - (6) невозможно получить в аналитическом виде.

Можно предположить, что статистические свойства оценок (5) - (6) зависят как от неизвестного истинного значения а , так и от параметра я (а также, естественно, и от объёма выборки п ).

В этой связи представляет интерес поиск приближённого асимптотического выражения для дисперсии

оценок д(а(п^)) и выработка рекомендаций по выбору s.

Введём обозначения

1 п

ВД =Х(8) Л(8)- 1 = -Xик,

П к=1

ик(8) =Хф ■ |ХкГ - 1.

Тогда оценки (5)-(6) можно записать в виде а(п,8)=

1-Г-1(1+У„(8)) '

а(п,8) ”8(- + уП-5)).

(7)

(8)

(9)

(10)

Для того чтобы оценить смещение и дисперсию оценок (9) - (10), следует исследовать статистические свойства величины (8) и её кумулятивного среднего (7). Непосредственно из (1), (3) следует, что

М(| X |28) = (^(х;а))(28) = ,

а значит случайная величина ик обладает конечной дисперсией при значениях 8є(—-2;От). Моменты величины ик составляют

М(ик) = Г(1 - 8/а) -1 = ц,

D(Uk) = |Ц Г(1 - 28/а)-Г2(1 - 8/а) = П

M(Yn) = М(ик) = ц,

D(Yn) = Щи^/п = D/n.

ных моментов является прямым следствием неограниченности носителя гауссовского закона.

Таким образом, искажение носителя меры ограничивает возможность применения центральной предельной теоремы. Вместе с тем, известно [1], что каждому устойчивому закону соответствует бесконечное множество подчинённых ему бесконечно делимых законов, находящихся в области притяжения данного устойчивого. Эти подчинённые бесконечно делимые законы могут обладать различными носителями, совпадающими с носителем устойчивого, или нет. Очевидно, что в тех случаях, когда искажением носителя нельзя пренебречь, асимптотический закон распределения сумм (или кумулятивных средних) следует искать в форме походящего бесконечно делимого закона.

Для устойчивого закона с а = 2 (т .е. гауссовского) одним из подчинённых ему бесконечно делимых распределений является гамма-распределение Г(уДк) с плотностью

) = ук-1е-у/е екГ(к)

(13)

(11)

Следовательно, моменты кумулятивного среднего Yn имеют вид

(12)

и носителем supp(Y) = [0,~). Другими словами, кумулятивное среднее (7) независимых одинаково распределённых случайных величин ик с положительным математическим ожиданием и ограниченной дисперсией при п сходится по распределению к гамма-закону (13). Математическое ожидание и дисперсия случайных величин, следующих гамма-распределению, составляют М^) = к9 и D(Y) = к92 соответственно.

При этом гамма-распределение, в отличие от гауссовского, обладает и инверсными моментами:

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

М^-1) = ё(к=1), М(^2) = 920^,

Из центральной предельной теоремы следует, что асимптотическим законом распределения кумулятивного среднего (7) одинаково распределённых случайных величин ик с конечной дисперсией ^) является гауссовский (нормальный) закон ^у;ц,д/п). Областью определения (носителем) гауссовского закона является вся действительная ось зирр^С!Ш^) = № независимо от значения носителя исходных величин supp(U). В то же время, при любом конечном числе слагаемых supp(Yn) с supp(U) . Таким образом, если носитель исходных величин ограничен, то переход к гауссовскому закону приводит к искажению носителя меры.

Так, при суммировании случайных величин, определённых на положительной полуоси вероятность отрицательных значений суммы тождественно равна нулю, в то же время при переходе к гауссовскому закону эта вероятность всегда ненулевая, хоть и асимптотически убывает с ростом п .

Важной особенностью гауссовского распределения является неограниченность инверсных моментов: М^р) = ~ при р<-1, в то время как исходные случайные величины Yn с законами 4(у) ^ N(y) , сходящимися к нормальному, вполне могут обладать инверсными моментами. Неограниченность инверс-

О^-1) =

е2(к-1)2(к-2)

(к > 2).

^ 9 О(У) , (M(Y))

Оценки 9 = м(у) , к = в(у) , полученные методом моментов, являются состоятельными и асимптотически несмещёнными. Тогда, с учётом (12), получим, что 9 = пц , к = “д- . Таким образом, к »1 при п »1. В этом случае справедливы приближённые соотношения

Р(У)

(М(У))‘

Из соотношений (10), (14) следует, что М(а(п,8)) « 8(1 + М^п-1)) = 8(1 +1/ ц),

п ■ц4

(14)

(15)

(16)

Заменяя в (11) гамма-функцию первым слагаемым её разложения Г(х) « -1, из выражения (15) получим, что М(а(п^))«а .

Таким образом, при принятых допущениях оценка (6) является асимптотически несмещённой.

Подставив в (16) значения ц и д из (11), получим:

Е

О(а(п,8))« Оо(а,8) , (17)

п

где

82 (Ш г(1 - 2 ^-г2(1 -і))

Оо(а,8) = -*---- ----------4----------------------’-. (18)

(Г(1 -|) -1)

Таким образом показано, что асимптотическая дисперсия оценок (5)-(6) убывает обратно пропорционально объёму выборки. График функции (18) представлен на рис. 1.

Рис. 1. График асимптотической дисперсии оценок д0(а^) по модели (18)

Согласно рис. 1, для каждого значения оцениваемой величины а существуют значения параметра smin(а) = а^тт(д0(а^)) , доставляющие

-1/2<Б<а/2

локальный минимум значению асимптотической дисперсии оценок. Минимизацию (18) по s легко провести численным методом. Графики зависимости smin(a) приведены на рис. 2, а, а графики

значений функции (18) д0тк1(а) = д0(а^тк1(а)) , соответствующих s = smin(а) - на рис. 2, б.

Согласно этим графикам, функция д0т1п(а) достигает максимума при а* «1.707 , чему соответствует значение smin « 0.665 .

Таким образом, значения индекса устойчивости, находящиеся в окрестности а*, являются наименее благоприятными для их оценивания предложенным методом.

Функция smin(a) может быть аппроксимирована выражением

= 0.35281.а1 2332, (19)

а при а< 1.7 - прямо пропорциональной зависимостью:

зЦппаг = 0.3630.а . (20)

Зависимости (19) - (20), а также значения функции д01Ып(а) , полученные при подстановке в (18) моделей (19) - (20), также представлены на рис. 2, а и рис. 2, б соответственно.

6. Численное моделирование

Для проверки свойств полученных оценок был проведён численный эксперимент. Для сетки значений а = 0:0.1: 2 генерировались п = 5000 случайных величин, подчинённых SaS -распределению g(x•,a) . Затем вычислялись оценки параметра аі(п,а^) по формуле (5).

Для проверки статистических свойств полученных оценок для каждого набора параметров (а^) осуществлялось т = 1000 реализаций, по которым рассчитывались эмпирические оценки математического ожидания и дисперсии:

а„(а ^) = т X а(п, а^,1), (21)

1=1

Рис. 2. Зависимости Б^^а), д01Ып(а) , полученные путём численной минимизации (18) по б , и с помощью моделей (19)-(20): а — зависимость Б^Да), б — зависимость д01Ып(а)

dij(аi,sj) = — У(а(п,аi,sj,l)-а() , (22)

где 1 - номер реализации.

Анализ зависимости а^(аi,Sj), полученной экспериментально, показывает несмещённость оценок (5), что подтверждает работоспособность предложенного метода. График зависимости dij(ai,sj) представлен на рис. 3.

Сравнение графиков оценок дисперсии, полученных теоретически (18) и экспериментально (22) (рис. 1, 3), показывает совпадение этих оценок с точностью до масштаба: теоретическая оценка примерно втрое больше полученной экспериментально. Тем не менее, можно утверждать, что выражения

(17), (18) качественно верно отражают характер зависимости асимптотической дисперсии оценок (5), (6) от истинного значения индекса ( а ) и порядка используемого момента ( б ).

о. $

Рис. 3. Эмпирическая дисперсия оценок dij(ai,sj) (22)

По данным численного эксперимента также был проведён поиск значений б , минимизирующих эмпирическую оценку дисперсии (22). Зависимости зшп(а) , полученные теоретически и экспериментально, показаны на рис. 4, а. Соответствующие значения оценок дисперсии приведены на рис. 4, б. Сравнение приведённых данных ещё раз подтверждает достоверность теоретических результатов, полученных в разделах 2 и 3.

7. Выводы

Основной целью работы являлось построение оценок индекса устойчивости SaS -распределений на основе метода дробных моментов. Этот подход обладает научной новизной. Искомые оценки (5), (6) были получены.

Доказана их состоятельность и асимптотическая несмещённость. Получены оценки асимптотической дисперсии (17), (18). Показано, что для любых допустимых значений а существуют значения дробного момента зЫп(а), минимизирующие дисперсию оценок а . Построены приближённые зависимости зшп(а) (19), (20).

Проведённый численный эксперимент в целом подтвердил результаты, полученные теоретически, однако показал расхождение масштабов при оценке дисперсии.

Причиной этого может быть погрешность, допущенная при аппроксимации прямых и обратных гамма-функций в (5) и (11). Этот вопрос нуждается в дополнительном изучении.

В общем случае а-устойчивая случайная величина характеризуется помимо индекса устойчивости также смещением, масштабом и мерой симметрии. Другим направлением дальнейших исследований должно стать применение метода дробных моментов для оценивания этих параметров.

Рис. 4. Сравнение эмпирических и теоретических зависимостей зЫп(а) и д01Ып(а) : а — зависимость зЫп(а),

б — зависимость д01Ып(а)

Е

Литература

1. Гнеденко, Б. В. Предельные распределения для сумм независимых случайных величин [Текст] / Б. В. Гнеденко, А. Н. Колмогоров - М.-Л.: ГИТТЛ - 1949. -264с.

2. Золотарев, В. М. Одномерные устойчивые распределения [Текст] / В. М. Золотарев - М., Наука - 1983. -304с.

3. Fama, E. F. Parameter estimates for symmetric stable distributions [Текст] / E. F. Fama, R. Roll // Journal of the American Statistical Association. - 1971. - №66, с.331-338.

4. McCulloch, J. H. Simple consistent estimators of stable distribution parameters [Текст] / J. H. McCulloch // Communications in Statistics. Computation and Simulation. - 1986. -№15 - с.1109-1136.

5. Garcia, R. Estimation of stable distributions with indirect inference [Текст] / R. Garcia, E. Renault, D. Veredas // Journal of Econometrics.-2011.-№161 - с.325-337.

6. Borak, S. Models for heavy-tailed asset returns [Текст] / S. Borak, A. Misiorek, R. Weron : сб. науч. тр. / SFB 649 Discussion Papers SFB649DP2010-049. - Berlin : Humboldt University, Sonderforschungsbereich 649, - 2010. - 40c.

7. Hill, B. M. A simple general approach to inference about the tail of a distribution [Текст] / B. M. Hill // Annals of Statistics. -1975. - №3 - с.1163-1174.

8. Dufour, J-M. Exact inference and optimal invariant estimation for the tail coefficient of symmetric alpha-stable distributions [Текст] / J-M. Dufour, J-R. Kurz-Kim // Journal of Empirical Finance. - 2010. - Vol.17(2) - с.180-194.

9. Nolan, J. P. Maximum likelihood estimation of stable parameters distribution [Текст] : сб. науч. тр. / Levy Processes: Theory and Applications - Boston: Birkhauser - 2001. - с.379-400.

10. Koutrouvelis, I. A. Regression-type estimation of the parameters of stable laws [Текст] / I. A. Koutrouvelis // Journal of the American Statistical Association. - 1980. - №75 - с.918-928.

11. Chenyao, D. Computing the probability density function of the stable paretian distribution [Текст] / D. Chenyao, S. Mittnik, T. Doganoglu // Mathematical and Computer Modelling. - 1999. - №29, с.235-240.

12. Учайкин, В. В. Метод дробных производных [Текст] / В. В. Учайкин - Ульяновск: Артишок, 2008. - 512 с.

13. Nolan, J. P. Stable distributions - models for heavy tailed data [Электронный ресурс] / Boston: Birkhauser Unfinished manuscript, Chapter 1. - Режим доступа : http://academic2.american.edu/~jpnolan/stable/chap1.pdf - 13.05.2009г.

i Надоели баннеры? Вы всегда можете отключить рекламу.