Научная статья на тему 'АППРОКСИМАЦИЯ ОЦЕНКИ ИНДЕКСА УСТОЙЧИВОСТИ SαS-РАСПРЕДЕЛЕНИЙ'

АППРОКСИМАЦИЯ ОЦЕНКИ ИНДЕКСА УСТОЙЧИВОСТИ SαS-РАСПРЕДЕЛЕНИЙ Текст научной статьи по специальности «Математика»

CC BY
91
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
УСТОЙЧИВЫЕ РАСПРЕДЕЛЕНИЯ / ОЦЕНКА ИНДЕКСА УСТОЙЧИВОСТИ / ДРОБНЫЕ МОМЕНТЫ / АСИМПТОТИЧЕСКАЯ ДИСПЕРСИЯ ОЦЕНОК / STABLE DISTRIBUTIONS / STABILITY FACTOR ESTIMATE / FRACTIONAL MOMENTS / ASYMPTOTIC VARIANCE OF ESTIMATES

Аннотация научной статьи по математике, автор научной работы — Шергин В. Л.

Рассмотрена задача аппроксимации оценки индекса устойчивости альфа-устойчивых распределений, получаемой с помощью метода дробных моментов. Отмечено, что исходная оценка содержит неэлементарную и сложную в программной реализации функцию. Получена дробно-линейная функция, аппроксимирующая исходную оценку с требуемой точностью. Уточнена оценка асимптотической дисперсии оцениваемого индекса. Проведено численное моделирование, полностью подтвердившее полученные результаты

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Approximation of stability factor estimate of sαs-distributions

The problem of approximating a stability factor estimate of alpha-stable distributions, obtained by the method of fractional moments, has been considered. Such distributions are widely used in models of stochastic processes, describing a wide range of processes and phenomena.The analysis of existing methods for estimating parameters of stable distributions has been carried out. One of the new and promising methods for solving the problem under consideration is the method of non-integer (fractional) moments.It has been noted that the formula for calculating the stability factor estimate, developed in accordance with this method, contains a non-elementary and rarely used function (inverse to a gamma function), that significantly complicates using such estimate in applied problems.The problem of approximating the stability factor estimate has been set and successfully solved in the paper. The original dependence has been approximated with a simple fractional-linear function with quite a sufficient practical accuracy.The suggested approximation has given an opportunity of adjusting an asymptotic variance estimate of the parameter under estimation regarding its true value. As a result, the discrepancy between a theoretical estimate and the data of numerical experiments has been eliminated.The conducted numerical modeling has fully justified obtained results.

Текст научной работы на тему «АППРОКСИМАЦИЯ ОЦЕНКИ ИНДЕКСА УСТОЙЧИВОСТИ SαS-РАСПРЕДЕЛЕНИЙ»

------------------------□ □-----------------------------

Розглядається задача апроксимації оцінки індексу стійкості альфа-стійких розподілів, яка ґрунтується на застосуванні метода дрібних моментів. Зазначено, що ця оцінка містить неелементарну функцію, яка є складною у програмній реалізації. Отримано дробово-лінійну функцію, яка наближує точну оцінку з необхідною точністю. Уточнено оцінку асимптотичної дисперсії оцінюваного індексу. Проведено чисельне моделювання, яке повністю підтвердило отримані результати

Ключові слова: стійки розподіли, оцінювання індексу стійкості, дрібні моменти, асимптотична дисперсія оцінок

□-----------------------------------□

Рассмотрена задача аппроксимации оценки индекса устойчивости альфа-устойчивых распределений, получаемой с помощью метода дробных моментов. Отмечено, что исходная оценка содержит неэлементарную и сложную в программной реализации функцию. Получена дробнолинейная функция, аппроксимирующая исходную оценку с требуемой точностью. Уточнена оценка асимптотической дисперсии оцениваемого индекса. Проведено численное моделирование, полностью подтвердившее полученные результаты

Ключевые слова: устойчивые распределения, оценка индекса устойчивости, дробные моменты, асимптотическая дисперсия оценок ------------------------□ □-----------------------------

УДК 519.213.7, 519.233.22

АППРОКСИМАЦИЯ ОЦЕНКИ ИНДЕКСА УСТОЙЧИВОСТИ

SaS-

РАСПРЕДЕЛЕНИЙ

В. Л. Шерги н

Кандидат технических наук, доцент Кафедра искусственного интеллекта Харьковский национальный университет радиоэлектроники пр. Ленина, 14, г. Харьков, Украина, 61166 E-mail: [email protected]

1. Введение

Оценивание параметров случайных величин является одной из основных задач математической статистики.

Особое место среди законов распределения случайных величин занимают а-устойчивые распределения. Это обусловлено тем, что эти и только эти законы могут быть пределом по распределению сумм независимых одинаково распределённых случайных величин [1].

С другой стороны, а-устойчивые случайные величины широко используются в моделях случайных процессов, описывающих временные ряды в различных предметных областях. Таким образом, разработка новых методов оценивания параметров а-устойчивых распределений является актуальной научной и практической задачей.

В общем случае а-устойчивая случайная величина характеризуется четырьмя параметрами [2], задающими индекс устойчивости 0<а<2 , смещение, масштаб и меру симметрии.

Оценивание этих параметров является сложной задачей. Отчасти это обусловлено тем, что за редким исключением плотности и функции распределения устойчивых законов не выражаются через элементарные функции.

Простейшим частным случаем а-устойчивых распределений являются симметричные стандартизованные (т. е. имеющие единичные меры смещения и масштаба) а-устойчивые распределения, называемые SаS-распределениями [3]. Единственным их параметром является индекс устойчивости (а).

2. Анализ методов оценивания параметров устойчивых распределений

Прежде всего, следует отметить, что ни один из существующих методов оценивания параметров устойчивых распределений не лишён недостатков и не является универсальным. Эти методы можно разделить на пять групп.

Исторически первой из них являются методы, основанные на порядковых статистиках [4 - 6]. Эти методы характеризуются низкой вычислительной сложностью, однако и их эффективность (точность оценивания) также невысока. Особенно это относится к оценкам индексов устойчивости и симметрии.

Другой распространённый класс методов оценивания индекса устойчивости основан на исследовании поведения «хвостов» распределений [7, 8]. Основным недостатком методов является смещённость получаемых оценок. Кроме того, эффективность таких методов существенно зависит от объёма выборки.

Наибольшую точность оценок параметров устойчивых распределений даёт метод максимального правдоподобия [9]. Однако его вычислительная сложность весьма высока, что обусловлено как свойствами самого метода, так и вычислительной сложностью расчёта плотностей устойчивых распределений. В силу этого данный подход применяется редко.

В настоящее время широкое распространение получили методы, основанные на переходе в частотную область [10, 11].

Согласно данному подходу оцениваются параметры не самих плотностей распределений, а характеристических функций. Это связано с тем, что характе-

© В. Л

ристические функции устойчивых распределений, в отличие от плотностей, имеют относительно простой вид.

Такие методы обеспечивают хорошую высокую точность оценивания параметров, однако также являются достаточно трудоёмкими.

Классическим методом получения точечных оценок параметров распределений является метод моментов, обладающий весьма низкой вычислительной сложностью.

Однако в случае а-устойчивых законов этот метод «в чистом виде» неприменим, поскольку при а Ф 2 случайная величина не имеет дисперсии и моментов большего порядка (а при а< 1 не имеет и математического ожидания). В работе [2] описан метод логарифмических моментов (т.е. моментов логарифма случайной величины). В то же время известно [2, 3], что а-устойчивая случайная величина обладает нецелыми (дробными) моментами порядка -1 < s <а . В работе [12] автором был предложен новый метод оценивания индекса устойчивости, основанный на использовании дробных моментов. Несмотря на свою состоятельность, этот метод не лишён определённых недостатков, на устранение части которых и направлена данная статья.

очевидно, следует численно решать нелинейное уравнение Г-1 (и) = зо1 {Г(х) = и}, или (что несколько удобнее) оптимизационную задачу: Г-1(и) = аг^тт{(Г(х)- и)2} . Этот недостаток существенно снижает практическую ценность метода.

В то же время, как обратная гамма-функция, так и сама оценка (3) являются монотонными функциями своих аргументов. Очевидно, что путём их аппроксимации можно получить искомую оценку индекса устойчивости в гораздо более простой форме, чем (3), обеспечив при этом любую наперёд заданную точность аппроксимации. Именно эта задача (рассматриваемая в разделе 4) и составляет основную цель настоящей работы.

Кроме того, при расчёте величины асимптотической дисперсии оценки (3) использовались приближённые соотношения

Г(х) « ¿, Г-1(у) « (5)

т. е. фактически оценивалась дисперсия не исходной оценки (3), а приближённой

а(п,з) ” s(1 + упУ . (6)

3. Постановка задачи аппроксимации оценки

Как было отмечено при анализе проблемной области, а-устойчивая случайная величина обладает моментами порядка -1 < s < а . Для стандартизованных SаS-распределений абсолютный момент порядка s имеет вид [2]:

(Мя(х;а)}^) = ||х|3 я(х;а^х = ,

где обозначено

X» = cos( П0Т(1 - s) > 1.

(1)

(2)

Путём замены в этом соотношении теоретического значения момента (Мg(x;а))(з) его выборочным значением, в работе [12] была получена оценка индекса устойчивости а:

а (п,з) =

1-Г-1(х(8)^(8)) 1-Г-1(1+У„(з)) ’

где

1

Zn(s) = -£|ХкГ, ВД = %(з)^(з)-1.

(3)

(4)

Было доказано, что полученная оценка (3) является состоятельной и асимптотически несмещённой при

0<s<а/2 .

Оценка (3), несмотря на простоту математической записи, имеет очевидный недостаток, связанный с использованием функции Г-1(и), обратной к гамма-функции и = Г(х).

Эта функция не только не относится к элементарным (с точки зрения математики), но и не реализована ни в одном из известных автору инженерных и математических пакетов. Таким образом, для её вычисления,

Несмотря на то, что полученное выражение асимптотической дисперсии

D(а(n,s))¡

s

Do(а,s) = -

(Ш г(1 -21!)-г2(1 -1!)}

(Г(1 -#) -1}4

(7)

качественно верно отражает характер её зависимости от истинного значения индекса ( а ) и порядка используемого момента (з), тем не менее, оценка (7) примерно втрое больше эмпирической оценки дисперсии оценивания а по модели (3). Очевидно, что это расхождение связано с неудовлетворительным качеством приближения оценки (3) выражением (6).

Уточнение оценок асимптотической дисперсии является второй задачей, рассматриваемой в работе (раздел 5).

В разделе 6 описан численный эксперимент, направленный на проверку адекватности оценок асимптотической дисперсии.

4. Аппроксимация оценки индекса устойчивости

Как известно из математического анализа [13], функция Г-1(и) , а, следовательно, и функция

х==-Й1+У),

(8)

на интервале у е(0;~) , хе(1;~) являются непрерывными и монотонно убывающими. Так, использовав приближения (5), справедливые при у ^ ~ , можно получить, что х = 1 +1. Именно такое, весьма грубое, при-

п

3

3

к=1

ближение применялось в работе [12]. График функции

(8) представлен на рис. 1.

Одним из возможных способов приближения функции (8) является её разложение в ряд Тейлора (относительно 1/у ). Поскольку наименьшая дисперсия оценок согласно [12] обеспечивается при б / а ~ 0.3630 , то логично использовать разложение в окрестности именно этой точки, т.е. при у0=0.41007, х0 = 2.75482. Ограничиваясь двумя слагаемыми, получим:

(9)

Относительная погрешность аппроксимации (8) с помощью (9) на интервале у е[0.1;0.7725] не превышает 3,5 %. График функции (9) также представлен на рис. 1.

2

СИ

' огідіпаї їипсйоп х(у) (8) тос1е1х=1+1/у - тосіеі (9)

■-

■ ■ — _

ШШ.

03-

0.4 0:5

У

0:6

0.8

Рис. 1. График функции (8) и её приближённых моделей

Другим подходом к решению поставленной задачи является применение математического аппарата аппроксимации в гильбертовом пространстве. Следует учесть, что большие значения аргумента (у) в функции

(8), хоть и теоретически возможны, но нехарактерны с точки зрения практического её использования в оценке (3). Так как при $>а/2 (т. е. х<2) оценка (3) становится несостоятельной (её дисперсия (7) обращается в бесконечность), то значение у ограничено сверху значением утах =4п -1 = 0.7725 . Это, конечно, не означает, что на практике не могут появиться большие значения. Просто в этом случае сама оценка (3) становится несостоятельной, а значит вопрос о точности её приближения теряет смысл.

Аналогичным образом, слишком малые значения у хоть и возможны, но также нежелательны. Итх(у) = ~ . Это свидетельствует о том, что величина используемого дробного момента ( б ) выбрана слишком малой, а значит полученная оценка индекса устойчивости будет хоть и состоятельна, но очень неточна. В этом случае следует увеличить б и повторить расчёт. Нижняя граница принята равной утк1 = 0.1, чему соответствует значение хтах = 7.3215.

Учитывая свойства оригинальной функции (8), имеет смысл подбирать модель (порядка п ) относи-

тельно независимой переменной 1/у , а не у . Применяя метод наименьших квадратов, получим:

1

х(2) = 1.23504+0.61721 —

У

(10)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Эта модель обеспечивает относительную погрешность аппроксимации функции (8), не превышающую 1,7 %, т. е. вдвое меньшую, чем (9).

Графики зависимости относительной погрешности моделей (9)-(10) от значений у и х(у) = а^ приведены на рис. 2, а и 2, б соответственно.

о.м

0035

0.03

0.025

0.02

0.015

0.01

0005

О

-0.005 -0 01

— МосІЄІ(9) .......Мосіеі (10)

V,

V.

V

V____

3 4 5 6 7

к(у) = аІр<іа / э

б

Рис. 2. Зависимости относительной погрешности моделей

(9) — (10): а — от значений у ; б — от значений х = а ^

Обеим построенным моделям (9)-(10) соответствует оценка индекса устойчивости (3) в форме

Уп(з)| %(8)^(8)-1

).

(11)

Следует отметить, что погрешность модели (10) знакопеременна, в то время как погрешность модели

а

Зб|

(9) неотрицательна (и равна нулю в точке у0=0.41007 ). В то же время, поведение модели в окрестности точки у0 представляется наиболее важным, поскольку именно в этом случае обеспечивается минимум дисперсии оценки (3).

Таким образом, уточнённая оценка асимптотической дисперсии отличается от прежней (7) масштабным коэффициентом Ь2, равным 0.4105 и 0.3809 по моделям (9) и (10) соответственно.

5. Уточнение оценки асимптотической дисперсии

Доказательство состоятельности и асимптотической несмещённости оценки (3), как и вычисление её асимптотической дисперсии, было основано [12] на том, что, во-первых, асимптотическим распределением случайной величины Уп(б) (4) является гамма-распределение. Её дисперсия и математическое ожидание составляют

D(Yn) = 1 (Ц) Г(1 - 2з/а)-Г 2(1 - з/а)} и

М(Уп) = Г(1 - s/а) -1.

При п»1 соответствующие характеристики обратных величин равны

6. Численное моделирование

м

(а(^я)) = s (а + Ь ■ М (Уn-1(s)))« s

а+

Ь

M(Уn(s))

а+

Ь

Г(1 - s/а) -1

Ь(а- as)

= я | а + ^-- 1 = а

(м(Уn(s)))

Для проверки свойств полученных оценок был проведён численный эксперимент. Для сетки значений а! генерировались п = 5000 случайных величин, подчинённых SаS -распределению. Вычислялись оценки индекса устойчивости а^п,а^) по приближённой формуле (9).

Для каждого истинного значения оцениваемого параметра а! проводился поиск таких значений дробного момента §т1п(а), при которых дисперсия отклонений оценок аi(n,а^) от истинного значения а! (взятая по т = 1000 реализациям) минимальна. График зависимости значений дисперсии D0min(a), полученных по данным эксперимента, показан на рис. 3.

Там же приведён график теоретических оценок дисперсии, полученных согласно (14).

М(¥п-1) «(М(Уп)}-1 и

Т'\/Л7'_1 \ ЩУп)

D(Уn ) -— 4 соответственно.

(м(Уп))

Во-вторых, использовались приближённые соотношения (5) из чего следовало, что а(п,з) - б (1 + у^зу) и м(уп)-а-з.

Легко видеть, что аппроксимация функции (8) с помощью (9)-(10) по сути означает использование вместо (5) следующих дробно-линейных аппроксимаций гамма-функции и обратной к ней:

(12)

Из этого следует асимптотическая несмещённость величины (11):

(13)

и новая, уточнённая, оценка её асимптотической дисперсии:

D(a(n,s)) ~ s2 ^(а + Ь ■M(Уn-1(s))) = Ь^^У;1^))«

_ Ь¥о(Уп(з)) = ь2Э,(а,5) (14)

где D0(а,s) определяется выражением (7).

Рис. 3. Сравнение эмпирических и теоретических значений дисперсии оценки индекса устойчивости

Сопоставление графиков, приведенных на рис. 3, демонстрирует хорошее согласование теоретической оценки дисперсии (14) с данными численного эксперимента.

7. Выводы

Основной целью работы являлась аппроксимация оценки индекса устойчивости SaS-распределений, получаемого с помощью метода дробных моментов [12]. Применение данного метода для оценки параметров альфа-устойчивых распределений обладает научной новизной.

В результате исходная оценка (3), содержащая трудновычислимую инверсную гамма-функцию, была аппроксимирована простой дробно-линейной

= я

п

Е

функцией (11) с погрешностью, не превышающей 3,5 %.

Такая аппроксимация существенно облегчает алгоритмическую и программную реализацию данного метода оценивания индекса устойчивости и делает возможным его применение в системах статистического анализа, построенных на базе программных средств общего назначения. Предложенная аппроксимация

дала возможность скорректировать оценку асимптотической дисперсии оцениваемого параметра относительно его истинного значения.

В результате в выражение (7) был внесён масштабный множитель (примерно равный 0.4). Как показывает численный эксперимент (рис. 3), полученная теоретически оценка дисперсии (14) хорошо согласуется с эмпирической.

Литература

1. Гнеденко, Б. В. Предельные распределения для сумм независимых случайных величин [Текст] / Б. В. Гнеденко,

A. Н. Колмогоров - М.-Л.: ГИТТЛ - 1949. -264 с.

2. Золотарев, В. М. Одномерные устойчивые распределения [Текст] / В. М. Золотарев - М., Наука, 1983. - 304 с.

3. Nolan, J. P. Stable distributions - models for heavy tailed data [Electronic resource] / Boston: Birkhauser Unfinished manuscript, Chapter 1. - Available: http://academic2.american.edu/~jpnolan/stable/chap1.pdf - 13.05.2009.

4. Fama, E. F. Parameter estimates for symmetric stable distributions [Text] / E. F. Fama, R. Roll / / Journal of the American Statistical Association. - 1971. - № 66. - Р. 331-338.

5. McCulloch, J. H. Simple consistent estimators of stable distribution parameters [Text] / J. H. McCulloch // Communications in Statistics. Computation and Simulation. - 1986. -№ 15 - Р. 1109-1136.

6. Garcia, R. Estimation of stable distributions with indirect inference [Text] / R. Garcia, E. Renault, D. Veredas // Journal of Econometrics. - 2011. - № 161. - Р. 325-337.

7. Hill, B. M. A simple general approach to inference about the tail of a distribution [Text] / B. M. Hill / / Annals of Statistics. -1975. - № 3. - Р. 1163-1174.

8. Dufour, J-M. Exact inference and optimal invariant estimation for the tail coefficient of symmetric alpha-stable distributions [Text] / J-M. Dufour, J-R. Kurz-Kim // Journal of Empirical Finance. - 2010. - Vol. 17(2). - Р. 180-194.

9. Nolan, J. P. Maximum likelihood estimation of stable parameters [Text] : sb. nauch. tr. / Levy Processes: Theory and Applications - Boston: Birkhauser. - 2001. - Р. 379-400.

10. Koutrouvelis, I. A. Regression-type estimation of the parameters of stable laws [Text] / I. A. Koutrouvelis // Journal of the American Statistical Association. - 1980. - № 75. - Р. 918-928.

11. Chenyao, D. Computing the probability density function of the stable paretian distribution [Text] / D. Chenyao, S. Mittnik, T. Doganoglu // Mathematical and Computer Modelling. - 1999. - № 29. - Р. 235-240.

12. Шергин, В. Л. Оценивание индекса устойчивости альфа-устойчивых распределений методом дробных моментов [Текст] /

B. Л. Шергин // Восточно-Европейский журнал передовых технологий. - 2013. - Т. 6, № 4 (66), - С. 25-30.

13. Абрамовиц, М. Справочник по специальным функциям [Текст] / М. Абрамовиц, И. Стиган. - М.: Наука, 1979. - 832 с.

3

i Надоели баннеры? Вы всегда можете отключить рекламу.