Научная статья на тему 'Сверхэффективная оценка начальных моментов старших порядков в задачах аппроксимации неизвестных распределений распределениями пуассоновского типа'

Сверхэффективная оценка начальных моментов старших порядков в задачах аппроксимации неизвестных распределений распределениями пуассоновского типа Текст научной статьи по специальности «Математика»

CC BY
224
28
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СВЕРХЭФФЕКТИВНАЯ ОЦЕНКА / НАЧАЛЬНЫЕ МОМЕНТЫ ПОРЯДКА К / АППРОКСИМАЦИЯ НЕИЗВЕСТНЫХ РАСПРЕДЕЛЕНИЙ / SUPEREFFICIENT ESTIMATION / ORDINARY K-TH MOMENTS / APPROXIMATION OF UNKNOWN DISTRIBUTIONS

Аннотация научной статьи по математике, автор научной работы — Сайкин А. И., Россошанский Е. В.

Предлагается методика получения сверхэффективной оценки начальных моментов случайных величин по выборкам ограниченного объема, которая позволяет существенно улучшить оценки начальных моментов старшего порядка.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Сайкин А. И., Россошанский Е. В.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

K-TH MOMENT SUPEREFFICIENT ESTIMATION IN THE PROBLEM OF POISSON TYPE DISTRIBUTION APPROXIMATION OF UNKNOWN DISTRIBUTIONS

We introduce the new method of small sample superefficient estimation, which allows to essentially improve existing k-th moment estimates.

Текст научной работы на тему «Сверхэффективная оценка начальных моментов старших порядков в задачах аппроксимации неизвестных распределений распределениями пуассоновского типа»

УДК: 519.2

А.И. Сайкин, Е.В. Россошанский

СВЕРХЭФФЕКТИВНАЯ ОЦЕНКА НАЧАЛЬНЫХ МОМЕНТОВ СТАРШИХ ПОРЯДКОВ В ЗАДАЧАХ АППРОКСИМАЦИИ НЕИЗВЕСТНЫХ РАСПРЕДЕЛЕНИЙ РАСПРЕДЕЛЕНИЯМИ ПУАССОНОВСКОГО ТИПА

Предлагается методика получения сверхэффективной оценки начальных моментов случайных величин по выборкам ограниченного объема, которая позволяет существенно улучшить оценки начальных моментов старшего порядка.

Сверхэффективная оценка, начальные моменты порядка К, аппроксимация неизвестных распределений

A.I. Saikin, E.V. Rossoshansky

K-TH MOMENT SUPEREFFICIENT ESTIMATION IN THE PROBLEM OF POISSON TYPE DISTRIBUTION APPROXIMATION OF UNKNOWN DISTRIBUTIONS

We introduce the new method of small sample superefficient estimation, which allows to essentially improve existing k-th moment estimates.

Superefficient estimation, ordinary K-th moments, approximation of unknown distributions

Существующие эффективные оценки M *[k] начальных моментов порядка k легко вычисляется по известным соотношениям:

M*[k] = ХГ=1 xk /N, (1)

где m *[k] - выборочный начальный момент порядка k, xt - значения случайной величины

X , N - объём выборки.

Однако они слишком грубы для оценки моментов старших порядков, начиная со второго.

Ранее были попытки получить сверхэффективные оценки начальных моментов случайных величин Ходжесом и Джеймсом-Стейном [1], но полученные ими результаты оказались малопригодными для практического применения. Ценность проведенных ими исследований в том, что была показана возможность существования сверхэффективных оценок.

Получение сверхэффективных оценок, дисперсия погрешности которых меньше дисперсии погрешности эффективных оценок, производится на основании решения уравнения баланса дисперсий [2]. Такой подход позволяет существенно улучшить оценки начальных моментов порядка k и не требует выполнения дополнительных условий, налагаемых на свойства случайной величины.

Рассмотрим соотношение

M0[k] = P *M*[k] + (1 - P) * M^k], (2)

где M*[k] - выборочный начальный момент порядка k , M0[k] - некоторая оценка начального момента порядка k , MГ [k] - генеральный начальный момент, P - коэффициент.

При значениях коэффициента 0 < P < 1 такая схема получения оценки по построению заведомо лучше эффективной оценки M*[k].

Уравнение (2) содержит три неизвестных М 0[к], М Г [к], Р, и поэтому не может

быть решено непосредственно.

Разобьем выборку на две примерно равные по объему подвыборки. Для каждой под-выборки запишем выражение для сверхэффективной оценки:

М 01[к ] = Р * М*[к ] + (1 - Р) * М Г [к ] (3)

и

М02[к] = Р * М*[к] + (1 - Р) * МГ[к], (4)

где М *[к] - выборочные начальные моменты для подвыборок (г = 1, 2), и определим дисперсию этих оценок Б:

(Мо21[к ] + Мо22[к ])/2 - М2г[к ] = Б. (5)

Эта дисперсия не зависит от значения м г [к ], поскольку генеральный момент является константой, не влияющей на дисперсию. Поэтому дисперсию можно найти из (2) при Р = 1 на основе эффективных оценок:

Б =(М *2[к ] + М 2*2[к ])/2 - М *2[к ], (6)

где Б* - дисперсия эффективных оценок, полученных для подвыборок, М*[к] - выборочный

начальный момент порядка к , найденный по полной выборке, Мг*[к] - выборочные началь-

ные моменты для подвыборок (г = 1,2).

Подставив М 01[к ] и М 02[к ] в уравнение (7):

(м 021[к ] + М 02 [к ])/ 2 - М Г2[к ] = Б (7)

получим квадратное уравнение с двумя неизвестными:

АМГ2[к] + ВМГ [к] + С = 0, (8)

где В = 2Р(1 -Р)(М01[к] + М02[к]), С = (Р2-1)(М02[к] + М022[к])-1/2(М01[к]+М02[к])2, А = 2Р(Р-2).

Но, как видно из уравнения (2), сверхэффективная оценка будет получаться при любых

значениях Р , взятых из интервала (0;1). Критерием выбора значения Р является минимум дис-

персии погрешности оценки. Выбрать это значение можно только посредством машинного эксперимента, который позволит нам найти локальный оптимум для Р , который оказался равным 0,69.

Нами исследовались распределения с разными дисперсиями от малых до больших значений. Для каждого объёма выборки и заданных параметров моделируемых распределений мы производили по 30000 опытов, в которых с помощью рассмотренной методики получения сверхэф-фективной оценки мы оценивали первые 4 начальных момента. Полученная сверхэффективная оценка сравнивалась с теоретическим значением начальных моментов, при этом вычислялась выборочная дисперсия погрешности сверхэффективной оценки. Значение выборочной дисперсии погрешности сверхэффективной оценки сравнивалось с её теоретическим значением.

Сравнение теоретического значения дисперсии погрешности с выборочным значением показало их практическое совпадение, что говорит о правильно поставленном эксперименте. Параллельно с этим всякий раз мы производили оценку выборочных первых 4 начальных моментов по формуле (1), представляющей эффективную оценку начальных моментов, и вычисляли дисперсию погрешности эффективной оценки.

Отдельно нами было рассмотрено нормированное нормальное распределение, которое обычно при моделировании систем массового обслуживания не используется. Результаты, полученные для нормированного нормального распределения, практически совпали с результатами для распределения Эрланга.

В статистике принято относить выборки объемом от 10 до 30 значений к малым, от 30 до 200 к средним и более 200 к большим. Конечно, такая градация является условной.

Анализируя проведённые эксперименты, различных вариантов которых для разных распределений, с разными параметрами и объёмами выборок было 16320, можно сделать следующие обобщающие выводы:

1. Сверхэффективная и эффективная оценки асимптотически сходятся для выборок большого объема (более 200 значений).

2. Для выборок малого (от 4 до 30 значений случайной величины) и среднего (от 30 до 200 значений) объемов сверхэффективная оценка всегда лучше эффективной, особенно в тех случаях, когда коэффициенты вариации (дисперсия) распределений достаточно велики.

3. С уменьшением объёма выборки и увеличением дисперсии моделируемых распределений эффект от предлагаемой методики возрастает. При этом дисперсия погрешности сверхэффек-тивной оценки оказывается меньше дисперсии погрешности эффективной оценки в 1,5-3 раза.

4. С ростом порядка оцениваемых моментов относительная эффективность предлагаемой методики монотонно возрастает.

Таким образом, для моделировавшихся распределений, в которых дисперсии менялись в большом диапазоне, подтвердилась корректность предлагаемой методики. С ростом объёма выборки эффективная и сверхэффективная оценки сходятся. Учитывая простоту получения сверхэффективной оценки, ее можно рекомендовать для оценки начальных моментов в задачах аппроксимации неизвестных распределений распределениями пуассоновского типа и прочих аналогичных задачах.

ЛИТЕРАТУРА

1. Ибрагимов И. А. Асимптотическая теория оценивания / И. А. Ибрагимов, Р.З. Хась-минский. М.: Наука, 1979.

2. Сайкин А.И. Уравнение сверхэффективной оценки начальных моментов порядка к по малым выборкам / А.И. Сайкин, Е.В. Россошанский // Сб. трудов МНК ММТТ-21. Т.10. Саратов: СГТУ, 2008.

3. Вероятностные методы в вычислительной технике / под. ред. А.И.Лебедева. М.: Высш. шк., 1986. 312 с.

Сайкин Александр Иванович -

кандидат технических наук, доцент кафедры «Программное обеспечение вычислительной техники и автоматизированных систем» Саратовского государственного технического университета

Россошанский Евгений Васильевич -

аспирант кафедры «Программное обеспечение вычислительной техники

и автоматизированных систем» Саратовского государственного технического университета

Статья поступила в редакцию 25.09.09, принята к опубликованию 25.11.09

i Надоели баннеры? Вы всегда можете отключить рекламу.