ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014
18
УДК 519.233.22 п. А. БАТРАКОВ
О. С. ЧЕРЕПАНОВ
Омский государственный технический университет
Курганский государственный университет
ИССЛЕДОВАНИЕ ОЦЕНОК ПАРАМЕТРА МАСШТАБА ВЗВЕШЕННОГО МЕТОДА МАКСИМАЛЬНОГО ПРАВДОПОДОБИЯ
В статье рассматриваются оценки параметра масштаба взвешенного метода максимального правдоподобия. Проводится исследование эффективности полученных оценок и их сравнение с классическими оценками для ряда типовых распределений в условиях модели Тьюки с симметричными и асимметричными выбросами. Результаты исследования показывают высокую эффективность предложенных оценок по сравнению с классическими робастными оценками.
Ключевые слова: параметр масштаба, робастные оценки, взвешенный метод максимального правдоподобия.
Введение. Математическая статистика предлагает большой арсенал методов оценивания параметра масштаба [1—4]. Хорошо известное среднеквадратическое отклонение является оптимальным для нормального распределения, но быстро теряет свою эффективность при наличии выбросов. Оценка абсолютного отклонения от медианы обладает робастными свойствами и эффективна для распределения Коши, но крайне не эффективная для распределений с более легкими хвостами. Взвешенный метод максимального правдоподобия (ВММП) [5] предлагает способ получения эффективных оценок, устойчивых к наличию выбросов. В данной работе предлагаются оценки параметра масштаба ВММП и проводятся исследование их эффективности для ряда типовых распределений при наличии выбросов. Полученные оценки включают в себя оценки максимального правдоподобия, радикальные оценки и оценки максимальной устойчивости [3] как частные случаи. Синтезированные оценки были использованы в задачах точечного оценивания параметра сдвига [6], задаче регрессии [7] и прогноза, где параметр масштаба выступает в роли мешающего параметра.
1. Взвешенный метод максимального правдоподобия. Оценки взвешенного метода максимального правдоподобия относятся к классу М-оценок, определяемых уравнением вида:
£ф(х, ■ 6«) = 0, (1)
ф(х,0) = I — 1од^(x,0) + р8 ]/'(х,0). (2)
где ф(х,0) — оценочная функция, Дх) — плотность распределения, 5 — параметр масштаба, 1 — параметр радикальности, определяющий робастность оценки, Рв — параметр, рассчитываемый из условия несмещенности оценки:
£ф(х, 0) = 0 .
При 1=0 и Рв =0 получаем оценки максимального правдоподобия, при 1=0,5 и 1= 1— радикальные оценки и оценки максимальной устойчивости соответственно.
В [5] показано, что ^/2(0М—Е0) имеет асимптотическое нормальное распределение с дисперсий
|ф2(х, 0)^(х) ||0ф(х, 0^(х)
V
2. Оценки параметра масштаба для типовых распределений. Выпишем оценки параметра масштаба и их дисперсии для класса типовых симметричных распределений с разной степенью затянутости хвостов. Будем рассматривать следующий класс распределений:
— обобщенно-нормальное распределений 4-й степени (ОНР4);
— нормальное распределение (НР);
— распределение Лапласа (РЛ);
— распределение Коши (РК).
Без потери общности положим, что параметр сдвига для рассматриваемого класса распределений равен 0.
2.1. Обобщенно-нормальное распределение 4-й степени. Плотность ОНР4 имеет вид:
9і(х) '■
2
^Г(0,25)
Оценка параметра 5, согласно (1) и (2), примет вид:
X
&1(х, ) = °.
(3)
2
4
Масштабный коэффициент Р1 для распределения F(x,5) будет рассчитываться из условия несмещенности оценки
А =
| х4д1(х, Б^р(х, 8)
19І(х, s)dF(x, в)
Рз —
1 | |х|?3 (х, s)dF(x.s) I д'з (Х8^р(х.8)
Дисперсия оценки параметра масштаба определяется следующим выражением:
Дисперсия оценки параметра масштаба будет определяться следующим образом:
4|^ I - А I д!‘(х^г(х)
' I 4 1 Т] _ Аі ]| 4І^ - 1]- 161 х
-рз) 9з2'(х)^(х)
93(х)^(х)
2.4. Распределение Коши. Плотность РК имеет вид:
9І(х^В(х)
2.2. Нормальное распределение. Плотность НР имеет вид:
1
_11 х_ЕЛ
92(х) = —^ге 21 5 ^ .
5л/ 2ж
Оценка параметра 5, согласно (1) и (2), примет вид:
9з(х) = ■
1 +
Оценка параметра 5, согласно (1) и (2), примет вид:
2™м| — 1 94(х,, ^ ) -р4
,
94(х,, ) = 0. (6)
Масштабный коэффициент Р4 для распределения F(x,5) будет иметь следующий вид:
X
ї I- А2
9 2(х,, ^) = 0.
(4)
Масштабный коэффициент Р2 для распределения F(x,5) будет рассчитываться следующим образом:
А =
Г х 292(х, s)dF(x, в)
1 -со
82 ""I .
Г 9 2(х, s)dF(x, в)
Дисперсия оценки параметра масштаба определяется следующим выражением:
Р 4 =
2л
Г х 294+1(х, s)dF(x.s)
Г 94 (х, Б^Р(х.з)
Дисперсия оценки параметра масштаба определяется следующим выражением:
П 2Ц ] 94(х) -р4
2%б\ х] 94(х)| 2Я/хI 94(х) - 2 | +
'I Ч]■ - А.)((8Т -1)-<7 ’
д2(х)<ІР(х)
9?(х^(х)
+ '( 2жв(х) 94 (х) - А4 )(2я5(х) 94(х) - 1)
94(х^(х)
2.3. Распределение Лапласа. Плотность РЛ имеет вид:
1 Iх-А
9з(х) = —е 5 .
25
Оценка параметра 5, согласно (1) и (2), примет вид:
X
9з(хі, ) = 0.
(5)
Масштабный коэффициент Р3 для распределения F(x,5) будет иметь следующий вид:
3. Исследование эффективности оценок параметра масштаба. Проводилось исследование эффективности оценок параметра масштаба (3) — (6) на обобщенно-нормальном распределении 4-й степени, нормальном распределении, распределении Лапласа и распределении Коши в условиях модели выбросов Тьюки:
— симметричные выбросы (СВ):
Г(х) = (1 - е)9(х) + ед(х - а);
— асимметричные выбросы (АВ):
4
2
Уз = 5
2
2
4
1
2
2
2
2
2
2
У4 = в
2
2
2
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ
ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014
Таблица 1
Значения параметров масштаба для типовых распределений
Распределение ОНР4 НР РЛ РК
Значение параметра масштаба 1,767 0,7144 0,2605
Таблица 2
Эффективность оценок параметра масштаба на распределениях (7)— (10)
Оценка ОМП РО ОМУ СКО АО САО ОВСКО ОВАО ООНР4 ООК
Распределение (7)
V 0,781 1,046 1,584 0,928 3,335 1,291 0,928 1,291 0,781 1,282
є 1,000 0,747 0,493 0,841 0,234 0,605 0,842 0,605 1,000 0,609
Распределение (8)
V 9,546 1,397 1,903 4,483 3,851 2,603 1,635 2,097 1,367 1,925
є 0,143 0,979 0,718 0,049 0,355 0,525 0,836 0,652 1,000 0,710
Распределение (9)
V 25,020 1,162 1,760 14,733 4,178 8,992 1,393 2,866 0,881 2,171
є 0,035 0,758 0,501 0,060 0,211 0,098 0,632 0,307 1,000 0,406
Распределение (10)
V 3,642 1,578 1,998 2,389 3,969 2,033 1,639 1,952 1,576 1,900
є 0,433 0,999 0,789 0,660 0,397 0,775 0,962 0,807 1,000 0,829
Таблица 3
Эффективность оценок параметра масштаба на распределениях (11)—(14)
Оценка ОМП РО ОМУ СКО АО САО ОВСКО ОВАО ООНР4 ООК
Распределение (11)
V 0,500 0,708 1,154 0,500 1,361 0,571 0,500 0,570 0,545 0,723
є 1,000 0,706 0,433 1,000 0,367 0,876 1,000 0,877 0,917 0,691
Распределение (12)
V 1,999 0,883 1,328 1,999 1,544 1,031 0,807 0,857 0,900 0,907
є 0,404 0,914 0,608 0,404 0,523 0,783 1,000 0,942 0,897 0,890
Распределение (13)
V 4,955 0,789 1,283 4,955 1,700 3,250 0,685 1,239 0,608 1,153
є 0,123 0,771 0,474 0,123 0,358 0,187 0,888 0,491 1,000 0,527
Распределение (14)
V 0,871 1.060 1,554 0,871 1,650 0,809 0,841 0,807 1,222 0,958
є 0,927 0,761 0,519 0,927 0,489 0,998 0,960 1,000 0,660 0,842
Таблица 4
Эффективность оценок параметра масштаба на распределениях (15)—(18)
Оценка ОМП РО ОМУ СКО АО САО ОВСКО ОВАО ООНР4 ООК
Распределение (15)
V 0,510 0,807 1,512 0,637 1,055 0,510 0,543 0,510 0,635 0,635
є 1,000 0,632 0,337 0,801 0,483 1,000 0,939 1,000 0,803 0,803
Распределение (16)
V 0,797 0,884 1,601 2,007 1,160 0,800 0,729 0,648 0,943 0,731
є 0,813 0,733 0,405 0,323 0,559 0,810 0,889 1,000 0,687 0,886
Распределение (17)
V 1,970 1,018 1,681 2,490 1.322 1,970 0,702 1,003 0,820 0,965
є 0,356 0,690 0,418 0,282 0,531 0,356 1,000 0,700 0,856 0,727
Распределение (18)
V 0,592 1,103 1,933 0,586 1,298 0,592 0,578 0,591 1,113 0,840
є 0,976 0,524 0,299 0,986 0,445 0,976 1,00 0,978 0,519 0,688
Таблица 5
Эффективность оценок параметра масштаба на распределениях (19)-(22)
Оценка ОМП РО ОМУ АО ОВСКО ОВАО ООНР4 ООК
Распределение (19)
V 0,136 0,184 0,271 0,168 0,193 0,148 0,312 0,136
є 1,000 0,739 0,502 0,810 0,704 0,919 0,435 1,000
Распределение (20)
V 0,146 0,196 0,287 0,183 0,220 0,161 0,255 0,146
є 1,000 0,745 0,509 0,780 0,664 0,907 0,573 1,000
Распределение (21)
V 0,191 0,208 0,302 0,209 0,216 0,174 0,348 0,174
є 0,91 0,84 0,58 0,833 0,81 0,5 1
Распределение (22)
V 0,185 0,218 0,309 0,208 0,231 0,242 0,357 0,182
є 0,984 0,835 0,589 0,875 0,788 0,752 0,510 1,000
і(х) = (1 - е)д(х) + ед\ -
і(х) =
1.8
0.2
( х-2.5 V \ 1.767 )
1.767Г(0.25)
1.767Г(0.25)
. (10)
Параметр масштаба для основного распределения подбрился таким образом, чтобы квантиль уровня 0,95 совпадал с квантилем уровня 0,95 стандартного нормального распределения (табл. 1).
Относительная эффективность оценки определяется как
_ V V ,
3.2. Оценивание параметра масштаба нормального распределения. Проводилось сравнение оценок параметра масштаба нормального распределения на следующих распределениях (табл. 3):
І (х)
1
(11)
где V — вариация оценки, Уор1 — вариация оценки, имеющей минимальную вариацию среди рассматриваемых оценок.
Эффективность полученных оценок сравнивались с оценками максимального правдоподобия (ОМП), радикальными оценками (РО), оценками максимальной устойчивости (ОМУ), средним квадратичным отклонением (СКО), абсолютным отклонением (АО) и средним абсолютным отклонением (САО).
Оценки (3) — (6) с оптимальными значениями параметра радикальности будем называть оптимальной оценкой обощенно-нормального распределения 4-й степени (ООНР4), оптимальным взвешенным среднем квадратичным отклонением (ОВСКО), оптимальным взвешенным абсолютным отклонением (ОВАО), оптимальным оценкой Коши (ООК) соответственно.
3.1. Оценивание параметра масштаба обобщеннонормального распределения 4-й степени. Проводилось сравнение оценок параметра масштаба обобще-но-нормального распределения 4-й степени на следующих распределениях (табл. 2):
і (х) =
2
І — I
1 1.767 )
1.767Г(0.25)
і (х) =
і (х) =
1.8
1.767Г(0.25)
1.8
---------------(
1.767Г(0.25)
0.2
5.301Г(0.25)
0.2
----------------(
1.767Г(0.25)
I
I. 1.767 )
(7)
(8)
(9)
а , 0.9
і (х) = ^= е
0.1 --
3^І2ж
0.1
+ ^= е
■\}2ж
(х-8)2 2
і (х) =
0.9
е 2 +
0.1
-.рік
(12)
(13)
(14)
3.3. Оценивание параметра масштаба распределения Лапласа. Проводилось сравнение оценок параметра масштаба распределения Лапласа на следующих распределениях (табл. 4):
і (х) =
1
|х|
0,7144
1.1488
0.9
і (х) = ----------е
1.1488
|х|
0,7144
0.1
+----------е
4.2864
|х|
2,1432
0.9
і (х) = ----------е
1.1488
|х|
0,7144
0.1
+----------е
1.1488
|х-8 0,7144
(15)
(16)
(17)
0.9
і (х) = ----------е
1.1488
|х|
0,7144
0.1
+---------е
1.1488
| х-2.5|
отШ (18)
3.4. Оценивание параметра масштаба распределения Коши. Проводилось сравнение оценок пара-
(х- 2.5)
х
2
ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014 ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ
ФИЗИКО-МАТЕМАТИЧЕСКИЕ НАУКИ ОМСКИЙ НАУЧНЫЙ ВЕСТНИК №2 (130) 2014
метра масштаба распределения Коши на следующих распределениях (табл. 5):
1
f (X) = -
f (X)
) 0.2605/ Г1 + f X У0.2605 0.9
0.2605/ r1+f X т У 0.2605 ) 0.1
0.7815/ 1+f X Т ' У 0.7815 ) 0.9
0.2605/ 1 + f X ] у 0.2605 ) 0.1
0.2605/ 1+fX-8T у0.2605 ) 0.9
)= ) 0.2605/ 1 + f X ] у0.2605 ) 0.1
0.2605/ 14X - “ Y У 0.2605 )
(19)
(20)
(21)
(22)
Заключение. В работе были предложены оценки параметров масштаба на основе взвешенного метода максимального правдоподобия. Было проведено сравнение эффективности полученных оценок с наиболее известными оценками параметра масштаба. По результатам исследования можно сделать следующие выводы:
1. Оценки взвешенного метода максимального правдоподобия при условии совпадения априорного и исходного распределения при наличии симметричных выбросов являются наиболее эффективными в рамках рассматриваемых оценок.
2. При наличии асимметричных выбросов эффективность оценки взвешенного метода максимального правдоподобия может зависеть от параметра сдвига
засоряющего распределения. В случае, когда выбросы находятся достаточно близко к основному распределению или внутри него, оценки с более мягким усечением (весовые функции g *(х) с более затянутыми хвостами) начинают проигрывать оценкам с более жестким усечением.
3. При удалении выбросов от основного распределения эффективность оценок при условии совпадения априорного и исходного распределения начинает возрастать.
4. Оценки максимальной устойчивость проигрывают оценкам с оптимальным значением параметра радикальности, что говорит о слишком сильном усечении ОМУ.
5. Ввиду сложного выбора наиболее эффективных оценок параметра масштаба требуется синтез алгоритмов адаптивных как к наличию и степени выбросов, так и по виду исходного распределения.
Библиографический список
1. Робастность в статистике / Ф. Хампель [и др]. — М. : Мир, 1989 — 512с.
2. Хьюбер, П. Робастность в статистике / П. Хьюбер. — М. : Мир, 1984 - 303 с.
3. Шурыгин, А. М. Прикладная статистика. Робастность. Оценивание. Прогноз / А. М. Шурыгин. — М. : Финансы и статистика, 2000 — 223 с.
4. Шуленин, В. П. Математическая статистика. Ч. 3. Робастная статистика / В. П. Шуленин — Томск : Изд-во НТЛ, 2012. — 518 с.
5. Симахин, В. А. Непараметрическая статистика. Ч. II. Теория оценок / В. А. Симахин. — Курган : Изд-во КГУ, 2004 — 163 с.
6. Симахин, В. А. Робастные непараметрические оценки / В. А. Симахин. — Saarbrucken : LAMBERT Academic Publishing, 2011. — 292 с.
7. Симахин, В. А. Адаптивные оценки параметра сдвига /
B. А. Симахин, О. С. Черепанов // Вестник ТГУ. Управление, вычислительная техника и информатика. — 2013. — № 1. —
C. 131-137.
БАТРАКОВ Петр Андреевич, ассистент кафедры теплоэнергетики Омского государственного технического университета.
ЧЕРЕПАНОВ Олег Сергеевич, аспирант, ассистент кафедры программного обеспечения автоматизированных систем Курганского государственного университета.
Адрес для переписки: [email protected]
Статья поступила в редакцию 04.03.2014 г.
© П. А. Батраков, О. С. Черепанов
2
+
+
+
+
+
Книжная полка
537/К17
Калистратова, Л. Ф. Основы колебательного и волнового движений : учеб. электрон. изд. локального распространения : учеб. пособие для студентов по направлению 5511 и специальности 2008 и 2205 / Л. Ф. Калистратова, А. А. Гладенко, Э. М. Ярош ; ОмГТУ. — Омск: Изд-во ОмГТУ, 2013. — 1 о=эл. опт. диск (CD-ROM).
В учебном электронном издании представлено описание физических основ гармонических механических и электромагнитных колебаний. Приводятся примеры решения задач, сводки формул. Предложены вопросы и задачи для проведения коллоквиума или экзамена. Предназначено для студентов радиотехнического факультета, обучающихся по специальностям 2008.00 «Проектирование и технология электронных средств», 2007.00 «Радиотехника», 2205.00 «Конструирование и технология ЭВС» и другим родственным специальностям.