+ 6(1 - Зе'2Ь +2е-гь)/аЬ + (1 - <Г')3Л). (31) Из приведённых на рис. 1 графиков зависимости ейд, , ей1 от Ь следует, что эффективность МНК-оценки параметра а достаточно высока. При -0,9 < 6 < 1,5 эффективность не менее 0,9. Эффективность параметра Ь несколько ниже, чем эффективность параметра а. Так, значения 0,9 она достигает при 0,6 < Ь < 1,7, а при увеличении или уменьшении Ь эффективность МНК-оценки параметра Ь, как и параметра о, убывает. Эффективность МНК-оценки тренда достигает своего наибольшего значения 0,91 при Ь - 1,4, а с уменьшением или увеличением Ъ она убывает.
Рис. 1
ЛИТЕРАТУРА
1. Кокс Д., Льюис П. Статистический анализ последовательностей событий. М.: Мир, 1969. 312 с.
2. Тривоженко Б.Е. Асимптотические свойства моментов наступления событий нестационарного пуассоновского потока // Математи-
ческое моделирование. Кибернетика. Информатика. Томск: Изд-во Том. ун-та, 1999. С. 140-150.
3. Свешников А.Г., Тихонов А Н. Теория функций комплексной переменной. М.: Наука, 1979.319 с.
Статья представлена кафедрой теории вероятностей и математической статистики факультета прикладной математики и кибернетики Томского государстоенногсьуниверситсте, соступила в научную редакцию 14 марта 2000 R.
УДК 519.24
С. С. Тарима
СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ ВЕРОЯТНОСТЕЙ С ПРИВЛЕЧЕНИЕМ ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ
Рассматривается способ учета дополнительной информации о вероятностях одних событий для улучшения эмпирических оценок вероятностей других. Приведен пример такого учета.
1. Пусть Х\, -Д, - последовательность независимых одинаково распределенных случайных величин, принимающих значения из измеримого пространства (Х,Б) с неизвестным распределением Р. Рассмотрим события A, Bi "t В„ принадлежащие ст-алгебре В. Предположим, что P(B,)=bh где b¡ ювесгны (М,—, s). Рассмотрим задачу статистического оценивания Р(А) с учетом данной информации. Результаты наблюдений представим в виде протокола;
А я. В,... в,
Хх m ЫХ) ых,)... ЫХ)
хг m 1тШ Ш... ых2)
Xi Ia(X,) ЫХ,) ЫХ)- ЫХ,)
... ...
Х„ ЦХг) 1вШ ЫХ)- ыхп)
В клетках протокола наблюдений /¿ДО) - индикатор некоторого события В из ст-алгебры В.
Рассмотрим события Л1=и1пи2г>—пи,, где и, либо 2?(, либо его дополнение, М,—, 5. Их совокупность, с возможным количеством до 2' событий, является разбиением пространства X. В этом случае имеют место равенства
I Р{л,)=Ь;, _/ = 1, --,5. (1)
Vя;
2. Для случая известных значений Р(Л,) в [3] была предложена оценка
= Рп(А,)>0,(2)
м Р„{А,)
1 я
где о-^гда
П1-1
В протоколе наблюдений часто реализуются не все события Л,, Предположим, что реализовалось только к из 2* событий Ai, для которых Р£А)>0. Остальные события в формуле (2) при рассмотрении отношения дают неопределенность типа 0/0 (если Р^АЦгО, то и PMAÍT =0). Аналогично, го событий Вк --, В, также реализуются не все, а только часть, допустим m<,k. Для этой ситуации рассмотрим следующую оценку
' i р^ШМ
-(3)
I
Суммирование ведется только по тем индексам, для которых эмпирическая оценка события А, не равна нолю. Эта оценка в отличие от (2) определена при любых РДЛД
3. В нашем случае значения P{A¡) неизвестны, но удовлетворяют условиям (1). Осталось оценить к вероятностей Р(А,). Если оценивать Р(Л,) распределением P„(A¡), то из (3) мы получаем Р"Л(А)=Р„(А).
Найдем проекцию [ближайшую в смысле информационного расхождения (4)] P"¿A) в класс, удовлетворя-
ющий условию (1). Информационное расхождение ме-, жду {/»(Ai» и {P¿A,)} будет следующим:
du(P(A),Pn(A))= I
'=иул,)>о ДА,)
(4)
(6)
4. Рассмотрим случай, где решение задачи нелинейного программирования находится в явном виде. При Р (8;)=6у, где/=1,2, получим:
РШ=Р(В1пВ2);Р(А2)=Р(В1п(С1\В2)); Р(Аг)=Р((П\В1)гхВ2); Р(А4)=Р((С1\В1)п(С1\В2));
Если наблюдения распределились по всем четырем множествам, то на вероятности ДЛ^ наложены три ограничения:
Р(Л1)+Р(Л2)=г.1; Р(^0+ />(Л3)=Й2,-
......ЛА,5+>(Л-2)+ Р(А3У Р(/и)=\.......
Определив одну из вероятностей из нало-
женных ограничений, можно найти остальные. Оценим Р(А{) из условия минимума информационного расхождения, которое в рассматриваемом случае примет вид
(ДА, ),№,)) = 1/5(Л/)1п4т7Т =
/=1 Р{А1)
ДА,)
xln-
Ь2-Р{А,)
+ (Л,-/>(Л,))х
xln . . +(}-Ь2 -fe, +Р(Л,))х
¿,-/>(Л,) xln-
П(Л4)
1 -¿2 - fe, + P(A¡) Минимизация (7) по Р(Л ¡) приводит к уравнению
(7)
1-
Р„(Л,)РИ(Л4)> Ри(Л2)/>„( А,),
P¿( Л,) +
1-6, -fe2 + 6,
+ Ь,
Заметим, что суммирование ведется только го положительным P¿A¡) вследствие необходимости абсолютной непрерывности меры Р по отношению к мере Р„. Оц еним ДЛ) из условия минимума информационного расхождения при условии (1) и условии нормировки, которое в нашем случае определяется как:
1/ЧЛ,) = 1. (5)
Нахождение Р(А) свелось к задаче нелинейного программирования. Пусть решение поставленной задачи нелинейного программирования будет {/""(Л,); /=1,-,25}; подставив это решение в (3), получим
/Г(Л)= I ПЬ)3^-
<=1./>„(л,)>0 Рп{ А,)
Р„(Л,)/>В(Л4)
Р„(А2)РП(А,) Р„(Л,)/>,,(Л4)
/>Я(Л2)/>„(Л3)
12 />я(Л2)/>„(А,) Решение уравнения (8) следующее:
í ¿1 + Ä2
2(1-0,
'h +b2
t
где t =
2 2(1-0 Р„(Л2).Я„(Л3)
(9)
(1-0
. Это решение и есть оценка
/>Й(Л,)/>Я(Л4)
ДЛД которая однозначно определяет Р{А£, ДЛзХ ДЛ4) из вышеупомянутых наложенных ограничений.
В выражении (9), когда г<1, используем «минус», а когда £>1 - «плюс». При /=1 (случай независимости событий В\ и В2 между собой) выражение (9) берем равным Ь1хЬ2. График зависимости Р'П(А\) от / будет следующий:
0,6
OrNn^UllOS П ф № N Ю О г
Ю Ф т-
О о
О — ^ ч" t
N IM (V
График приведен для Р{В\)=0,5 и Р(В2)=0,6
Оценка вероятности Р(В\ В2) изменяется в границах от шах{0;б1+62-1)} до тт{Аьй2}, а эмпирическая оценка (по комплектным наблюдениям) искомой вероятности изменяется от 0 до 1. Остальные оценки вероятностей определяются из условия нормировки и двух дополнительных ограничений.
Если наблюдения не попали в одно из четырех множеств, то наши три ограничения однозначно фиксируют три оставшихся Р{Л,).
ЛИТЕРАТУРА
1. Тарима С.С. О свойствах эмпирического распределения, модифицированного с учетом знания вероятностей // Мат. моделирование
и теория вероятностей / Под ред. И.А. Александрова, Томск: Пеленг, 1998. С. 257.
2. Кудъбак С. Теория информации и статистики. М.: Наука, 1967. 408 е..
3. Дмитриев Ю.Г., Устинов ¡O.K. Статистическое оценивание распределений вероятностей с использованием дополнительной ин-
формации. Томск: Изд-во ТГУ, 1988.
Статья представлена кафедрой теоретической кибернетики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию 14 февраля 2000 г.