Научная статья на тему 'Статистическое оценивание вероятностей с привлечением дополнительной информации'

Статистическое оценивание вероятностей с привлечением дополнительной информации Текст научной статьи по специальности «Математика»

CC BY
93
70
i Надоели баннеры? Вы всегда можете отключить рекламу.

Аннотация научной статьи по математике, автор научной работы — Тарима Сергей Сергеевич

Рассматривается способ учета дополнительной информации о вероятностях одних событий для улучшения эмпирических оценок вероятностей других. Приведен пример такого учета.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Statistical estimation of probabilities using supplementary information

The way of taking into account additional information about the probabilities of some events to improve the empirical estimates of the probabilities of others. An example of such an account.

Текст научной работы на тему «Статистическое оценивание вероятностей с привлечением дополнительной информации»

+ 6(1 - Зе'2Ь +2е-гь)/аЬ + (1 - <Г')3Л). (31) Из приведённых на рис. 1 графиков зависимости ейд, , ей1 от Ь следует, что эффективность МНК-оценки параметра а достаточно высока. При -0,9 < 6 < 1,5 эффективность не менее 0,9. Эффективность параметра Ь несколько ниже, чем эффективность параметра а. Так, значения 0,9 она достигает при 0,6 < Ь < 1,7, а при увеличении или уменьшении Ь эффективность МНК-оценки параметра Ь, как и параметра о, убывает. Эффективность МНК-оценки тренда достигает своего наибольшего значения 0,91 при Ь - 1,4, а с уменьшением или увеличением Ъ она убывает.

Рис. 1

ЛИТЕРАТУРА

1. Кокс Д., Льюис П. Статистический анализ последовательностей событий. М.: Мир, 1969. 312 с.

2. Тривоженко Б.Е. Асимптотические свойства моментов наступления событий нестационарного пуассоновского потока // Математи-

ческое моделирование. Кибернетика. Информатика. Томск: Изд-во Том. ун-та, 1999. С. 140-150.

3. Свешников А.Г., Тихонов А Н. Теория функций комплексной переменной. М.: Наука, 1979.319 с.

Статья представлена кафедрой теории вероятностей и математической статистики факультета прикладной математики и кибернетики Томского государстоенногсьуниверситсте, соступила в научную редакцию 14 марта 2000 R.

УДК 519.24

С. С. Тарима

СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ ВЕРОЯТНОСТЕЙ С ПРИВЛЕЧЕНИЕМ ДОПОЛНИТЕЛЬНОЙ ИНФОРМАЦИИ

Рассматривается способ учета дополнительной информации о вероятностях одних событий для улучшения эмпирических оценок вероятностей других. Приведен пример такого учета.

1. Пусть Х\, -Д, - последовательность независимых одинаково распределенных случайных величин, принимающих значения из измеримого пространства (Х,Б) с неизвестным распределением Р. Рассмотрим события A, Bi "t В„ принадлежащие ст-алгебре В. Предположим, что P(B,)=bh где b¡ ювесгны (М,—, s). Рассмотрим задачу статистического оценивания Р(А) с учетом данной информации. Результаты наблюдений представим в виде протокола;

А я. В,... в,

Хх m ЫХ) ых,)... ЫХ)

хг m 1тШ Ш... ых2)

Xi Ia(X,) ЫХ,) ЫХ)- ЫХ,)

... ...

Х„ ЦХг) 1вШ ЫХ)- ыхп)

В клетках протокола наблюдений /¿ДО) - индикатор некоторого события В из ст-алгебры В.

Рассмотрим события Л1=и1пи2г>—пи,, где и, либо 2?(, либо его дополнение, М,—, 5. Их совокупность, с возможным количеством до 2' событий, является разбиением пространства X. В этом случае имеют место равенства

I Р{л,)=Ь;, _/ = 1, --,5. (1)

Vя;

2. Для случая известных значений Р(Л,) в [3] была предложена оценка

= Рп(А,)>0,(2)

м Р„{А,)

1 я

где о-^гда

П1-1

В протоколе наблюдений часто реализуются не все события Л,, Предположим, что реализовалось только к из 2* событий Ai, для которых Р£А)>0. Остальные события в формуле (2) при рассмотрении отношения дают неопределенность типа 0/0 (если Р^АЦгО, то и PMAÍT =0). Аналогично, го событий Вк --, В, также реализуются не все, а только часть, допустим m<,k. Для этой ситуации рассмотрим следующую оценку

' i р^ШМ

-(3)

I

Суммирование ведется только по тем индексам, для которых эмпирическая оценка события А, не равна нолю. Эта оценка в отличие от (2) определена при любых РДЛД

3. В нашем случае значения P{A¡) неизвестны, но удовлетворяют условиям (1). Осталось оценить к вероятностей Р(А,). Если оценивать Р(Л,) распределением P„(A¡), то из (3) мы получаем Р"Л(А)=Р„(А).

Найдем проекцию [ближайшую в смысле информационного расхождения (4)] P"¿A) в класс, удовлетворя-

ющий условию (1). Информационное расхождение ме-, жду {/»(Ai» и {P¿A,)} будет следующим:

du(P(A),Pn(A))= I

'=иул,)>о ДА,)

(4)

(6)

4. Рассмотрим случай, где решение задачи нелинейного программирования находится в явном виде. При Р (8;)=6у, где/=1,2, получим:

РШ=Р(В1пВ2);Р(А2)=Р(В1п(С1\В2)); Р(Аг)=Р((П\В1)гхВ2); Р(А4)=Р((С1\В1)п(С1\В2));

Если наблюдения распределились по всем четырем множествам, то на вероятности ДЛ^ наложены три ограничения:

Р(Л1)+Р(Л2)=г.1; Р(^0+ />(Л3)=Й2,-

......ЛА,5+>(Л-2)+ Р(А3У Р(/и)=\.......

Определив одну из вероятностей из нало-

женных ограничений, можно найти остальные. Оценим Р(А{) из условия минимума информационного расхождения, которое в рассматриваемом случае примет вид

(ДА, ),№,)) = 1/5(Л/)1п4т7Т =

/=1 Р{А1)

ДА,)

xln-

Ь2-Р{А,)

+ (Л,-/>(Л,))х

xln . . +(}-Ь2 -fe, +Р(Л,))х

¿,-/>(Л,) xln-

П(Л4)

1 -¿2 - fe, + P(A¡) Минимизация (7) по Р(Л ¡) приводит к уравнению

(7)

1-

Р„(Л,)РИ(Л4)> Ри(Л2)/>„( А,),

P¿( Л,) +

1-6, -fe2 + 6,

+ Ь,

Заметим, что суммирование ведется только го положительным P¿A¡) вследствие необходимости абсолютной непрерывности меры Р по отношению к мере Р„. Оц еним ДЛ) из условия минимума информационного расхождения при условии (1) и условии нормировки, которое в нашем случае определяется как:

1/ЧЛ,) = 1. (5)

Нахождение Р(А) свелось к задаче нелинейного программирования. Пусть решение поставленной задачи нелинейного программирования будет {/""(Л,); /=1,-,25}; подставив это решение в (3), получим

/Г(Л)= I ПЬ)3^-

<=1./>„(л,)>0 Рп{ А,)

Р„(Л,)/>В(Л4)

Р„(А2)РП(А,) Р„(Л,)/>,,(Л4)

/>Я(Л2)/>„(Л3)

12 />я(Л2)/>„(А,) Решение уравнения (8) следующее:

í ¿1 + Ä2

2(1-0,

'h +b2

t

где t =

2 2(1-0 Р„(Л2).Я„(Л3)

(9)

(1-0

. Это решение и есть оценка

/>Й(Л,)/>Я(Л4)

ДЛД которая однозначно определяет Р{А£, ДЛзХ ДЛ4) из вышеупомянутых наложенных ограничений.

В выражении (9), когда г<1, используем «минус», а когда £>1 - «плюс». При /=1 (случай независимости событий В\ и В2 между собой) выражение (9) берем равным Ь1хЬ2. График зависимости Р'П(А\) от / будет следующий:

0,6

OrNn^UllOS П ф № N Ю О г

Ю Ф т-

О о

О — ^ ч" t

N IM (V

График приведен для Р{В\)=0,5 и Р(В2)=0,6

Оценка вероятности Р(В\ В2) изменяется в границах от шах{0;б1+62-1)} до тт{Аьй2}, а эмпирическая оценка (по комплектным наблюдениям) искомой вероятности изменяется от 0 до 1. Остальные оценки вероятностей определяются из условия нормировки и двух дополнительных ограничений.

Если наблюдения не попали в одно из четырех множеств, то наши три ограничения однозначно фиксируют три оставшихся Р{Л,).

ЛИТЕРАТУРА

1. Тарима С.С. О свойствах эмпирического распределения, модифицированного с учетом знания вероятностей // Мат. моделирование

и теория вероятностей / Под ред. И.А. Александрова, Томск: Пеленг, 1998. С. 257.

2. Кудъбак С. Теория информации и статистики. М.: Наука, 1967. 408 е..

3. Дмитриев Ю.Г., Устинов ¡O.K. Статистическое оценивание распределений вероятностей с использованием дополнительной ин-

формации. Томск: Изд-во ТГУ, 1988.

Статья представлена кафедрой теоретической кибернетики факультета прикладной математики и кибернетики Томского государственного университета, поступила в научную редакцию 14 февраля 2000 г.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.