Научная статья на тему 'Двухмерное биномиальное распределение'

Двухмерное биномиальное распределение Текст научной статьи по специальности «Математика»

CC BY
253
86
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НАТУРАЛЬНОЕ ЭКСПОНЕНТНОЕ СЕМЕЙСТВО РАСПРЕДЕЛЕНИЙ / ДВУХМЕРНОЕ БИНОМИАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / ПРОИЗВОДЯЩАЯ ФУНКЦИЯ КУМУЛЯНТОВ / ДИСПЕРСИОННАЯ ФУНКЦИЯ / NATURAL EXPONENTIAL FAMILIES / TWO-DIMENSIONAL BINOMIAL DISTRIBUTION / CUMULANT GENERATING FUNCTION / VARIANCE FUNCTION

Аннотация научной статьи по математике, автор научной работы — Хохлов Юрий Степанович, Шестаков Иван Петрович

Рассматривается модель двухмерного случайного вектора с зависимыми, биномиально распределёнными маргиналами, определяется закон распределения построенной модели.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Two-Dimensional Binomial Distribution

We consider a model of two-dimensional random vector with dependent binomial marginals.The distribution for constructed model is determined.

Текст научной работы на тему «Двухмерное биномиальное распределение»

Теория вероятностей и случайные

процессы

УДК 519.2

Двухмерное биномиальное распределение Ю. С. Хохлов, И. П. Шестаков

Кафедра теории вероятностей и математической статистики Российский университет дружбы народов ул. Миклухо-Маклая, д. 6, Москва, 117198, Россия

Рассматривается модель двухмерного случайного вектора с зависимыми, биномиально распределёнными маргиналами, определяется закон распределения построенной модели.

Ключевые слова: натуральное экспонентное семейство распределений, двухмерное биномиальное распределение, производящая функция кумулянтов, дисперсионная функция.

Известно, что биномиальное распределение относится к семейству натуральных экспонентных распределений на К1 с квадратичной относительно математического ожидания функцией дисперсии [1]. Одномерное распределение хорошо изучено, чего нельзя сказать о случайных векторах, маргиналами которых являются одномерные случайные величины, распределённые согласно биномиальному закону. Изучение осложняется характером зависимости между компонентами вектора, который может быть различным при одних и тех же натуральных параметрах координат.

В данной работе мы рассматриваем особое параметрическое семейство распределений Т € К2. Это семейство обладает следующими свойствами:

1) Т — натуральное экспонентное семейство распределений на К2;

2) распределения маргиналов принадлежат натуральному экспонентному семейству на К1.

Для начала опишем натуральное экспонентное семейство распределений (НЭС) Т на основе производящей функции кумулянтов (ПФК). Далее формулируется теорема об удобном виде представления ПФК семейства распределений Т, приводятся следствия, позволяющие восстанавливать её на основе ПФК маргиналов и функции, характеризующей зависимость между ними. Затем строится двухмерная модель, полезная с точки зрения прикладных задач, на основе биномиально распределённых зависимых случайных величин, определяется их совместное распределение вероятностей.

Пусть X = (Х1,Х2,... ,Хп) — случайный вектор с множеством значений на % С К" и $ = ($1,$2,..., "&п) € © С К" — п-мерный параметр.

3 = 1

тельной меры ц, на % определим: преобразование Лапласа меры ц, при заданном значении параметра

1. Введение

2. Предварительные сведения

Введём скалярное произведение на К", как

положи-

Статья поступила в редакцию 26 мая 2011 г.

производящую функцию кумулянтов кц (0) = 1п Ь/л (§) на в(^), где параметрическое множество (естественное параметрическое пространство семейства) есть вм = (0 е в : ^ (0) <

Определим натуральное экспонентное семейство (НЭС), порождённое положительной мерой ^ на х, как распределение вероятностей

тМ = {р (#,») = ехР {(0,ж) -к^ (#)}»(Ах);0 е е(^)}.

Для таких распределений можем определить вектор математических ожиданий и дисперсионную функцию [2] как

ТТ V дкМ Т, V ! \ ((V) ^ • • 1

М = т; = X = (^-^ = 1,...,п.

3. Постановка задачи

Рассмотрим последовательность {е^,'} ^ 1}независимых одинаково распределённых случайных величин со значениями во множестве двухмерных индексов I [3], распределение которых задаётся по правилу:

Р (е3 = (1, 0))= ри Р (е3 = (0,1))= Р2, Р (е3 = (1,1)) = 1 - Р1 - р2,

где р\ > 0, р2 > 0, р\ + р2 < 1.

п

Необходимо найти вид совместного распределения вектора У = ^^ е3, т.е.:

3 = 1

1) доказать, что распределение У принадлежит НЭС Т;

2) найти функцию, характеризующую зависимость между компонентами вектора У;

3) найти ПФК распределения вектора У;

4) найти дисперсионную функцию.

Для решения этой задачи необходимо сформулировать и доказать теорему об удобном виде представления ПФК семейства распределений Т, позволяющего восстанавливать её на основе ПФК маргиналов и функции, характеризующей зависимость между ними.

4. Получение распределения вероятностей вектора У

Теорема 1. Производящая функция кумулянтов двухмерного распределения Т с натуральным параметром ($1, 02) е К2 может быть записана в следующем виде: ^ (0Ь 02) = (01 + Р1 (02)) + /1 (02) = ¿2 (02 + & (01)) + /2 (01), где кг, г = 1, 2 — маргинальная производящая функции кумулянтов; г = 1, 2 —

некоторые функции.

Доказательство. Так как вектор X = (^1,^2) принадлежит классу двухмерных НЭС, который описывается с помощью закона

(Х1,Х2) = ехр {Ж101 + Х202 - кЦ (01,02)} ^ (Х1,Х2) ,

где ц, (х1,х2) — порождающая мера для двумерного НЭС, то распределение случайной величины Х1, как компоненты вектора X, имеет вид

Р1 (Ж1) =/ ^ (Ж1, Ж2) ^ = еХР ^^ - ^ (§1 еХР » (Х1,Х2^ ^

(1)

С другой стороны, Х1 принадлежит классу одномерных натуральных семейств распределений, порождённых мерой /11, т.е.,

Р1 (х{) = ехр {х1 а1 — к1 (а1)} ^1 (х{), (2)

где а1 € К1 — одномерный натуральный параметр.

Сравним правые части соотношений (1) и (2). Интеграл в соотношении (1) не зависит ни от значения Х2(переменной интегрирования), ни от значения параметра $1, следовательно, учитывая (2), имеем:

У ехр {Х2^2} ^ (Х1,Х2) йХ2 = ехр {Х1@1 (02) + ¡1 ($2)} 1^1 (Х1),

где р1 (02) и /1 (02) — некоторые функции, зависящие только от 02, а значит, имеют место следующие соотношения между одномерными и двумерными натуральными параметрами и производящими функциями кумулянтов:

Г #1 + 01 (#2) = а1 (01 ,02), (3)

(#1,02) — /1 Ш = к1 (а.1). (3)

Проводя аналогичные рассуждения относительно компоненты Х2 вектора X, запишем

'02 + р2 (01) = а.2 (01,02) , (4)

К (#1,#2) — /2 (01) = к2 (а.2), ()

где аналогично рассмотренному случаю с компонентой Х1, @2 (^1) и /2 (01) — функции, зависящие только от $1. Эти функции характеризуют зависимость между компонентами случайного вектора X. Таким образом, из (3) и (4) следует, что

^ (01,02) = к1 (01 + (02)) + /1 (02) = к2 (02 + $2 (01)) + /2 (01) .

Доказательство теоремы завершено. □

Следствие 2. Для того, чтобы по известным распределениям маргиналов восстановить производящую функцию кумулянтов их совместного распределения, необходимо только знать характер зависимости компонент или, что тоже самое, — функции р1 (02), @2 (0{), которыми выражается эта зависимость.

Доказательство. Из теоремы 1 следует, что

к„ (01,02) = к1 (01 + р1 (02)) + /1 (02) = к2 (02 + р2 (01)) + /2 (01). (5)

Тогда, используя свойство производящей функции кумулянтов НЭС, продифференцируем (5) по $1 и 02:

Ш1 (01 + р1 (02)) = Ш2 (02 + $2 (01)) 13'2 (01) + 12 (01) , (6)

Ш2 (02 + $2 (01)) = Ш1 (01 + (02)) ¡3[ (02) + /1 (02) , (7)

где тг (0,1) = Еа1 Хг, г = I, 2. Поэтому для того чтобы определить /1 (02)и /2 (01_), нам необходимо знать только функции р1 (02), @2 (0{).

Таким образом, двухмерное распределения Т с натуральным параметром (01,02) € К2 определяется функциями р1 (02) и ¡32 (0]_), так как они определяют натуральный параметр и производящую функцию кумулянтов совместного распределения, а последняя является преобразованием Лапласа меры ц, (х1 ,х2).□

Следствие 3. Производящая функция кумулянтов двухмерного распределения Т с натуральным параметром (01,02) е К2 может быть записана в следующем виде:

^ (01,02) =

= к1 (01 + 01 (02)) + /Ш2 (02 + 02 (01)) d§2 - !Ш1 (01 + 01 (02)) й (01 (02)) =

к2 (02 + 02 (01)) + /Ш1 (01 + 01 (02)) ¿01 - /Ш2 (02 + 02 (01)) б, (02 (01)) .

Следствие 4. Если компоненты вектора имеют однотипные распределения, симметричные с точностью до значений натуральных параметров, т.е. 01 (0) = 02 (0) = 0 (0), /1 (0) = /2 (0) = / (0), к1 (0) = ¿2 (0) = к (0), то производящая функция кумулянтов двухмерного распределения Т с натуральным параметром (01,02) е К2 может быть записана в следующем виде:

^ (01, 02) = к (01 + 0 (02)) + / (02) = к (02 + 0 (01)) + / (01) .

Теорема 2. При сформулированных выше условиях для модели двухмерного

п

случайного вектора У = ^ е^ верны следующие утверждения:

3 = 1

1) маргиналы случайного вектора У имеют распределения: У1 ~ Вг (п; 1 - р2), У2 ~ В1 (п; 1 - Р1);

2) распределение вектора У принадлежит классу НЭС, единственно и имеет следующий вид:

„1

Ру (УиУ2)

( п - у2)! ( п - Ух)! (у! +у2 - п)!

х ехр {#'1У1 + §'2У2 - п ■ 1п (е< + е^2 + е^2) }

для (01,02) е К2и любых натуральных у1 и у2 таких, что у1 < п, у2 < п, У1 + у2^ п, где 01 = 1п , ^ = 1п ^^, к^ы (<&[, 02) = п ■

1п (е^1 + е^2 + е^1 ) — производящая функция кумулянтов распределения

п!

вектора У, ^ (у1,у2) = (п—^ )! (п—у )! (у + у-П)! — порождающая мера;

3) распределение вектора У характеризуется при помощи любого из 3 эквивалентных способов:

3.1) «бэта-функция» 0 (0) = 1п (1 + е;

3.2) производящая функция кумулянтов к^ (01; 02) = п 1п (е®1 + е^2 + ;

( т} \

т,1 - — СТ12 \

3.3) дисперсионная функция Уаг (т) = I п 2 I, где т^ = п ■

V ^21 Ш2 - ^п2/

е^1 + е^1 +^2 птх — т} пт2 — т}

-, г = 1, 2; СТ12 = 021 = -

+ е^2 + ' "21 п (1 + е^2) п (1 + )'

Доказательство. Рассмотрим распределение вероятностей случайных величин е^ со значениями во множестве двухмерных индексов I для р1 + р2 ^ 1 (табл. 1).

Первое утверждение теоремы очевидно:

Таблица 1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Распределение вероятностей случайных величин е^

№ исхода £з Вероятность

1 (1 0) Р1

2 (0 1) Р2

3 (1 1) 1 — Р1 — Р2

1) У представляет собой количество исходов № 1 и № 3 в п независимых испытаниях, так как {е^,'} ^ 1} — последовательность независимых одинаково распределённых случайных величин. Таким образом У ~ В1 (п; 1 —

2) представляет собой количество исходов № 2 и № 3 в п независимых испытаниях, так как {е^,'} ^ 1} — последовательность независимых одинаково распределённых случайных величин. Таким образом У2 ~ В1 (п; 1 — р{).

Из [1] следует, что трёхмерное полиномиальное распределение может быть описано с помощью производящей функции кумулянтов вида:

(01;02) = п • 1п (1 + е*1 + е^2) ,

где § = 1п—-—--, §2 = 1п т"-—-т. Отсюда запишем функцию распре-

(1 — Р1 — Р2) (1 — Р1 — Р2)

п

деления случайного вектора У = ^^ е^ для любых натуральных у1 и у2, таких

3 = 1

что у1 ^ п, у2 ^ п, у1 + у2 ^ п:

Ру (У1, Уъ) = Рх (п - У2,п - У!) =

- ехр |(п - уъ) -&1 + (п - у!) -&2 - п ■ 1п + е»1 + |

(га - уъ)! (га - У1)\(У1 + У2 - га)!

П' у ехр |п (#1 + #2) - $1У2 - $2У1 - п ■ 1п + е»1 + е»2^ |

(га - уъ)! (га - г/1)! (у1 + уъ - га)! = (га - уъ)! (га - щ)! (у1 + ,2 - га)! еХР { * ^ + № (-<М - п ^ ^ ( ^е»^) }

га!

■ ехр {у1 (-#2) + уъ (-#1) -

(га - уъ)! (га - г/1)! (у 1 + уъ - га)!

-п ■ 1п (е(-"1) + е(-"2) + е(-»1)+(-»2))| =

■ ехр {#1 г/1 + -д'ъуъ -п ■ 1п ^е»1 + е»2 + |

(га - уъ)! (га - У1)! (у1 + уъ - га)!

о/ о 1 1 — Р1 — Р2 а, о , 1 — Р1 — Р2 где §1 = —§2 = 1п-, §2 = —§1 = 1п-.

Р2 Р1

Покажем, что полученное распределение принадлежит классу двухмерных натуральных экспонентных семейств на К2 с производящей функцией кумулянтов

^ (§1 ;§2) = п • 1п (е^1 + е®2 + ) .

Из следствий 3 теоремы 1 и свойства производящей функции кумулянтов

(#1 = = д= д^ъ = а12 = д#2#1 = а21

28 Вестник РУДН. Серия Математика. Информатика. Физика. № 4. 2011. С. 23-30

следует, что аи (01 + 3 (02)) 3' (02) = 012, 022 (02 + 3 (01)) 3' (01) = 021 •

Таким образом, если распределение вектора У принадлежит классу НЭС Т и п ■ 1п (е^1 + е^2 + ) — его ПФК, то

3' (02) = -п ' '

3' (01) = -п

(+ е^2 + )2 п (е^1+^2 + е^1+2^2) 1 + е^2

^1+^2 ^ + е^2 + )2 1

( + е^2 + )2 п (е^1+^2 + е^2+2^1) 1 +

положительная

т.е. 3 (0) = 1п (1 + е*) - 1п е* + 1п с = 1п (с(1 + е-*)), где с — константа.

Из доказательства следствия 1 теоремы 1 следует, что

т (01 + 3 (02)) = т (02 + 3 (01)) 3' (01) + Г (01), (8)

т (02 + 3 (01)) = т (01 + 3 (02)) 3' (02) + Г (02), (9)

где для биномиально распределённых маргиналов т (0)

пе *

1 + е*' Таким образом,

1 + 1 + \ 1 +

о ■(-г+^) + ^( 01)

пе(1 + е-^2) пе (1 + е-^1) / 1 \ п(е ^ + е^1 ) / (01) = 1 + (1 + е-^2) - 1 + е^2(1 + е-^1) ■ I- 1 + е^1 / = 1 + е^1 + е^1 -^2 + _п(е + е^2-^1)_ = _ п(е + е^2)

1 + 2 • е^2 + + + (1 + + )( е^2 + )

п(е + е^2)

= п,

1 + 2 • е^2 + + +

/(01) = п01 + С1, /(02) = п02 + С1,

где С1 — неотрицательная константа. Отсюда

кц (01,02) = к (01 +3 (02)) + / (02) =

= п ■ 1п (1 + ехр^ +1п (с ■ (1 + е-^2))}) + п02 + с1 = = п ■ 1п (е^2 (1 + е^с ■ (1 + е-^2))) + С1 = п ■ 1п (с ■ е^1 + е^2 + с ■ ) + С1.

Пусть имеется 2 производящие функции кумулянтов:

1) к,1 (х1,х2) ( 01,02) и к^2(х1,х2) (01,02) = к^1 (ш1,ш2) (01,02) + сь тогда ц2 (хЪ Х2) =

-(—у-, что следует из определения производящей функции кумулянтов

2) к/л(Х1 ,Х2) (01, 02) = 1п ехр {01х1 + 02х2} ц (с1 (х^ х2))^ и закона двухмерного распределения из класса Т,

Р'&1,'&2 (Х1,Х2) = ехр {Х101 +Х202 - кЦ (01,02)} Ц (Х1,Х2) .

Зададим меру ^ (х1,х2), для которой с1 = 0. Тогда при Р (§) = 1п{ус(\ + е мы получаем производящую функцию кумулянтов

^ (§1,§2) = п • 1п (с • е®1 + е®2 + с • е*1+*2) .

Определим (§1,§2) натуральный параметр) распределения из класса Т соответствующего функции Р (§) = 1п (с (1 + еи порождающую меру ^ (х1,х2).

Из доказательства теоремы 1 следует, что

,

§2 = а2 — р (§1), { §2 = а2 — 1п (с (1 + е)) ,

§1 = а.1 — р (§2), \§1 = а1 — 1п (с (1 + е,

Н ^

§2 = 1п(^ , ) , I §2 = 1п

с-1 ■ е«1-»1 - 1 у' I 2 \с-1 ■ е"1 +1

§ =1п (с-2 ■ *а1+а2 - 1 А ( а , (с-2 ■ е«1 +«2 -

§1 =4 с-1 ■ в«2 + 1 ) , (§1 = 1п( с-1 ■ в^2 +1

Т/Г Г11 Л ( 1 - Р2 \ л ( 1 - Р1 \ а 1 1 - Р1 - Р2

Из 111 следует, что а1 = 1п - , а2 = 1п - , тогда §1 = 1п-,

V Р2 / V Р1 / с ■ Р2

§2 = 1п 1 - Р1 - Р2 . с ■ Р1

Таким образом, полученное распределение вероятностей

п'

Ру(УЪ У2)

( п - г/2)! ( п - 2/1)! (У1 + У2 - п)!

х ехр{§[У1 +§'2у2 —п • 1п (е^1 + е^2 + е^2) }

единственно и принадлежит классу двухмерных натуральных экспонентных семейств Т.

Действительно для с = 1 получим:

Р (§) = 1п (1 + е-*) , §1 = 1п 1 - Р1 - Р2, §2 = 1п 1 - Р1 - Р2,

1 2 2 Р 1

^ (§1,§2) = п • 1п (е^1 + е^2 + е®1+"®2) , п!

»(уъ У2) = (п - у2)'(п - У1)'(У1 + у2 -п)' — порождающая меPа, так как Ру (Уи У2) есть вероятность, следовательно, выполняется свойство нормировки вероятности

Е Ру (У1, У2) = 1.

У1+У2^п

Запишем для полученного распределения дисперсионную функцию:

(т1

т,1--а12

п 2

т2

а 21 т2--

п

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

eeí + е$1+$2 пт1 — т2 пт2 — т2

где т^ = п • —-г—1—-Т—-Г-, 1 = 1,2; а12 = а21 = — -

е*1 + е&2 + е»1+»2> ^ "12 "21 п (1 + е^) п (1 + е^ ) Определим параметрическое множество, опираясь на свойство положитель-

ной определённости ПФК [4]. Для этого найдём матрицу Р2к1Л вторых частных

с-2 . +«2 _ 1

производных kр (t?i,02):

П2к ( 011 (01 + 3 (02)) 011 (01 + 3 (02)) 3' (02)Л » \022 (02 + 3 (01)) 3' (01) 022 (02 + 3 (01))

У (02Л

))

|^2кд| = 011 (01 + 3 (02)) 022 (02 + 3 (01)) [1 - 3' (01) 3' (02)]

Таким образом, для выполнения условия положительной определённости ПФК кц (01, 02) необходимо и достаточно выполнение условия 3' (01) 3' (02) < 1- Найдём 01 и 02, удовлетворяющие этому условию:

__^ . (__1_^ < 1 1 + е*1 + е^2 + > 1

1 + е*1 V 1 + е^ < i, 1 + е +е +е > 1.

Значит ( 01,02) е К2.

Доказательство теоремы завершено. □

5. Заключение

Построенная в данной работе модель может быть использована в прикладных целях, таких как: оценка стоимости опционов, определение стоимости страхового контракта с одинаковыми страховыми суммами по пересекающимся рискам, разработка алгоритмов маршрутизации пакетов в телекоммуникационных системах.

Литература

1. Morris C. Natural Exponential Families with Quadratic Variance-Functions // Annals of Statistics. — 1982. — Vol. 10, No 1. — Pp. 65-80.

2. Ivanova N. L. The Reconsruction of Natural Exponential Families by Their Marginals // Journal of Mathematical Sciences. — 2001. — Vol. 106, No 1. — Pp. 2672-2681.

3. Иванова Н. Л., Хохлов Ю. С. Многомерная модель коллективного риска // Вестник МГУ. — 2005. — Т. 15, № 3. — С. 22-30. [Ivanova N. L, Khokhlov Yu. S. Mnogomernaya modelj kollektivnogo riska // Vestnik MGU. — 2005. — T. 15, No 3. — S. 22-30. ]

4. Иванова Н. Л., Хохлов Ю. С. О восстановлении многомерного распределения по его компонентам // Вестник МГУ. — 2001. — Т. 15, № 1. — С. 32-37. [Ivanova N. L., Khokhlov Yu. S. O vosstanovlenii mnogomernogo raspredeleniya po ego komponentam // Vestnik MGU. — 2001. — T. 15, No 1. — S. 32-37. ]

UDC 519.2

Two-Dimensional Binomial Distribution Y. S. Khokhlov, I. P. Shestakov

Department of Probability Theory and Mathematical Statistics Peoples' Friendship University of Russia Miklukho-Maklaya str., 6, Moscow, 117198, Russia

We consider a model of two-dimensional random vector with dependent binomial marginals. The distribution for constructed model is determined.

Key words and phrases: natural exponential families, two-dimensional binomial distribution, cumulant generating function, variance function.

i Надоели баннеры? Вы всегда можете отключить рекламу.