Теория вероятностей и случайные
процессы
УДК 519.2
Двухмерное биномиальное распределение Ю. С. Хохлов, И. П. Шестаков
Кафедра теории вероятностей и математической статистики Российский университет дружбы народов ул. Миклухо-Маклая, д. 6, Москва, 117198, Россия
Рассматривается модель двухмерного случайного вектора с зависимыми, биномиально распределёнными маргиналами, определяется закон распределения построенной модели.
Ключевые слова: натуральное экспонентное семейство распределений, двухмерное биномиальное распределение, производящая функция кумулянтов, дисперсионная функция.
Известно, что биномиальное распределение относится к семейству натуральных экспонентных распределений на К1 с квадратичной относительно математического ожидания функцией дисперсии [1]. Одномерное распределение хорошо изучено, чего нельзя сказать о случайных векторах, маргиналами которых являются одномерные случайные величины, распределённые согласно биномиальному закону. Изучение осложняется характером зависимости между компонентами вектора, который может быть различным при одних и тех же натуральных параметрах координат.
В данной работе мы рассматриваем особое параметрическое семейство распределений Т € К2. Это семейство обладает следующими свойствами:
1) Т — натуральное экспонентное семейство распределений на К2;
2) распределения маргиналов принадлежат натуральному экспонентному семейству на К1.
Для начала опишем натуральное экспонентное семейство распределений (НЭС) Т на основе производящей функции кумулянтов (ПФК). Далее формулируется теорема об удобном виде представления ПФК семейства распределений Т, приводятся следствия, позволяющие восстанавливать её на основе ПФК маргиналов и функции, характеризующей зависимость между ними. Затем строится двухмерная модель, полезная с точки зрения прикладных задач, на основе биномиально распределённых зависимых случайных величин, определяется их совместное распределение вероятностей.
Пусть X = (Х1,Х2,... ,Хп) — случайный вектор с множеством значений на % С К" и $ = ($1,$2,..., "&п) € © С К" — п-мерный параметр.
3 = 1
тельной меры ц, на % определим: преобразование Лапласа меры ц, при заданном значении параметра
1. Введение
2. Предварительные сведения
Введём скалярное произведение на К", как
положи-
Статья поступила в редакцию 26 мая 2011 г.
производящую функцию кумулянтов кц (0) = 1п Ь/л (§) на в(^), где параметрическое множество (естественное параметрическое пространство семейства) есть вм = (0 е в : ^ (0) <
Определим натуральное экспонентное семейство (НЭС), порождённое положительной мерой ^ на х, как распределение вероятностей
тМ = {р (#,») = ехР {(0,ж) -к^ (#)}»(Ах);0 е е(^)}.
Для таких распределений можем определить вектор математических ожиданий и дисперсионную функцию [2] как
ТТ V дкМ Т, V ! \ ((V) ^ • • 1
М = т; = X = (^-^ = 1,...,п.
3. Постановка задачи
Рассмотрим последовательность {е^,'} ^ 1}независимых одинаково распределённых случайных величин со значениями во множестве двухмерных индексов I [3], распределение которых задаётся по правилу:
Р (е3 = (1, 0))= ри Р (е3 = (0,1))= Р2, Р (е3 = (1,1)) = 1 - Р1 - р2,
где р\ > 0, р2 > 0, р\ + р2 < 1.
п
Необходимо найти вид совместного распределения вектора У = ^^ е3, т.е.:
3 = 1
1) доказать, что распределение У принадлежит НЭС Т;
2) найти функцию, характеризующую зависимость между компонентами вектора У;
3) найти ПФК распределения вектора У;
4) найти дисперсионную функцию.
Для решения этой задачи необходимо сформулировать и доказать теорему об удобном виде представления ПФК семейства распределений Т, позволяющего восстанавливать её на основе ПФК маргиналов и функции, характеризующей зависимость между ними.
4. Получение распределения вероятностей вектора У
Теорема 1. Производящая функция кумулянтов двухмерного распределения Т с натуральным параметром ($1, 02) е К2 может быть записана в следующем виде: ^ (0Ь 02) = (01 + Р1 (02)) + /1 (02) = ¿2 (02 + & (01)) + /2 (01), где кг, г = 1, 2 — маргинальная производящая функции кумулянтов; г = 1, 2 —
некоторые функции.
Доказательство. Так как вектор X = (^1,^2) принадлежит классу двухмерных НЭС, который описывается с помощью закона
(Х1,Х2) = ехр {Ж101 + Х202 - кЦ (01,02)} ^ (Х1,Х2) ,
где ц, (х1,х2) — порождающая мера для двумерного НЭС, то распределение случайной величины Х1, как компоненты вектора X, имеет вид
Р1 (Ж1) =/ ^ (Ж1, Ж2) ^ = еХР ^^ - ^ (§1 еХР » (Х1,Х2^ ^
(1)
С другой стороны, Х1 принадлежит классу одномерных натуральных семейств распределений, порождённых мерой /11, т.е.,
Р1 (х{) = ехр {х1 а1 — к1 (а1)} ^1 (х{), (2)
где а1 € К1 — одномерный натуральный параметр.
Сравним правые части соотношений (1) и (2). Интеграл в соотношении (1) не зависит ни от значения Х2(переменной интегрирования), ни от значения параметра $1, следовательно, учитывая (2), имеем:
У ехр {Х2^2} ^ (Х1,Х2) йХ2 = ехр {Х1@1 (02) + ¡1 ($2)} 1^1 (Х1),
где р1 (02) и /1 (02) — некоторые функции, зависящие только от 02, а значит, имеют место следующие соотношения между одномерными и двумерными натуральными параметрами и производящими функциями кумулянтов:
Г #1 + 01 (#2) = а1 (01 ,02), (3)
(#1,02) — /1 Ш = к1 (а.1). (3)
Проводя аналогичные рассуждения относительно компоненты Х2 вектора X, запишем
'02 + р2 (01) = а.2 (01,02) , (4)
К (#1,#2) — /2 (01) = к2 (а.2), ()
где аналогично рассмотренному случаю с компонентой Х1, @2 (^1) и /2 (01) — функции, зависящие только от $1. Эти функции характеризуют зависимость между компонентами случайного вектора X. Таким образом, из (3) и (4) следует, что
^ (01,02) = к1 (01 + (02)) + /1 (02) = к2 (02 + $2 (01)) + /2 (01) .
Доказательство теоремы завершено. □
Следствие 2. Для того, чтобы по известным распределениям маргиналов восстановить производящую функцию кумулянтов их совместного распределения, необходимо только знать характер зависимости компонент или, что тоже самое, — функции р1 (02), @2 (0{), которыми выражается эта зависимость.
Доказательство. Из теоремы 1 следует, что
к„ (01,02) = к1 (01 + р1 (02)) + /1 (02) = к2 (02 + р2 (01)) + /2 (01). (5)
Тогда, используя свойство производящей функции кумулянтов НЭС, продифференцируем (5) по $1 и 02:
Ш1 (01 + р1 (02)) = Ш2 (02 + $2 (01)) 13'2 (01) + 12 (01) , (6)
Ш2 (02 + $2 (01)) = Ш1 (01 + (02)) ¡3[ (02) + /1 (02) , (7)
где тг (0,1) = Еа1 Хг, г = I, 2. Поэтому для того чтобы определить /1 (02)и /2 (01_), нам необходимо знать только функции р1 (02), @2 (0{).
Таким образом, двухмерное распределения Т с натуральным параметром (01,02) € К2 определяется функциями р1 (02) и ¡32 (0]_), так как они определяют натуральный параметр и производящую функцию кумулянтов совместного распределения, а последняя является преобразованием Лапласа меры ц, (х1 ,х2).□
Следствие 3. Производящая функция кумулянтов двухмерного распределения Т с натуральным параметром (01,02) е К2 может быть записана в следующем виде:
^ (01,02) =
= к1 (01 + 01 (02)) + /Ш2 (02 + 02 (01)) d§2 - !Ш1 (01 + 01 (02)) й (01 (02)) =
к2 (02 + 02 (01)) + /Ш1 (01 + 01 (02)) ¿01 - /Ш2 (02 + 02 (01)) б, (02 (01)) .
Следствие 4. Если компоненты вектора имеют однотипные распределения, симметричные с точностью до значений натуральных параметров, т.е. 01 (0) = 02 (0) = 0 (0), /1 (0) = /2 (0) = / (0), к1 (0) = ¿2 (0) = к (0), то производящая функция кумулянтов двухмерного распределения Т с натуральным параметром (01,02) е К2 может быть записана в следующем виде:
^ (01, 02) = к (01 + 0 (02)) + / (02) = к (02 + 0 (01)) + / (01) .
Теорема 2. При сформулированных выше условиях для модели двухмерного
п
случайного вектора У = ^ е^ верны следующие утверждения:
3 = 1
1) маргиналы случайного вектора У имеют распределения: У1 ~ Вг (п; 1 - р2), У2 ~ В1 (п; 1 - Р1);
2) распределение вектора У принадлежит классу НЭС, единственно и имеет следующий вид:
„1
Ру (УиУ2)
( п - у2)! ( п - Ух)! (у! +у2 - п)!
х ехр {#'1У1 + §'2У2 - п ■ 1п (е< + е^2 + е^2) }
для (01,02) е К2и любых натуральных у1 и у2 таких, что у1 < п, у2 < п, У1 + у2^ п, где 01 = 1п , ^ = 1п ^^, к^ы (<&[, 02) = п ■
1п (е^1 + е^2 + е^1 ) — производящая функция кумулянтов распределения
п!
вектора У, ^ (у1,у2) = (п—^ )! (п—у )! (у + у-П)! — порождающая мера;
3) распределение вектора У характеризуется при помощи любого из 3 эквивалентных способов:
3.1) «бэта-функция» 0 (0) = 1п (1 + е;
3.2) производящая функция кумулянтов к^ (01; 02) = п 1п (е®1 + е^2 + ;
( т} \
т,1 - — СТ12 \
3.3) дисперсионная функция Уаг (т) = I п 2 I, где т^ = п ■
V ^21 Ш2 - ^п2/
е^1 + е^1 +^2 птх — т} пт2 — т}
-, г = 1, 2; СТ12 = 021 = -
+ е^2 + ' "21 п (1 + е^2) п (1 + )'
Доказательство. Рассмотрим распределение вероятностей случайных величин е^ со значениями во множестве двухмерных индексов I для р1 + р2 ^ 1 (табл. 1).
Первое утверждение теоремы очевидно:
Таблица 1
Распределение вероятностей случайных величин е^
№ исхода £з Вероятность
1 (1 0) Р1
2 (0 1) Р2
3 (1 1) 1 — Р1 — Р2
1) У представляет собой количество исходов № 1 и № 3 в п независимых испытаниях, так как {е^,'} ^ 1} — последовательность независимых одинаково распределённых случайных величин. Таким образом У ~ В1 (п; 1 —
2) представляет собой количество исходов № 2 и № 3 в п независимых испытаниях, так как {е^,'} ^ 1} — последовательность независимых одинаково распределённых случайных величин. Таким образом У2 ~ В1 (п; 1 — р{).
Из [1] следует, что трёхмерное полиномиальное распределение может быть описано с помощью производящей функции кумулянтов вида:
(01;02) = п • 1п (1 + е*1 + е^2) ,
где § = 1п—-—--, §2 = 1п т"-—-т. Отсюда запишем функцию распре-
(1 — Р1 — Р2) (1 — Р1 — Р2)
п
деления случайного вектора У = ^^ е^ для любых натуральных у1 и у2, таких
3 = 1
что у1 ^ п, у2 ^ п, у1 + у2 ^ п:
Ру (У1, Уъ) = Рх (п - У2,п - У!) =
- ехр |(п - уъ) -&1 + (п - у!) -&2 - п ■ 1п + е»1 + |
(га - уъ)! (га - У1)\(У1 + У2 - га)!
П' у ехр |п (#1 + #2) - $1У2 - $2У1 - п ■ 1п + е»1 + е»2^ |
(га - уъ)! (га - г/1)! (у1 + уъ - га)! = (га - уъ)! (га - щ)! (у1 + ,2 - га)! еХР { * ^ + № (-<М - п ^ ^ ( ^е»^) }
га!
■ ехр {у1 (-#2) + уъ (-#1) -
(га - уъ)! (га - г/1)! (у 1 + уъ - га)!
-п ■ 1п (е(-"1) + е(-"2) + е(-»1)+(-»2))| =
■ ехр {#1 г/1 + -д'ъуъ -п ■ 1п ^е»1 + е»2 + |
(га - уъ)! (га - У1)! (у1 + уъ - га)!
о/ о 1 1 — Р1 — Р2 а, о , 1 — Р1 — Р2 где §1 = —§2 = 1п-, §2 = —§1 = 1п-.
Р2 Р1
Покажем, что полученное распределение принадлежит классу двухмерных натуральных экспонентных семейств на К2 с производящей функцией кумулянтов
^ (§1 ;§2) = п • 1п (е^1 + е®2 + ) .
Из следствий 3 теоремы 1 и свойства производящей функции кумулянтов
(#1 = = д= д^ъ = а12 = д#2#1 = а21
28 Вестник РУДН. Серия Математика. Информатика. Физика. № 4. 2011. С. 23-30
следует, что аи (01 + 3 (02)) 3' (02) = 012, 022 (02 + 3 (01)) 3' (01) = 021 •
Таким образом, если распределение вектора У принадлежит классу НЭС Т и п ■ 1п (е^1 + е^2 + ) — его ПФК, то
3' (02) = -п ' '
3' (01) = -п
(+ е^2 + )2 п (е^1+^2 + е^1+2^2) 1 + е^2
^1+^2 ^ + е^2 + )2 1
( + е^2 + )2 п (е^1+^2 + е^2+2^1) 1 +
положительная
т.е. 3 (0) = 1п (1 + е*) - 1п е* + 1п с = 1п (с(1 + е-*)), где с — константа.
Из доказательства следствия 1 теоремы 1 следует, что
т (01 + 3 (02)) = т (02 + 3 (01)) 3' (01) + Г (01), (8)
т (02 + 3 (01)) = т (01 + 3 (02)) 3' (02) + Г (02), (9)
где для биномиально распределённых маргиналов т (0)
пе *
1 + е*' Таким образом,
1 + 1 + \ 1 +
о ■(-г+^) + ^( 01)
пе(1 + е-^2) пе (1 + е-^1) / 1 \ п(е ^ + е^1 ) / (01) = 1 + (1 + е-^2) - 1 + е^2(1 + е-^1) ■ I- 1 + е^1 / = 1 + е^1 + е^1 -^2 + _п(е + е^2-^1)_ = _ п(е + е^2)
1 + 2 • е^2 + + + (1 + + )( е^2 + )
п(е + е^2)
= п,
1 + 2 • е^2 + + +
/(01) = п01 + С1, /(02) = п02 + С1,
где С1 — неотрицательная константа. Отсюда
кц (01,02) = к (01 +3 (02)) + / (02) =
= п ■ 1п (1 + ехр^ +1п (с ■ (1 + е-^2))}) + п02 + с1 = = п ■ 1п (е^2 (1 + е^с ■ (1 + е-^2))) + С1 = п ■ 1п (с ■ е^1 + е^2 + с ■ ) + С1.
Пусть имеется 2 производящие функции кумулянтов:
1) к,1 (х1,х2) ( 01,02) и к^2(х1,х2) (01,02) = к^1 (ш1,ш2) (01,02) + сь тогда ц2 (хЪ Х2) =
-(—у-, что следует из определения производящей функции кумулянтов
2) к/л(Х1 ,Х2) (01, 02) = 1п ехр {01х1 + 02х2} ц (с1 (х^ х2))^ и закона двухмерного распределения из класса Т,
Р'&1,'&2 (Х1,Х2) = ехр {Х101 +Х202 - кЦ (01,02)} Ц (Х1,Х2) .
Зададим меру ^ (х1,х2), для которой с1 = 0. Тогда при Р (§) = 1п{ус(\ + е мы получаем производящую функцию кумулянтов
^ (§1,§2) = п • 1п (с • е®1 + е®2 + с • е*1+*2) .
Определим (§1,§2) натуральный параметр) распределения из класса Т соответствующего функции Р (§) = 1п (с (1 + еи порождающую меру ^ (х1,х2).
Из доказательства теоремы 1 следует, что
,
§2 = а2 — р (§1), { §2 = а2 — 1п (с (1 + е)) ,
§1 = а.1 — р (§2), \§1 = а1 — 1п (с (1 + е,
Н ^
§2 = 1п(^ , ) , I §2 = 1п
с-1 ■ е«1-»1 - 1 у' I 2 \с-1 ■ е"1 +1
§ =1п (с-2 ■ *а1+а2 - 1 А ( а , (с-2 ■ е«1 +«2 -
§1 =4 с-1 ■ в«2 + 1 ) , (§1 = 1п( с-1 ■ в^2 +1
Т/Г Г11 Л ( 1 - Р2 \ л ( 1 - Р1 \ а 1 1 - Р1 - Р2
Из 111 следует, что а1 = 1п - , а2 = 1п - , тогда §1 = 1п-,
V Р2 / V Р1 / с ■ Р2
§2 = 1п 1 - Р1 - Р2 . с ■ Р1
Таким образом, полученное распределение вероятностей
п'
Ру(УЪ У2)
( п - г/2)! ( п - 2/1)! (У1 + У2 - п)!
х ехр{§[У1 +§'2у2 —п • 1п (е^1 + е^2 + е^2) }
единственно и принадлежит классу двухмерных натуральных экспонентных семейств Т.
Действительно для с = 1 получим:
Р (§) = 1п (1 + е-*) , §1 = 1п 1 - Р1 - Р2, §2 = 1п 1 - Р1 - Р2,
1 2 2 Р 1
^ (§1,§2) = п • 1п (е^1 + е^2 + е®1+"®2) , п!
»(уъ У2) = (п - у2)'(п - У1)'(У1 + у2 -п)' — порождающая меPа, так как Ру (Уи У2) есть вероятность, следовательно, выполняется свойство нормировки вероятности
Е Ру (У1, У2) = 1.
У1+У2^п
Запишем для полученного распределения дисперсионную функцию:
(т1
т,1--а12
п 2
т2
а 21 т2--
п
eeí + е$1+$2 пт1 — т2 пт2 — т2
где т^ = п • —-г—1—-Т—-Г-, 1 = 1,2; а12 = а21 = — -
е*1 + е&2 + е»1+»2> ^ "12 "21 п (1 + е^) п (1 + е^ ) Определим параметрическое множество, опираясь на свойство положитель-
ной определённости ПФК [4]. Для этого найдём матрицу Р2к1Л вторых частных
с-2 . +«2 _ 1
производных kр (t?i,02):
П2к ( 011 (01 + 3 (02)) 011 (01 + 3 (02)) 3' (02)Л » \022 (02 + 3 (01)) 3' (01) 022 (02 + 3 (01))
У (02Л
))
|^2кд| = 011 (01 + 3 (02)) 022 (02 + 3 (01)) [1 - 3' (01) 3' (02)]
Таким образом, для выполнения условия положительной определённости ПФК кц (01, 02) необходимо и достаточно выполнение условия 3' (01) 3' (02) < 1- Найдём 01 и 02, удовлетворяющие этому условию:
__^ . (__1_^ < 1 1 + е*1 + е^2 + > 1
1 + е*1 V 1 + е^ < i, 1 + е +е +е > 1.
Значит ( 01,02) е К2.
Доказательство теоремы завершено. □
5. Заключение
Построенная в данной работе модель может быть использована в прикладных целях, таких как: оценка стоимости опционов, определение стоимости страхового контракта с одинаковыми страховыми суммами по пересекающимся рискам, разработка алгоритмов маршрутизации пакетов в телекоммуникационных системах.
Литература
1. Morris C. Natural Exponential Families with Quadratic Variance-Functions // Annals of Statistics. — 1982. — Vol. 10, No 1. — Pp. 65-80.
2. Ivanova N. L. The Reconsruction of Natural Exponential Families by Their Marginals // Journal of Mathematical Sciences. — 2001. — Vol. 106, No 1. — Pp. 2672-2681.
3. Иванова Н. Л., Хохлов Ю. С. Многомерная модель коллективного риска // Вестник МГУ. — 2005. — Т. 15, № 3. — С. 22-30. [Ivanova N. L, Khokhlov Yu. S. Mnogomernaya modelj kollektivnogo riska // Vestnik MGU. — 2005. — T. 15, No 3. — S. 22-30. ]
4. Иванова Н. Л., Хохлов Ю. С. О восстановлении многомерного распределения по его компонентам // Вестник МГУ. — 2001. — Т. 15, № 1. — С. 32-37. [Ivanova N. L., Khokhlov Yu. S. O vosstanovlenii mnogomernogo raspredeleniya po ego komponentam // Vestnik MGU. — 2001. — T. 15, No 1. — S. 32-37. ]
UDC 519.2
Two-Dimensional Binomial Distribution Y. S. Khokhlov, I. P. Shestakov
Department of Probability Theory and Mathematical Statistics Peoples' Friendship University of Russia Miklukho-Maklaya str., 6, Moscow, 117198, Russia
We consider a model of two-dimensional random vector with dependent binomial marginals. The distribution for constructed model is determined.
Key words and phrases: natural exponential families, two-dimensional binomial distribution, cumulant generating function, variance function.