Journal of Siberian Federal University. Mathematics & Physics 1 (2008) 68-77
УДК 517.55
Многомерные дискретные распределения
Олег Ю.Воробьев* Лаврентий С.Головков ^
Институт вычислительного моделирования СО РАН, Академгородок, 660036, Красноярск,
Россия
Получена 10.10.2007, принята 10.11.2007 Вводятся два новых дискретных распределения: многомерное биномиальное распределение и многомерное распределение Пуассона. Эти распределения были созданы в рамках эвентологии как более корректные обобщения биномиального и пуассоновского распределений. Согласно эвентологии новые законы учитывают полные распределения вероятностей событий. Также в статье описываются их свойства и характеристики.
Ключевые слова: многомерное биномиальное распределение, многомерное распределение Пуассона, полное распределение вероятностей событий.
Введение
Распределение вероятностей — одно из центральных понятий теории вероятностей и математической статистики. Его определение равносильно заданию всех случайных событий, относящихся к выбранному явлению. Однако результаты испытаний крайне редко выражаются одним числом, и намного чаще — системой чисел, вектором, функцией. Если некая закономерность описывается несколькими случайными величинами, заданными на одном и том же вероятностном пространстве, то говорят о многомерном распределении. Таким образом, последние вводятся для отображения поведения случайного вектора, который служит для описания более или менее приближенных к реальности случайных явлений. В связи с возникшей научной необходимостью задания двух многомерных дискретных распределений и появилась эта работа.
Используемое в настоящее время полиномиальное распределение как обобщение биномиального не учитывает, фактически, основного специфического понятия теории вероятностей, а именно независимости событий, случайных величин, испытаний. Ведь без этого свойства теория вероятностей может рассматриваться лишь как часть общей теории меры множеств1.
1. Биномиальное многомерное распределение
Пусть проводится конечная последовательность из n независимых случайных экспериментов. В результате г-го эксперимента могут наступить или нет события из N-множества X(i) событий Эвентологические распределения множеств событий X(i),i = 1, ...,n,
совпадают с одним и тем же эвентологическим распределением {p(X),X С X} некоторого N-множества X событий x е X, которое не меняется от эксперимента к эксперименту.
Такая схема проведения экспериментов называется многомерной (эвентологической) схемой испытаний Бернулли с порождающим множеством событий X, и каждая из случайных
* e-mail: vorob@akadem.ru te-mail: lavrentiy.golovkov@gmail.com © Siberian Federal University. All rights reserved
Случайные величины предстают как измеримые функции, а их математические ожидания, дисперсии и другие моменты — как абстрактные интегралы Лебега и так далее.
величин
п
1ХЦ)
= ^ 1х('>Н,х(<) е £<1),х е X
г=1
подчиняется биномиальному распределению с параметрами п, рх = Р(х), а случайный вектор2 £ = (£х,х е X) подчиняется биномиальному многомерному (К-мерному) 'распределению с параметрами (п, {р(Х), 0 = X С X}).
Вероятности биномиального многомерного распределения, порожденного N -множеством событий X, определяются для любого целочисленного набора п = (пх,х е X) е [0,п]м формулой
Ъп(п;р(Х), 0 = X С X) = Р(£ = п) = Р(£х = Пх, х е X) = £ тп(п; {р(Х), X С X}),
где
тп( п
(п; {р(Х), X С X}) = Р(£ = п) = Р ((£(Х), X С X) = (п(Х), X С X))
П ^)]п(х)
п!
хсх
хсх
— вероятности 2м-мерного полиномиального распределения случайного вектора £ = ), X С X с параметрами (п; {p(X),X С X}), порожденного 2м-множеством событий-террасок {¿ег^),X С X}, которое взаимно-однозначно соответствует данному биномиальному многомерному распределению; а суммирование производится по всем 2м-мерным наборам п = (п^),X С X е Б2 из 2м-вершинного симплекса Б2 , то есть таким, что
п = £ n(X),
хсх
но для которых выполнены еще N равенств
пх ^^ n(X), х е X.
хех
1.1. Биномиальное одномерное распределение
При N =1 (когда порождающее множество X = {х} — моноплет событий) биномиальное одномерное распределение случайной величины £х совпадает с классическим биномиальным распределением с параметрами (п; рх). Иначе говоря, вероятности биномиального одномерного распределения имеют классический вид:
Ъпх (п;рх) = Р(£х = пх) = СПрПх (1 -рх)п-пх, 0 < пх < п.
1.2. Биномиальное двумерное распределение
При N = 2 (когда порождающее множество X = {х, у} — дуплет событий) биномиальное двумерное распределение случайного вектора £ = (£х,£у) = (£х,х е X) определяется четырьмя параметрами (п;р(х),р(у),р(ху)), где3
р(х) = Р(х П ус), р(у) = Р(хс П у), р(ху) = Р(х П у).
Вероятности биномиального двумерного распределения вычисляются для любого целочисленного вектора п = (пх , пу) е [0, п]2 по формуле
2В эвентологии вообще и в данном контексте в частности понятие «вектор» используется в расширенном смысле: как неупорядоченное конечное множество или неупорядоченный конечный набор неких элементов.
3Очевидно, что р(0) = 1 — р(х) — р(у) — р(ху). Ниже используются обозначения: рх = Р(х) = р(х) + р(ху), Ру = Р(у) = р(у) + р(ху), КоУху = р(ху) — рхРу, о"2 = Рх(1 — Рх), = Ру(1 — Ру).
где
6ñ(n;= р(£ = п) = = £y = ny) =
min{nx ,ny }
= тй(п; p(0),p(x),p(y),p(xy)),
n(xy) = max{0,nx +ny —n}
шй(п; p(0),p(x),p(y),p(xy)) = P(| = n) =
= p( (e(0),e(x),e(y),e(xy^ = (n(0),n(x),n(y),n(xy))) = = (0), ( ), ( ), [p(0)]n(0) [p(x)]n(x) [p(y)]n(y) [p(xy)]n(xy)
n(0)!n(x)!n(y)!n(xy)!
— вероятности 4-мерного полиномиального распределения случайного вектора £ = (£(0), £(x), £(y), £(xy)) с параметрами (n;p(0),p(x),p(y),p(xy)), а суммирование проводится по всем наборам П = (n(0), n(x), n(y), n(xy)) таким, что n = n(0) + n(x) + n(y) + n(xy), для которых выполнены ещё два равенства, nx = n(x) + n(x, y), ny = n(y) + n(x, y), и может быть сведено к суммированию по одному параметру n(x, y) в границах Фреше, поскольку при фиксированных nx и ny все величины n(0), n(x), n(y), n(xy) можно выразить через один параметр, например, n(xy):
n(x) = nx — n(xy), n(y) = ny — n(xy), n(0) = n — nx — ny + n(xy),
который меняется в пределах границ Фреше:
max{0, nx + ny — n} ^ n(xy) ^ min{nx, ny}.
Формулу можно также записать в виде
bn (n; p(x),p(y),p(xy)) = P(£ = n) =
min{nx ,ny }
= [p(0)]n [T(x)]nx [T(y)]ny ¿ en(x'y)(n) [T(x,y)]
n(xy)=max{0,nx +ny — n}
где
en(x'y)(n) n
n(xy)
(n — nx — ny + n(xy))!(nx — n(xy))!(ny — n(xy))!n(xy)!
— двумерный биномиальный коэффициент, а
Р(ж) р(у) р(0)р(ху)
Т(х) = —7-Г , Т(у) = —7-Г , Т(х, у) = -, , , ,
р(0) р(0) р(х)р(у)
— мультковариации первого и второго порядка событий ж и у.
Вектор математических ожиданий биномиального двумерного случайного вектора (£ж, £у) равен (Е£х, Е£х) = (прх,пру), а его ковариационная матрица выражается через ковариационную матрицу случайного вектора (1х, 1у) индикаторов событий из порождающего множества X = {ж, у} и имеет вид
прх(1 -Рж) пКоУху ^ = п -Рж) КоуЖу
«КоУХу ПРу (1 - Ру )У у КоУху Ру (1 - Ру)
Ковариационная матрица центрированного и нормированного биномиального двумерного случайного вектора
- пРж Су - «РуЧ
ст
ст
x
y
выражается через ковариационную матрицу случайного вектора
!ж рХ Ру
их "у
центрированных и нормированных индикаторов событий из X = {ж, у} и имеет вид
п пРхуА = ( 1 Рху прху п ) \Рху 1
где рху = — коэффициент корреляции случайных величин 1х и 1у — индикаторов
событий из X = {ж, у}.
1.3. Характеристики биномиального многомерного распределения
Вектор математических ожиданий биномиального многомерного случайного вектора (£х, ж € X) равен (Е£х,ж € X) = (прх, ж € X), а его ковариационная матрица выражается через ковариационную матрицу случайного вектора (1х,ж € X) индикаторов событий из порождающего множества X и имеет вид
па^ . .. пКоуху\ / а" ... Коуху
=п
ху ... пау / \Ко»ху ... ау
тКоуху . .. па' ! \Коуху ... ах
где а" = рх(1 - Рх), а КоУху = -РхРу при ж = у.
Ковариационная матрица порожденного разбиением центрированного и нормированного биномиального многомерного случайного вектора
£х - пРх ^ --, ж € X
ах
выражается через ковариационную матрицу случайного вектора
( 1 х - Р х )
-, ж € X
ах
центрированных и нормированных индикаторов событий из X и имеет вид
'па' .. . прху\ /а" ... рху^
.'х ) =п (...
УпРху ... пах ) \Рху ... аХ .
Соуху РхРу ,, 1 1
где Рху = -- =-----коэффициент корреляции случайных величин 1х и 1у — инди-
ахау ахау
каторов событий из X.
1.4. Полиномиальное распределение — частный случай биномиального многомерного распределения, когда последнее порождается разбиением пространства элементарных событий
Когда порождающее N-множество X составлено из событий, образующих разбиение О = ^ ж, биномиальное многомерное распределение случайного вектора £ = (£х,ж € X)
определяется N параметрами4 (п;Рх,ж € X), где Рх = Р(ж), ^ Рх = 1, и представляет из
себя полиномиальное распределение с данными параметрами (см. Рис. 1).
Поскольку Рх = 1, то среди N вероятностей только N — 1 можно выбирать независимо.
хех
Отсюда вероятности биномиального многомерного распределения, порожденного разбиением О, определяются для любого целочисленного вектора п = (пх, х Е X) из симплекса £м (так как ^пх = п) такой же формулой, что и вероятности соответствующего полиномиального распределения
Ьп(п;Рх,х Е X) = Р(« = п) = Р(«х = Пх,х Е X) =
п!
П<
х£Х
П[рх ]Пх •
1х! х£Х
Рис. 1. Полиномиальная схема испытаний Бернулли, определяющая полиномиальное распределение с параметрами (п; рх,Ру,Рг), порождаемое триплетом событий X = {х,у,г}
1.5. Биномиальное ^-мерное распределение, порожденное множеством X, определяет полиномиальное 2м-мерное распределение, порожденное множеством событий-террасок {1ег(Х), X С X}, но не наоборот
Многомерная N-мерная) схема п испытаний Бернулли с порождающим множеством событий X, которое подчиняется эвентологическому распределению {р(Х), X С X}, определяет N случайных величин
п
«х(ы) = ^ 1х(о (ы), х(г) Е X(i), х Е X,
каждая из которых имеет биномиальное распределение с параметрами (п;рх = Р(х)), а все вместе образуют N-мерный случайный вектор « = («х, х Е X), распределенный по биномиальному многомерному N-мерному) закону с 2м параметрами (п; {р(Х), 0 = X С X}), в состав которых входит число испытаний п и 2м — 1 вероятность из эвентологического распределения порождающего множества событий X (иначе говоря, все 2м вероятностей р(Х) за исключением одной: р(0)) (см. Рис. 2).
Та же многомерная схема п испытаний Бернулли определяет 2м случайных величин
п
«(X)(ы) = £ 1Мх(,))(ы), X(<) С X(i), X Е X,
г=1
каждая из которых имеет биномиальное распределение с параметрами (п;p(X) = P(ter(X))), а все вместе образуют 2м-мерный случайный вектор « = («(X), X С X, распределенный по полиномиальному многомерному (2м -мерному) закону, порожденному множеством событий-террасок ^ег^С X} и определяемому 2м + 1 параметром (п; {р^), X С X}, в состав которых входит число испытаний п и все 2м вероятностей р^) из эвентологического распределения порождающего множества событий X.
2
Рис. 2. Трехмерная схема п испытаний Бернулли, порожденная триплетом событий X = {х,у,г}, определяющая 3-мерный случайный вектор £ = (£х, х Е X), распределенный по биномиальному 3-мерному закону с параметрами (п; р(х), р(у), р(г),р(ху),р(хг),р(уг),р(хуг)); а также 8-мерный случайный вектор £ = (£(0),£(х),£(у), £(г), £(ху), £(хг),£(уг),£(хуг)), распределенный по полиномиальному 8-мерному закону с теми же параметрами, что и у биномиального 3-мерного распределения
Вероятности данных биномиального и полиномиального многомерных распределений связаны для любых N-мерных наборов неотрицательных чисел п = {пх, х Е X} Е [0,п]м формулой Р(<^ = п) = ^п Р(£ = п), где суммирование проводится по всем 2м-мерным наборам неотрицательных чисел п = (п(Х), X С X) Е 52 таким, что п = хсх п(Х), для которых также выполнены N равенств пх = ^хЕх п(Х), х Е X.
Замечание 1. Любому биномиальному N-мерному распределению, порожденному множеством событий X, соответствует единственное полиномиальное 2м -мерное распределение, порожденное множеством соответствующих событий-террасок {1ег(Х),Х С X}. Обратное не верно: произвольному полиномиальному 2м -мерному распределению, порожденному 2м-множеством событий, образующих разбиение О, соответствуют, вообще говоря, (2м)! биномиальных N-мерных распределений, порожденных N-множествами событий X, составленных из событий разбиения как из событий-террасок, что существенно зависит от способов отнесения событий разбиения к подмножествам X С X (общее число таких способов как раз и равно (2м)!).
2. Многомерное распределение Пуассона
Многомерное распределение Пуассона — дискретное распределение вероятностей случайного вектора £ = (£х, х Е X), принимающего значения п = (пх, х Е X) с вероятностями
Р(| = п) = Р(Сх = пх, х Е X) = Пй(А(Х), 0 = X С X) =
= е-л
ЕП
n X=0
[A(X )]n(X ) n(X )!
где суммирование распространяется на такие наборы неотрицательных целых чисел n = (n(X), 0 = X Ç X), для которых справедливы N равенств nx = xGx n(X), x Е X, а {A(X), 0 = X Ç X} — параметры: A(X) — среднее число наступления события-терраски
ter (X) = р| x р| xc,
xEx xExc
иначе говоря, среднее число наступления всех событий из X и ни одного из Xc.
A = Е A(X)
x = 0
— среднее число наступления хотя бы одного события из X, иначе говоря, среднее число наступления события х (объединения всех событий из X).
х^Х
Например, при п = (0,..., 0)
= е-\
Р(С = (0,..., 0)) = Р(Сх = 0, х е X) при п = (0,..., 0, пх, 0,..., 0), х е X,
Р(С=(0,..., 0,пх, 0,..., 0)) = Р(Сх = Пх, Су = 0, у = х) = е- П(Х)1 .
Если же в векторе п одна компонента пх фиксирована, а остальные произвольны: п (•,..., •, пх, •,..., •), х е X, то получаем
Р(е =(•,..., •, Пх, •,..., •)) = Р(Сх = Пх) = е-Лх
х
— формулу одномерного распределения Пуассона с параметром Ах случайной величины Сх, где Ах = ^х£х А(Х) для каждого х е X определяется параметром многомерного распределения Пуассона.
2.1. Эвентологическая интерпретация
Проводится счетное множество независимых экспериментов, в результате каждого п-го эксперимента наступают события из множества X. Вероятности рх = Р(х) событий х е X малы, то есть малы и вероятности р(Х), 0 = X С X порождаемых ими событий-террасок ter(X), 0 = X С X, причем при п ^ то имеется пр(Х) ^ А(Х), 0 = X С X. Тогда случайный вектор
^
С = (Сх, х е X) = 1х(п), х е X
п=1
подчиняется многомерному (Ж-мерному) распределению Пуассона с параметрами {А(Х), 0 = X С X} (см. Рис. 3,4).
Замечание 2. Не верно представлять, что вероятности стремятся к нулю так, что только в одном п-м испытании пр^) = А^), X С X. На самом деле, правильнее считать, что стремление вероятностей к нулю таково, что данное соотношение выполнено во всех первых п испытаниях. Таким образом, случайный эксперимент заключается в том, что проводится последовательность п-серий независимых испытаний (серий из п испытаний), и данное соотношение выполнено для всех испытаний из п-серии. Тогда п-серия определяет биномиальное многомерное (Ж-мерное) распределение с параметрами (п; ), 0 = X С X, которое при п ^ то стремится к многомерному (Ж-мерному) пуассоновскому с параметрами (А^), 0 = X С X).
2.2. Характеристики многомерного распределения Пуассона
Вектор математических ожиданий распределения Пуассона (ЕСх, х е X) = (Ах, х е X), где Ах =2 А^), х е X. Поскольку Соу(Сх,Су) = Аху, где Аху =2 А^),
хех {х,у}сх
{х, у} С X, то ковариационная матрица имеет вид
х ... Аху ^Аху . . . Ау .
В двумерном варианте, когда X = {х,у}, суммирование происходит по одному параметру п(ху) = п({х, у}), который меняется в пределах границ Фреше:
Р(С = п) = Р(Сх = пх, Су = пу) = Пй (А(х), А(у), А(ху)) =
Рис. 3. Схема счетного ряда испытаний Бернулли, порожденная триплетом событий X = }, определя-
ющая 3-мерное распределение Пуассона с параметрами (А(ж), А(у), А(г), А(ху), А(жг), А(уг), А(жуг))
Рис. 4. Параметры А(х), А (у), А(г), А(ху), А(жг), А(уг), А(жуг) 3-мерного распределения Пуассона, порожденного триплетом событий X = имеют смысл среднего числа наступления соответствующих событий-террасок 1ег(ж), 1ег(у), 1ег(г), 1ег(жу), 1ег(ж£), 1ег(уг), 1ег(жу£). Величина А(0), хотя и не считается параметром, по определению полагается равной бесконечности, как предельное число испытаний, в которых не наступило
ни одно из событий
= е
_л т1п{ПХ'Пу} [Л(ж)]п(х) [А(у)]п(^ [А(жу)]п(х^
£
п(ж)! п(у)! п(жу)!
п(ху)=0 У
где п(ж) = пх — п(жу), п(у) = пу — п(жу), а Л = А(ж) + Л(у) + Л(жу).
Вектор математических ожиданий двумерного распределения Пуассона (Е£х, Е£у) = (Ах, Лу), где Лх = Л (ж) + Л(жу) и Лу = Л (у) + А(жу), а ковариационная матрица имеет вид
Ах А(жу) Л(жу) Лу
так как в двумерном варианте Лху = Л(жу).
2.3. Многомерное пуассоновское приближение
Если количество независимых экспериментов п велико, а вероятности рх = Р(х) событий х € X малы, то есть малы и вероятности р(Х), 0 = X С X, порождаемых ими событий-террасок ter(X), 0 = X С X, то для любого набора целых чисел п = (пх, х € X) € [0,п]№ биномиальные вероятности приближенно выражаются в терминах многомерного распределения Пуассона:
6п (п;р(Х), 0 = X С X) « е-п £р(х) £ П ^Г',
х=и п( )!
где суммирование распространяется на такие наборы (п(Х), 0 = X С X, для которых п ^
n(X), и справедливы N равенств пх ^^ n(X), х € X. хсх хех
В двумерном варианте, когда X = {х,у}, суммирование происходит по одному параметру п(ху) = п({х, у}), который меняется в пределах так называемых границ Фреше:
6й(п; р(х),р(у),р(ху))
[пр(х)]п(х) [пр(у)]п(у) [пр(ху)]п п(х)! п(у)! п(ху)!
п(ху) = 0 V 7 V
( ( ^ ( ^ ( )) } [пр(х)]п(х) [пп(у)]и(У) [пп(ху)]и(хУ)
где п(х) = пх — п(ху), п(у) = пу — п(ху).
Теорема Пуассона (многомерный вариант). Пусть рх ^ 0, х € X, при п ^ ж, причем пр^) ^ А^) для всех непустых подмножеств 0 = X С X. Тогда для любого набора целых чисел п = (пх, х € X) € [0, п]№ при п ^ ж
6Й(п;р^), 0 = X С X) ^ пп(А^), 0 = X С X),
где
пп(А(X), 0 = X С X) = е- £л(х) ^ П [А(XX?!
п х=0 ( )!
— многомерная пуассоновская вероятность, а суммирование распространяется на такие наборы п, для которых пх = ^хеХ п^), х € X.
Доказательство. Так как при больших п условие п хсх n(X) выполнено при любых фиксированных п^),X С X, то суммирование в формулах биномиальной
6Й (п;р^), 0 = X С X) шй(п; {р^), X С X})
п
и пуассоновской
пп(А^), 0 = X С X) = е- £л(х) ^ П
[А(X )]п(х)
n(X)!
п Х=0 у 7
вероятностей распространяется на одинаковые наборы п, для которых пх = ^х£х п^), х €
X.
Покажем пуассоновское приближение для полиномиальных вероятностей:
тп(п; {р^), X С X}) ^ п' П IP(X)]п(Х)• (1)
П )! хсх х сх
Заметим, что для любых фиксированных п^С X, и достаточно больших п выполнены следующие соотношения:
т(п(0),п(^),|п(х),я=хсж}) (п; {P(X), X С 3}) _ Кп(0) + !)
г(п(0) + 1,
г(г)-1,|п(х),г=хсх}^п; {p(X), X С X}) п(^)р(0)
где Z С X. Умножив и разделив числитель и знаменатель на п и учитывая, что "(0)+1
и р(0) ~ 1, где символ « означает приближенное равенство с точностью до членов порядка п-1, получаем
)(п(0) + 1) п _ пр(£) п(0) + 1 1 _ пр(£) п(Я )р(0) п п(Я) п р(0) п(Я)
По условию теоремы пр(^) ^ А(^), поэтому
т(п(0),п(г),|п(х),г=хсж})(п; {р(Х),Х С X}) ^ А(£) т(п(0)+1,п(г)-1,{п(х),г=хсг}^п; {р(Х), X С X}) п(^)
При п(Х) _ 0, 0 _ X С X,
т(п(0),о,...,о) (п; {р(Х), X С X}) _ [р(0)]п _ 11 - £ ^ ) _ (1 - п) П '
(2)
где А _ ^хсх А(Х). Логарифмируя обе части уравнения и раскладывая в ряд Маклорена5, имеем
( А\ А2
1п [т(„(0),о,...,о^ п; {р(Х), X С X})] _ п • 1п ( 1 - -) _ -А - — - •••
При больших п заключаем, что
т(„(0),о,...,о) (п; {р^), X С X}) « е-л. (3)
Последовательно применяя соотношение 2 к приближению 3, приходим к
[A(X )]п(х)
г(п(0),{п(х),хсж}^{P(X),X С X}) « е-Л Yi n(X
— пуассоновскому приближению полиномиальной вероятности 1, из которого следует утверждение теоремы. □
Список литературы
[1] О.Ю.Воробьёв, Эвентология, Красноярск, Сибирский федеральный университет, 2007.
Discrete Multidimensional Distributions
Oleg Yu.Vorob'ov Lavrenty S.Golovkov
Polynomial distribution, which is used at present as a generalization for Binomial, in fact, doesn't take into account the specific notion from the probability theory namely independence of events, random variables, tests. Such a generalization can be used in a special case, that is to .say when events don't intersect. Eventology deals with various structures of events' dependencies, therefore it is reasonable that in case of arbitrary structure dependency structure question emerges about more harmonious generalization of the Binomial distribution.
Besides there is cite about approximation Binomial multivariate distribution with another new one — multivariate analogue of the Poisson distribution. The article brings in definitions for those new objects and also their main characteristics and properties.
Key words: multidimensional polynomial distribution, multidimensional binomial distribution.
1
5ln(1 + ^¿(-l)*-1 X-.
k=1