УДК 519.2
МНОГОМЕРНОЕ ОБОБЩЕННОЕ РАСПРЕДЕЛЕНИЕ ЛАПЛАСА
И.В.Золотухин
MULTIVARIATE GENERALIZED LAPLACE DISTRIBUTION
I.V.Zolotukhin
Санкт-Петербургский филиал института океанологии им. П.П.Ширшова РАН, [email protected]
В работе вводится многомерное обобщенное распределение Лапласа (MGLD) как смесь л-мерных векторов, составленных из независимых одномерных центрированных нормальных случайных величин со случайными дисперсиями, имеющими многомерное показательное распределение Маршалла—Олкина. Выведена формула для характеристической функции. Подробно рассмотрено двумерное распределение; найдены явные выражения для плотности и моментов распределения. Изучены важные частные случаи предлагаемого распределения.
Ключевые слова: многомерное геометрическое распределение, распределение Лапласа, смесь распределений, характеристическая функция
In this paper multivariate generalized Laplace distribution has been obtained as a variance mixture of n-dimensional vectors of independent univariate normal centered variables with different variances with respect to Marshall—Olkin multivariate exponential distribution. The results include the formula for characteristic function. Bivariate distribution has been investigated in details; the density and the moments have been explicitly calculated. Also, the important special cases of distribution have been discussed.
Keywords: multivariate exponential distribution, Laplace distribution, mixture of distributions, characteristic function
1. Введение
Классическое одномерное распределение Лапласа часто используется как пример распределения «с хвостами, более тяжелыми, чем нормальные».
Оно задается своей характеристической функцией
ф(0=—^ (1)
1+
2^2 СТ t
IT
или, эквивалентно, через плотность f (x) =
1 f J2\X \ n
expl--— I, ст>0, -ж<x«х>.
л/2с
Название «многомерное распределение Лапласа» используется для различных классов много-
мерных распределений. Такие распределения должны обладать основными свойствами одномерного распределения Лапласа, и их маргинальные распределения должны относиться к тому же самому типу.
Обычно используются следующие два метода получения многомерного распределения Лапласа, а также их обобщения и модификации.
Случай А. Многомерное распределение, порожденное независимыми одинаково распределенными случайными величинами, имеющими одномерное распределение Лапласа, и задающееся характеристической функцией
п 1
ф(А,.../„) = П-2Л-. (2)
2Л • CTi t
Случай Б. Эллиптически контурное распределение Лапласа, задающееся характеристической функцией
Ф(А,...А)=——П-. (3)
1+21
i=1
Это распределение получается как слабый предел соответствующим образом нормализованных случайных сумм независимых одинаково распределенных случайных векторов с конечными вторыми моментами
1V
Z
i=i
X,
(4)
здесь N — случайная величина, имеющая геометрическое распределение с параметром р, независимая от X, и р стремится к нулю.
Распределения с характеристической функцией (3) входят в класс геометрически стабильных распределений. Они имеют разнообразные приложения, поскольку суммы вида (4) появляются в различных вопросах биологии, экономики, финансов и т.п.
В статье предлагается новый подход к построению многомерного распределения Лапласа. Его можно получить как смесь и-мерных векторов, составленных из независимых одномерных центрированных нормальных случайных величин со случайными дисперсиями, имеющими многомерное показательное распределение Маршалла-Олкина. В этот новый класс распределений оба распределения (2) и (3) будут входить как частные случаи.
2. Представление распределения Лапласа
как смеси нормальных распределений
Распределение Лапласа можно получить следующим образом. Пусть случайная величина X имеет центрированное нормальное распределение с диспер-
2 -сией ст , и эта дисперсия сама является случайной
величиной. При этом распределение ст2 показательное, с математическим ожиданием ст0.
1
/a (u) = -г- exp(-Ku), u > 0;
а К
1
^ 2 1 2 Ест =к = ст().
(5)
Формула полной вероятности для математических ожиданий дает следующее выражение для его ха-
г (
рактеристической функции: ф() = |Хехр—— -\u\du=
1 +
2К
А это в точности характеристическая функция (1) распределения Лапласа.
Иными словами, распределение Лапласа получается как смесь нормальных распределений с дисперсиями, распределенными по показательному закону.
Другой, более громоздкий вывод этого утверждения предложен в [1].
3. Двумерное обобщенное распределение Лапласа
Предлагается следующий алгоритм моделирования двумерного вектора (X1,X2), распределенного по закону Лапласа. Пусть для фиксированной ковариационной матрицы Е координаты X1,X2 имеют
независимые центрированные нормальные распреде-
2 2 / 2 2Ч ления с дисперсиями стьст2, а вектор (стьст2) имеет
двумерное показательное распределение.
К настоящему времени имеются различные определения двумерного показательного распределения, к примеру [2-4]. Желательно, чтобы это распределение обладало характеристическим свойством одномерного показательного распределения, а именно свойством отсутствия последействия. Маршалл и Олкин (см. [4], Lemma 1) доказали, что для этого необходимо и достаточно, чтобы двумерное распределение состояло из двух независимых показательно распределённых компонент. Обобщённое свойство отсутствия последействия предложено ими в следующем виде: Vu > 0, v > 0, z > 0,
P(aj2 > u + z, a( > v + z)/CTj2 > u, a) > v) = P(ctj2 > z, a( > z).
Маршалл и Олкин доказали, что двумерное распределение удовлетворяет условию (6) тогда и только тогда, когда выполняется:
G (a( >u,a( >v) = exp(-Kju -K2v -K12max{u,v});
(7)
u > 0,v > 0,К > 0,K2 > 0,K12 > 0. Распределение (7) называется двумерным показательным распределением типа Маршалла— Олкина. В общем случае оно имеет как абсолютно непрерывную, так и сингулярную часть (см. [4], Theorem 5.1). Именно для К = К +К2 +К12
__к +к __К _
G (x, y) = Ga (x, y)+-К- Gs (x, y);
где Gs(x, y) = exp(-K)max{x, y}) есть сингулярное сла-
гаемое, а Ga(x,y) =
К
К +К
-exp(-Kjx-К2 y-K12max{x, y})-
К,-
K1 +К2
exp(-K max{x, y}) — абсолютно непрерывное.
Маршалл и Олкин вывели следующую формулу для преобразования Лапласа двумерного показательного распределения:
М(2Х, 22) = Еехр(-21СТ12 - 22ст\) =
ОТ ОТ
= J J exp(-zju - z2v)dG(u, v) =
= (К +К12)(К)+Кр) + (К +Kj2 + zj)(K) +Кк + z()
__K12 z1z2_
(K + zx + z()(K! +Кк + ^)(К) +Кк + z()'
22
(8)
Пусть дисперсии (сть ст2) двумерного нормального распределения распределены, в свою очередь, по двумерному показательному закону типа Маршалла— Олкина. Формула полной вероятности для математи-
1
2
t
ческих ожиданий позволяет вывести следующее выражение для характеристической функции:
ф($,s) = JJexpl - Цт -W(M,v) = M1у,S" 0 0 1 ' 1 Затем, используя (8), получим:
(X +XJ-XX-+хп)
t- s-
W, S) =
(X7 +X12 +1- /2)(X2 +X12 + s- /2)
t - S -Xl-2T
(X +12 /2 + s2 /2)(X1 +X12 +1 -/2)(X2+X12 + s2 /2)
(9)
Распределение с характеристической функцией (9) будем называть двумерным обобщённым распределением Лапласа (BGLD).
Найдем из (9) характеристические функции компонент:
Фх (0 = ф7 (,) =
(Х1 +Х12 +12/2) (Х2 +Х12 + s2/2)
Мы видим, что ф(^ s) (0ф7 следовательно, компоненты зависимы.
Одномерные распределения оказываются распределенными по закону Лапласа со следующими плотностями:
^(Х) = А+Х12 ехр(-л/2(Х1 +Х12)|X),
(X) ^Х2+Х12 ехр(—/2(Х2 +Х12)|у|). Высшие моменты могут быть вычислены посредством формулы (9):
EX2nYЪп =
= (2n-1)!!(2m-1)!!
m-1
+ (пГ(т + 1)^
n—1
(тГ(п+1)^-
k=
Г(т+k)
Г(п+k)
k=o r(k+1)(X1+X12)n—k Xm+k Л
,=0 Г(к+1)(Х2+Х12Гк Хп+к ЕХУ7ц = 0 для2п или2да
Следовательно, соу(Х,7) = ЕХ7 = 0, и компоненты X и 7 некоррелированы, но зависимы.
Наконец, плотность вектора (Х,7) можно записать так:
Х
f (x, y) = ^ Ko (l 2X( x2 + y2))+
2 _ _
+ — X 2(X1 +X12)exp(-| x +X12 -I yVXT)
ад / ^ _
J exp í —11W X1 +X12 —
:4-
\dz x
Jexpl -I WX2-■
dw +
JyL
2 _ _
+ — X1(X 2 + X12)exp(-|y л/ X 2 +X12 - |x|VX)
ix -2
ад / , _
J exp I -I z^XJ -
\dz x
<J*exp|-|wjX2 +X12 —l^j jdw,
(10)
где К0 есть модифицированная функция Бесселя третьего рода нулевого порядка (см. Приложение). Заметим, что распределение вектора (Х,7) не содержит сингулярных компонент, в отличие от распределения Маршалла—Олкина.
Рассмотрим два частных случая более подробно.
I. Х12 = 0; Х1 = Х2 = Х = —-.
ст0
Как следует из (9), при этих предположениях X и 7 — независимые одинаково распределенные по закону Лапласа случайные величины с плотностью
f (X, у) = -^ехр(-л/2Х (IX + | У)).
Плотность
X
2 в
полярных координатах:
f (Р, Ф)="2 pexp(-V-Xp(|cos ф+|sin ф)).
Видим, что угловое распределение не является равномерным; радиус-вектор и полярный угол зависимы.
II. o = Xj = X^ Xj2 =-L CTÍ)
Используя (9) и (10), вычислим характеристическую функцию:
Ф^, s) =
X1
X12 +1 /2+s/2
f
а плотность равна f (x, y) = -
—K0
V2(x2 + y 2)
Такая плотность принадлежит классу эллиптически контурных распределений [5].
Запишем ее в полярных координатах: f <* ♦)=
В этом случае радиус-вектор и полярный угол являются независимыми случайными величинами.
Таким образом, эти два частных случая распределения BGLD соответствуют Случаю А и Случаю Б, предложенным ранее.
4. Многомерное обобщённое распределение Лапласа
Теперь рассмотрим аналогичный алгоритм моделирования многомерного распределения Лапласа. Пусть для фиксированных ст2 (/' = 1,...,п) вектор X = (Х1,...,Хп) имеет центрированное нормальное
распределение:
X е Nn(0, Е), Е = diag(p^,...,a2n). При
2/2 2\ -этом вектор ст = (ст1,...,стп) тоже случайный и имеет
многомерное показательное распределение типа Маршалла—Олкина со следующей функцией надежности:
__п ____
G (X!,..., Хп) = ехр(-^Хгхг--^Х, тах^-, X,) -
г=1 1<]
- ЕХу тах^-, X,, xк) -...-Хп...п max(x1, X2,..., Xn)).
г< ,<к
Например, для п = 3
а
0
X
2
x
x
2
X
X
X
G (хь х2, х3) = ехр(-Я,1х1 -Х2 х2 -Х3х3 -Х12 тах(хь х2) --Х13 тах(хь х3)-Х23 тах(х2, х3)-Х123 тах(хь х2, х3)). Очевидно, характеристическая функция вектора X будет равна
г г ( п
ф^.О=|...|ехр-Х
¿х-^ 2
dGxъ...Xn) = м( "у,...,у )(п)
0 0 V ]=1
Явное выражение этой функции, а также характеристических функций проекций вектора X на все координатные гиперплоскости найдено в [6].
Распределение с характеристической функцией (11) будем называть многомерным обобщённым распределением Лапласа (MGLD).
Опять рассмотрим два частных случая более подробно.
I. Х1 = Х2 = Хп = Х = ^-; все остальные констан-
ст2
ты X — нулевые.
Этот случай тривиален и соответствует Случаю А. Вектор X состоит из независимых одинаково распределенных по закону Лапласа одномерных случайных величин.
II. Хп 1 = Х = ^-; все остальные константы X
ст20
— нулевые. Имеем
ФЙ,..4) =
характеристическую функцию
X
х+<1+...+| 2 2
Плотность вероятности:
f (Х],..., Хп) = 1
п/29(п-1)/2
л 2
СТ!-п/2 у ст0 у
у (Х2 +... + хП)1/2-П/4Кп/2-!
гл/2(х12 +... + хП) ^
Здесь Кч (и) есть модифицированная функция Бесселя третьего рода с индексом V .
Такая плотность является частным случаем многомерного распределения Лапласа, предложенного Андерсоном [5]; случай соответствует Случаю Б.
Будем использовать следующее выражение для функции Kv (и) (см. [7]):
1 (и
2 V 2
Kv (и) = 1V 2 I |Г^1 ехр( - < - ^ ¡Л, и > 0.
В сферических координатах условная плотность (Я,61,...,6п-1) при фиксированном значении ст2 равна:
f(p,ф1,...,фп-1 /СТ ) =
(2л)п/2стп
,2
п—1 п—2 п—3
р ^ Ф1COS Ф2...^ Фп-! I р'
' "ехР1- 2ст2
0 <р<г, 0<фг- <л(/ = 1,...,п-2), 0<фп-1 <2л.
fR (р) =
Для безусловной плотности R имеем:
п/2 (-.421
р
-Кп
ст0+п/22п/4-3/4Г(п/2/'п/2-1[ Ст0
р
Отметим, что в сферических координатах, в отличие от декартовых, случайный вектор состоит из независимых компонент.
Приложение
Будем искать плотность распределения вектора (XД). Двумерную функцию распределения типа Маршалла—Олкина обозначим через G(u,v). Тогда
G(u,v) = 1- GX (и) - GY (V)+G (иу),
(12)
где G (и, V) вычисляется в соответствии с (7). Формула полной вероятности дает следующее выражение для плотности безусловного распределения вектора
1 гг / 2 2 \
f (х, у)=шЯ^ ехр(-2и - £ К^.
0 0 4 7
Принимая во внимание выражение для функции G(u,v) в (7), нетрудно показать, что одномерные
распределения ст^ и ст2 будут показательными, с
плотностями
gСTl2(u) = (Х1 +Х12)ехр(-(Х1 +Х12)и), и > 0,
gст2 (V) = (X 2 + Х12)ехр(-(Х 2 + ХцМ, V > 0. Запишем плотность Ах,у):
, г г ,
1 гг 1 ехр - Х" у" Juv
(13)
1 гг / 2 2 \
А (х, у)=шЯ^ Ч- 2и - £ Jgст12(u) ^' и),(14)
Г, Г, V /
дG(u, V)/ди
здесь G(v / и) =-—— — условная функция рас-
Яст2(и)
пределения.
Принимая во внимание (5), (12) и (13), найдем
Г1 - ехр(-Х^), и > V > 0;
G(v / и) = •
1-
Х1
-ехр(-(Х1 +X12)v+Х12и), V >и >0.
Х1 +Хц
Ясно, что функция G(v/u) имеет скачок в точке и. Величина скачка будет
Р(и) = |1-
а условная плотность:
дG(v / и)
Х1
Х1 +Х12
ехр(-Х2и),
(15)
Ф(v / и) = -
ду
Х2 ехр(-Х^), и > V > 0; Х1(Х2 +Х12)
1-
exp(-X2v-X12(v - и)), V > и > 0.
(16)
Х1 +Хц
Используя (13), (15) и (16), перепишем (14) в следующей форме:
А (ху)=2Л^^^Г2и "(Х1 +ХЦ)и Пхх
у|1-х^ И-2и"
х 2и ]+/£ Г+
ехр(х1и)Гх/1(х2 +Х12)ехриУ2-(х2 +x12)v ]dv) = 1 ^(х1 +хц) 2и ^ 2 ш j '
= /1 +12 + 4
ст
0
+
Здесь
п 4
I2 = пХ2(Х1 +х12 )exp(-| Хл/ X +Xj2 -Ыл/х2)
{ех{-Й- ^^ )4ех{-Вт ^ ]йЦ
/3 Х1(Х2 +Х12 )ехр(-| -Ыл/Х2+Х7)
|е:хр[-С- 2 ~+Х12] ^Чт^- ^
К0(и) есть модифицированная функция Бесселя третьего рода [7].
1. Вапник В.Н. Восстановление зависимостей по эмпирическим данным. М.: Наука, 1979. 448 с.
2. Mardia K.V. Families of bivariate distributions. V.27. L.: Griffin, 1970. 109 р.
3. Gumbel E.J. Bivariate exponential distributions // J. Amer. Statist. Assoc. 1960. V.55(292). P.698-707.
4. Marshall A.W. and Olkin I. A. A multivariate exponential distribution // J. Amer. Statist. Assoc. 1967. V.62(317). P.30-44.
5. Anderson D.N. A multivariate Linnik distribution // Statist. Probab. Lett. 1992. V.14. P.333-336.
6. Zolotukhin I.V. The Study of the Laplace Transform of Marshall-Olkin Multivariate Exponential Distribution // Topics in Statistical Simulation. N.Y.: Springer, 2014. P.531-539.
7. Абрамовиц М., Стиган И. Справочник по математическим функциям. М.: Мир, 1979. 832 с.
References
1. Vapnik V.N. Vosstanovlenie zavisimostei po empiricheskim dannym [Reconstruction of dependencies based on empirical data]. Moscow, "Nauka" Publ., 1979. 448 p.
2. Mardia K.V. Families of bivariate distributions. London, Griffin, 1970. 109 р.
3. Gumbel E.J. Bivariate exponential distributions. Journal of the American Statistical Association, 1960, v.55(292), pp.698-707.
4. Marshall A.W., Olkin I.A. A multivariate exponential distribution. Journal of the American Statistical Association, 1967, vol. 62 (317), pp. 30-44.
5. Anderson D.N. A multivariate Linnik distribution. Statistics & Probability Letters, 1992, vol. 14, pp. 333-336.
6. Zolotukhin I.V. The Study of the Laplace Transform of Marshall-Olkin Multivariate Exponential Distribution. Topics in Statistical Simulation, Springer N.Y., 2014, pp. 531-539.
7. Abramowitz M., Stegun I.A. Handbook of Mathematical Functions with Formulas, Graphs, and Mathematical Tables. New York, Dover Publications. 698p. (Russ. ed.: Abramovits M., Stigan I. Spravochnik po matematicheskim funktsiiam. Moscow, "Mir" Publ. 1979. 832 p.).