УДК 519.2
0.0. Лямин1
О СКОРОСТИ СХОДИМОСТИ РАСПРЕДЕЛЕНИЙ НЕКОТОРЫХ СТАТИСТИК К РАСПРЕДЕЛЕНИЯМ ЛАПЛАСА И СТЬЮДЕНТА
В работе рассматриваются асимптотически нормальные статистики. Если объем выборки заменен случайной величиной, равной максимуму от п независимых случайных величин с дискретным распределением Парето, то распределение статистик является асимптотически лапласовским. Если объем выборки заменен случайной величиной с отрицательным биномиальным распределением, то распределение статистик является асимптотически стьюдентовским. В этой работе оцениваются скорости сходимости распределений этих статистик к соответствующим предельным распределениям и уточняются константы в выражениях для оценок скоростей.
Ключевые слова: асимптотически нормальные статистики, случайный объем выборки, распределение Лапласа, дискретное распределение Парето, отрицательное биномиальное распределение, распределение Стьюдента.
1. Введение. В подавляющем большинстве ситуаций, связанных с анализом экспериментальных данных, можно признать, что число случайных факторов, влияющих на наблюдаемые величины, само является случайным и изменяется от наблюдения к наблюдению. Поэтому вместо различных версий центральной предельной теоремы, обосновывающих нормальность распределения наблюдаемых случайных величин в классической статистике, в таких ситуациях следует опираться на их аналоги для выборок случайного объема.
Рассмотрим случайные величины Ni, N2, ■ ■ ■, Xi, Х2, • • •, определенные на одном и том же измеримом пространстве (fi, Л). Пусть на Л задана некоторая вероятностная мера Р. Предположим, что при каждом п ^ 1 случайные величины Nn принимают только натуральные значения и не зависят от последовательности .... Далее пусть Тп = Тп(Хi,... ,Хп) — некоторая статистика, т.е.
измеримая функция от случайных величин Х\,..., Хп. Для каждого п ^ 1 определим случайную величину Tjvn, положив
TNn(oü) = ТМп{ш) (Х^ш),.. .,XNn(u))
для каждого элементарного исхода ш € О. Будем говорить, что статистика Тп асимптотически нормальна, если существуют о > 0 и ß € Ж, такие, что
Р (сту/п(Тп — ß) < х) => Ф(ж), п ^ оо.
Если статистика Тп асимптотически нормальна, то:
1) статистика Тдтп является асимптотически лапласовской, где Nn — случайная величина вида (1) (см. работу [1]);
1 Факультет ВМК МГУ, асп., email: oleg.lyaminQgmail.com
2) статистика Тдтп является асимптотически стьюдентовской, где — случайная величина с отрицательным биномиальным распределением с некоторыми параметрами (см. работу [2]).
Оценим скорости сходимости распределений статистики Тдтп к распределению Стьюдента и Лапласа в двух случаях: 1) является случайной величиной вида (1); 2) является случайной величиной с отрицательным биномиальным распределением.
2. ЛГП — случайная величина вида (1). Пусть ЛГ^^т), .
величины с одним и тем же дискретным распределением Парето
т к> 1, ¿ = 1,2,
независимые случайные
Р (Ж«(т) ^ Jfe) =
т + к — 1' "" ' ' ' '
где т — некоторое натуральное число. Положим
Nn = max N^(m).
Далее, пусть статистика Тп = Тп(Хi,... ,Хп) удовлетворяет соотношению
sup |Р {у/по(Тп — ц) < х) — Ф(ж)| ^ Cn~s, п = 1, 2,.
(1) (2)
где ст > О, /¿еЖиО<5^«о<2;С — некоторая положительная константа. Тогда, как было показано в работе [1], распределение статистики Тдтп = 7"\ „ (А' 1..... .V д „ )• где — случайная величина вида (1) с параметром т, удовлетворяет соотношению
sup
|P(Vn<7(Tjvn -ц) < х) -Л(®)| < csn~m'm{1's\
(3)
где С8 — некоторая константа, зависящая от параметра в; А(х) — распределение Лапласа с плотностью вида
А(х) =
Уточним константу Cs. Положим
ехр
{^л/2m |ж|}, х €
Г1 = /4е_2А т = 1,
т \е"2, т ^ 2. Теорема 1. Для константы Сs из (3) справедливо
(4)
Ся — 8„
rCT(l + s) S < 1
ms '
$n + < — + Г1 m TO' s = 1
P1 V Ш' s > 1
где С — константа из (2); 8п — бесконечно малая последовательность.
Доказательство. Частично повторим доказательство теоремы 2 из работы [1], где была получена следующая оценка:
sup |Р {V^a(TNn — ц) < х) — Л(ж)| ^ Ji + J2,
где
Ji =
¿Р (Мп = к)Ф
к=1
Л(ж)
fc=i
Для Ji была получена следующая оценка:
1
J1 < - sup
* z>О
ka(Tk - /i) <
P ( ^f < * ) " QW
Ф
где (¿(г) = е г > О, — функция распределения обратного показательного распределения. Применяя теорему 1 из работы [1], получим, что
Cl
'1 "
Ji £
п
где определяется соотношением (4). Для J2 там же была получена оценка
пВ(п — s, 1 + s) •h < С •---,
ms
где С — константа из (2). В некоторой окрестности нуля функция v(t) = B(l/t — s, 1 + s) при наложенных ограничениях на s допускает следующее разложение:
v(t) = Т(1 + s)ts+1 + o(ts+1), и значит, при достаточно больших п можно записать
т + \ 1
J2 < С +«„ •—,
ms ) ns
где ап — некоторая бесконечно малая последовательность, причем ап = О(п А значит,
С1т _ ^ (Т{1 + з) \
п8
Рассмотрим три случая. Случай 5 < 1. Тогда
sup |Р (y/ncr(TN - и) < х) - Л(ж)| < — + С (+ ^ +
X 1 п 1 п \ ms )
sup IP Una{TNn - ц) < x) - Л(ж)| < fÇIÎi±f) + pn x \ ms
1
П
где Рп — некоторая бесконечно малая последовательность, причем /Зп = Случай s > 1. Тогда
I
sup |Р (угпа{Т^п — ц) < х) — Л(ж)| ^ (С^п +7«) • —,
х П
где 7„ — некоторая бесконечно малая последовательность, причем (Зп = 0{nl~s). Случай s = l. Тогда
sup |Р (т/па(Т]\[ — ¡х) < х) — Л(ж)| ^ (CI, + — + ап ] • —.
х 1 1 \ m J п
Теорема доказана.
Пример. Пусть Xi,... ,Хп — независимые одинаково распределенные случайные величины
с математическим ожиданием 0 и дисперсией 1. Положим /х3 = E|Xi|3 < оо. Тогда для статисти-
п
к и Т„ Xi/n по неравенству Берри-Эссеена справедлива оценка (см. [3])
г=1
sup \Р(у/пТп <х)^ Ф(ж)| < °'4784^3
п
Пусть — случайная величина вида (1) с некоторым натуральным т. Применяя теорему 1 для случая 5 = 1/2, получим
irw /-rr, \ », \i (0.4784л/7ги3 \ 1
sup Р WnTNn < х) - Л (ж) < -—-¡=-+ Рп
х \ 2^/m J х/п
где рп = 0(п 1/2) —> 0. Справедлива также более грубая, но не зависящая от т оценка
1п/ ГФ / \ д / \| ^ 0.2392^тг/х3 + рп эир Р [у/пТмп < х) — Л(ж)| < -
п
3. Nn — случайная величина с отрицательным биномиальным распределением. Предположим, что для распределения Тп справедлива следующая оценка скорости сходимости:
sup |Р (ал/п{Тп - /х) < х) - Ф (ж) | < Сп~1/2, п = 1,2,.... (5)
х
Рассмотрим случайную величину NPtr, имеющую отрицательное биномиальное распределение с параметрами р, г € (0,1), т. е.
mP,r = к) = ^^-Vd-р)к~\ к = 1,2,....
При к = 1 первый множитель в правой части этой формулы полагается равным единице. Известно, что
_ г(1 -р) +р
Р
так что Е/У;,.г оо при р ^ 0.
Пусть Nn = N± r, a F2r(x) — функция распределения Стьюдента с числом степеней свободы 7 = 2г. В работе [2] было показано, что распределение статистики Тдтп = Т^п(Хi,... постро-
енной по выборке случайного объема Nn, при г € (0,1) удовлетворяет соотношению
sup|P (y/rn + 1 - ra(TNn - ц) < х) - F2r(x) | =
х
При доказательстве использовался вспомогательный результат: если р, г € (0,1), то существует постоянная Сг > 0, такая, что
sup |P(iVp*r < x) - Gr,r(x) | < (6)
x^Q
где N*r = Nptr/ENPtr и £?Г)Г — функция распределения гамма-распределения с параметрами формы и масштаба, равными г, т. е.
X
Gr,r(x) = ^у J е ryyr ldy, ж > 0.
(7)
Оценим скорость сходимости
ДР)Г = sup Р(N*r ^ х) — GTjr(x) J —> 0 при р ^ 0,
х>0
т.е. покажем справедливость (6) и параллельно уточним константу Сг из (6).
Теорема 2. Пусть 0 < г < 1, тогда CyUJjG.CTflGyG.Tfl Н О С 7Т1О ЯН Н (ЛЯ Сг > 0, такая, что
причем
sup |P(iVp r < х) -Gr,r{x)\ < Сгр^+К
х>0
'2(l + (f)"2)\I/(r+1V 5 У«' + '>
где /х —> 0 при р ^ 0.
Nn
Доказательство. Характеристическая функция случайной величины N* = Fравна
Е Np,r
UAt) = Е,-;, = /«PI^T^} (i-d-р)«ф{н^})
—г
При этом
fp,r(t) ->• gr(t) = ( 1 - з ) при р ->• 0,
—г
где <7г(£) — характеристическая функция гамма-распределения с функцией распределения (7). Применяя неравенство Правица-Бенткуса-Гетуэ в виде
sup IF(x) — G(x) I ^
1
7Г
Г
№-g(t)
t
т т
dt + jí If(t)\dt+^ í \g(t)\dt,
-T
-T
где .Р(ж) и 0{х) — непрерывные справа функции ограниченной вариации, /(¿) и — преобразования Фурье и Т — любое положительное число, к Р(х) = Р(М* ^ ж) и £?(ж) = £?Г)Г(ж), получаем
1\ + 1-2 + /;5 •
где
г
г
г
т
-т
Оценим первый интеграл: г
h = l [ \gr(t)\dt, h = \\ \fp,r(t)\dt, h = l
7Г
-Г
/p,r(í) -5r(í)
dt.
h = T
dt
t¿
2 \ 2
t 1 2r = < ж = - ^ =
0 11 + ^
Оценим второй интеграл: г
(¿Ж
г J Т VJ (1 + ж2)г/2 о
(¿Ж
(1 + ж2)г/2 ) ^ Т
2 г
2г / Г dx\ < ^ 1+ / — =
ж'
Т(1 - г)
1—т
= О
rpf
J _р_
2 fjp
-T
1 — (1 — p) exp
itp
r(l — p) + p
dt <
2pr
T
1 + (1 ^p)2 - 2(1 — p) cos
tp
r(l — p) + p
-r/2
di
«с
2pr T
г
2(1 — p) 1 ^cos
ip
p
-r/2
di
«с
r(l — p) + p
T
12\r/2 2^/(1 ^p)"r/2(r(l-p) +p)r f dt
Tpr
tr
= 0(T~r).
Здесь предполагалось, что величина T = Т(р) —> оо выбирается таким образом, что рТ(р) —> О, а также использовалась хорошо известная оценка
1 — cosa ^ —a2, |а| ^ 1. 12 ' 11
Для оценки /3 запишем подынтегральное выражение в виде
fp,r(t) - gr(t)
1
при этом
Ingr(t) = ^rln ( 1--
,ln fp,r(t) _ Jngrit)
it
In fp,r(t) = -rln 1--
it
itp
r J r( 1 — p) + p
a(t),
где
(а \ ( ¿¿р
1--) + г 1пр — г 1п — (1 — р)е »-(1-р)+р
и под Ыг мы понимаем нулевую ветвь многозначной функции Ьпг. Значит,
1р,г 9г(1) 1 е-г1п(1-¥)
1 ~¥\
_ш>__
£ г(1-р) + р
1
1
_ш>__
£ г(1-р) + р
1
Для оценки величины о(Ь) воспользуемся оценкой |ега — 1 — ш| ^ а2/2, справедливой для любого вещественного а. Имеем
о(Ь) = г 1пр — г 1п ( р — (1 — р)
г1р +гЫ[1 _г1
г(1 — р) + р ) \ г
где
(1 — р)12р2 2(г(1 -р) + р):
Преобразуем выражение
Р ~ (1 ~Р)
где
¿¿р
—--- + €1(1) =р (г -- + е2(*) + ^
г(1 — р) + р \ г р
ыт =
р
Таким образом, о{Ь) = —г 1п(1 + ез(£)), где
ыт =
й
€
м__.
г г( 1 — р) + р
М*)! , ь
1
е
рЩ
ЫЩ.
Учитывая неравенство |1п(1 + г) — ^ \г\ , справедливое для любого комплексного числа г из области ^ 1/2, для величины а(1) можно записать а(1) = —гез(£) — г(1п(1 + ез(£)) — ез(¿)) = —гез(£) + €^(1), где |е4^)| ^ г |бз(^)|- Теперь применим неравенства \ега — 1| ^ |о|, |ег — 1| ^ \г\ справедливые для любого действительного а и комплексного г, к
где
Щр
г(1 — р) + р! Тогда для 13 справедлива оценка
г
-<3
|е6(*)| < \а(1)\е^; е7(1) = е5(1)е6(1) + е5(1) + е6(*).
7г(г(1 — р) + р)
Р
г(1 — р) + р
гт <Й ^
Г 1 — р 1
^ < Обозначим А = г( 1 — р) + р, Б = Н——; сделаем замену г = ^
Тр Тр
^ рТ + г Г в (1 + гВ) еГгВ(1+гВ) П + 1 \ = рТ + гВ Г+ (1 + Ав+ А)еГ(х2В2+хВ) ^ ^ Атт тт $ \J\zl Атт Атт $
Тр
пТ гЯрВгТр Г 2 2 пТ гЯрВгТр
+ - / (Вг2 + (1 + АВ)г + А)егВ г <Ь = + —А-(В11 + (1 + АВ)12 + А13)
Аж Аж J Аж Аж
где
Тр
2 2 ТпегВ (Тр) Ь = I я*егВ г д,г= Р
1
Тр
12 = I ¿х =
2 гВ2 2 гВ2
егВ2(Тр)2 г
Ъ
3!
2 гВ2
2 г В2''
Тр
1я= е
Г,ГВ222
~ . (рТ)2п+1 _ 1 гВ2(рТ)3 1 г2В4(рТ)5
— / ..I, — Р-*
п=О
п\(2п + 1)
10
Тогда, раскладывая экспоненты в ряды Тейлора, при Тр ^ 0 получим
/я ^
рТ гВеВтТр (ВТрегв2(Тр}
Атт
Атт \ 2 гВ2 рТ гВеБтТр
А
В \ (1 + АВ)егв2(-Тр)2 1 + АВ" 2гВ2 ) 3 + 2гВ2
Атт Атт
гв2(Тр)2 (ВТр_ 1 + АВ\ _ 1 + АВ \2гВ2 2 г В2 ) 2 г В2
2 гВ2 В
х рТ
х рТ
3 4 10
гВ2(Тр)2 г2В4(Тр)4
1! ' 2!
гВ2(рТ)3 г2 В4 (рТ)5
2 г В2 )
рТ гВ / ВгТр В2г2(Тр)2 + + 1! + 2!
Г ВТр 1 + АВ\ 1 + АВ \2гВ2 + 2гВ2 ) ~ 2гВ2
А-ЛЛх
2 г В2 )
10
рТ гВ ( ВгТр В2г2(Тр)2 + + 1! + 2!
гВ (Тр) г В (Тр)
1!
2!
)(
( ВТр 1 + АВ 2 гВ2 + 2 гВ2
В N /гВЧГТ? + Г*ВЧ?ТУ< \ т
2гВ2) \ 3 10 ) .
1 т В
= РТ( —+ — ) +о(рТ).
7Г
Производя обратные замены для А ж В, имеем
^ (г(1 - р) + 4А' /з ^ РТ ( 2,12 тг где /¿1 —> 0 при р ^ 0. Учитывая полученную оценку, имеем
1 ( 2гт /12\г/2 21"г</2гг
о(рТ) <: рТ ( — + /л ) = 0(рТ),
Ар,г < тг , 1_г
1 — г
где V = О (р). Так как то можно переписать
рТ
У+1
о,
Ар,г < М(Т(р)) = —
1 ( 2гт /12\г/2 21_г/2гг
Тг \ 1 - г \ 5
1 — г
где /х = /¿1 + ь>/(рТг+1) —> 0. Выберем теперь Т(р) —> оо так, чтобы минимизировать функцию М(Т(р)), для этого продифференцируем М(Т(р)) и приравняем производную нулю. Получим
( ( /6\г/2\ \1/(1+Г)
Т(р) = г
2 1
■р
-1/(г+1)
При этом условие рТ(р) —> 0 очевидно выполняется и
-г/(г+1)
! J1Л \
(1-г) (¿ + "
V 2гтг
2гг /12\ Г//2 21~г/2
"Ы
•«г'Л \
1 — г \ 5 / 1 — г
г *рг/(г+1).
2 1
(1-г)
■р
г/(г+1) _
/
^ll+^Y'V'™
= (1+г)
1 — г
(-
V 2гтг
г/(г+1)
р
г/г+1
/
Теорема доказана.
Теорема 3. Пусть распределение статистики Тп = Tn(Xi,... ,Хп) удовлетворяет соотношению (5), тогда распределение статистики = Т^п(Хi,... ,Х^п), где случайная величина Nn имеет отрицательное биномиальное распределение с параметрами 1 /п иг, удовлетворяет при п ^ оо неравенству (г € (0,1))
sup |Р (y/rn + 1 — ro(TNn — ц) < х) — F2r{x)\ < Сгп~~,
причем
С г = ^ + Л
гс>е — некоторая бесконечно малая последо вательность, а С^ конста,нта, из теоремы 2.
Доказательство. Частично повторим доказательство теоремы 2.2.1 из работы [2], где была получена следующая оценка:
Дг
где
sup |Р (у/т + 1 — ra(Tpfn — ц) < ж) — F2r(s)| ^ Ji + J2,
00
J] P(iVn = *)Ф
J1 =
fc=i
Jfe
rn + 1 — r
ж - F2r(s)
k
rn + 1 — r
-ж - Ф
k
rn + 1 — r
Для Ji в этой работе была получена следующая оценка:
Применяя теорему 2, получим, что
Ji^l sup |P(JV* ^Z)^ Gr,r(z)\.
1 z>0
Cr
Ji ^ -П r+1 при 0 < r < 1.
Из работы [2] также имеем следующие оценки для J2:
2 С
J2^ — ( 1 + 2 log п
\ п \ п
1
О < г < -, п 2, 1
г =
п > 2,
2^+i/2CT(r _ 1/2) 1
J2 < --—, о < г < 1, п > 2,
/п 2
где С — константа из (5). Тогда очевидно, что для константы из ДП)Г при достаточно больших п
можно записать
Сг = -у + 6п, 0 < г < 1,
где 5п — некоторая бесконечно малая последовательность. Теорема доказана.
СПИСОК ЛИТЕРАТУРЫ
1. Л ямин 0.0. О скорости сходимости распределений некоторых статистик к распределению Лапласа // Вестн. Моск. ун-та. Сер. 15. Вычисл. матем. и киберн. 2010. № 3. С. 30-38.
2. Бенинг В. Е., Королев В.Ю., Да У. Оценки скорости сходимости распределений некоторых статистик к распределению Стьюдента // Вестн. Рос. ун-та дружбы народов. Сер. Прикладная математика и информатика. 2004. № 1(12). С. 59-74.
3. Королев В. Ю., Шевцова И. Г. Уточнение неравенства Берри-Эссеенас приложениями к пуассоновским и смешанным пуассоновским случайным суммам // Обозрение прикладной и промышленной математики. 2010. 17. Вып. 1. С. 25-56.
Поступила в редакцию 07.12.09
ON THE RATE OF CONVERGENCE OF DISTRIBUTIONS OF CERTAIN STATISTICS TO THE LAPLACE AND THE STUDENT DISTRIBUTIONS
Lyamin O. O.
In the paper we consider asymptotically normal statistics. If sample size is changed for a random variable equal to maximum of n independent random variables with discrete Pareto distribution, then distribution of such statistic converges to the Laplace distribution. If sample size is changed for a random variable with negative binomial distribution, then distribution of such statistic converges to the Student distribution. In this paper we obtain the estimation for the rate of convergence of distributions of these statistics to corresponding asymptotic distributions as well as refine constants in the estimating expressions.
Keywords: asymptotically normal statistics, random sample size, the Laplace distribution, discrete Pareto distribution, negative binomial distribution, the Student distribution.