УДК 519.2 Вестник СПбГУ. Сер. 1. 2013. Вып. 3
ОБ ОЦЕНКАХ ТИПА БЕРРИ—ЭССЕЕНА И АСИМПТОТИЧЕСКИХ РАЗЛОЖЕНИЯХ ДЛЯ СЛАБО УСЕЧЕННЫХ СРЕДНИХ*
Н. В. Грибкова
С.-Петербургский государственный университет, д-р физ.-мат. наук, доцент, [email protected]
1. Введение и основные результаты. Пусть Х\,Х2,... —последовательность независимых одинаково распределенных невырожденных вещественнозначных случайных величин с функцией распределения (ф.р.) —, и для каждого натурального п пусть Х1:п < • • • < Хп:п обозначают порядковые статистики, соответствующие выборке Х1,... ,Хп. Введем непрерывную слева инверсию —-1, определенную равенством --1(и) = т^ж : — (х) > и}, 0 < и < 1, —-1(0) = — -1(0+), и пусть —п и Р,-1 обозначают эмпирическую ф. р. и ее инверсию соответственно. Определим генеральное усеченное среднее
/• 1— V
ц(и, 1 - V) = / ——1(в) ¿в (1.1)
«/ и
и функцию, определяющую асимптотическую дисперсию [3] усеченного среднего ТП,
р 1 —V р 1—V
а2(и, 1 - v)=/ / (в л г - вг) —1(в) —1^г), (1.2)
ии
где 0 < и < 1 — V < 1, в Л г = шт(в,г). Заметим, что ст2(0,1) равно дисперсии Х1, если существует конечный второй момент ЕХ^2.
Пусть кп, тп —две последовательности целых чисел, 0 < кп < п — тп < п; предположим, что гп := кп Л тп ^ то, п ^ то. Положим ап = кп/п, вп = тп/п. Рассмотрим усеченное среднее:
1 п—тп г 1—в,
Тп = - Х™ = / Р-1(и)д,и. (1.3)
, _ _ . . . - . / 1 п
п
г=кп + 1
В случае, когда ап, вп ^ 0, статистику Тп называют слабо усеченным средним.
Асимптотические свойства первого порядка усеченных и слабо усеченных сумм и средних исследовались многими авторами (см., например, [17, 3, 12]). В частности, Ш.Чёргё и др. [3] получили необходимые и достаточные условия существования последовательностей {ап}, {Ьп} таких, что распределение соответствующим образом нормированной статистики а—1(Тп — Ьп) стремится к стандартному нормальному закону. Используя другой подход, П. Гриффин и В. Пруит [12] нашли несколько иные по форме, но эквивалентные полученным в [3] необходимые и достаточные условия асимптотической нормальности Тп.
В случае сильного усечения (фиксированных ап, вп) асимптотические свойства второго порядка распределений Тп были исследованы в работах Н. Грибковой и
* Работа выполнена при финансовой поддержке Совета по грантам Президента РФ для государственной поддержки молодых российских ученых и ведущих научных школ (грант №НШ-1216.2012.1).
© Н. В. Грибкова, 2013
Р. Хэлмерса [7-9], где, в частности, доказана справедливость разложений Эджворта для (стьюдентизованного) усеченного среднего, бутстрепированного усеченного среднего и найдены простые явные формулы первых членов этих разложений.
Некоторые оценки скорости сходимости распределений сумм порядковых статистик к нормальному закону в общей ситуации, когда доли усечения зависят от объема выборки, были найдены в работе В. А. Егорова и В. Б. Невзорова [4].
В работе Н. Грибковой и Р. Хэлмерса [11] получены неравенства типа Берри— Ессеена для нормальной аппроксимации слабо усеченных средних Tn, имеющие при определенных условиях регулярности порядок O(r-1/2). В частности, в статье [11] с использованием свойств Караматы (см., например, [2, 5]) правильно меняющихся функций показано, что этот порядок является неулучшаемым в случае тяжелых хвостов у F, когда EXj = то. В работе [11] также найдены разложения типа Эджвор-та для слабо усеченных средних и их стьюдентизованных версий в случае тяжелых хвостов у F.
В этой статье мы приведем некоторые результаты, касающиеся случая лёгких хвостов, когда EXj < то. В этом случае естественно ожидать возможности получения оценок скорости сходимости и остаточных членов разложений в терминах отрицательных степеней n, т. е. в виде n-d с некоторым 0 < d < 1/2. Однако это потребует условий на скорость, с которой rn = kn A mn стремится к бесконечности (чего не требовалось в [11], где оценки вероятностей давались в терминах rn 1/2). Одним из наших основных предположений будет следующее: r—1 log n ^ 0 при n ^ то.
Как и в статье [11], наш метод доказательства основан на стохастической аппроксимации (слабо) усеченного среднего U-статистикой второго порядка с ядром, зависящим от n. Для построения аппроксимирующей U-статистики мы используем уинсоризацию исходных наблюдений и специальные представления типа Бахадура— Кифера, имеющие форму статистик фон Мизеса для (крайних) выборочных квантилей, полученные в [10].
Вводимые нами обозначения и условия частично повторяют соответствующие обозначения и условия работы [11], однако мы приведем их заново для удобства читателя.
Обозначим через = F-1(v) квантиль распределения F уровня 0 < v < 1, и пусть Wj(n), i = 1,..., n, обозначают Xi, уинсоризованные вне (£an, ], то есть
Wi (n) = V (Xi A ), (1.4) где s V t = max(s, t). Определим квантильную функцию
Qn(u)= V (F-1(u) A £i_0„) (1.5) и два первых момента Wi (n):
= J Qn(u)du , °W(n) = J (Qn(u) - )2du . (1.6)
Легко проверить, что } = o2(an, 1 — en) (см. 1.2), причем &W(n) является надлежащим параметром масштаба для нормировки с. в. Tn при установлении ее асимптотической нормальности [3]. Мы будем предполагать всюду далее, что lim infaW(n) > 0 (то есть что = для всех достаточно больших n).
Определим четыре числа:
ai = liminf ап, a2 = lim sup an,
n ?
п
(1.7)
bi = liminf (1 — вп), b2 = limsup (1 — вп),
и предположим, что < bi.
Как ив [11], будем предполагать всюду выполненным следующее условие гладкости.
[Ai] Существуют два открытых множества Ua, Ub С (0,1) такие, что функция F-1 дифференцируема в U = Ua U Ub, причем
(0, е), если 0 = ai = a2, (1 — е, 1), если bi = b2 = 1,
Ua D (0, a2], если 0 = ai < a2, Ub D [bi, 1), если bi < b2 = 1,
[ai, a2], если 0 < ai < a2, [bi, b2], если bi < b2 < 1,
(1.8)
(с некоторым 0 < е < 1 в случаях, соответствующих первой строке (1.8)), т.е. плотность f = F' существует и положительна в F-i(U). Определим две последовательности:
^ _ _1__аП ^ _ _1__Рп ^ g-j
Заметим, что условие [Ai] влечет за собой то, что эти величины определены при всех достаточно больших n. То же замечание применимо и к другим последовательностям величин, которые вводятся далее.
Второе предположение, которое будет использоваться в формулировках, следующее:
[A2] qa„ V qpn -> 0 при n ^ то.
Отметим, что [А2] выполняется, если ЕХ2 < то и , V .(/Рп—г = о{у/п). Как
f Isan / f — вп /
уже отмечалось, мы будем предполагать в этой статье, что EX2 < то, поэтому величина 0"W(n) в знаменателе qan и q^n (отделенная от нуля по условию) ограничена сверху, и ее можно не включать в определение qan, q^n, поскольку ее наличие не влияет на факт сходимости к нулю в [A2] (в отличие от ситуации тяжелых хвостов, когда EX2 = то, рассмотренной в [11], в которой стремится к бесконечности с ростом
n). Однако, чтобы сохранить соответствие обозначениям и условиям работы [11], с которой наши результаты тесно связаны, мы не будем менять определение qan, q^n, сохраняя форму условий.
Для формулировки результатов нам потребуется следующее условие:
[Si] r— i log n ^ 0, n ^ то,
где, как прежде, rn = kn Л mn.
Пусть h — вещественнозначная функция, определенная на множестве F-i(U) (см. (1.8)). Для произвольного 0 < B < то определим функции
Ф a„,h(B) = sup |t|<B
ф i-e„,h(B) = sup |t|<B
hoF-i(l-ßn+t]p^)-hoF-i(l-ßn)
(1.10)
и если
где коР-1(и) = к(р-1(и)). Заметим, что = ап +1
выполнено условие [£1], то последняя величина есть ап(1 + о(1)) при п ^ то. Аналогично, при условии [£1] мы имеем 1 — (Зп = 1 — /3„(1 + о(1)). В частности, отсюда следует, что величины, введенные в (1.10), определены при всех достаточно больших п.
Мы будем использовать далее следующие вспомогательные функции: Ф,Х(В), Ф^„,1//(ж)(В), = а„, 1 - вп, соответствующие Л,(х) = х и 1//(х) в (1.10).
Сформулируем третье предположение, которое будет использоваться в формулировках результатов:
[Аз]. Для любого 0 < В < то
Ф
/now
(n)
0,
вп
/nffW(
(n)
/Зтг, у^у
0,
Мы используем обозначение [A3] для третьего условия, чтобы отличить его от соответствующего условия [A3] в [11]. Функции ФVn,h(B), vn = an, 1 — вп, определенные в (1.10), отличаются от функций (B), vn = an, 1 — вп, в условии [A3] в [11] только присутствием в их формулах log n вместо log kn и log mn, которые определяли Ф^п,л,(В), vn = an, 1 — вп соответственно в [11]. Замена logkn, logmn на logn позволит нам получить оценки вероятностей в терминах отрицательных степеней n вместо степеней rn, как в [11].
Очевидно, что Ф^п ^(В) < ФVn,h(B), vn = an, 1 — вп, поэтому выполнение условия [A3] влечет за собой автоматическое выполнение условия [A3] из [11].
Определим функцию распределения нормированного усеченного среднего Tn:
FTn (x) = P (a-n) n1/2 ( Tn — M(a„, 1 — вп)) < x) .
(1.11)
В [11] показано, что условия [Ах]-[Аз] влекут за собой выполнение необходимых и достаточных условий асимптотической нормальности Ш. Чёргё и др. [3], поэтому
sup |FTn(x) — Ф(х)| = o(1) при n ^то ,
xeR
(1.12)
где Ф — стандартная нормальная ф. р.
Условия [Ах]-[Аз] несколько более строгие, чем необходимые и достаточные условия [3], но они позволяют нам установить границу ошибки нормальной аппроксимации для ф. р. Тп, определенной в (1.11).
Сначала мы сформулируем общий результат о точности нормальной аппроксимации, не требующий существования конечных моментов у ^.
Теорема 1.1 Предположим, что выполняются условия [Ах], [А2], [Аз] и [£1]. Тогда
A
sup|FTn(x) -Ф(х)| < + S2,n + S3iU + S4iU) + Ci
(1.13)
E |W1(n)
'W,
(n)
1/3
¿2,
1
5/3
f (^ап )CTW(n)
+ вп/3
+
вп
aW(n) Vf (^n ) f (^1-вп )/'
вп
5/3
f (^1-вп )ffW(n)
a
п
n
3
a
п
3
a
п
п
log n
aw(
(n)
«пф a„
i(B) + ßn%_0i(B)
'iW
для любого с > 0, гс?е А, В, С > 0 — величины, зависящие только от с.
Теорема 1.1 аналогична теореме 1.1 из статьи [11] и отличается от нее только тем, что условие [Аз] заменено здесь условием [Аз] и предполагается выполненным [£1]. Это позволяет получить в качестве последнего слагаемого справа в (1.13) величину порядка п-с вместо г— с, как в оценке (1.16) из [11], остальные слагаемые в правой части (1.13) те же, что и в (1.16) в работе [11].
Доказательства всех основных результатов приведены ниже, в п. 3.
Рассмотрим несколько примеров применения теоремы 1.1. Пример 1.1. Пусть /(ж) = 1[0,1](ж) (1а(ж) обозначает индикатор множества А), т.е. рассматриваем равномерное на (0,1) распределение. Легко показать, что условия [А1]—[А2] в этом случае выполняются. Величины ¿¿,п, г = 1, 2, 3, ограничены сверху равномерно по п. И так как Фun,l/f (Х)(В) =0, ип = ап, 1 — вп, для любого В > 0 и для всех достаточно больших п, мы получаем оценку порядка 0(п-1/2) в правой части (1.13), если выполнено условие [£1]. Отметим, что в этом простом случае оценка порядка 0(п-1/2) может быть получена, например, как следствие результатов ван Цвета [18] (см. формулу (4.1) и теорему 1.1, [18]).
Пример 1.2. Пусть /(ж) = е-х1[о,то](ж), т.е. исходное распределение стандартное экспоненциальное. Условия [А1]—[А2] выполняются. Используя тот факт, что f (^-1(и)) = 1 — и, /(^-1(1 — и)) = и (и € (0,1)) и предположение 0 < а2 < Ь1 < 1 (см. (1.7)), мы легко проверяем, что ¿¿,п, г = 1, 2, 3, ограничены сверху равномерно по п и что
¿4,n =O log n
log n\ 1/2 /log n\
kn J
+
1/2
Ч^Г
O
n 3 \ 1/2 log n
Таким образом, если выполняется условие [Si] и если при этом log3 n/mn = O(1) при n ^ то, то наша оценка (1.13) имеет порядок O(n-1/2).
Пример 1.3. В случае стандартного нормального распределения с плотностью f(x) = ехр(—ж2/2), когда кп = то„, мы можем получить оценки лучшего порядка, чем O(n-1/2) (см. (1.17)—(1.18) и теорему 1.2 [11]). Рассмотрим общий случай, когда последовательности kn, mn, вообще говоря, различны. Используя хорошо известные соотношения |ж|Ф(ж) ~ f (x), x ^ -то, и x(1 — Ф(х)) ~ f (x), x ^ то, мы легко проверяем, что ¿i n, i = 1, 2, 3, ограничены сверху равномерно по n и что
1/2\
X ш 1 /log n\1/2 flog n
ö4,n =0 ( an log n ( —— I + ßn log n
O
1/2
1/2
+ ä1/2
log3 n
mn 1/2N
= o(1).
Таким образом, мы получаем оценку порядка 0(п 1/2) при единственном условии, что имеет место [£1].
2
а
n
m
n
m
n
n
n
n
Теперь мы приведем следствие теоремы 1.1 для случая слабо усеченного среднего и регулярно меняющейся на бесконечности плотности.
Обозначим через класс регулярно меняющихся на бесконечности функций
такой, что / € £ДУте означает выполнение следующих двух условий:
(г) / (ж) = |ж|р Ь(ж) для |ж| > хо с некоторыми жо > 0, р € М и Ь(ж) —положительной медленно меняющейся на бесконечности функцией;
1/2
(и) |/(ж + Дж) - /(ж)| = О(/(ж) ^ когда Ах = о(|ж|) при |ж| —>■ то.
Отметим, что (гг) имеет место для правильно меняющейся на бесконечности
1/2
^г когда |ж| —> +оо, где Д есть соответ-
функции /, если
Ь(х+Ах) _ ,
О
ствующая медленно меняющаяся функция, и это выполнено (причем с показателем степени, равным 1 вместо 1/2), если Ь непрерывно дифференцируема для достаточно больших \х\ и |Д'(ж)| = О ("^у^) ПРИ \х\ —> +оо, что имеет место, например, если Ь есть некоторая степень логарифма (для детального ознакомления с теорией правильно меняющихся функций см., например, монографии Н. Бингама и др. [2], В. Феллера [5]).
В формулировке следствия потребуется также условие
[£2] г-1пя ^ 0 при п ^ то для некоторого в > 0.
Следствие 1.1 Предположим, что ап V вп ^ 0, п ^ то, и что выполнено условие [£1]. Кроме того, предположим, что условие [А1 ] имеет место с некоторым е > 0 и плотность / € БКУ^, где р = -(1 + 7) с некоторым 7 > 2. Тогда
вир |ДТп(ж) - Ф(ж)| = о(п-(1/2-1/^ г-(1/7(1.14)
жек "V У
для любого й > 0.
Кроме того, если условие [£2 ] выполнено с некоторым 0 < в < 1, то в правой части (1.14) мы имеем оценку порядка о(п-(1/2-1/7)).
Заметим, что если показатель 7 > 3 (т. е. при конечном третьем моменте у Д), во второй части утверждения мы имеем оценку порядка о(п-1/6). Этот порядок (предположительно) не является оптимальным, но используемый нами подход, основанный на специального вида и -статистической аппроксимации (см. п. 2), не позволяет получить другой оценки, которая, как мы предполагаем, в условиях регулярности следствия 1.1 могла бы иметь порядок п-1/2, если 7 > 3.
Пример 1.4. Рассмотрим /(ж) = у^г^/!)- (1 + т-е- плотность распре-
деления Стьюдента с 7 степенями свободы, 7 € N. Используя формулу Тейлора, мы легко проверяем, что (гг) в этом случае имеет место, следовательно, / € «БДУ^. Если 7 = 1 (распределение Коши) или 7 = 2, мы можем получить оценку скорости
1/2
сходимости к нормальному закону порядка О(гп ) (см. работу [11]). Предположим теперь, что 7 > 3. Так как Д(ж) ~ |ж| г, ж ^ -то, и 1 — Д(ж) ~ ж г, ж ^ то, после некоторых простых вычислений (см. также доказательство следствия 1.1) мы получаем, что
\ (<*1,п + <*2,п + ¿3,п) = 0(п-Ы2-1/7)г-1/7^
^(б4п)=0((\0ёп)3/2 п-(1/2-1/7)г-(1/2+1/7) \/п ' V
и
Таким образом, если log3 n/rn = O(1), то наша оценка имеет порядок O^n-(1/2-1/7Vn . Мы видим, что для y = 3 оценка имеет порядок o(n-1/6), тогда как в случае y = 4 оценка уже порядка o(n-1/4) и так далее.
Второе следствие касается классического случая усечения на уровне центральных порядковых статистик. В этом случае не требуется выполнения каких-либо мо-ментных предположений. Пусть а1, 62, Ua и Ub определены, как в (1.7)—(1.8).
Следствие 1.2 Предположим, что 0 < a1 <62 < 1 и выполняется условие [A1 ]. Кроме того, предположим, что плотность f удовлетворяет условию Гёльдера степени d > 0 на множествах F-1(Uc), c = a, 6. Тогда
sup|FT„(x)-$(x)| <-£=, (1.15)
хек Vn
где C > 0 — не зависящая от n постоянная.
Такой же результат был получен в [11] в качестве следствия теоремы 1.1 [11]. Теперь мы сформулируем результаты по аппроксимации второго порядка, аналогичные результатам типа Эджворта из [11].
Определим центральный третий момент Wj(n)
Jo
где ^п(и), —квантильная функция и среднее с.в. ^(п) (см. (1.5) и (1.6)), и
положим 2 2
¿2,\у(п) = -ап-——-+ /3„-—-г-. (1.16)
Определим две последовательности вещественных чисел:
= = (1.17)
Мы получим результаты о приближении ф. р. Frn нормированного усеченного среднего функцией вида
Gn(x) = Ф(х) - ® ((Alw + ЗА2( J(x2 - 1) + 6^—), (1.18)
где ф = Ф',
, _ 1 A an(l-an) /3n(l-/?n) ™ ~~ 2а/П \ /(e«j + жi-^j
Величина bn — смещение, которое представлено в аппроксимации, несмотря на отсутствие каких-либо моментных предположений (см. [7, 11]). Отметим, что если an = вп и распределение F симметрично, то Gn(x) = Ф(х), поскольку второе слагаемое (1.18) в этом случае равно нулю.
В работе [11] показано, что в случае тяжелых хвостов у F (EX2 = то) при определенных условиях регулярности (и в отсутствие симметрии распределения и
усечения) второе слагаемое в (1.18), то есть величина С„(ж) — Ф(х), имеет точный
порядок г,
-1/2
при п ^ то и что эир \РТп(х) - Сп(х)\ = О ( -—--Ь
жек
к
3/4
3/4
при п ^ то. Это означает, что функция С„(ж) является разложением типа Эджворта для Дгп (х).
Здесь мы приведем наши результаты по аппроксимации (х) функцией (х) в случае, когда ЕХ2 < то.
Вначале мы сформулируем результат, который является общим и не предполагает существования каких-либо моментов у Д.
Теорема 1.2 Предположим, что выполнены условия [А1], [А2], [А3] и [£1]. Тогда
С1
виР\ртп(х) - Сп{х)\ <—(¿11П + 32,п + <*з,п) +
жек п
п3/4 п1/2
(1.19)
для любого с > 0, где
5щ =
Е (^(п))4
2+е
^2,п(е) =
(п)
/ (£а„ )
+ в
с произвольным £ > 0, ¿з,„ = ¿2,п(0), кроме того,
(1о ё»)5/4 / «п/4 ^
04,п = - ( "777-7 +
вП/4
^ п
(п)
(п)
/ ) / )
где В > 0 — величина, зависящая только от с. Наконец,
, _ |(Л1(п) + 3Л2(„) ) -Ьп\
2+е
Величины С > 0, г = 1, 2, 3, 4, в (1.19) зависят только от с и от £.
Теорема 1.2 аналогична теореме 1.4 из работы [11] и отличается от нее только предположением [А3], вместо [А3], как в статье [11], и дополнительным предположением [£1]. Это позволяет, как и в случае с теоремой 1.1, получить в качестве последнего слагаемого справа в (1.19) величину порядка п-с вместо г—с, как в оценке (1.28) из [11], остальные слагаемые правой части (1.19) те же, что и в (1.28) из [11].
Следующее утверждение дает оценку точности аппроксимации функции распределения нормированного слабо усеченного (ап V вп ^ 0, п ^ то) среднего функцией С„(ж), когда ЕХ2 < то и плотность Д регулярно меняется на бесконечности.
— с
1
1
2
а
4
п
а
Следствие 1.3 Предположим, что an V вп ^ 0, n ^ ж, и что выполнено условие [Si]. Кроме того, предположим, что условие [Ai] имеет место с некоторым е > 0 и плотность f £ SRV^, где р = —(1 + 7) с некоторым 7 > 2. Тогда для любого d > 0
sup |FTn(x) — Gn(x)| = o in-(1-2/Y)+dr-(2/Y+d) +n-(1/2-1/Y)+d(logп)5/4г-(1/4+1/^ xeR L
(1.20)
Если 7 > 3, то следствие 1.3 дает оценку точности аппроксимации порядка o(n-1/3).
Нужно отметить, что, как показано в замечании 1.1 работы [11], более точная, чем Gn(x), аппроксимация в случае EX2 < ж может быть получена при центрировании статистики посредством ETn вместо ^(а„, 1 — вп), и что функция Gn(x), по-видимому, представляет собой разложение типа Эджворта для Frn (x) именно в ситуации тяжелых хвостов у F. Авторы работы [11] планируют изучить более детально аппроксимацию второго порядка для слабо усеченных сумм в случае лёгких хвостов в другой работе.
Следующее утверждение, являющееся следствием теоремы 1.2, есть обобщение результата из [8] на случай, когда урезающие процентили зависят от n.
Следствие 1.4 Предположим, что 0 < Я1 <62 < 1, где Я1,62, как в (1.7), условие [A1] выполнено и плотность f удовлетворяет условию Гёльдера степени d > 0 на множествах F-1(Ua) и F-1(Ub), где Ua и Ub те же, что и в (1.8). Тогда
sup |Fr„(x) — G„(x)| = o(n-1/2-p) , n ^ж, (1.21)
xeR ^ '
для любого p < min(1/4, d/2).
2. Стохастическая аппроксимация U-статистиками. В п.2 мы доказываем вспомогательное утверждение об аппроксимации (слабо) усеченного среднего U-статистикой степени 2 с ядром, зависящим от n. Это позволит нам доказать результаты, сформулированные в п. 1, путем применения соответствующих результатов для U-статистик степени 2. Этот метод доказательства хорошо известен, имеется много работ, в которых используется этот подход. Обычно в качестве приближающей U-статистики применяют две первые группы слагаемых разложения Хёфдинга интересующей статистики: линейную и квадратичную. Так, в работе Х. Путтера и В. ван Цвета [16] этот тип аппроксимации применен для получения эмпирических разложений Эджворта для «гладких» симметричных статистик. В нашем «негладком» случае использование U-статистики, являющейся частью разложения Хёфдинга, не удобно из-за сложной интегральной формы ¿2-проекций порядковых статистик (см. [16]).
Как и в работе [11], для построения аппроксимирующей U-статистики мы используем уинсоризацию исходных наблюдений и специальные представления типа Бахадура—Кифера, имеющие форму статистик фон Мизеса для (крайних) выборочных квантилей, полученные в [10].
Положим 1v(Xj) = 1{Xi< }, где = F-1(v), 0 < v < 1, и 1a —индикатор события A. Определим U-статистику степени 2 с ядром, зависящим от n:
п
Ln + Un = Ln,i + X) Un,(i,j), (2.1)
i=1 1 < i<j < n
где
Ln,i =-j={wi{n) = 1 -1 «„№)) +
+ Ion. (Xi) + Ci-вп (l - li-вп - ,
W- (n) и здесь определены, как в (1.4) и (1.6) соответственно, и
(2.2)
f(Can)
(la„ (Xj) - an) (la„ (Xj) - an) +
+ } - (1 - /?n)) - (1 - /?n))
Заметим, что
EU„i(ijj) =0, E( L„,iU„i(ijj^ =0, i,j = 1,...,n (i = j).
Как в [11], используя (2.1)—(2.5), мы легко находим, что
2
Ef Ln±Un , =1 + £n;
(2.3)
(2.4)
(2.5)
(2.6)
(n)
где 0 <е„ < п + (см. (1.9)), и е„ ^ 0 при п ^ то, если условие [А2] выполнено. Кроме того, для третьего момента (см. [11])
Е ( —-- ) — —¡= (Ai п + ЗА2 п) + Rn
\ aw(n) I \/nK
(2.7)
(n)
где
Rn = 0 [ql +q2p —= + an[3nqanqPn{-^= + —) .
V Vkn \рПп Vkn л/гпп J
Следующая лемма — это вариант леммы 2.1 из [11] для случая, когда выполнено условие [Si] (т.е. когда последовательности kn, mn стремятся к бесконечности быстрее, чем log n). Как и упомянутая лемма, она дает оценку точности аппроксимации Tn суммой U-статистики с переменным ядром вида (2.1) с нулевым средним и смещения bn, но не с вероятностью порядка 1 — O(r— c) для любого c > 0, как в [11], а с вероятностью 1 — O(n-c).
Лемма 2.1 Предположим, что выполнены условия [Ai], [A2] и [Si]. Тогда
р(|ni/2(T„ — M(a„, 1 — в„)) — (Ln + U„ + 6„)| > Д^ = O(n-c) (2.8)
для любого c > 0, где bn — величина, определенная в (1.18), Дп = А(Да,п + Д^,п),
log n г 1 flog n\ i/4
Д
a,n — ^n
> L/(£aJ V
Аз,п — Pn ■
log n Vn 1-/3J
log n
i/4
(2.9)
где величины A, B > 0 зависят только от c.
1
nn
ELn - =0, i = 1, .. ., n
и
m
n
Доказательство. Доказательство леммы такое же, как доказательство леммы 2.1 в [11]. Мы только заменяем в нем log kn и log mn всюду на log n и применяем вторые части утверждений теорем 1.1, 1.2 из [10], использующие условие [S1], вместо первых, как в [11].
Определим биномиальную с. в. Nv = Щг : Xj < £v}, 0 < v < 1, и заметим, что
n
n
i=1
n
1 n _ n1
+ ~ У, ^--~€l-f3n-
nn
i = Nan + 1
(2.10)
Тогда
Tn — мК, 1 — вп) — [Wn — EWn] 1
sgn(Nan — kn (Xi:n — ) —
j=(kn ANa„ ) + 1
— sgn(N1_e„ — (n — mn))
Ni-en V (n-mn) i=((n-m„ )ANi-e„ )+1
(Xi:n — £1-вп) , (2.11)
где sgn(s) = в/|в|, sgn(0) = 0, и по теореме 2.2 (в части (и)) из [10], применяемой с функцией С(ж) = х (см. также доказательство теоремы 2.2 [10]), последняя величина
равна
(Nan — an n)2 1 (N1_0„ — (1 — en) n)2 1
2 n2 f (Can )
+
2 n2
f (С1-вп )
+ Rn
(2.12)
где р(|Д„| > + А/з,п)) = 0(п с), и Да1„, Д^« определены в (2.9). Соотно-
шения (2.1)-(2.3) и (2.11)-(2.12) влекут за собой равенство
1/2
(Tn — Man, 1 — вЛ) = Ln + Un —
2 пд/п
n
f (Can)
]T(lan (Xj) — an) 2 +
+ 777-t£(1I-/J„№)-(1-/?»))
n/ j=1 2
f (C1-en ) j=1
+ n1/2Rn
= Ln + £/n + bn + -^r„ + n1/2i?„, (2.13) 2n
где Ь„, как в (1.18), и rn = -/(¿j^.i + Ж1-эГ1)г"-2'
j=1
2 =- ]r [(li-^cxo - (i - f3n)f -/?„(!- /?„)
j=1
Мы рассмотрим только г„д; оценки для гп<2 получаются аналогично. Заметим, что г„,1 является средним независимых одинаково распределенных центрированных с. в.,
n
1
n
n
Г„, 1 = ÍSnA, где SnA = J2nk=iYk, EYfc = О, и B„ = D(SnA) = na2 с a? = ЕУХ2 = a„( 1 — a„) [l — 2an] . Более того, для каждого натурального m > 2 мы имеем
EYT = а? [1 — 2 a„]m-2 [(l — a„)m-1 + ( —1)m(a„)m-1],
и, следовательно, | EY™| < а2. Тогда, применяя экспоненциальные оценки (см. Петров [15], глава 3, теорема 17, с H =1), мы получаем
P(Vn,i| >х) <ехр (2-14)
1 /2 I I
для каждого 0 < x < Bn. Возьмем x = A(nl°gnan(1 — a„)) |1 — 2 an|. Если a = 1/2 не является частичным пределом последовательности an, можем легко показать, что 0 < x < Bn для всех достаточно больших n. В противном случае заметим,
I I (1 N 1/2
что можем рассматривать только те случаи, когда Sn = \ап — > А\ ( °fcs" ) с
некоторым A1 > 0, которое мы выберем! позднее. Действительно, если это не так, то мы можем написать г„д = (5 + ¿n,i)2 ~ ~ 5п)(\ + 6п)
1/2
, где
(_1)1«„№) (ап - А), \5п,г\ = 5п, и |г„д| < 5п{ 1 + 2<5„) = О . Поскольку
£1/2 € иа и Ц при условии [А1], мы имеем /(ж) > /о > 0 в некоторой окрестности £1/2 , тогда г„ду^—у = О (С°й8")1/2), и, следовательно, с учетом [¿>1] мы получаем ^|г„д|=о(Д„) (см. (2.13)).
/, ч 1/2
Для случая 6п > А\ () мы легко проверяем, что х < В„ для всех достаточно больших п, если выбрать А1 таким, что А1 > А(1 — Я2)-1/2, и в силу (2.14) получаем
р(|г„д| > -2а„|(1оёп а„(1-а„))1/2) < ехр ^А2 .
Последняя величина имеет порядок О (п-с), когда А2 > 4с. Таким образом, 1 |гпд| < А Ас
ЯбО 1 1 - v^/(£«JK)1/2 " V кп
и, следовательно, j^ja—)Г«Д = (см- (2-9) и (2.13)). Лемма доказана. □
1 1
Т
3. Доказательства. В этом разделе мы доказываем результаты, сформулированные в п. 1.
доказательство теоремы 1.1. Для того чтобы доказать теорему 1.1, достаточно повторить доказательство теоремы 1.1 из [11], беря в нем Д„, как в лемме 2.1, п.2, и применяя, соответственно, лемму 2.1 из п.2 вместо леммы 2.1 из [11]. Других изменений не требуется, поэтому мы опускаем детали. Теорема доказана. □
Доказательство следствия 1.1. Для доказательства этого следствия мы применяем теорему 1.1. Как при доказательстве следствия 1.1 из [11], используя условие регулярности / € ЙДУ^, находим, что условия [А2] и [А3] выполняются. Положим с =1 и пусть А, В —постоянные, соответствующие этому выбору. Остается оценить г = 1, 2, 3, 4, в правой части (1.13).
Так как ЕХ2 < ж, мы имеем ап£ап + ^ 0, п ^ ж, и ст^Ц } ^ ст2, поэтому
"1-вп
Е|^1 (п)|3 = а„|е«„ |3 + / -1(и)|3 ¿и + вп|&-£„ |3 = ОI + 1&-в» 0 •
В силу правильного изменения плотности /, мы имеем
+
вп
/ (£а„ ) / )
= 01£«п I + I)
(см. доказательство следствия 1.1 [11]). Отсюда в силу правильного изменения инверсии Д-1 (см. [2]) следует, что
№,„ + §2,п) = 0[п-* ап-> ^Ю + вп 7 ¿1(вп)
о (
кп ^ ¿1(оп) + Ш„ ^ ¿1(вп) , (3.1)
п ^ ж, где ¿1(и) —медленно меняющаяся при и ^ 0 функция. Таким образом, для любого й > 0 мы имеем оценку порядка
0(п-(1/1-1/7+ ш-1/7-Ч]), п ^ ж,
в правой части (3.1). Кроме того, если выполнено условие Итэир,^,^ к "т для некоторого в > 0, то если й < в/(7(1 — в)), мы имеем оценку о(п-(1/2-1/7)). Теперь рассмотрим ¿з,п. В силу правильного изменения плотности / имеем
<
/(£а„ )
= 0I) ,
вп
/ (б-вп )
= 01£1-вп I),
и в силу правильного изменения инверсии Д 1 получаем
= О (п-1/2 [аУ3-5/3^^««) + вУ3"5/37Ь1(вп)]) = = О (п-(М) [ауз(1-2/7)Ь1(ап) + ^1/3(1-2/7)^^)])
п —> ж.
Так как 7 > 2, мы делаем тот же вывод, что и в связи с (3.1).
Наконец, рассмотрим ¿4,п. Как при доказательстве следствия 1.1 из работы [11], находим, что
=о ТтЬ ■ =° {№шЬ) ■
Следовательно,
¿4,п = О
/ (£а„)
1 /log п ,
вп
кп / (^1-вп )
log п
log п
Шп
и для мы получаем оценку того же порядка, что и для
Следствие доказано. □
1, 2, 3.
а
п
а
п
п
а
п
Доказательство следствия 1.2. Достаточно показать, что выполняются условия теоремы 1.1. Условие [А1], неравенства 0 < а1 <62 <1 и непрерывность / в окрестностях ^ и влекут за собой оценки ИтЫ(/) Л /)) > 0
и Итт1„^то > 0. Следовательно, [А2] имеет место. Кроме того, по условию
Гёльдера степени <1 > 0 мы имеем Фаг1д//(Ж)(В) = О ) = о(
й/2
1
log п '
), п —> ж. Те
же аргументы справедливы для Ф^^д//(Х)(В). Таким образом, выполняется более сильное условие, чем [А3]. Неравенство (1.15) с учетом конечности моментов (п) следует из полученных оценок и из неравенства (1.13). Следствие доказано. □
Доказательство теоремы 1.2. Для того чтобы доказать теорему 1.2, достаточно повторить доказательство теоремы 1.4 из [11], используя в нем Дп, как в лемме 2.1, п. 2, и применяя, соответственно, лемму 2.1 из п.2 вместо леммы 2.1 из [11]. Других изменений не требуется, поэтому мы опускаем детали. Отметим, что при доказательстве теоремы 1.4 в [11] используются результаты по разложениям Эджворта для симметричных статистик, полученные в работе В. Бенткуса и др. [1]. Теорема доказана. □
Доказательство следствия 1.3. Для доказательства этого следствия мы приме— а2 > 0, п — ж,
2
няем теорему 1.2 при с =1. Так как 7 > 2, имеем ст^
Е(^(„) )4 = а„ + (Д-1(и))4 + = „ V £2-вп). Поскольку по условию плотность / € ЙДУ^о, т.е. правильно меняется на бесконечности, имеем ) + ) = + £1-/0' Отсюда находим (см. доказательство следствия 1.1), что
-№,п+<*3,п) = 0(-пп
-- 9 —- 9
(ап1 Ь^а-1))-+ (/?„- Д^/З-1))'
= 0 {п^1-^
кп-'ЬЦа-^ + тп-'ЬЦр-1)
+
(3.2)
где ! — произвольная положительная постоянная и Д1 —медленно меняющаяся
на бесконечности функция. Для — 62гП мы имеем — 62
7 5з,пО
+
(/(с/ э )) ' и когДа ^ ^ 7)' последняя величина имеет такой же порядок, как
оценка в правой части (3.2). Легко видеть, что -¿=(56 п = + £1 _р ), и оценка
этой величины дана в (3.2). Для п-3/4 ¿4,„ имеем оценку
п-3/4 ¿4,„ = О (п-3/4(^п)5/4 [К)-1/4КГ1/7Д1(а-1) + (в„)-1/4(вп)-1/7¿1(в-1)])
(3.3)
где Дс, как в (3.2). В силу медленного изменения Д1, последняя величина имеет порядок о (п-
(1/2-1/7)+^(1оё п)5/4 [к,
-(1/4+1/7)-й
+ Ш,
-(1/4+1/7 )-й
]) для любого ! > 0. Остается заметить, что при условии, что / € бДСГьо, как при доказательстве следствия 1.1 из [11], мы получаем ап ^ " ^ ^ = О (ап ^ "^ , и такую же оценку мы
имеем для второго слагаемого Таким образом, в силу условия / € ^Д^ГйО мы по-
лучаем = Ои-(1/2-1/7)(1оёп)1/2
-(1/2+1/7);
Д1(а-1) +
-(1/2+1/7)
Д1(в-1)
2
2
й
к
7
7
£
1
П
к
Ш
что имеет пренебрежимый порядок малости по сравнению с правой частью (3.3). Следствие доказано. □
Доказательство следствия 1.4. Это утверждение является непосредственным следствием (1.19). Действительно, в наших условиях мы имеем + ¿2,п(е) +
М = O(i), п-3/4<54,„ = о п-'/Че^п = 0(±), и по условию Гёльде-
ра logn^ant7f_(B) + Ф^^В)) = О (logn(i^)d/2) = o(n-d/2+е) для любого
£ > 0. Из этих оценок следует, что n-3/%jn + n-1/2£5j„ = o(n"1/2"p) для любого p < min(1/4, d/2). Следствие доказано. □
Литература
1. Bentkus V., Gotze F., van Zwet W. R. An Edgeworth expansion for symmetric statistics // Ann. Statist., 1997. Vol. 25. P. 851-896.
2. Bingham N.M., Goldie C.M., Teugels J.L. Regular variation // Encyclopedia Math. Appl. Vol. 27. Cambridge: Cambridge Univ. Press, 1987.
3. Csorgo S., Haeusler E., Mason D. M.. The asymptotic distribution of trimmed sums // Ann. Probab., 1988. Vol. 16. P. 672-699.
4. Егоров В. А., Невзоров В. Б. Некоторые оценки скорости сходимости сумм порядковых статистик к нормальному закону // Зап. научн. семинаров ЛОМИ, 1974. Т. 41. С. 105128; пер. англ.: Certain estimates of the rate of convergence of sums of order statistics to the normal law // J. Math. Sci. (New York), 1978. Vol. 9, N1. P. 81-105.
5. Феллер В. Введение в теорию вероятностей и ее приложения. Том II. М.: Мир, 1984.
6. Грибкова Н. В. Об аналогах неравенства Берри—Эссеена для урезанных линейных комбинаций порядковых статистик // Теория вероятн. и ее примен., 1993. Т. 38. С. 176-183.
7. Gribkova N. V., Helmers R. The empirical Edgeworth expansion for a Studentized trimmed mean // Math. Methods Statist., 2006. Vol. 15. P. 61-87.
8. Gribkova N. V., Helmers R. On the Edgeworth expansion and the M out of N bootstrap accuracy for a Studentized trimmed mean // Math. Methods Statist., 2007. Vol. 16. P. 142-176.
9. Грибкова Н. В., Хэлмерс Р. О состоятельности M ^ N-бутстреп-аппроксимации распределения усеченного среднего // Теория вероятн. и ее примен., 2010. Т. 55, №1. С. 3-18.
10. Gribkova N. V., Helmers R. On a Bahadur—Kiefer representation of von Mises statistic type for intermediate sample quantiles // Prob. Math. Statist., 2012. Vol. 32, N2. P. 255-279.
11. Грибкова Н. В., Хэлмерс Р. Аппроксимация второго порядка для слабо усеченных средних // Теория вероятн. и ее примен., 2013. Т. 58 (в печати); arXiv:1104.3347v1 [math.PR].
12. Griffin P. S., Pruitt W. E. Asymptotic normality and subsequential limits of trimmed sums // Ann. Probab., 1989. Vol. 17. P. 1186-1219.
13. Helmers R. On the Edgeworth expansion and the bootstrap approximation for a Studen-tized U-statistic // Ann. Statist., 1991. Vol. 19. P. 470-484.
14. Hoeffding W. Probability inequalities for sum of bounded random variables //J. Amer. Statist. Assoc., 1963. Vol. 58. P. 13-30.
15. Петров В. В. Суммы независимых случайных величин. М.: Наука, 1972.
16. Putter H., van Zwet W. R. Empirical Edgeworth expansions for symmetric statistics // Ann. Statist., 1998. Vol. 26. P. 1540-1569.
17. Stigler S. M. The asymptotic distribution of the trimmed mean // Ann. Statist., 1973. Vol. 1. P. 472-477.
18. van Zwet W. R. A Berry—Esseen bound for symmetric statistics // Z. Wahrsch. Verw. Gebiete, 1984. Vol. 66. P. 425-440.
Статья поступила в редакцию 28 марта 2013 г.