Научная статья на тему 'Предельная Теория непараметрических статистик'

Предельная Теория непараметрических статистик Текст научной статьи по специальности «Математика»

CC BY
180
132
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ / СТАТИСТИКИ ИНТЕГРАЛЬНОГО ТИПА / НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ / НЕПАРАМЕТРИЧЕСКИЕ СТАТИСТИКИ / СТАТИСТИКИ ТИПА ОМЕГА-КВАДРАТ / СТАТИСТИКИ ТИПА КОЛМОГОРОВА СМИРНОВА / MATHEMATICAL STATISTICS / LIMIT THEOREMS / INTEGRAL TYPE STATISTICS / NECESSARY AND SUFFICIENT CONDITIONS / NONPARAMETRIC STATISTICS / STATISTICS OF OMEGA-SQUARE TYPE / STATISTICS OF KOLMOGOROV SMIRNOV TYPE

Аннотация научной статьи по математике, автор научной работы — Орлов Александр Иванович

Изучено асимптотическое поведение широкого класса непараметрических статистик, в который входят статистики типа омега-квадрат и типа Колмогорова-Смирнова. Доказаны предельные теоремы. Разработан метод аппроксимации ступенчатыми функциями, с его помощью получен ряд необходимых и достаточных условий

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LIMIT THEORY OF NONPARAMETRIC STATISTICS

We have studied the asymptotic behavior of a broad class of nonparametric statistics, which includes statistics of omega-square type and Kolmogorov-Smirnov type. Limit theorems have been proved. We have also developed the method of approximation with step functions. With the help of this method we have obtained a number of necessary and sufficient conditions

Текст научной работы на тему «Предельная Теория непараметрических статистик»

УДК 519.2:303.732.4

ПРЕДЕЛЬНАЯ ТЕОРИЯ НЕПАРАМЕТРИЧЕСКИХ СТАТИСТИК

Орлов Александр Иванович д.э.н., д.т.н., к.ф.-м.н., профессор

Московский государственный технический университет им. Н.Э. Баумана, Россия, 105005, Москва, 2-я Бауманская ул., 5, prof-orlov@mail. т

Изучено асимптотическое поведение широкого класса непараметрических статистик, в который входят статистики типа омега-квадрат и типа Колмогорова-Смирнова. Доказаны предельные теоремы. Разработан метод аппроксимации ступенчатыми функциями, с его помощью получен ряд необходимых и достаточных условий

Ключевые слова: МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ, СТАТИСТИКИ ИНТЕГРАЛЬНОГО ТИПА, НЕОБХОДИМЫЕ И ДОСТАТОЧНЫЕ УСЛОВИЯ, НЕПАРАМЕТРИЧЕСКИЕ СТАТИСТИКИ, СТАТИСТИКИ ТИПА ОМЕГА-КВАДРАТ, СТАТИСТИКИ ТИПА КОЛМОГОРОВА -СМИРНОВА

1. Введение

В прикладной статистике широко используются статистики типа омега-квадрат и типа Колмогорова - Смирнова [1]. Они применяются для проверки согласия с фиксированным распределением или семейством распределений, для проверки однородности двух выборок, симметрии распределения относительно 0, при оценивании условной плотности и регрессии в пространствах произвольной природы и т.д. В настоящей статье изучено асимптотическое поведение широкого класса непараметрических статистик, в который входят статистики типа омега-квадрат и типа Колмогорова-Смирнова. Доказаны предельные теоремы. Разработан метод аппроксимации ступенчатыми функциями, с его помощью получен ряд необходимых и достаточных условий. Доказательства теорем впервые публикуются в научной периодике.

UDC 519.2:303.732.4

LIMIT THEORY OF NONPARAMETRIC STATISTICS

Orlov Alexander Ivanovich

Dr.Sci.Econ., Dr.Sci.Tech., Cand.Phys-Math.Sci.,

professor

Bauman Moscow State Technical University, Moscow, Russia

We have studied the asymptotic behavior of a broad class of nonparametric statistics, which includes statistics of omega-square type and Kolmogorov-Smirnov type. Limit theorems have been proved. We have also developed the method of approximation with step functions. With the help of this method we have obtained a number of necessary and sufficient conditions

Keywords: MATHEMATICAL STATISTICS, LIMIT THEOREMS, INTEGRAL TYPE STATISTICS, NECESSARY AND SUFFICIENT CONDITIONS, NONPARAMETRIC STATISTICS, STATISTICS OF OMEGA-SQUARE TYPE, STATISTICS OF KOLMOGOROV — SMIRNOV TYPE

2. Статистики интегрального типа и их асимптотика

Рассмотрим введенное автором настоящей статьи естественное обобщение статистик типа омега-квадрат - статистики интегрального типа

4a=4( fa. Fa) = j. fa ( *■ ®)«F ( X, W) , (1 )

X

где Х - некоторое пространство, по которому происходит интегрирование (например, X = [0; 1], X = R1 или X = Rk). Здесь {а} - направленное множество, переход к пределу по которому обозначен как a^-œ (в терминологии общей топологии [2]). Случайные функции fa: XxQ ^ Y обычно принимают значения, являющиеся числами. Но иногда рассматривают и постановки, в которых У = Rk или У - банахово пространство (т.е. полное нормированное пространство [3]). Наконец, Fa(x,ro) - случайная функция распределения или случайная вероятностная мера; в последнем случае используют также обозначение dFa(x,ro)= Fa(dx,ro).

Предполагаются выполненными необходимые для корректности выводов внутриматематические предположения измеримости, например, сформулированные в [4, 5].

Пример 1. Рассмотрим критерий Лемана - Розенблатта, т.е. критерий типа омега-квадрат для проверки однородности двух независимых выборок (см. [6, гл. 5]). Его статистика имеет вид:

A = jm>i_ j( Fm(x) - Gn(x))2dHm+n(x) , m + n

где Fm(x) - эмпирическая функция распределения, построенная по первой выборке объема m, Gn(x)) - эмпирическая функция распределения, построенная по второй выборке объема n, а Hm+n(x) - эмпирическая функция распределения, построенная по объединенной выборке объема m+n. Легко видеть, что

Hm+n(x) = m Fm(x) + ——Gn(x). m + n m + n

Ясно, что статистика А имеет вид (1). При этом х - действительное число, Х = У = Я1, в роли а выступает пара (т, п), и а^-да означает, что шт(т, п) ^ да. Далее,

,«Х,ю) = — Е (х) - С„ (X))2. т + п

Наконец, Еа(х,ю) = Нт+п(х).

Теперь обсудим асимптотическое поведение функций /а(х,ю) и Еа(х,ю), с помощью которых определяется статистика А. Ограничимся случаем, когда справедлива гипотеза однородности, функции распределения, соответствующие генеральным совокупностям, из которых взяты выборки, совпадают. Их общую функцию распределения обозначим Е(х). Она предполагается непрерывной.

Введем в рассмотрение выборочные процессы

4т (Х) = ^т (Ет (Х) - Е(х)) Лп (Х) = ^П (0п (Х) - Е(Х)) .

Нетрудно проверить, что

/а (X О) = [Л1 —— Хт (Х) -1~т-Л„ (Х)

Сделаем замену переменной г = Е(х). Тогда выборочные процессы переходят в соответствующие эмпирические процессы (см. [7, разд. П5]):

( I „ I ... Л2

/а( Е-1 (г ),о) =

пт

—Хт 0) -^^~Лп 0) т + п V т + п J

0 < г < 1.

Конечномерные распределения этого процесса, т.е. распределения случайных векторов

(/ (Е- (г1), О), /а (Е- (г2), О),..., /а (Е-1 (г,), О)) для всех возможных наборов (г1, г2, ... , г,), сходятся к конечномерным распределениям квадрата броуновского моста £ (г). В соответствии с [7, разд. П5] рассматриваемая сходимость по распределению обозначается так:

/а(Е-1(г,), о) ^ Хг(!), 0 < г < 1. (2)

Нетрудно видеть, что

Fa(x,ro) = Hm+n(x) ^ F(x) при а^да. С помощью замены переменной t = F(x) получаем, что

Fa(F'(t),<a) = Hm+n(F'(t)) ^ t (3)

при а^да. Из соотношений (2) и (3) хотелось бы сделать вывод, что в

случае статистики Лемана - Розенблатта типа омега-квадрат

1

4a= j fa (^ w)dFa (x,w) = A ^ jХ (t)dt ,

X 0

т.е. предельным распределением этой статистики является классическое распределение омега-квадрат [8], найденное как предельное для одновыборочной статистики критерия согласия омега-квадрат Крамера -Мизеса - Смирнова [1].

Действительно, сформулированное утверждение справедливо. Однако доказательство нетривиально.

Так, может показаться очевидным следующее утверждение. Утверждение 1. Пусть f [0; 1] ^ R1 - ограниченная функция, Gn(x) и G(x) - функции распределения, Gn(0) = G(0) =0, Gn(1) = G(1) = 1, причем

Gn(x) ^ G(x) при всех x. Тогда

1

lim j f (x)d (Gn(x) - G( x)) = 0. (4)

n®¥ J

0

Это утверждение неверно (ср. [9, с.42]). Действительно, пусть f(x) = 1, если х рационально, и fx) = 0, если x иррационально, G(x) =x, а Gn(x) имеет скачки величиной 2-n в точках m/2n, m = 1, 2, ... , 2n при всех n =1, 2,

... Тогда Gn(x) ^ G(x) при всех х, однако

11 jf (x)dGn (x) = 1, jf (x)dG(x) = 0

00

при всех n =1, 2, ... Следовательно, вопреки сформулированному выше утверждению 1,

1

/ / (х)Л (О, (х) - О( х)) = 1,

0

т.е. соотношение (4) неверно.

Итак, сформулируем проблему. Пусть известно, что последовательность случайных функций /а(х,ю) сходится по распределению при а^-да к случайной функции /(х,ю). Пусть последовательность случайных мер Еа(А,ю) сходится по распределению к вероятностной мере Е(А) при а^да. Если речь идет о конечномерном пространстве и меры задаются функциями распределения, то сходимость Еа(х,ю) к Е(х) должна иметь место во всех точках непрерывности Е(х). В каких случаях можно утверждать, что при а^-да справедлив предельный переход

Ха = Х( /а, Еа) = /а (Х,®)^ Х,О) Э { = Ц /, Е ) = /. / (Х,О)^ (X) ?

X X

Выше показано, что, например, ограниченности /а(х,ю) для этого недостаточно.

3. Метод аппроксимации ступенчатыми функциями

Пусть Т = (С1, С2, ... , С,} - разбиение пространства Х на непересекающиеся подмножества. Пусть в каждом элементе С, разбиения Т выделена точка х, у = 1, 2, ... , ,. На множестве функций/ X ^ У введем оператор АТ следующим образом: если хе Ср то

А/х) = /х,), у = 1, 2, . . ,. (5)

Тогда АТ/ - аппроксимация функции / ступенчатыми (кусочнопостоянными) функциями.

Пусть /а(х,ю) - последовательность случайных функций на Х, а К() -функционал на множестве всех возможных их траекторий как функций от х. Для изучения распределения К(/а) методом аппроксимации ступенчатыми функциями используют разложение

К(/а) = ЩА&) + {К/) - К(А/)}.

Согласно (5) распределение первого слагаемого в (6) определяется конечномерным распределением случайного элемента, а именно, распределением вектора

В обычных постановках предельной теории непараметрических критериев распределение вектора (7) сходится при а^-да к соответствующему конечномерному распределению предельной случайной функции _/х,ю), т.е. к распределению случайного вектора

В соответствии с теорией наследования сходимости (см. [7, разд. П3]) при слабых условиях на функционал К() из сходимости по распределению вектора (7) к вектору (8) следует сходимость по распределению К(АТ/а) к

можно устанавливать сходимость по распределению К(/а) к К(/) при а^-да в два этапа: сначала выбрать разбиение Т так, чтобы вторые слагаемые в правых частях соотношений (6) и (9) были малы, а затем при фиксированном операторе АТ воспользоваться сходимостью по распределению К(А/а) к К(А/).

Рассмотрим простой пример применения метода аппроксимации ступенчатыми функциями.

4. Обобщение теоремы Хелли

Пусть / [0; 1] ^ Я1 - измеримая функция, Еп(х) - функции распределений, сосредоточенных на отрезке [0; 1]. Пусть Еп(х) сходятся в основном к функции распределения Е(х), т.е.

(/а(Х1,Ю),/а(*2,Ю), ••• /а(ХъЮ)). (7)

(/(хью),/*2,ю), ••• /ХьЮ)).

(8)

К(Ат/).

для всех х, являющихся точками непрерывности F(x).

Утверждение 2. Если/(х) - непрерывная функция, то

11

ЙI/ (х')аРп (х) = I/ (х)йр (х) (11)

00

(рассматриваются интегралы Лебега-Стилтьеса).

Утверждение 2 известно в литературе как первая теорема Хелли [3, с.344-346], вторая теорема Хелли [10, с.174-175], лемма Хелли - Брея [11, с.193-194].

Естественно поставить вопрос: при каких / из (10) следует (11)? Необходимо ввести условия и на ¥п. Отметим, что если ¥п = ¥, то соотношение (11) верно для любой измеримой функции /, для которой интеграл в (11) существует. Поэтому рассмотрим следующую постановку.

Постановка 1. Пусть функция / такова, что для любой последовательности ¥п, удовлетворяющей (10), справедливо (11). Что можно сказать о функции /?

В работах [4, 5] найдены следующие необходимые и достаточные условия на функцию /.

Теорема 1. Пусть ограниченная на [0; 1] функция /интегрируема по Риману-Стилтьесу по функции распределения ¥(х). Тогда для любой последовательности функций распределения ¥п, сходящейся в основном к ¥, имеет место предельный переход (11).

Теорема 2. Пусть функция / не интегрируема по Риману-Стилтьесу по функции распределения ¥(х). Тогда существует последовательность функций распределения ¥п, сходящаяся в основном к ¥, для которой соотношение (11) не выполнено.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Теоремы 1 и 2 в совокупности дают необходимые и достаточные условия для / в постановке 1. А именно, необходимо и достаточно, чтобы ограниченная на [0; 1] функция / была интегрируема по Риману-Стилтьесу по ¥.

Напомним определение интегрируемости функции / по Риману-Стилтьесу по функции распределения ¥ согласно [3, с.341]. Рассмотрим разбиение Т = (С1, С2, ... , С к], где

С, = [У-1,у), , = 1, 2, ..., т - 1, Ст = [ут-1,Ут], (12)

0 = У0 < У1 < У2 <•••< Ут = 1.

Выберем в Сг произвольную точку хг, г = 1, 2, ., т, и составим сумму

т

5(Т) = ^ /(х, )[¥(у,) - ¥(у,_,)].

г=1

Если при тах(уг - у,.,) ^ 0 эти суммы стремятся к некоторому пределу (не зависящему ни от способа дробления отрезка [0; 1], ни от выбора точек х, в каждом из элементов разбиения), то этот предел называется интегралом Римана-Стилтьеса от функции / по функции ¥ по отрезку [0; 1] и обозначается символом, приведенным в правой части равенства (11). Рассмотрим суммы Дарбу-Стилтьеса

тт

(Т) = ^ т, [ ¥ (у,) - ¥ (у,-, )], (Т) = £ М, [ ¥ (у,) - ¥ (у,-,)],

,=1 ,=1

где

т, = (х) х е X, ] М, = Бир /{/(x), х е X, }.

Ясно, что

5н(Т) < ВД < 5в(Т).

Необходимым и достаточным условием интегрируемости по Риману-Стилтьесу является следующее: для любой последовательности разбиений Тк, к = 1, 2, 3, ... вида (12) такой, что тах(у, - уг-1) ^ 0 при к^-да, имеем

Ит[5в (Тк) - 5Я (Тк)] = 0. (13)

к

Напомним, что колебанием 5/, В) функции / на множестве В называется 5(/, В) = Бир{/(х) -/(у)|, хе В, уе В]. Поскольку

5(/, Сг) = М, - т,, то условие (13) можно записать в виде

lim £d(/,C)F(C) = 0. (14)

Условие (14), допускающее обобщение с Х = [0; 1] и / [0; 1] ^ Я на X и / более общего вида, и будем использовать при доказательстве теорем 1 и 2.

Доказательство теоремы 1. Согласно методу аппроксимации ступенчатыми функциями рассмотрим оператор АТ. Как легко проверить,

имеет место разложение

1 1

(15)

Ь = //(х)^ (х) -1/(Х)&(X) = /{/(х) - Лг/(х))<Ш, (X) +

0 0 0

+ |{Лг/(х) - /(Х))ЛР(х) + І |Лг/(Х)ЛРп (х) - |Лг/(Х)ЛР(х) [

0 10 0 }

Поскольку

|Дх) - Лг[(х)\ < 8# X) хє Сі, то первое слагаемое в правой части (15) не превосходит

(С), (16)

СєГ

а второе не превосходит

!*( /, С) Г (С).

СєГ

Согласно определению оператора АТ третье слагаемое в (15) имеет вид

т

I / (х,)(Г (С,) - Г (С,)).

,=1

Очевидно, оно не превосходит по модулю

зир|/(х)\!\Г„ (С) - Г (С )\

n '

СеТ

(здесь используется ограниченность / на X).

Согласно (16) первое слагаемое в правой части (15) не превосходит

£ 5(/, С )¥ (С) + £ в( /, С) | ¥п (С) - ¥ (С) |.

СеТ СеТ

Поскольку

3(/, С) < 2эир \ /(х)1,

хєХ

то первое слагаемое в правой части (15) не превосходит

к

2 5( /, С) ¥ (С) + 281ДР | / (х) 121 ¥ (С) - ¥ (С) |.

п '

СеТ

Из оценок, относящихся к трем слагаемым в разложении (15), следует, что

1А £22^(/,С)¥(С) + 3зир|/(х)|2|¥п(С)-¥(С)|. (17)

п

СеТ хеХ СеТ

Используя оценку (17), докажем, что вп ^ 0 при п ^ да. Пусть дано е > 0. Согласно условию интегрируемости функции / по Риману-Стилтьесу, т.е. условию (14), можно указать разбиение Т = Т(е) такое, что

2*(/,С)¥(С) <££, (18)

СеТ (£) 4

и в точках у, I = 1, 2, ..., т - 1 (см. (12)), функция ¥ непрерывна.

Поскольку

¥п(Хг) = ¥п(уг) - ¥п(у1Л),

то из (10) следует, что существует число п = п(е) такое, что при п > п(е) справедливо неравенство

2¥ (С) - ¥(СП<е( 8ир|/(х)|'] . (19)

СеТ(е) 6 Vхе^ У

Из (17), (18) и (19) следует, что при п > п(е) справедливо неравенство

1 1

11 (х^¥п (х) -11 (Х^¥ (х) < £ ,

0 0

что и требовалось доказать.

Обсудим условие ограниченности / Если оно не выполнено, то из (10) не всегда следует (11).

Пример 2. Пусть /(х) = 1/х при х > 0 и /(0)=0. Пусть ¥(0,5) = 0, т.е.

предельное распределение сосредоточено на [1/2; 1]. Пусть распределение

1/2

¥п на [0; S) имеет единственный атом в точке х = 1/п величиной п" , а на [1/2; 1] справедливо (10). Тогда по причинам, изложенным при

доказательстве теоремы 1,

1 1

Й 1У(Х)ёРп (Х) = I У (Х)ёР (Х) ,

1/2 1/2

однако

1/2 1/2 | у(Х)ЛРп ( х) = 4n, | у(х)ёР( х) = 0,

0 0

т.е. соотношение (11) не выполнено.

Условие ограниченности подынтегральной функции У можно заменить, как это сделано, например, в [4], на условие строгого

возрастания функции распределения К

Лемма. Пусть функции распределения ^ всюду строго возрастает, т.е. из х1 < х2 вытекает ¥(х1) < ^(х2). Пусть функция У интегрируема по Риману-Стилтьесу по ¥, т.е. выполнено (14). Тогда функцияУограничена.

Доказательство. Рассмотрим точки 0 = у0 < у < у2 <.. .< у2т = 1 и два разбиения

Т = ([°;У:),[У:;Уз),[Уз;У5),...,[У2m-l;1]}, Т2 ={[0;У2),[У2;уЛ[у4;Уб),...,[У2т-2;1]}. Тогда для любых двух точек х и х' можно указать конечную

последовательность точек х1 = х, х2, х3, ., х8, х+ = х' такую, что любые две

соседние точки хг, хг+1, г = 1, 2, ..., s, одновременно принадлежат

некоторому элементу Сг разбиения Т1 или разбиения Т2, причем Сг Ф С) при г Ф у. Действительно, пусть х е у;у^+1), х'е [уч;у9+1). Пусть для определенности q > р. Тогда можно положить х2 = ур+1, х3 = ур+2, ., х5 = yq. Поскольку среди элементов разбиений Т1 и Т2 есть С1 = [ур; ур+2), то Х е Х1 е Cl, Х2 = ур+1 е С1 . Дaлее, Х2 е [ Уp+l, ур+з) = C2, Хз е С2 , и тд.

Из указанных выше свойств последовательности х1 = х, х2, х3, ., х5, х5+1 = х' следует, что

| /(Х) - /(Х) |< 2 | У (Х,+1) - У ((Хг) | < 2 б(/, С) + 2 3(1, С) .

г=1 СеТ СеТ2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть теперь число тах(уг - уг-2) настолько мало, что согласно (14)

23(У,С)^(С) < 1, 23(У,с)р(С) < 1.

СеТх СеТ2

Тогда согласно двум последним соотношениям

| У(Х) - У (Х) |< 2[тт(Р(С): С е Т и Т2}]-1, что и доказывает лемму.

Доказательство теоремы 2. Пусть условие (14) не выполнено, т.е. существуют число у > 0 и последовательность разбиений Тп, п = 1, 2, ..., такие, что тах(уг - уг-1) ^ 0 при п^-да и при всех п

23(У, С) Р (С) >у. (20)

СеТп

Для доказательства теоремы построим две последовательности функций распределения Р1п и Р2п, п = 1, 2, ..., для которых выполнено (10), но последовательность

11

3п = I У(х)ари (Х) -1 У(х№„ (Х)

00

не стремится к 0 при п ^ да. Тогда (11) не выполнено хотя бы для одной из последовательностей Р1п и Р2п.

Для любого С - элемента некоторого разбиения Т - можно указать, как вытекает из определения 5(У С), точки х1(С) и х2(С) такие, что У(Х1(С)) -УХ2(С) > S 5(У С). (21)

Построим Р1п и Р2п следующим образом. Пусть Р1п(С) = Р2п(С) = Р(С) для любого С из Тп. При этом Р1п имеет в С один атом в точке х1(С) величиной Р(С), а Р2п имеет в С также один атом в точке х2(С) той же величины Р(С). Другими словами, распределение Р1п в С сосредоточено в одной точке, а именно, в х1(С), а распределение Р2п сосредоточено в х2(С). Тогда

3 = 2 (У (Х (С)) - У (Х2 (С)))Р(С). (22)

СеТп

Из (20), (21) и (22) следует, что

8п > 2 28(У ■ с )р (с ) >£.

2 СеТп 2

Остается показать, что для последовательностей функций распределения ¥1п и ¥2п выполнено (10). Пусть х - точка непрерывности ¥. Пусть

у(х, Т) = тах{уь: Уь < х}, у2(х, Т) = тш{ уы: уы > х}, где уы - точки, определяющие разбиения Тп согласно (12). В соответствии с определением ¥п

¥1п(у](х, Тп))= ¥(уу(х, Тп)), I = 1, 2,у = 1, 2,

а потому

|¥п(х) - ¥(х)| < ¥(У2(Х, Тп)) - ¥(У1(Х, Тп)), I = 1, 2.

В силу условия тах(укп - У(к-1)п) ^ 0 и непрерывности ¥ в точке х правая часть последнего соотношения стремится к 0 при п ^ да, что и заканчивает доказательство теоремы 2.

Теоремы 1 и 2 демонстрируют основные идеи предельной теории статистик интегрального типа и непараметрических критериев в целом. Как показывают эти теоремы, основную роль в рассматриваемой теории играет предельное соотношение (14). Отметим, что если 5(У Тп) ^ 0 при п ^ да, то (14) справедливо, но, вообще говоря, не наоборот. Естественно возникает еще ряд постановок. Пусть (14) выполнено для У1 и У2. При каких функциях к это соотношение выполнено для Н(х, У1(х), У2(х))? В прикладной статистике вместо У(х) рассматривают Уа(х, ю) и У(х, ю), а вместо интегрирования по функциям распределения ¥п(х) - интегрирование по случайным мерам ¥а(ю). Как меняются формулировки в связи с такой заменой? В связи со слабой сходимостью (т.е. сходимостью по распределению) АТУа к АТ и переходом от Уа(х, ю) к ка(х, У1а(х, ю), У2а(х, ю)) возникает следующая постановка. Пусть последовательность случайных элементов ка слабо сходится к случайному элементу к при а^да. Когда распределения случайных элементов ga(ка) сближаются с распределениями

случайных элементов gа(к)? Полным ответом на последний вопрос являются необходимые и достаточные условия наследования сходимости. Они приведены в [7, разд.ПЗ].

5. Основные результаты о статистиках интегрального типа

Наиболее общая теорема типа теоремы 1 выглядит так [5].

Теорема 3. Пусть существует последовательность разбиений Тп, п = 1, 2, ., такая, что при п ^да и а^-да

Л(Л,Тп) = 2ад,,С)¥(С) ® 0. (23)

СеТп

Пусть для любого С, входящего хотя бы в одно из разбиений Тп,

¥а(С, ю) ^ ¥(С) (24)

при а^да (сходимость по вероятности). Пусть Уа асимптотически ограничены по вероятности при а^да. Тогда

У ¥а)-У ¥) ® 0 (25)

при а^да (сходимость по вероятности).

Как известно, полное сепарабельное метрическое пространство называется польским. Это понятие понадобится для формулировки аналога теоремы 2.

Теорема 4. Пусть Х - польское пространство, У конечномерно, существует измельчающаяся последовательность Тп разбиений, для которой соотношение (23) не выполнено. Тогда существует удовлетворяющая (24) последовательность ¥а, для которой соотношение (25) неверно, хотя ¥а слабо сходится к ¥ при а^да.

Условие (23) естественно назвать условием римановости, поскольку в случае, рассмотренном в теореме 1, оно является условием интегрируемости по Риману-Стилтьесу. Рассмотрим наследуемость римановости при переходе от У1а(х, ю) со значениями в У1 и У2а(х, ю) со

значениями в У2, удовлетворяющих (23), к ha(x, f1a(x, ю), f2a(x, ю)) со значениями в У3.

Положим

Yk (a,e) = {^ у) : y е Yk, ye Yk ,|| y || к < a,\\y' ||< a,|| у - у' ||< e}, к = ^ где ||^ ||к - норма (т.е. длина вектора) в пространстве Yk, к = 1, 2. Рассмотрим также множества

А(С, а,е) ={(x, x/, y 1, y*, y2, y*): x, х е C, (yk, y*) е Yk(a, е\ к =1,2}

и функции

Ча (x, x/, y1, y*, y 2, y * ) = ha (x, Уl, y 2) - ha (x/, y*, у * ).

Наконец, понадобится измеритель колеблемости

C(ha,T, а,£) = ^ SUp W qa W3 F(С)

CeTA(C ,а,е)

и множество

Z(а) = Xx{y :Wy 1 W<а}х{y2 :Wy2 w<а}.

Теорема 5. Пусть ha асимптотически (при a—да) ограничены на Z(a) при любом положительном а, функции f1a и f2a асимптотически ограничены по вероятности и удовлетворяют условию (23). Пусть для участвующей в (23) последовательности Tn

c(ha, Tn, а, е) — 0 (26)

при a—да, n—да, е—— 0 и любом положительном а. Тогда f3a(x, ю) = ha(x, f1a(x, ю), f2a(x, ю)) удовлетворяют условию (23) и асимптотически ограничены по вероятности.

Теорема 6. Пусть условие (26) не выполнено для ha. Тогда существуют детерминированные ограниченные функции f1a и f2a такие, что соотношение (23) выполнено дляf1a и f2a и не выполнено для f3a.

Пример 3. Пусть X = [0; 1]к, пространства Y1 и Y2 конечномерны, функция ha = h(x, y1, y2) непрерывна. Тогда условие (26) выполнено.

С помощью теорем 3 и 5 и результатов о наследовании сходимости можно изучить асимптотическое поведение статистик интегрального типа

xa= j ha (X,f1a (x WX f2a (X w))Fa № w)

X

со значениями в банаховом пространстве У.

Теорема 7. Пусть для некоторой последовательности Tn разбиений Х справедливы соотношения (23) для f1a и f2a и (24) для Fa. Пусть последовательность функций ha удовлетворяет условию в теореме 5, конечномерные распределения (f1a(x, ю), f2a(x, ю)) слабо сходятся к конечномерным распределениям (f1(x, ю), f2(x, ю)), причем для f1 и f2 справедливо соотношение (23). Тогда

lim ЩаЯа) = ^

где L - расстояние Прохорова (см. [7, разд. П.3]),

ha= j ha (x,f1 (X, W), f 2 (X, W))F(dx) .

X

Теорема 7 дает общий метод получения асимптотических распределений статистик интегрального типа. Важно, что соотношение (23) выполнено для эмпирического процесса и для процессов, связанных с оцениванием параметров при проверке согласия [1, 4].

Один из выводов общей теории состоит в том, что в качестве Fa можно использовать практически любую состоятельную оценку истинной функции распределения. Этот вывод использовался при построении критерия типа омега-квадрат для проверки симметрии распределения относительно 0 и обнаружения различий в связанных выборках [12, 13]).

6. Критерии типа Колмогорова - Смирнова

Асимптотическое поведение критериев типа Колмогорова -Смирнова (их называют также критериями супремумного типа) может быть получено с помощью описанного выше метода аппроксимации ступенчатыми функциями. Этот метод не требует обращения к теории сходимости вероятностных мер в функциональных пространствах [14].

Для критериев Колмогорова и Смирнова достаточно использовать лишь свойства эмпирического процесса и броуновского моста. В случае проверки согласия с помощью критерия типа Колмогорова - Смирнова [1] добавляется необходимость изучения еще одного случайного процесса. Он является разностью между двумя функциями распределения. Одна -(теоретическая) функция распределения элементов выборки. Вторая - член параметрического семейства распределений, полученный путем подстановки оценок параметров вместо их истинных значений.

7. Выводы

Итак, асимптотическое поведение статистик интегрального и супремумного типов может быть изучено с помощью полученных в настоящей статье результатов, основанных на методе аппроксимации ступенчатыми функциями. Предельные распределения практически используемых статистик рассматриваемых типов находят как распределения функционалов от соответствующих случайных процессов (в частности, броуновских процессов, броуновских мостов). Для статистик типа омега-квадрат математических аппарат расчета предельных распределений развит в [9]. Важно, что настоящая статья дает полное обоснование эвристическому подходу Дуба к получению предельных теорем и показывает тем самым, что для изучения асимптотики практически используемых статистик интегрального и супремумного типов (т.е. статистик типов Колмогорова - Смирнова и омега-квадрат) нет необходимости привлекать теорию сходимости вероятностных мер в функциональных пространствах.

В нескольких постановках найдены необходимые и достаточные условия. Это означает, что полученные результаты являются окончательными.

Литература

1. Орлов А.И. Непараметрические критерии согласия Колмогорова, Смирнова, омега-квадрат и ошибки при их применении / А.И. Орлов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. - №03(097). С. 647 - 675. - IDA [article ID]: 0971403047. - Режим доступа: http://ej.kubagro.ru/2014/03/pdf/47.pdf

2. Келли Дж. Общая топология. М.: Наука, 1968. 384 с.

3. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1972. 496 с.

4. Орлов А. И. Асимптотическое поведение статистик интегрального типа // Доклады АН СССР. 1974. Т.219. № 4. С. 808-811.

5. Орлов А. И. Асимптотическое поведение статистик интегрального типа // Вероятностные процессы и их приложения. Межвузовский сборник научных трудов. М.: МИЭМ, 1989. С.118-123.

6. Орлов А.И. Организационно-экономическое моделирование : учебник : в 3 ч. Ч.3. Статистические методы анализа данных. М.: Изд-во МГТУ им. Н.Э. Баумана, 2012. 624 с.

7. Орлов А.И. Организационно-экономическое моделирование : учебник : в 3 ч. Ч. 1. Нечисловая статистика. М.: Изд-во МГТУ им. Н.Э. Баумана, 2009. 541 с.

8. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983. 416 с.

9. Мартынов Г.В. Критерии омега-квадрат. М.: Наука, 1978. 80 с.

10. Гнеденко Б.В. Курс теории вероятностей: 7-е изд., исправл. М.: Эдиториал УРСС, 2001. 320 с.

11. Лоэв М. Теория вероятностей. М.: ИЛ, 1962. 720 с.

12. Орлов А.И. О проверке симметрии распределения // Теория вероятностей и ее применения. 1972. Т.17. № 2. С.372-377.

13. Орлов А. И. Методы проверки однородности связанных выборок // Заводская лаборатория. Диагностика материалов. 2004. Т.70. № 7. С.57-61.

14. Биллингсли П. Сходимость вероятностных мер. М.: Наука, 1977. 352 с.

References

1. Orlov A.I. Neparametricheskie kriterii soglasija Kolmogorova, Smirnova, omega-kvadrat i oshibki pri ih primenenii / A.I. Orlov // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. - №03(097). S. 647 - 675. -IDA [article ID]: 0971403047. - Rezhim dostupa: http://ej.kubagro.ru/2014/03/pdf/47.pdf

2. Kelli Dzh. Obshhaja topologija. M.: Nauka, 1968. 384 s.

3. Kolmogorov A.N., Fomin S.V. Jelementy teorii funkcij i funkcional'nogo analiza. M.: Nauka, 1972. 496 s.

4. Orlov A.I. Asimptoticheskoe povedenie statistik integral'nogo tipa // Doklady

AN SSSR. 1974. T.219. № 4. S. 808-811.

5. Orlov A.I. Asimptoticheskoe povedenie statistik integral'nogo tipa // Verojatnostnye processy i ih prilozhenija. Mezhvuzovskij sbornik nauchnyh trudov. M.: MIJeM, 1989. S.118-123.

6. Orlov A.I. Organizacionno-jekonomicheskoe modelirovanie : uchebnik : v 3 ch. Ch.3. Statisticheskie metody analiza dannyh. M.: Izd-vo MGTU im. N.Je. Baumana, 2012. 624 s.

7. Orlov A.I. Organizacionno-jekonomicheskoe modelirovanie : uchebnik : v 3 ch. Ch. 1. Nechislovaja statistika. M.: Izd-vo MGTU im. N.Je. Baumana, 2009. 541 s.

8. Bol'shev L.N., Smirnov N.V. Tablicy matematicheskoj statistiki. M.: Nauka, 1983. 416 s.

9. Martynov G.V. Kriterii omega-kvadrat. M.: Nauka, 1978. 80 s.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

10. Gnedenko B.V. Kurs teorii verojatnostej: 7-e izd., ispravl. M.: Jeditorial URSS, 2001. 320 s.

11. Lojev M. Teorija verojatnostej. M.: IL, 1962. 720 s.

12. Orlov A.I. O proverke simmetrii raspredelenija // Teorija verojatnostej i ee

primenenija. 1972. T.17. № 2. S.372-377.

13. Orlov A.I. Metody proverki odnorodnosti svjazannyh vyborok // Zavodskaja laboratorija. Diagnostika materialov. 2004. T.70. № 7. S.57-61.

14. Billingsli P. Shodimost' verojatnostnyh mer. M.: Nauka, 1977. 352 s.

i Надоели баннеры? Вы всегда можете отключить рекламу.