Научная статья на тему 'О применении критериев проверки однородности законов распределения'

О применении критериев проверки однородности законов распределения Текст научной статьи по специальности «Математика»

CC BY
1106
135
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
КРИТЕРИИ ОДНОРОДНОСТИ / КРИТЕРИЙ СМИРНОВА / КРИТЕРИЙ ЛЕМАНА-РОЗЕНБЛАТТА / КРИТЕРИЙ АНДЕРСОНА-ДАРЛИНГА / МОЩНОСТЬ КРИТЕРИЯ / HOMOGENEITY TESTS / SMIRNOV TEST / LEHMANN-ROSENBLATT TEST / ANDERSON-DARLING TEST / POWER OF TEST

Аннотация научной статьи по математике, автор научной работы — Лемешко Борис Юрьевич, Лемешко Станислав Борисович, Веретельникова Ирина Викторовна

Проведен сравнительный анализ мощности критериев однородности законов распределения вероятностей (критериев Смирнова, Лемана-Розенблатта, Андерсона-Дарлинга). Построены модели предельных распределений статистик для -выборочного критерия Андерсона-Дарлинга. Даются рекомендации по применению критериев.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Лемешко Борис Юрьевич, Лемешко Станислав Борисович, Веретельникова Ирина Викторовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Application of criteria for testing homogeneity of distribution laws

The necessity of general homogeneity hypothesis checking, i.e. whether two (or more) samples of random variables belong to the same general aggregate, arises constantly in the course of analysis of unbiased errors of measuring instruments. Such task arises naturally in the course of measuring instruments calibration and when comparing lab tests results. Technologists, medical researchers and biologists also face the same task when processing results of experimental research. The present paper deals with the Smirnov, the Lehmann-Rosenblatt and the Anderson-Darling two-samples homogeneity tests; statistics for these tests is given; advantages and disadvantages of the tests are discussed. As a drawback of the Smirnov test we may mention a substantial discreteness of statistics distribution which must be taken into account when having significant values of n and equal number of m and n samples. This drawback can be overcome if we choose mutually prime integers as m and n. But even when this drawback has been remedied the real statistics distribution still differs substantially from the Kolmogorov limit distribution as the checked hypothesis is true. Hence when using the latter for evaluation of the significance level (pvalue) incorrect conclusions can be reached. One can avoid this only by modifying the test statistics. As opposed to the Smirnov test, the Lehmann-Rosenblatt and the Anderson-Darling statistics distribution homogeneity tests do not actually differ from their limit distributions when having samples values of m,n > 25. Comparative analysis of tests powers under discussion, conducted with the help of statistic modeling methods, showed that, as a rule, the Anderson-Darling test boasts of bigger power than the Lehmann-Rosenblatt test, especially in case of differences of samples in their measure of dispersion. At the same time, when having rather similar yet competing hypothesis and smaller number of samples, the Lehmann-Rosenblatt test can show advantage in power. The Smirnov test yields to the Lehmann-Rosenblatt and the Anderson-Darling competing tests, but in certain cases it can be quite competitive. Previously, information on distribution of statistics for к-sample Anderson-Darling homogeneity test has been available only within a limited table of critical limits. In the present case the study of statistics distribution through statistic modeling methods with actual к values showed the presence of corresponding limit distributions. Results of such modeling showed that when using this test we can disregard the difference between the statistics distributions and the corresponding limit values while the number of samples nt > 30. Based on the results of statistics modeling, approximate models for limit distributions of the Anderson-Darling k-samples test for к = 2 +11. This paper shows the models created, represented by the laws of beta-distributions of the IlIrd with particular parameter values. Such models produced with the help of the Anderson-Darling к-sample test enable finding the values of pvalue, thus making the results of statistics conclusions more informative and more substantiated. The possibility of using the Z hang к-sample homogeneity test with statistics of ZK, ZC and ZA is discussed, these being the extension of the Smirnov, the Lehmann-Rosenblatt and the Anderson-Darling test, respectively. The Zhang tests have some advantages in power with reference to the scale alternatives, but they somewhat yield to the Smirnov, the Lehmann-Rosenblatt and the Anderson-Darling tests with reference to the shift alternatives.

Текст научной работы на тему «О применении критериев проверки однородности законов распределения»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2017 Управление, вычислительная техника и информатика № 41

УДК 519.24

DOI: 10.17223/19988605/41/3

Б.Ю. Лемешко, С.Б. Лемешко, И.В. Веретельникова О ПРИМЕНЕНИИ КРИТЕРИЕВ ПРОВЕРКИ ОДНОРОДНОСТИ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ

Работа выполнена при поддержке Министерства образования и науки РФ в рамках государственной работы «Обеспечение проведения научных исследований» (№ 1.4574.2017/6.7) и проектной части государственного задания

(№ 1.1009.2017/4.6).

Проведен сравнительный анализ мощности критериев однородности законов распределения вероятностей (критериев Смирнова, Лемана-Розенблатта, Андерсона-Дарлинга). Построены модели предельных распределений статистик для ¿-выборочного критерия Андерсона-Дарлинга. Даются рекомендации по применению критериев. Ключевые слова: критерии однородности; критерий Смирнова; критерий Лемана-Розенблатта; критерий Андерсона-Дарлинга; мощность критерия.

С необходимостью решения задач проверки гипотез о принадлежности двух (или более) выборок случайных величин одной и той же генеральной совокупности (проверки однородности) постоянно сталкиваются при анализе случайных ошибок средств измерений, при статистическом управлении качеством процессов. Такая задача естественно возникает при поверке средств измерений, когда пытаются убедиться в том, что закон распределения случайных ошибок измерений не претерпел существенных изменений по истечении некоторого интервала времени. При обработке результатов экспериментальных исследований такую задачу часто приходится решать технологам, медикам, биологам.

Задача проверки однородности двух выборок формулируется следующим образом. Пусть имеются две упорядоченные по возрастанию выборки размером m и n:

x1 < x2 < ... < Xm и У1 < У2 < ... < Уп . Для определенности обычно полагают, что m < n, но это совсем необязательно. Проверяется гипотеза о том, что две выборки извлечены из одной и той же генеральной совокупности, т.е. H0 : F(x) = G(x) при любом x.

Как правило, на практике используется либо критерий Смирнова [1], либо критерий Лемана-Розенблатта [1-3]. В русскоязычной литературе практически не упоминается о применении критерия однородности Андерсона-Дарлинга [4] (Андерсона-Дарлинга-Петита) или, тем более, об использовании многовыборочного варианта этого критерия [5].

Настоящая статья является развитием работы [6], в которой были исследованы реальные свойства распределений статистик и мощности критериев Смирнова и Лемана-Розенблатта при ограниченных объемах выборок. В данном случае исследования дополнены анализом критериев Андерсона-Дарлинга и развитием его многовыборочного варианта. При проведении исследований использовалась методика компьютерного моделирования и исследования статистических закономерностей [7], хорошо зарекомендовавшая себя при сравнительном анализе критериев, ориентированных на проверку гипотез определённого вида [8-10].

1. Критерий Смирнова

Критерий однородности Смирнова предложен в работе [11]. Предполагается, что функции распределения F (x) и G( x) являются непрерывными. Статистика критерия Смирнова измеряет расстояние между эмпирическими функциями распределения, построенными по выборкам

Dm,n = SUP |Gm (x) - Fn (x^ .

x

При практическом использовании критерия значение статистики Dm n рекомендуется вычислять в соответствии с соотношениями [1]:

Кт ,п = таХ 1<г <т

Кт ,п = тах

1<г <т

--Рп (хг )

т

= тах

1<з< п

Ст (Уз ) "

5 - 1

Рп (хг ) -

Г - 1

т

" з

= тах --^ (Уз )

1<3 <п _ п _

Кт,п = таХ (К,п, Кт,п ) •

Для объёмов выборок т, п < 20 таблицы процентных точек для статистики От п приводятся в [1]. Если гипотеза Н0 справедлива, то при неограниченном увеличении объемов выборок статистика

' тп

~ (1)

Бс =

К

т + п

в пределе подчиняется распределению Колмогорова К (Б) [1].

Недостатки критерия Смирнова заключаются в следующем. Во-первых, при ограниченных значениях т и п случайные величины К п и От п являются дискретными, и множество их возможных значений представляет собой решетку с шагом 1/ к, где к - наименьшее общее, кратное т и п [1]. Гладкость распределения статистики зависит от величины к . Поэтому предпочтительнее применять критерий, когда объемы выборок т и п не равны и представляют собой взаимно простые числа. При равных объёмах выборок явная ступенчатость G (БС |Н0 ) сохраняется даже при т = п = 1000 .

Другим недостатком применения критерия со статистикой (1) является то, что распределения G (5С |Н0 ) с ростом т и п приближаются к предельному распределению К(з) слева. И при небольших

и умеренных значениях т и п распределения G (БС |Н 0 ) существенно сдвинуто влево от К (Б). В этой связи в [6] предложена простая модификация статистики (1).

2. Критерий Лемана-Розенблатта

Критерий однородности Лемана-Розенблатта представляет собой критерий типа ю2. Критерий предложен в работе [2] и исследован в [3]. Статистика критерия имеет вид [1]:

тп 2

Т =-I [(х)-^(х)]2ёНт+п(х),

т + п

где Нт+п (х) =-

т п

-От (х) +--¥п (х) - эмпирическая функция распределения, построенная по вариа-

т + п т + п

ционному ряду объединения двух выборок. Статистика Т используется в форме [Там же]:

Т = -

1

тп(т + п)

п

т

,\2

п £(г- - г) + т - ] )

1=1 г=1

4тп -1 6(т + п)

(2)

где г - порядковый номер (ранг) уг; Sj - порядковый номер (ранг) х^ в объединенном вариационном ряде.

В [3] было показано, что статистика (2) в пределе распределена как а1(^) [1]. В отличие от критерия Смирнова распределение статистики Т быстро сходится к предельному а1(Т) [Там же]. При т = п = 100 распределение G (Т|Н0 ) статистики (2) практически совпадает с а1(Т). При т, п < 25 желательно учитывать отклонение реального распределения G (Т|Н0 ) статистики (2) от а1(Т).

3. Критерий Андерсона-Дарлинга

Двухвыборочный критерий Андерсона-Дарлинга (критерий однородности) рассмотрен в работе [4]. Статистика критерия определяется выражением

А2 _ тп \(>т (X) - Р„ (X)]2 (

" , -1 Л и / ии ТТиГ'т+пУл> ■ т + п (1 - Нт+п (х))Нт+п (Х)

Для выборок непрерывных случайных величин выражение для этой статистики принимает простой вид [4]:

2 1 т+п 1 (М,(т + п) - т7)2

А2 _— X ^-—-1-, (3)

тп ,_1 ,(т + п -,)

где М1 - число элементов первой выборки, меньших или равных 7-му элементу вариационного ряда объединенной выборки.

Предельным распределением статистики (3) при справедливости проверяемой гипотезы Н 0 является то же самое распределение а2(^) [4], которое является предельным для статистики критерия согласия Андерсона-Дарлинга [1].

Вопросы мощности критерия рассматривались в [4, 12], мощность критерия исследовалась в [13].

Сходимость распределения G(А2 |Н01 статистики (7) к а2(А2) при ограниченных объёмах выборок была исследована в [13], где было показано, что при т, п > 45 отклонение функции распределения G(А2 |Н01 от а2(А2) не превышает 0,01. При т _ п _ 100 распределение G(А2 |Н0 ) статистики (7) практически совпадает с а2(А2).

4. Анализ мощности двухвыборочных критериев

Мощность критериев проверки однородности исследовалась в случае различных альтернатив. В данном случае (для определенности) проверяемой гипотезе Н0 соответствовала принадлежность выборок одному и тому же стандартному нормальному закону распределения с плотностью

/(X) ' ехр! (х-е»)21

/-1 о (

01>/2я [ 292 } и параметрами сдвига 90 _ 0 и масштаба 0Х _ 1.

При всех альтернативах первая выборка всегда соответствовала стандартному нормальному закону, а вторая - некоторому другому.

При альтернативе сдвига и конкурирующей гипотезе Н1 вторая выборка соответствовала нормальному закону с параметром сдвига 90 _ 0,1 и параметром масштаба 0Х _ 1.

При изменении масштаба и конкурирующей гипотезе Н2 вторая выборка соответствовала нормальному закону с параметрами 90 _ 0 и 0Х _ 1,1.

В случае конкурирующей гипотезы Н3 вторая выборка соответствовала логистическому закону с плотностью

1 I к(х-00) /(X) _—7= ехР^ 0

1 + ехр < -

я( х -00)

01л/3

01Л/3 [ 01Л/3 ]

и параметрами 00 _ 0 и 0Х _ 1. Нормальный и логистический законы очень близки и трудноразличимы с помощью критериев согласия.

Поскольку при ограниченных объемах выборок распределения статистик критериев существенно отличаются от предельных, оценки мощности находились по результатам моделирования распределений статистик при справедливости проверяемой Н0 и конкурирующих гипотез Н1, 7 _ 1,3 , при конкретных объемах выборок п. Количество экспериментов имитационного моделирования в каждом случае составило величину N _ 10б. Некоторые оценки мощности критериев Смирнова (С), Лема-на-Розенблатта (ЛР), Андерсона-Дарлинга (АД) при заданных уровнях значимости а_ 0,1 и различных объемах выборок представлены в табл. 1.

Оценки мощности критериев однородности относительно альтернатив Н1 - Н3 в зависимости от объемов выборок ( т = п , а = 0,1)

Таблица 1

Критерий п = 20 п = 50 п = 100 п = 300 п = 500 п = 1000 п = 2000

Относительно альтернативы Н1

АД 0,114 0,137 0,175 0,319 0,447 0,691 0,919

ЛР 0,115 0,136 0,173 0,313 0,438 0,678 0,910

С 0,111 0,132 0,164 0,280 0,381 0,617 0,869

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Относительно альтернативы Н 2

АД 0,104 0,112 0,128 0,202 0,290 0,528 0,861

ЛР 0,103 0,107 0,114 0,149 0,191 0,324 0,624

С 0,105 0,108 0,120 0,150 0,186 0,297 0,551

Относительно альтернативы Н3

АД 0,103 0,108 0,117 0,156 0,203 0,343 0,640

С 0,104 0,110 0,121 0,159 0,198 0,319 0,564

ЛР 0,103 0,106 0,113 0,142 0,178 0,288 0,547

Критерий Андерсона-Дарлинга, как правило, обладает несколько большей мощностью, чем критерий Лемана-Розенблатта, особенно в случае отличия анализируемых выборок в характеристиках рассеяния. В то же время эксперименты показали, что относительно (очень) близких конкурирующих гипотез при малых объемах выборок преимущество в мощности может быть за критерием Лемана-Розенблатта. Критерий Смирнова заметно уступает в мощности критериям Лемана-Розенблатта и Андерсона-Дарлинга. В то же время следует обратить внимание на неплохие показатели критерия Смирнова относительно гипотезы Н3.

5. Многовыборочный критерий Андерсона-Дарлинга

Вопросы построения ^-выборочных критериев однородности законов, являющихся аналогами критериев однородности Смирнова и Лемана-Розенблатта, рассматривались в работе [14]. Однако нам не известно о соответствующих результатах построения, которые можно было бы рекомендовать к применению.

Задача проверки однородности k выборок формулируется следующим образом. Пусть xij - ]-е

наблюдение »-й выборки ] = 1,, i = 1,к . Предположим, что »-й выборке соответствует непрерывная функция распределения ^(х). Необходимо проверить гипотезу вида Н0 : х) = х) =... = Гк(х) без указания общего для них закона распределения.

Многовыборочный вариант критерия однородности Андерсона-Дарлинга предложен в [5]. Обозначим эмпирическую функцию распределения, соответствующую »-й выборке, как (х), а эмпирик

ческую функцию распределения, соответствующую объединенной выборке объемом п = 2 п1, - как

i=1

Нп (х). Статистика к-выборочного критерия Андерсона-Дарлинга определяется выражением

к [(х) - Нп (х)]2 Акп = 2 п I Н ( )Н ( ) dHn (х), (4)

»=1 Бп I1 - Нп (х))Н (х)

где Бп = {х е Я: Нп (х) < 1}. Для к = 2 соотношение (4) сводится к (3). В предположении о непрерывности (х), упорядочив объединенную выборку 21 < 2г < ... < 2п , непосредственно из (4) можно получить простое выражение для вычисления статистики

2 1 к 1 п-1 [пЫи - ]п» Н

А2п =12-2 1 ( , (5)

п »=1 п»у =1 ] (п - ] )

где М9 - число элементов в ,-й выборке, которые не больше, чем 2 ^. Проверяемая гипотеза Н0

отклоняется при больших значениях статистики (5).

В работе [5] таблица верхних процентных точек представлена не для статистики (5), а для статистики вида

Tkn -'

An " (k " 1)

Vd[An ] '

(6)

Дисперсия статистики A/tn определяется выражением [5]:

an3 + bn2 + cn + d

D

[ А- ] =

(n - 1)(n - 2)(n - 3)

при

где

a - (4g - 6)(k -1) + (10 - 6g)H , b - (2g - 4)k2 + 8hk + (2g - 14h - 4)H - 8h + 4g - 6, c - (6h + 2g - 2)k2 + (4h - 4g + 6)k + (2h - 6)H + 4h , d - (2h + 6)k2 - 4hk,

к 1 и-11 п-2 и-1 1

Н = Е-, Ь = Е-, £ = Е Е -——.

,=1 г=1 г ,=1 у=,+1 (п - г) ]

Зависимость предельных распределений статистики (6) от числа сравниваемых выборок к иллюстрирует рис. 1. С ростом числа сравниваемых выборок это распределение медленно сходится к стандартному нормальному закону. Исследование распределений статистик методами статистического моделирования при конкретных к показало наличие соответствующих предельных распределений. Результаты моделирования выявили, что при использовании критерия отличием распределений статистик от соответствующих предельных можно пренебречь при объемах анализируемых выборок п, > 30 .

1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10

0,00

к = 2

к = 3

к = 5 у

Ш/ к = 9

Стандарта нор малый закон 1ЫЙ

зШ

- - /

т 2

-3,00

-2,00

-1,00

0,00

1,00

2,00

3,00

Рис. 1. Зависимость предельных распределений статистики (6) от числа сравниваемых выборок

Верхние критические значения предельных распределений для статистики (6), полученные методами статистического моделирования (при ni -1000 и числе экспериментов имитационного

моделирования N -106), уточняющие и расширяющие таблицу, приведенную в [5], представлены в [15]. В то же время для числа сравниваемых выборок k - 2 11 нами были построены приближенные модели предельных распределений статистики (6). Хорошими моделями оказались законы семейства бета-распределений III рода с плотностью

f ( x) =

6e°

x-e

V»-v

x-e

yi-

esB(eo, ei)

i+(e2 -1) ^ e

e»+ei

при конкретных значениях параметров этого закона, найденных по полученным в результате моделирования выборкам статистик. Представленные в табл. 2 модели Вш(90,9Ь 92, 93, 94) с приведенными значениями параметров позволяют по значениям статистики, вычисленным по соотношению (6), находить оценки достигнутого уровня значимости руа[ие при соответствующем числе к сравниваемых выборок.

Таблица 2

Модели предельных распределений статистики

к Модель

2 В,,, (3,1575; 2,8730; 18,1238; 15,0000; -1,1600)

3 В,,, (3,5907; 4,5984; 7,8040; 14,1310; -1,5000)

4 В,,, (4,2657; 5,7035; 5,3533; 12,8243; -1,7500)

5 В,,, (6,2992; 6,5558; 5,6833; 13,010; -2,0640)

6 В,,, (6,7446; 7,1047; 5,0450; 12,8562; -2,2000)

7 В,,, (6,7615; 7,4823; 4,0083; 11,800; -2,3150)

8 Вш (5,8057; 7,8755; 2,9244; 10,900; -2,3100)

9 Вш (9,0736; 7,4112; 4,1072; 10,800; -2,6310)

10 Вш (10,2571; 7,9758; 4,1383; 11,186; -2,7988)

11 Вш (10,6848; 7,5950; 4,2041; 10,734; -2,8400)

œ N(0,0; 1,0)

В табл. 3 приведены оценки мощности к-выборочного критерия Андерсона-Дарлинга при к = 4 относительно H1, H2 и H3, когда только одна из к выборок принадлежала конкурирующему закону. При к = 2 критерий со статистикой (6) эквивалентен по мощности двухвыборочному критерию Андерсона-Дарлинга со статистикой (3).

Естественно, что с ростом количества сравниваемых выборок тех же объемов мощность критерия относительно аналогичных конкурирующих гипотез снижается.

Таблица 3

Оценки мощности к-выборочного критерия однородности Андерсона-Дарлинга относительно альтернатив H1 и H3 в зависимости от объемов выборок ( к = 4, щ = n )

Уровень значимости а n = 20 n = 50 n = 100 n = 300 n = 500 n = 1000

Относительно альтернативы H,

0,1 0,112 0,131 0,164 0,301 0,433 0,701

Относительно альтернативы H 2

0,1 0,104 0,110 0,123 0,180 0,254 0,474

Относительно альтернативы H3

0,1 0,102 0,106 0,113 0,143 0,179 0,291

Заключение

Построенные в данной работе модели предельных распределений статистики (6) при использовании к-выборочного критерия однородности Андерсона-Дарлинга для анализа к сравниваемых выборок ( к = 2 11) дают возможность находить оценки pva[ue, что, несомненно, делает результаты статистических выводов более информативными и более обоснованными.

Необходимо упомянуть о критериях однородности Жанга [16, 17], которые дают возможность анализировать к > 2 выборок. Три критерия Жанга со статистиками ZK , ZC и ZA являются развитием, соответственно, критериев однородности Смирнова, Лемана-Розенблатта и Андерсона-Дарлинга. Предварительные исследования показали, что критерии однородности Жанга имеют некоторое преимущество в мощности по отношению к альтернативам масштаба, но несколько уступают рассмотренным критериям Смирнова, Лемана-Розенблатта и Андерсона-Дарлинга по отношению к альтернативам сдвига. Недостатком критериев Жанга, затрудняющим их применение в приложениях, является зависимость распределений статистик от объемов выборок. Однако при современном уровне развития информационных технологий такой недостаток уже не является критичным [15].

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ЛИТЕРАТУРА

1. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М. : Наука, 1983.

2. Lehmann E.L. Consistency and unbiasedness of certain nonparametric tests // Ann. Math. Statist. 1951. V. 22, No. 1. P. 165-179.

3. Rosenblatt M. Limit theorems associated with variants of the von Mises statistic // Ann. Math. Statist. 1952. V. 23. P. 617-623.

4. Pettitt A.N. A two-sample Anderson-Darling rank statistic // Biometrika. 1976. V. 63, No. 1. P. 161-168.

5. Scholz F.W., Stephens M.A. K-Sample Anderson-Darling Tests // Journal of the American Statistical Association. 1987. V. 82, No. 399. P. 918-924.

6. Лемешко Б.Ю., Лемешко С.Б. О сходимости распределений статистик и мощности критериев однородности Смирнова и

Лемана-Розенблатта // Измерительная техника. 2005. № 12. С. 9-14.

7. Лемешко Б.Ю., Лемешко С.Б., Постовалов С.Н., Чимитова Е.В. Статистический анализ данных, моделирование и исследова-

ние вероятностных закономерностей. Компьютерный подход. Новосибирск : Изд-во НГТУ, 2011.

8. Лемешко Б.Ю. Непараметрические критерии согласия. Руководство по применению. М. : ИНФРА-М, 2014. DOL 10.12737/11873.

9. Лемешко Б.Ю. Критерии проверки отклонения распределения от нормального закона. Руководство по применению. М. :

ИНФРА-М, 2015. DOL 10.12737/6086.

10. Лемешко Б.Ю., Блинов П.Ю. Критерии проверки отклонения распределения от равномерного закона. Руководство по применению. М. : ИНФРА-М, 2015. DOL 10.12737/11304.

11. Смирнов Н.В. Оценка расхождения между эмпирическими кривыми распределения в двух независимых выборках // Бюл. МГУ. Сер. А. 1939. Т. 2, № 2. С. 3-14.

12. Макаров А.А., Симонова Г.И. Исследование мощности двухвыборочного критерия Андерсена-Дарлинга в случае засорения одной из выборок // Статистические методы оценивания и проверки гипотез : межвуз. сб. науч. тр. № 20. Перм. ун-т. Пермь, 2007. C. 40-52.

13. Постовалов С. Н. Применение компьютерного моделирования для расширения прикладных возможностей классических методов проверки статистических гипотез : дис. ... д-ра техн. наук. Новосибирск, 2013.

14. Kiefer J. K-Sample Analogues of the Kolmogorov-Smirnov and Cramer-v. Mises Tests // Annals of Mathematical Statistics. 1959. V. 30, No. 2. P. 420-447.

15. Лемешко Б.Ю. Критерии проверки гипотез об однородности. Руководство по применению. М. : ИНФРА-М, 2017.

16. Zhang J. Powerful goodness-of-fit and multi-sample tests : PhD Thesis. Toronto : York University, 2001. URL: http://www.collectionscanada.gc.ca/obj/s4/f2/dsk3/ftp05/NQ66371.pdf (дата обращения: 26.01.2016).

17. Zhang J. Powerful Two-Sample Tests Based on the Likelihood Ratio // Technometrics. 2006. V. 48, No. 1. P. 95-103.

Лемешко Борис Юрьевич, д-р техн. наук, профессор. E-mail: [email protected] Лемешко Станислав Борисович, канд. техн. наук. E-mail: [email protected] Веретельникова Ирина Викторовна. E-mail: [email protected]

Новосибирский государственный технический университет Поступила в редакцию 10 июня 2017 г.

ЬвтвяНко Boris Yu., Ьвтвякко Stanislav B., Veretel 'nitova Irina V. (Novosibirsk State Technical University, Russian Federation). Application of criteria for testing homogeneity of distribution laws.

Keywords: homogeneity tests; Smirnov test; Lehmann-Rosenblatt test; Anderson-Darling test; power of test. DOL 10.17223/19988605/41/3

The necessity of general homogeneity hypothesis checking, i.e. whether two (or more) samples of random variables belong to the same general aggregate, arises constantly in the course of analysis of unbiased errors of measuring instruments. Such task arises naturally in the course of measuring instruments calibration and when comparing lab tests results. Technologists, medical researchers and biologists also face the same task when processing results of experimental research.

The present paper deals with the Smirnov, the Lehmann-Rosenblatt and the Anderson-Darling two-samples homogeneity tests; statistics for these tests is given; advantages and disadvantages of the tests are discussed.

As a drawback of the Smirnov test we may mention a substantial discreteness of statistics distribution which must be taken into account when having significant values of n and equal number of m and n samples. This drawback can be overcome if we choose mu-

tually prime integers as m and n . But even when this drawback has been remedied the real statistics distribution still differs substantially from the Kolmogorov limit distribution as the checked hypothesis is true. Hence when using the latter for evaluation of the significance level (pvalue) incorrect conclusions can be reached. One can avoid this only by modifying the test statistics.

As opposed to the Smirnov test, the Lehmann-Rosenblatt and the Anderson-Darling statistics distribution homogeneity tests do not actually differ from their limit distributions when having samples values of m,n > 25.

Comparative analysis of tests powers under discussion, conducted with the help of statistic modeling methods, showed that, as a rule, the Anderson-Darling test boasts of bigger power than the Lehmann-Rosenblatt test, especially in case of differences of samples in their measure of dispersion. At the same time, when having rather similar yet competing hypothesis and smaller number of samples, the Lehmann-Rosenblatt test can show advantage in power. The Smirnov test yields to the Lehmann-Rosenblatt and the Anderson-Darling competing tests, but in certain cases it can be quite competitive.

Previously, information on distribution of statistics for ¿-sample Anderson-Darling homogeneity test has been available only within a limited table of critical limits. In the present case the study of statistics distribution through statistic modeling methods with actual k values showed the presence of corresponding limit distributions. Results of such modeling showed that when using this test we can disregard the difference between the statistics distributions and the corresponding limit values while the number of samples nt > 30.

Based on the results of statistics modeling, approximate models for limit distributions of the Anderson-Darling k-samples test for k = 2 +11. This paper shows the models created, represented by the laws of beta-distributions of the IlIrd with particular parameter values. Such models produced with the help of the Anderson-Darling k-sample test enable finding the values of pvaiue, thus making the results of statistics conclusions more informative and more substantiated.

The possibility of using the Z hang k-sample homogeneity test with statistics of ZK , ZC and ZA is discussed, these being the extension of the Smirnov, the Lehmann-Rosenblatt and the Anderson-Darling test, respectively. The Zhang tests have some advantages in power with reference to the scale alternatives, but they somewhat yield to the Smirnov, the Lehmann-Rosenblatt and the AndersonDarling tests with reference to the shift alternatives.

REFERENCES

1. Bolshev, L.N. & Smirnov, N. V. (1983) Tablitsy matematicheskoy statistiki [Tables for Mathematical Statistics]. Moscow: Nauka.

2. Lehmann, E.L. (1951) Consistency and unbiasedness of certain nonparametric tests. The Annals of Mathematical Statistics. 22(1).

pp. 165-179.

3. Rosenblatt, M. (1952) Limit theorems associated with variants of the von Mises statistic. The Annals of Mathematical Statistics. 23.

pp. 617-623.

4. Pettitt, A.N. (1976) A two-sample Anderson-Darling rank statistic. Biometrika. 63(1). pp. 161-168. DOI: 10.1093/biomet/63.1.161

5. Scholz, F.W. & Stephens M.A. (1987) K-Sample Anderson-Darling Tests. Journal of the American Statistical Association. 82(399).

pp. 918-924. DOI: 10.1080/01621459.1987.10478517

6. Lemeshko, B.Yu. & Lemeshko, S.B. (2005) Statistical distribution convergence and homogeneity test power for Smirnov and Leh-

mann-Rosenblatt tests. Measurement Techniques. 48(12). pp. 1159-1166. DOI: 10.1007/s11018-006-0038-3

7. Lemeshko, B.Yu., Lemeshko, S.B., Postovalov, S.N. & Chimitova, E.V. (2011) Statisticheskiy analiz dannykh, modelirovanie i issle-

dovanie veroyatnostnykh zakonomernostey. Komp'yuternyy podkhod [Statistical Data Analysis, Simulation and Study of Probability Regularities. Computer Approach]. Novosibirsk: NSTU.

8. Lemeshko, B.Yu. (2014) Neparametricheskie kriterii soglasiya. Rukovodstvo po primeneniyu [Nonparametric goodness-of-fit tests].

Moscow: INFRA-M. DOI: 10.12737/11873

9. Lemeshko, B.Yu. (2015) Kriterii proverki otkloneniya raspredeleniya ot normal'nogo zakona [Tests for checking the deviation from

normal distribution law]. Moscow: INFRA-M. DOI: 10.12737/6086

10. Lemeshko, B.Yu. & Blinov, P.Yu. (2015) Kriterii proverki otkloneniya raspredeleniya ot ravnomernogo zakona [Tests for checking the deviation from uniform distribution law]. Moscow: INFRA-M. DOI: 10.12737/11304

11. Smirnov, N.V. (1939) Otsenka raskhozhdeniya mezhdu empiricheskimi krivymi raspredeleniya v dvukh nezavisimykh vyborkakh [Evaluation of discrepancy between the empirical distribution curves in two independent samples]. Byuleten. MGU. Ser. A. - Bulletin of MGU, Series A. 2(2). pp. 3-14.

12. Makarov, A.A. & Simonova, G.I. (2007) Issledovanie moshchnosti dvukhvyborochnogo kriteriya Andersena-Darlinga v sluchae zasoreniya odnoy iz vyborok [Studies of the power of the two-sample Anderson-Darling test in the case of littering of one of the samples]. In: Lumelsky, Ya.P. (ed.) Statisticheskie metody otsenivaniya i proverki gipotez [Statistics methods of evaluation and checking of hypothesis]. Perm: Perm State University. pp. 40-52.

13. Postovalov, S.N. (2013) Primenenie komp'yuternogo modelirovaniya dlya rasshireniya prikladnykh vozmozhnostey klassicheskikh metodov proverki statisticheskikh gipotez [Using of computer modeling for expanding application of classical methods of statistics hypothesis checking]. Engineering Dr. Diss. Novosibirsk.

14. Kiefer, J. (1959) K-Sample Analogues of the Kolmogorov-Smirnov and Cramer-v. Mises Tests. Annals of Mathematical Statistics. 30(2). pp. 420-447.

15. Lemeshko, B.Yu. (2017) Kriterii proverki gipotez ob odnorodnosti [Tests for homogeneity]. Moscow: INFRA-M.

16. Zhang, J. (2001) Powerful goodness-of-fit and multi-sample tests. PhD Thesis. Toronto: York University. [Online] Available from: http://www.collectionscanada.gc.ca/obj/s4/f2/dsk3/ftp05/NQ66371.pdf. (Accessed: 26th January 2016).

17. Zhang, J. (2006) Powerful Two-Sample Tests Based on the Likelihood Ratio. Technometrics. 48(1). pp. 95-103. DOi: 10.1198/004017005000000328. 95

i Надоели баннеры? Вы всегда можете отключить рекламу.