Научная статья на тему 'ПРОБЛЕМЫ ПРИМЕНЕНИЯ НЕПАРАМЕТРИЧЕСКИХ КРИТЕРИЕВ СОГЛАСИЯ В ЗАДАЧАХ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ'

ПРОБЛЕМЫ ПРИМЕНЕНИЯ НЕПАРАМЕТРИЧЕСКИХ КРИТЕРИЕВ СОГЛАСИЯ В ЗАДАЧАХ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ Текст научной статьи по специальности «Математика»

CC BY
82
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОВЕРКА ГИПОТЕЗ / НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ / ПРОСТАЯ ГИПОТЕЗА / СЛОЖНАЯ ГИПОТЕЗА / РАСПРЕДЕЛЕНИЕ СТАТИСТИКИ / ОШИБКИ ОКРУГЛЕНИЯ / ДОСТИГНУТЫЙ УРОВЕНЬ ЗНАЧИМОСТИ / ОШИБКА 1-ГО РОДА / ОШИБКА 2-ГО РОДА / ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ

Аннотация научной статьи по математике, автор научной работы — Лемешко Борис Юрьевич, Лемешко Станислав Борисович

Утверждается, что в основе некорректного применения непараметрических критериев согласия в различных приложениях в большинстве случаев лежат две причины. Первая причина заключается в том, что при проверке сложных гипотез и оценивании параметров закона по анализируемой выборке используют классические результаты, связанные с проверкой простых гипотез. При проверке сложных гипотез на распределения статистик критериев согласия влияют вид наблюдаемого закона F(x, q), соответствующий проверяемой гипотезе, тип и число оцениваемых параметров, метод оценивания, в некоторых случаях - значение параметра формы. В работе показано влияние всех названных факторов на распределения статистик критериев. Подчеркивается, что пренебрежение при проверке сложных гипотез факта потери критерием свойства «свободы от распределения» приводит к увеличению вероятности ошибок 2-го рода. Показывается, что распределение статистики критерия, необходимое для формирования вывода о результатах проверки сложной гипотезы, может находиться с использованием имитационного моделирования в интерактивном режиме непосредственно в процессе проверки. Вторая причина связана с наличием ошибок округления, которые могут существенно изменять распределения статистик критериев. В работе показано, что асимптотическими результатами при проверке простых и сложных гипотез можно пользоваться при ошибках округления D много меньше среднеквадратического отклонения закона распределения ошибок измерения и объемах выборок n , не превышающих некоторых максимальных значений. При объемах выборок больших, чем эти максимальные значения, реальные распределения статистик критериев отклоняются от асимптотических в сторону больших значений статистик. В таких ситуациях использование асимптотических распределений для формирования вывода о результатах проверки приводит к увеличению вероятностей ошибок 1-го рода (к отклонению справедливой проверяемой гипотезы). Показано, что при соизмеримости ошибок округления и распределения статистик критериев отклоняются от асимптотических распределений и при малых n . А с ростом n ситуация только усугубляется. В работе изменения распределений статистик под влиянием округлений демонстрируются при проверке как простых, так и сложных гипотез. Показано, что единственным выходом, обеспечивающим корректность выводов по применяемым критериям в таких нестандартных условиях, является использование реальных распределений статистик. Эта задача может решаться в интерактивном режиме (в процессе проверки) и опираться на компьютерные технологии исследования и аппарат математической статистики.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Лемешко Борис Юрьевич, Лемешко Станислав Борисович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

PROBLEMS OF NONPARAMETRIC GOODNESS-OF-FIT TEST APPLICATION IN TASKS OF MEASUREMENT RESULTS PROCESSING

It is argued that in most cases two reasons underlie the incorrect application of nonparametric goodness-of-fit tests in various applications. The first reason is that when testing composite hypotheses and evaluating the parameters of the law for the analyzed sample, classical results associated with testing simple hypotheses are used. When testing composite hypotheses, the distributions of goodness-of-fit statistics are influenced by the form of the observed law F(x, q) corresponding to the hypothesis being tested, by the type and number of estimated parameters, by the estimation method, and in some cases by the value of the shape parameter. The paper shows the influence of all mentiomed factors on the distribution of test statistics. It is emphasized that, when testing composite hypotheses, the neglect, of the fact that the test has lost the property of “freedom from distribution” leads to an increase in the probability of the 2nd kind errors. It is shown that the distribution of the statistics of the test necessary for the formation of a conclusion about the results of testing a composite hypothesis can be found using simulation in an interactive mode directly in the process of testing. The second reason is associated with the presence of round-off errors which can significantly change the distributions of test statistics. The paper shows that asymptotic results when testing simple and composite hypotheses can be used with round -off errors D much less than the standard deviation s of the distribution law of measurement errors and sample sizes n not exceeding some maximum values. For sample sizes larger than these maximum values, the real distributions of the test statistics deviate from asymptotic ones towards larger statistics values. In such situations, the use of asymptotic distributions to arrive at a conclusion about the test results leads to an increase in the probabilities of errors of the 1st kind (to the rejection of a valid hypothesis being tested). It is shown that when the round-off errors and s are commensurable, the distributions of the test statistics deviate from the asymptotic distributions for small n. And as n grows, the situation only gets worse. In the paper, changes in the distributions of statistics under the influence of rounding are demonstrated both when testing both simple and composite hypotheses. It is shown that the only way out that ensures the correctness of conclusions according to the applied tests in such non-standard conditions is the use of real distributions of statistics. This task can be solved interactively (in the process of verification) and rely on computer research technologies and the apparatus of mathematical statistics.

Текст научной работы на тему «ПРОБЛЕМЫ ПРИМЕНЕНИЯ НЕПАРАМЕТРИЧЕСКИХ КРИТЕРИЕВ СОГЛАСИЯ В ЗАДАЧАХ ОБРАБОТКИ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ»

ISSN 2782-2001 Системы анализа и обработки данных том 82, № 2, 2021, с. 47-66

http://journals.nstu.ru/vestnik Analysis and data processing systems Vol. 82, No. 2, 2021, pp. 47-66

ИНФОРМАТИКА, ВЫЧИСЛИТЕЛЬНАЯ ТЕХНИКА И УПРАВЛЕНИЕ

INFORMATICS, COMPPUTER ENGINEERING AND CONTROL

УДК 519.24

DOI: 10.17212/2782-2001-2021-2-47-66

Проблемы применения непараметрических

критериев согласия в задачах обработки

*

результатов измерений

Б.Ю. ЛЕМЕШКОЯ, С Б. ЛЕМЕШКО4

630073, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет

а lemeshko@ami.nstu.ru ь skyer@mail.ru

Утверждается, что в основе некорректного применения непараметрических критериев согласия в различных приложениях в большинстве случаев лежат две причины.

Первая причина заключается в том, что при проверке сложных гипотез и оценивании параметров закона по анализируемой выборке используют классические результаты, связанные с проверкой простых гипотез. При проверке сложных гипотез на распределения статистик критериев согласия влияют вид наблюдаемого закона ^х, 6), соответствующий проверяемой гипотезе, тип и число оцениваемых параметров, метод оценивания, в некоторых случаях - значение параметра формы. В работе показано влияние всех названных факторов на распределения статистик критериев. Подчеркивается, что пренебрежение при проверке сложных гипотез факта потери критерием свойства «свободы от распределения» приводит к увеличению вероятности ошибок 2-го рода. Показывается, что распределение статистики критерия, необходимое для формирования вывода о результатах проверки сложной гипотезы, может находиться с использованием имитационного моделирования в интерактивном режиме непосредственно в процессе проверки.

Вторая причина связана с наличием ошибок округления, которые могут существенно изменять распределения статистик критериев. В работе показано, что асимптотическими результатами при проверке простых и сложных гипотез можно пользоваться при ошибках округления А много меньше среднеквадратического отклонения ст закона распределения ошибок измерения и объемах выборок п, не превышающих некоторых максимальных значений. При объемах выборок больших, чем эти максимальные значения, реальные распределения статистик критериев отклоняются от асимптотических в сторону больших значений статистик. В таких ситуациях использование асимптотических распределений для формирования вывода о результатах проверки приводит к увеличению вероятностей ошибок 1-го рода (к отклонению справедливой проверяемой гипотезы). Показано, что при соизмеримости ошибок округления и распределения статистик критериев отклоняются от асимптотических распределений и при малых п. А с ростом п ситуация только усугубляется. В работе изменения распределений статистик под влиянием округлений демонстрируются при проверке как простых, так и сложных гипотез. Показано, что единственным выходом, обеспечивающим корректность выводов по применяемым критериям в таких не-

Статья получена 05 февраля 2021 г.

стандартных условиях, является использование реальных распределений статистик. Эта задача может решаться в интерактивном режиме (в процессе проверки) и опираться на компьютерные технологии исследования и аппарат математической статистики.

Ключевые слова: проверка гипотез, непараметрические критерии согласия, простая гипотеза, сложная гипотеза, распределение статистики, ошибки округления, достигнутый уровень значимости, ошибка 1-го рода, ошибка 2-го рода, имитационное моделирование

ВВЕДЕНИЕ

Статистические методы, ориентированные на обнаружение и исследование скрытых закономерностей, в том числе вероятностных, содержащихся в рядах измерений, связанных с процессами в различных системах и окружающей среде, занимают заметное место в задачах анализа и обработки данных.

С момента зарождения в математической статистике накоплен огромный аппарат методов статистического анализа, предназначенных для решения тех или иных задач. Особенно стремительно этот аппарат развивался последние 120 лет. Если проанализировать сотни тысяч публикаций, касающихся статистических методов, то можно увидеть, что львиная доля из них посвящена разработке математического аппарата и значительно меньшая часть уделена использованию этого аппарата в приложениях (причем не всегда корректно применяемого). Можно обратить внимание и на то, что в некоторых областях, где полезность применения определенных статистических методов кажется очевидной, этого не делается.

Причин такого состояния много. Во-первых, потенциальному пользователю сложно ориентироваться во всем многообразии методов, о существовании большей части из которых он просто не слышал. Трудно отдать предпочтение какому-то методу или критерию из ряда, предназначенного для решения одной и той же задачи, из-за отсутствия четких рекомендаций, учитывающих свойства сравниваемых методов. Перспективные методы или критерии и полезные результаты остаются неизвестными, просто теряются в растущем потоке публикаций. Во-вторых, университетский курс теории вероятностей и математической статистики, читаемый для нематематических специальностей, абсолютно не ориентирован на применение соответствующих методов в приложениях. Поэтому будущему специалисту приходится впоследствии добывать необходимые знания и опыт самостоятельно. В-третьих, корректность применения соответствующего метода или статистического критерия обусловливается некоторыми стандартными предположениями, которые в условиях конкретного приложения могут не выполняться. В нестандартных условиях свойства критериев, как правило, меняются, и меняются существенно. Использование классических результатов в таких ситуациях может приводить к некорректности статистических выводов. В то же время это не исключает возможности применения конкретного критерия в нестандартных условиях. Для этого надо лишь знать свойства критерия в этих условиях.

В настоящей статье мы продемонстрируем, как меняются распределения статистик непараметрических критериев согласия в зависимости от вида проверяемой гипотезы (простой или сложной) и величины ошибок округления, а также покажем, что использование вычислительных технологий и статистического моделирования позволяет с успехом применять эти критерии в изменившихся условиях, обеспечивая корректность выводов.

1. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ ПРИ ПРОВЕРКЕ ПРОСТЫХ ГИПОТЕЗ

Изначально все непараметрические критерии согласия предлагались для проверки простых гипотез вида Hо : F(x) = F(x, 0), где F(x, 0) - функция распределения вероятностей, с которой проверяют согласие наблюдаемой (упорядоченной) выборки х1, х2,..., xn объемом п, а 0 - известное значение параметра (скалярного или векторного). В процессе проверки вычисля-*

ется значение £ статистики критерия 5 как некоторой функции от выборки и теоретического закона распределения F(х, 0). Далее, опираясь на асимптотическое (предельное) распределение О(5|Н0) статистики критерия при справедливости Н0, вычисляют достигнутый уровень значимости

Руа1ие = >

5*}=1 - О(5* |н0) . Если руа[ие больше заданного а, гипотеза Н 0 не отклоняется.

В критерии Колмогорова [1] рекомендуется использовать статистику с поправкой Большева в форме [2]

„ 1 6пБп +1

Бк =^пВп +—Г= " , (1)

М п 6\ п

где Бп = max(п+ , Д-), В+ = max {— - F(xi, 0)1, = max ^(хг-, 0) - -—1].

У ' 1<—<п [п ) 1<-<п\ п )

При справедливости Н0 статистика (1) подчиняется распределению Колмо-

, -2> 2 2

горова с функцией распределения К(5) = ^ (-1) е 5 .

к=-<»

Статистика критерия Крамера-Мизеса-Смирнова имеет вид [2]

= п®2 = 12п+, 0) - ^тГ (2)

и при простой гипотезе подчиняется закону с функцией распределения а1( 5) [2].

В критерии Андерсона-Дарлинга [3, 4] статистика задается выражением

<%=-п-1пF(х-, 0) + -^^ 1п(1 -F(х-, 0))] , (3)

и при простой Н 0 подчиняется закону с функцией распределения а2(5) [2]. В процессе применения этого критерия зачастую приходится сталкиваться с ситуациями, когда на интервале [Х1, хп ] функция распределения F(х-, 0) принимает значения 0 или 1. Это исключает возможность вычисления значения статистики (3) и одновременно сигнализирует о несправедливости Н0 .

В критерии Купера [5] можно использовать статистику в виде [6]

УГА = ^ (Д+ + В-) + . (4)

При справедливости Н о асимптотическим распределением статистики (4)

является функция распределения О(^Но ) = 1 - I 2(4т252 - 1)е

т=1

Статистика критерия Ватсона [8, 9] используется в форме

л 2 2

-2 т 5

[7].

щ = 1|р (х, 0)-

7 =1

-1/2

2 ( 1 п

- п

1

V п7=1

-IР (х, 0)-т + (5)

12п

и при простой Но подчиняется закону О (5 |Но ) = 1 - 2 I (-1)

2 2

т-1 -2т к 5

т=1

В критериях Жанга [10, 11] статистики задаются выражениями:

2к = тахI I 7 - — 1 1ой•{ ——1

К 1<7<п IV 2 у пР(х7, 0)

+ | п - 7 + 2 | log

п - 7 + 1/2

¿4=-1 7 =1

п{1- Р (х-, 0)}] (х, 0)} + 1ОВ(1-Р^,0)}

!-7 + 1/2

! -1/2

^ =1

7=1

[Р (х, 0)]-1 -1 ] (п -1/2)/(7 - 3/4) -11

(6)

(7)

(8)

Эти критерии являются развитием критериев со статистиками (1)-(3). Как правило, критерии Жанга имеют преимущество в мощности по сравнению с критериями со статистиками (1)-(5) [6]. Распределения статистик (6)-(8) зависят от объемов выборок п, поэтому вычисление оценок рш[ие возможно только при использовании вычислительных технологий.

Относительно недавно предложен критерий, опирающийся на оценку информации Кульбака-Лейблера [12, 13], со статистикой

$кь = -

1I 1П {^ [Р(Х7+т, 0)-Р(Х-т, 0)]

7 =1

(2т

(9)

где т < п/2 ; х{ = Х1, если 7 < 1; х{ = хп , если 7 > п .

Критерии, использующие различные оценки энтропии или, как в данном случае, оценки информации Кульбака-Лейблера, как правило, демонстрируют высокую мощность. Однако в случае выборок с повторяющимися значениями их применение по понятным причинам может оказаться проблематичным. Распределения статистики (9), так же как и статистик критериев Жанга, зависят от объемов выборок п . Поэтому эффективное применение критерия с вычислением оценок рт[ие требует использования компьютерных технологий, базирующихся на методах имитационного (статистического) моделирования.

При проверке простых гипотез все перечисленные критерии являются «свободными от распределения», так как распределения статистик О(5|Н0) не зависят от вида закона F(х, 0) .

При малых объемах выборок распределения статистик О(Бп Н0) критериев могут несколько отличаться от предельных, что приходится учитывать на практике. Для критериев со статистиками (1)-(5) асимптотическими распределениями (вместо реальных О(Бп )), как правило, можно пользоваться при п > 25...30 [6].

2. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ ПРИ ПРОВЕРКЕ СЛОЖНЫХ ГИПОТЕЗ

При проверке сложных гипотез, когда по той же самой выборке оценивают параметры наблюдаемого закона распределения вероятностей F(х, 0), все непараметрические критерии согласия теряют свойство «свободы от распределения». Впервые существование этой проблемы было обозначено в работе [14], которая послужила точкой отсчета для многочисленных попыток ее решения. Например, в работах [15, 16] с использованием статистического моделирования были построены таблицы критических значений для критерия Колмогорова при проверке сложных гипотез относительно нормального и экспоненциального законов. В [17] аналитическими методами аналогичная задача была решена для критерия Крамера-Мизеса-Смирнова. Решению таких же задач были посвящены работы [18, 19]. Жизнь подтвердила, что использование имитационного моделирования является более перспективным направлением при исследованиях распределений статистик критериев, применяемых при проверке различных гипотез.

В наших работах, опирающихся на компьютерные технологии исследований, были построены приближенные модели распределений статистик критериев Колмогорова, Крамера-Мизеса-Смирнова и Андерсона-Дарлинга при проверке различных сложных гипотез относительно ряда законов, часто используемых в приложениях, а также была показана существенная зависимость распределений статистик от используемого метода оценивания параметров [20]. На базе этих результатов были разработаны рекомендации [21]. Последующие исследования и уточненные модели распределений статистик (1)-(5) непараметрических критериев [22-26] послужили основой руководства [6].

При проверке сложной гипотезы на распределение статистики О(5|Н0) критерия влияет совокупность следующих факторов [6]: вид наблюдаемого закона распределения F(х, 0), соответствующего проверяемой гипотезе Н0 ; тип оцениваемого параметра и число оцениваемых параметров; используемый метод оценивания параметров [20]; в некоторых ситуациях - конкретное значение параметра (например, значения параметров формы гамма-распределения, бета-распределений, обобщенного нормального закона и других) [6, 25].

Влияние перечисленных факторов на распределения статистик непараметрических критериев согласия (без потери общности) продемонстрируем на статистике (2) критерия Крамера-Мизеса-Смирнова. На данном этапе мы не акцентируем внимания на возможном влиянии на распределения статистик О(5 Н0) ошибок округления Д .

На рис. 1 показано изменение распределения статистики (2) в зависимости от типа оцениваемого параметра (сдвига или масштаба), от числа оцениваемых параметров нормального закона в случае использования оценок максимального правдоподобия (ОМП), а также от метода оценивания. На рисунке показано также распределение статистики для случая оценивания двух параметров нормального закона в результате минимизации статистики (2) (MD-оценки). Как видим, наблюдается существенная зависимость от типа оцениваемого параметра и от используемого метода оценивания. При проверке согласия с другими законами, определяемыми также лишь параметрами сдвига и масштаба, картина будет аналогична. Однако распределения статистик, соответствующие тем же сложным гипотезам, будут отличаться от приведенных на рис. 1, так как распределения G(S|#o) зависят от вида закона F(x, 0) . Построенные модели распределений статистик критериев при проверке различных сложных гипотез относительно ряда законов F(x, 0), которые наиболее часто используются в различных приложениях и для которых отсутствует зависимость от значения параметра (параметров) формы, приведены в [6, 27].

1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00

0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рис. 1. Предельные распределения статистики (2) при справедливости простой и сложных гипотез о принадлежности выборки нормальному закону при отсутствии ошибок округления (Д = 0):

1 - распределение а1( S); 2 - распределение статистики при вычислении только ОМП параметра масштаба; 3 - при вычислении только ОМП параметра сдвига; 4 - при вычислении ОМП параметров сдвига и масштаба;

5 - при вычислении MD-оценок параметров сдвига и масштаба

Fig. 1. Limiting distributions of statistics (2) with the validity of simple and composite hypotheses that the sample belongs to the normal law in the absence of round-off errors (Д = 0):

1 is distribution a1(S); 2 is distribution of statistics when calculating only he MLE of the scale parameter; 3 - when calculating only the MLE of the shift parameter; 4 - when calculating the MLE of the shift and scale parameters;

5 - when calculating MD-estimates of shift and scale parameters

Влияние конкретного значения параметра формы на распределение статистики О(5|Но) при проверке сложной гипотезы продемонстрируем

02 х

на обобщенном нормальном законе с плотностью (х) = -

20!Г(1/ 02)

х ехр|-(|х -0о|/01 )02 |, где 02 - параметр формы. В частном случае при

02 = 2 обобщенный нормальный закон совпадает с нормальным, а при 02 = 1 - с распределением Лапласа. На рис. 2 показаны распределения О (5|Н о) статистики (2) при проверке сложной гипотезы о принадлежности выборки обобщенному нормальному закону в случае оценивания всех трех параметров методом максимального правдоподобия в зависимости от значения 02 .

Следует отметить, что с ростом 02 распределение О(5Но) сначала удаляется от а1(5) (до 02 ~ 1.6), а затем начинает сближаться с а1(5).

Рис. 2. Предельные распределения статистики (2) при справедливости сложной гипотезы о принадлежности выборки обобщенному нормальному закону при отсутствии ошибок округления (Д = 0) в зависимости от значения параметра формы 62 (при вычислении ОМП трех параметров закона):

1 - распределение a1(S); 2 - при 02 = 0.5; 3 - при 02 = 1; 4 - при 02 = 1.6; 5 - при 02 = 2; 6 - при 02 = 3; 7 - при 02 = 5

Fig. 2. Limiting distributions of statistics (2) with the validity of the composite hypothesis that the sample belongs to the generalized normal law in the absence of round-off errors (Д = 0), depending on the value of the form parameter 02 (when calculating the MLE of 3 parameters

of the law):

1 is distribution a1(S); 2 - with 02 = 0.5; 3 - with 02 = 1; 4 - with 02 = 1.6;

5 - with 02 = 2; 6 - with 02 = 3; 7 - with 02 = 5

В подобных ситуациях (наличия зависимости G (0) от значений параметра или параметров формы) исключается возможность заранее построить модель закона (асимптотического или предельного), так как значение пара-

метра мы узнаем только в процессе проверки гипотезы (при оценивании). Отсюда следует, что распределения статистик применяемых критериев должны находиться (моделироваться) в интерактивном режиме в ходе проводимого статистического анализа [28], а затем использоваться при формировании вывода по итогам проверки сложной гипотезы.

Реализация такого интерактивного режима требует наличия развитого программного обеспечения, позволяющего в целях ускорения распараллеливать процессы имитационного моделирования и привлекать доступные вычислительные ресурсы. В результате N имитационных экспериментов можно построить эмпирическое распределение статистики GN \Но) (при п, соответствующем объему анализируемой выборки), по которому может быть найдена оценка руа1ие . В работе [29] такой режим исследования распределений статистик предусмотрен в случае применения критериев Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга, Купера, Ватсона, трех критериев Жанга и критерия Кульбака-Лейблера. При этом могут использоваться различные методы оценивания параметров. Для критериев Жанга и Кульбака-Лейблера такой режим используется и при проверке простых гипотез.

Следует признать, что появление рекомендаций [21] и руководства [6] не сильно изменило в лучшую сторону ситуацию с корректностью применения непараметрических критериев согласия при проверке сложных гипотез. Большинство ошибок применения непараметрических критериев согласия в приложениях (и в учебной литературе) по-прежнему связано с незнанием существующей проблемы.

Картина, представленная на рис. 1 и 2, показывает диапазон изменений распределений G(о) при простой и сложных гипотезах и подчеркивает, что вследствие ошибок применения, не учитывающих сложности проверяемой гипотезы, существенно увеличивается вероятность ошибок 2-го рода.

Представленная картина не учитывает влияния ошибок округления, которые всегда присутствуют в реальных данных.

Такая картина сохраняется при ошибках округления А << о, где о -среднеквадратичное отклонение ошибки измерения, и при таких максимальных объемах выборок птах, при которых G(^Пт Но) (при данном А) еще

практически не отличается от G(£|Но) [30]. Именно в таких ситуациях оказывается правомерным использование классических результатов, связанных с критериями проверки гипотез, и имеют силу результаты и рекомендации, представленные в руководстве [6] и в руководствах [31-34].

3. ВЛИЯНИЕ ОКРУГЛЕНИЯ НА СТАТИСТИЧЕСКИЕ ВЫВОДЫ

Любые измерения фиксируются с некоторой погрешностью округления. Что наличие ошибок округления А может как-то отражаться на результатах статистических выводов, очевидно давно. Например, о возможности проблем с применением критериев нормальности, являющихся следствием округления, отмечалось еще в работе [35]. В работах [36, 37] на примере критериев проверки гипотез о равенстве математического ожидания и дисперсии номинальным значениям, а также критериев Стьюдента об однородности средних и Фишера

об однородности дисперсий двух выборок было показано влияние ошибок округления на реальный уровень значимости, а также отмечено, что с их увеличением снижается мощность критериев. Авторами работы [38] при анализе множества выборок с повторяющимися наблюдениями было показано, что в такой ситуации критические значения распределений статистик непараметрических критериев согласия при проверке сложных гипотез относительно обобщенного распределения Парето отличаются от ранее полученных. Наконец, в наших работах [39-41] показано, как в условиях соизмеримости ошибок округления Д и среднеквадратичного отклонения ошибок измерения а изменяются распределения статистик различных статистических критериев.

В данном случае, опять же без потери общности, в условиях соизмеримости Д и а проиллюстрируем влияние Д на распределения О (о) статистики (2) критерия Крамера-Мизеса-Смирнова на примере проверки гипотезы о принадлежности выборок нормальному закону распределения.

На рис. 3 в условиях справедливости простой гипотезы Н о показана зависимость распределения статистики (2) от величины Д = wа при п = 50. Очевидно, что отклонением О(«^о Но) от а1(£) можно пренебречь лишь при Д < 0.1а .

На рис. 4, также при простой гипотезе Но и фиксированной ошибке округления Д = о.1а, показана зависимость О( £п|Но) от объемов выборок п.

0,00 0,05 0,10 0,1 5 0,20 0,25 0,30 0,35 0,10 0,15 0,50

Рис. 3. Зависимость распределения статистики (2) от ошибки округления Д при справедливости простой гипотезы Н0 о принадлежности выборки нормальному закону при n = 50:

1 - a1(S) (при Д = 0); 2 - при Д = 0.1а; 3 - при Д = 0.3а; 4 - при Д = 0.5а; 5 - при Д = 0.7а; 6 - при Д = а

Fig. 3. Dependence of the statistics (2) distribution on the round-off error Д when the simple hypothesis Н0 that the sample belongs to the normal law is valid when n = 50:

1 - a1(S) (with Д = 0 ); 2 - with Д = 0.1а; 3 - with Д = 0.3а; 4 - with Д = 0.5а; 5 - with Д = 0.7а; 6 - with Д = а

1,00 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,00

0,00 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50

Рис. 4. Зависимость распределения статистики (2) от объема выборки n при справедливости простой гипотезы Н0 о принадлежности выборки нормальному закону при ошибке округления Д = 0.1ст:

1 - a1(S); 2 - при n = 50; 3 - при n = 100 ; 4 - при n = 200 ; 5 - при n = 500 ;

6 - при n = 1000; 7 - при n = 2000; 8 - при n = 5000

Fig. 4. Dependence of the statistics (2) distribution on the sample size n with the validity of the simple hypothesis Н0 that the sample belongs to the normal law with a round-off error Д = 0.1ст:

1 is a1(S); 2 - with n = 50 ; 3 - with n = 100 ; 4 - with n = 200 ; 5 - with n = 500; 6 - with n = 1000; 7 -with n = 2000; 8 - with n = 5000

Что вытекает из представленных результатов исследований?

Во-первых, можно видеть, что наличие ошибок округления приводит к появлению зависимости G(S\Hq ) от n.

Во-вторых, признание самого факта наличия округлений в данных исключает возможность использования предельного распределения a1(S) в качестве распределения статистики (2) в условиях больших выборок.

В-третьих, в условиях соизмеримости Д и а и при относительно небольших объемах выборок распределения G(Sn \Hq ) статистики (2) могут значительно отличаться от a1(S) , что полностью исключает возможность при проверке гипотезы использовать классические результаты. С такими ситуациями часто сталкиваются в задачах анализа данных в биологии и медицине, где результаты измерений всегда имеют ограниченную точность, а в выборках оказывается много повторяющихся значений, что является признаком соизмеримости Д и а. Именно в этом заключается причина удивляющей специалистов «неработоспособности» многих статистических критериев, применяемых к подобным выборкам. Следует добавить, что с такой же ситуацией сталкиваются при анализе высокоточных измерений в технических приложениях, когда измерения осуществляются на пределе разрешающей способности используемой измерительной системы.

В-четвертых, проведенные исследования показали, что вследствие округлений потеря свойства «свободы от распределения» происходит и в

условиях проверки простых гипотез. В частности, при одном и том же соотношении А = wа между Д и а наблюдаемого симметричного закона степень отклонения G(Бп |#о) от а1(увеличивается в случае законов с более тяжелыми «хвостами» (по сравнению с нормальным законом).

В ситуации проверки сложной гипотезы при использовании ОМП для оценки двух параметров нормального закона мы имеем аналогичную картину влияния А на распределения статистики (2) (рис. 5 и 6).

Рис. 5. Зависимость распределения статистики (2) от ошибки округления Д при справедливости сложной гипотезы Н0 о принадлежности выборки нормальному закону (в случае ОМП) при n = 50:

0 - a1(S); 1 - асимптотическое (при Д = 0); 2 - при Д = 0.1а; 3 - при Д = 0.3а;

4 - при Д = 0.5а; 5 - при Д = 0.7а; 6 - при Д = а

Fig. 5. Dependence of the statistics (2) distribution on the round-off error Д when the composite hypothesis Н0 that the sample belongs to the normal law is true (in the case of MLE) when n = 50:

0 - a1(S); 1 is asymptotic distribution (with Д = 0); 2 - with Д = 0.1а;

3 - with Д = 0.3а; 4 - with Д = 0.5а; 5 - with Д = 0.7а; 6- with Д = а

На распределения статистик (6)-(9), которые и в отсутствие ошибок округления зависят от n, факторы, влияющие на распределения статистик непараметрических критериев согласия при проверке сложных гипотез, и ошибки округления воздействуют аналогичным образом.

Стандартным предположением, обусловливающим корректность выводов по применяемым непараметрическим критериям согласия со статистиками (1)-(9) с использованием известных классических результатов (предельных распределений или критических значений), касающихся проверки простых гипотез, в условиях Д «а является отсутствие зависимости G(S|#0) от Д (при данном n).

В случае проверки сложных гипотез это предположение дополняется необходимостью знания модели предельного распределения статистики для соответствующей сложной гипотезы [6], которая чаще всего оказывается неизвестной.

Рис. 6. Зависимость распределения статистики (2) от объема выборки n при справедливости сложной гипотезы Н0 о принадлежности выборки нормальному закону (в случае ОМП) при А = 0.1 ст:

0 - a1(S); 1 - асимптотическое (при А = 0); 2 - при n = 50; 3 - при n = 100; 4 - при n = 200 ; 5 - при n = 500 ; 6 - при n = 1000; 7 - при n = 2000 ;

8 - при n = 5000

Fig. 6. Dependence of the statistics (2) distribution on the sample size n with the validity of the composite hypothesis Н0 that the sample belongs to the normal law (in the case of MLE) with А = 0.1 ст:

0 - a1(S); 1 is asymptotic distribution (at А = 0); 2 - with n = 50 ; 3 - with n = 100 ; 4 - with n = 200 ; 5 - with n = 500 ; 6 - with n = 1000 ; 7 - with n = 2000 ;

8 - with n = 5000

Приходится констатировать, что в подавляющем числе случаев критерии применяются в условиях нарушения стандартных предположений.

4. ПРИМЕНЕНИЕ КРИТЕРИЕВ В НЕСТАНДАРТНЫХ УСЛОВИЯХ

Еще раз подчеркнем, что вывод о результатах проверки гипотезы, формируемый на основе оценки достигнутого уровня значимости

Pvalue = > S} = 1 - G ^ S \Hо ), более информативен и обоснован, чем

принимаемый по результатам сравнения значения статистики S , вычисленной по анализируемой выборке, с критическим значением Si-a . Поэтому предпочтительней опираться на распределения статистик G(Sn |Но ), а не на критические значения.

При проверке простых гипотез нарушение стандартных предположений, препятствующее возможности использования предельных распределений для вычисления pvaiue, может быть связано только с изменением G(Sn|Ho) под влиянием ошибок округлений Д .

При проверке сложных гипотез приходится учитывать зависимость G(Бп Но) от вида F(х, 0) , от числа и типа оцениваемых параметров, от используемого метода оценивания, от конкретных значений параметров формы, к которым добавляется влияние на G(Sn Но) ошибок округления А . То есть за редким исключением [6], распределения статистик G(Бп Но) оказываются неизвестными.

Для критериев со статистиками (6)-(9) распределения статистик G(Бп Но) зависят от п и от всех факторов, связанных с проверкой сложных гипотез. При проверке как простых, так и сложных гипотез возможно влияние ошибок округления А . То есть по существу распределения G(5"п|Но) статистик (6)-(9) всегда оказываются неизвестными.

Вопрос об аналитических исследованиях вида G(5"п|Но) в таких разнообразных ситуациях даже не ставится как абсолютно бесперспективный.

А вот интерактивное исследование распределения G(Sn Но) статистики критерия в ходе проверки конкретной гипотезы (простой или сложной, при фактических ошибках округления и объеме п анализируемой выборки) позволяет в результате статистического моделирования построить эмпирическое распределение статистики GN ^п|Но) и найти оценку руа[ие .

Такой интерактивный режим исследования распределений статистик предусмотрен в работе [29] при использовании рассмотренного множества критериев согласия. При этом в случае отсутствия модели распределения статистики используемого критерия при проверке соответствующей сложной гипотезы автоматически предлагается построить это распределение в результате моделирования. Если присутствуют опасения, что на результаты анализа могут влиять ошибки округления А , надо указать эту возможность и задать величину А, соответствующую округлениям в анализируемой выборке. Интерактивный режим моделирования GN Но) обеспечивает корректность выводов по применяемым критериям в условиях любых нарушений стандартных предположений.

Покажем, как меняются оценки рт[ие, соответствующие вычисленным значениям статистик (1)-(5), при учете влияния ошибок округления на распределения статистик критериев. Продемонстрируем это на примере проверки сложной гипотезы о принадлежности выборки объемом п = 5о:

о.7 1.о о.3 о.3 о.3 о.7 о.4 о.4 о.6 о.7 о.7 о.3 о.5 о.9 о.2

о.8 о.5 о.6 о.4 о.6 о.2 о.4 о.4 1.о 1.о о.7 1.3 о.9 о.1 о.2

о.3 о.5 о.8 о.6 о.8 о.7 о.4 1.1 о.6 1.2 о.4 о.3 о.4 о.2 о.5

1.6 о.8 о.6 о.6 о.6

гамма-распределению с плотностью

0о -1 е-(х-02)/01 01Г(0о) .

/ (х) =

х-02

Измерения фиксировались с ошибкой округления А = о.1. Параметры формы 0о и масштаба 01 оценивались методом максимального правдоподо-

бия. Параметр сдвига 02 = 0.0 не оценивался. Распределения статистик G(Sn \H0) критериев в данном случае зависят от значения оценки 00. ОМП параметров, полученные по выборке, принимают значения: 00 = 3.72296, 01 = 0.61699. В таблице приведены значения статистик (1)-(5), рассматриваемых критериев и оценки pva[ue, соответствующие двум ситуациям: а) отсутствие ошибок округления (при А = 0); б) наличие ошибок округления А = 0.1.

Результаты проверки гипотезы по критериям со статистиками (1)-(5) Results of hypothesis testing by criteria with statistics (1)-(5)

№ Критерий Статистика pvalue

п/п А = 0 А = 0.1

1 Колмогорова 0.776317 0.167 0.774

2 Крамера-Мизеса-Смирнова 0.064356 0.343 0.947

3 Андерсона-Дарлинга 0.360314 0.466 0.985

4 Купера 1.451192 0.075 0.744

5 Ватсона 0.063283 0.303 0.941

Как можно видеть, оценки рт1ие, учитывающие наличие округлений измерений порядка А = 0.1, существенно отличаются от значений, не учитывающих ошибок округления.

ЗАКЛЮЧЕНИЕ

Таким образом, существует две основные причины, вследствие которых при идентификации закона распределения ошибок измерений с использованием непараметрических критериев согласия выводы могут оказаться некорректными.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Первая связана с использованием при проверке сложных гипотез классических результатов, соответствующих проверке простых гипотез, что приводит к увеличению вероятностей ошибок 2-го рода: при справедливости некоторой конкурирующей гипотезы проверяемая гипотеза Н о не отклоняется.

Вторая причина связана с наличием ошибок округления, которые всегда сопровождают процесс измерений. При А << ст и п меньше некоторого птах, зависящего от п и ст, влиянием А на G(5"п|Но) можно пренебречь. Но при п > птах реальное распределение статистики уже заметно отклоняется от асимптотического распределения, использование которого в этом случае приводит к увеличению вероятностей ошибок 1-го рода, т. е. к отклонению справедливой гипотезы Н0 . При соизмеримости А и ст такая ситуация может иметь место и при малых объемах выборок, а с ростом п она будет только усугубляться.

Единственным выходом, способным обеспечивать корректность выводов по применяемым критериям в нестандартных условиях (при проверке

сложных гипотез и влиянии Д на G(Sn|H0)), является использование реальных распределений статистик критериев (имеющих место в этих нестандартных условиях). Эта задача должна решаться в интерактивном режиме (в процессе проверки) и опираться на компьютерные технологии исследования и аппарат математической статистики. Такие процедуры имитационного моделирования распределений статистик критериев могут быть реализованы в рамках специализированного программного обеспечения, предназначенного для анализа результатов измерений.

СПИСОК ЛИТЕРАТУРЫ

1. Kolmogoroff A.N. Sulla determinazione empírica di una legge di distribuzione // Giomale del Istituto Italiano degli Attuari. - 1933. - Vol. 4, N 1. - P. 83-91.

2. Большее Л.Н., Смирное Н.В. Таблицы математической статистики. - М.: Наука, 1983. -

416 с.

3. Anderson T.W., Darling D.A. Asymptotic theory of certain "Goodness of fit" criteria based on stochastic processes // The Annals of Mathematical Statistics. - 1952. - Vol. 23. - P. 193-212.

4. Anderson T.W., Darling D.A. A test of goodness of fit // Journal of the American Statistical Association. - 1954. - Vol. 29. - P. 765-769.

5. Kuiper N.H. Tests concerning random points on a circle // Indagationes Mathematicae (Proceedings). - 1960. - Vol. 63. - P. 38-47.

6. Лемешко Б.Ю. Непараметрические критерии согласия: руководство по применению. -М.: Инфра-М, 2014. - 163 с. - DOI: 10.12737/11873.

7. Stephens M.A. The goodness-of-fit statistic VN: distribution and significance points // Bio-metrika. - 1965. - Vol. 52, N 3-4. - P. 309-321.

8. Watson G.S. Goodness-of-fit tests on a circle. 1 // Biometrika. - 1961. - Vol. 48, N 1-2. -P. 109-114.

9. Watson G.S. Goodness-of-fit tests on a circle. 2 // Biometrika. - 1962. - Vol. 49, N 1-2. -P. 57-63.

10. Zhang J. Powerful goodness-of-fit and multi-sample tests: PhD Thesis / York University. -Toronto, 2001. - 113 p. - URL: http://www.collectionscanada.gc.ca/obj/s4/f2/dsk3/ftp05/ NQ66371.pdf (дата обращения 05.01.2021).

11. Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio // Journal of the Royal Statistical Society: Series B. - 2002. - Vol. 64, N 2. - P. 281-294.

12. Noughabi H.A, Arghami N.R. General treatment of goodness of fit tests based on Kullback-Leibler information // Journal of Statistical Computation and Simulation. - 2013. - Vol. 83. -P. 1556-1569.

13. Noughabi H.A. A new estimator of Kullback-Leibler information and its application in goodness of fit tests // Journal of Statistical Computation and Simulation. - 2019. - Vol. 89, N 10. -P. 1914-1934.

14. KacM., Kiefer J., Wolfowitz J. On tests of normality and other tests of goodness of fit based on distance methods // The Annals of Mathematical Statistics. - 1955. - Vol. 26. - P. 189-211.

15. LillieforsH.W. On the Kolmogorov-Smirnov test for normality with mean and variance unknown // Journal of the American Statistical Association. - 1967. - Vol. 62. - P. 399-402.

16. Lilliefors H.W. On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown // Journal of the American Statistical Association. - 1969. - Vol. 64. - P. 387-389.

17. Мартынов Г.В. Критерии омега-квадрат. - М.: Наука, 1978. - 80 с.

18. Тюрин Ю.Н. О предельном распределении статистик Колмогорова-Смирнова для сложной гипотезы // Известия АН СССР. Серия математическая. - 1984. - Т. 48, № 6. -C. 1314-1343.

19. Тюрин Ю.Н., Саееушкина Н.Е. Критерии согласия для распределения Вейбулла-Гнеденко // Известия АН СССР. Серия: Техническая кибернетика. - 1984. - № 3. - C. 109-112.

20. Лемешко Б.Ю., Постоеалое С.Н. О зависимости распределений статистик непараметрических критериев и их мощности от метода оценивания параметров // Заводская лаборатория. Диагностика материалов. - 2001. - Т. 67, № 7. - С. 62-71.

21. Р 50.1.037-2002. Рекомендации по стандартизации. Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Ч. 2. Непараметрические критерии. - М.: Изд-во стандартов, 2002. - 64 с.

22. Lemeshko B.Yu., Lemeshko S.B. Distribution models for nonparametric tests for fit in verifying complicated hypotheses and maximum-likelihood estimators. Pt. 1 // Measurement Techniques. -2009. - Vol. 52, N 6. - P. 555-565.

23. Lemeshko B.Yu., Lemeshko S.B. Models for statistical distributions in nonparametric fitting tests on composite hypotheses based on maximum-likelihood estimators. Pt. 2 // Measurement Techniques. - 2009. - Vol. 52, N 8. - P. 799-812.

24. Lemeshko B.Yu., Lemeshko S.B., Postovalov S.N. Statistic distribution models for some nonparametric goodness-of-fit tests in testing composite hypotheses // Communications in Statistics. Theory and Methods. - 2010. - Vol. 39, N 3. - P. 460-471.

25. Lemeshko B.Yu., Lemeshko S.B. Models of statistic distributions of nonparametric good-ness-of-fit tests in composite hypotheses testing for double exponential law cases // Communications in Statistics. Theory and Methods. - 2011. - Vol. 40, N 16. - P. 2879-2892.

26. Lemeshko B.Yu., Gorbunova A.A. Application of nonparametric Kuiper and Watson tests of goodness-of-fit for composite hypotheses // Measurement Techniques. - 2013. - Vol. 56, N 9. -P. 965-973.

27. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход: монография / Б.Ю. Лемешко, С.Б. Лемешко, С.Н. Постовалов, Е.В. Чимитова. - Новосибирск: Изд-во НГТУ, 2011. - 888 с.

28. Lemeshko B.Yu., Lemeshko S.B., Rogozhnikov A.P. Interactive investigation of statistical regularities in testing composite hypotheses of goodness of fit // Statistical models and methods for reliability and survival analysis / ed. by V. Couallier, L. Gerville-Reache, C. Huber-Carol. - Hobo-ken, NJ: Wiley-ISTE, 2013. - Ch. 5. - P. 61-76.

29. Статистический анализ интервальных наблюдений одномерных непрерывных случайных величин «Интервальная статистика 5.4»: свидетельство о гос. регистрации программы для ЭВМ № 2018666213 / Лемешко Б.Ю., Лемешко С.Б., Блинов П.Ю., Веретельникова И.В., Новикова А.Ю. - Заявка № 2018663206; заявл. 22.11.2018; зарег. 13.12.2018. - URL: https://ami.nstu.ru/~headrd/ISW.htm (дата обращения: 22.01.2021).

30. Лемешко Б.Ю. Лемешко С.Б., Семёнова М.А. К вопросу статистического анализа больших данных // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. - 2018. - № 44. - С. 40-49. - DOI: 10.17223/19988605/44/5.

31. Лемешко Б.Ю., Блинов П.Ю. Критерии проверки отклонения распределения от равномерного закона: руководство по применению. - М.: Инфра-М, 2015. - 183 с. - (Научная мысль. Математическая статистика). - DOI: 10.12737/11304.

32. Лемешко Б.Ю. Критерии проверки отклонения распределения от нормального закона: руководство по применению. - M.: Инфра-М, 2015. - 160 с. - (Научная мысль. Математическая статистика). - DOI: 10.12737/6086.

33. Лемешко Б.Ю., Блинов П.Ю. Критерии проверки отклонения от экспоненциального закона: руководство по применению. - М.: Инфра-М, 2021. - 352 с. - (Научная мысль. Математическая статистика). - DOI 10.12737/1097477.

34. Лемешко Б.Ю. Критерии проверки гипотез об однородности: руководство по применению. - 2-е изд., перераб. и доп. - М.: Инфра-М, 2021. - 248 с. - (Научная мысль. Математическая статистика). - DOI 10.12737/986695.

35. PearsonE.S., D'AgostinoR.B., Bowman K.O. Tests for departure from normality: comparison of powers // Biometrika. - 1977. - Vol. 64. - P. 231-246. - DOI: 10.1093/biomet/64.2.427-a.

36. TrickerA.R. The effect of rounding on the significance level of certain normal test statistics // Journal of Applied Statistics. - 1990. - Vol. 17, N 1. - P. 31-38. - DOI: 10.1080/757582644.

37. Tricker A.R. The effect of rounding on the power level of certain normal test statistics // Journal of Applied Statistics. - 1990. - Vol. 17, N 2. - P. 219-228. - DOI: 10.1080/757582833.

38. Deidda R., Puliga M. Sensitivity of goodness-of-fit statistics to rainfall data rounding off // Physics and Chemistry of the Earth. - 2006. - Vol. 31. - P. 1240-1251. - DOI: 10.1016/j.pce.2006.04.041.

39. Лемешко Б.Ю., Лемешко С.Б. Влияние округления на свойства критериев проверки статистических гипотез // Автометрия. - 2020. - Т. 56, № 3. - С. 35-45. -DOI: 10.15372/AUT20200305.

40. Лемешко Б.Ю., Лемешко С.Б. О влиянии ошибок округления на распределения статистик критериев согласия // Вестник Томского государственного университета. Управление,

вычислительная техника и информатика. - 2020. - № 53. - С. 47-60. - DOI: 10.17223/19988605/53/5.

41. Lemeshko B.Y., Lemeshko S.B. About the effect of rounding on the properties of tests for testing statistical hypotheses // Journal of Physics: Conference Series. - 2021. - Vol. 1715. -P. 012063. - DOI: 10.1088/1742-6596/1715/1/012063.

Лемешко Борис Юрьевич, доктор технических наук, профессор, профессор кафедры теоретической и прикладной информатики Новосибирского государственного технического университета. Основное направление научных исследований - компьютерные технологии исследования статистических и вероятностных закономерностей. Имеет более 400 печатных работ, в том числе 20 монографий и учебных пособий. E-mail: lemeshko@ami.nstu.ru

Лемешко Станислав Борисович, кандидат технических наук, старший научный состудник Центра статистических технологий Новосибирского государственного технического университета. Основное направление научных исследований - компьютерные технологии моделирования и исследования статистических закономерностей. Имеет 67 печатных работ, в том числе одну монографию. E-mail: skyer@mail.ru

Lemeshko Boris Yu., D.Sc. (Eng,), professor, professor at the Department of Theoretical and Applied Informatics, Novosibirsk State Technical University. The main field of his scientific research is computer technologies to study statistical and probabilistic laws. He has more than 400 publications including 20 monographs and textbooks. E-mail: lemeshko@ami.nstu.ru Lemeshko Stanislav B., PhD (Eng.), senior researcher in the Center for Statistical Technology, Novosibirsk State Technical University. The main field of his scientific research is computer modeling technologies and research of statistical laws. He has 67 publications including 1 monograph. E-mail: skyer@mail.ru

DOI: 10.17212/2782-2001-2021-2-47-66

Problems of nonparametric goodness-of-fit test application in tasks of measurement results processing

B.Yu. LEMESHKOa, S.B. LEMESHKOb

Novosibirsk State Technical University, 20 K. Marx Prospekt, Novosibirsk, 630073, Russian Federation

a lemeshko@ami.nstu.ru b skyer@mail.ru Abstract

It is argued that in most cases two reasons underlie the incorrect application of nonpara-metric goodness-of-fit tests in various applications.

The first reason is that when testing composite hypotheses and evaluating the parameters of the law for the analyzed sample, classical results associated with testing simple hypotheses are used. When testing composite hypotheses, the distributions of goodness-of-fit statistics are influenced by the form of the observed law F(x, 0) corresponding to the hypothesis being tested, by the type and number of estimated parameters, by the estimation method, and in some cases by the value of the shape parameter. The paper shows the influence of all mentiomed factors on the distribution of test statistics. It is emphasized that, when testing composite hypotheses, the neglect, of the fact that the test has lost the property of "freedom from distribution" leads to an increase in the probability of the 2nd kind errors. It is shown that the distribution of the statistics of the test necessary for the formation of a conclusion about the results of testing a

Received 05 February 2021.

64

E.rn. №memko, C.E. MEMEWKO

composite hypothesis can be found using simulation in an interactive mode directly in the process of testing.

The second reason is associated with the presence of round-off errors which can significantly change the distributions of test statistics. The paper shows that asymptotic results when testing simple and composite hypotheses can be used with round -off errors A much less than the standard deviation a of the distribution law of measurement errors and sample sizes n not exceeding some maximum values. For sample sizes larger than these maximum values, the real distributions of the test statistics deviate from asymptotic ones towards larger statistics values. In such situations, the use of asymptotic distributions to arrive at a conclusion about the test results leads to an increase in the probabilities of errors of the 1st kind (to the rejection of a valid hypothesis being tested). It is shown that when the round-off errors and a are commensurable, the distributions of the test statistics deviate from the asymptotic distributions for small n. And as n grows, the situation only gets worse. In the paper, changes in the distributions of statistics under the influence of rounding are demonstrated both when testing both simple and composite hypotheses. It is shown that the only way out that ensures the correctness of conclusions according to the applied tests in such non-standard conditions is the use of real distributions of statistics. This task can be solved interactively (in the process of verification) and rely on computer research technologies and the apparatus of mathematical statistics.

Keywords: hypothesis testing, nonparametric goodness-of-fit tests, simple hypothesis, composite hypothesis, distribution of statistics, round-off errors, achieved significance level, error of the 1st kind, error of the 2nd kind, simulation

REFERENCES

1. Kolmogoroff A.N. Sulla determinazione empirica di una legge di distribuzione. Giornale del Istituto Italiano degli Attuari, 1933, vol. 4, no. 1, pp. 83-91.

2. Bol'shev L.N., Smirnov N.V. Tablitsy matematicheskoi statistiki [Tables for mathematical statistics]. Moscow, Nauka Publ., 1983. 416 p.

3. Anderson T.W., Darling D.A. Asymptotic theory of certain "Goodness of fit" criteria based on stochastic processes. The Annals of Mathematical Statistics, 1952, vol. 23, pp. 193-212.

4. Anderson T.W., Darling D.A. A test of goodness of fit. Journal of the American Statistical Association, 1954, vol. 29, pp. 765-769.

5. Kuiper N.H. Tests concerning random points on a circle. Indagationes Mathematicae (Proceedingsi), 1960, vol. 63, pp. 38-47.

6. Lemeshko B.Yu. Neparametricheskie kriterii soglasiya: rukovodstvo po primeneniyu [Non-parametric goodness-of-fit tests. Guide on the application]. Moscow, Infra-M, 2014. 163 p. DOI: 10.12737/11873.

7. Stephens M.A. The goodness-of-fit statistic VN: distribution and significance points. Bio-metrika, 1965, vol. 52, no. 3-4, pp. 309-321.

8. Watson G.S. Goodness-of-fit tests on a circle. 1. Biometrika, 1961, vol. 48, no. 1-2, pp. 109-114.

9. Watson G.S. Goodness-of-fit tests on a circle. 2. Biometrika, 1962, vol. 49, no. 1-2, pp. 57-63.

10. Zhang J. Powerful goodness-of-fit and multi-sample tests: PhD Thesis. York University. Toronto, 2001. 113 p. Available at: http://www.collectionscanada.gc.ca/obj/s4/f2/dsk3/ftp05/ NQ66371.pdf (accessed 15.01.2021).

11. Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio. Journal of the Royal Statistical Society: Series B, 2002, vol. 64, no. 2, pp. 281-294.

12. Noughabi H.A, Arghami N.R. General treatment of goodness of fit tests based on Kull-back-Leibler information. Journal of Statistical Computation and Simulation, 2013, vol. 83, pp. 1556-1569.

13. Noughabi H.A. A new estimator of Kullback-Leibler information and its application in goodness of fit tests. Journal of Statistical Computation and Simulation, 2019, vol. 89, no. 10, pp. 1914-1934.

14. Kac M., Kiefer J., Wolfowitz J. On tests of normality and other tests of goodness of fit based on distance methods. The Annals of Mathematical Statistics, 1955, vol. 26, pp. 189-211.

15. Lilliefors H.W. On the Kolmogorov-Smirnov test for normality with mean and variance unknown. Journal of the American Statistical Association, 1967, vol. 62, pp. 399-402.

16. Lilliefors H.W. On the Kolmogorov-Smirnov test for the exponential distribution with mean unknown. Journal of the American Statistical Association, 1969, vol. 64, pp. 387-389.

17. Martynov G.V. Kriterii omega-kvadrat [Omega-square criteria]. Moscow, Nauka Publ., 1978. 80 p.

18. Tyurin Yu.N. O predel'nom raspredelenii statistik Kolmogorova-Smirnova dlya slozhnoi gipotezy [On the limit distribution of Kolmogorov-Smirnov statistics for a composite hypothesis]. Izvestiya AN SSSR. Seriya matematicheskaya = Mathematics of the USSR-Izvestiya, 1984, vol. 48, no. 6, pp. 1314-1343. (In Russian).

19. Tyurin Yu.N., Savvushkina N.E. Kriterii soglasiya dlya raspredeleniya Veibulla-Gnedenko [Goodness of fit for the Weibull-Gnedenko distribution]. Izvestiya AN SSSR. Seriya: Tekhnicheskaya kibernetika = Soviet journal of computer and systems sciences, 1984, no. 3, pp. 109-112. (In Russian).

20. Lemeshko B.Yu., Postovalov S.N. O zavisimosti raspredelenii statistik neparametricheskikh kriteriev i ikh moshchnosti ot metoda otsenivaniya parametrov [On the dependence of the distributions of statistics of nonparametric tests and their power on the parameter estimation method]. Za-vodskaya laboratoriya. Diagnostika materialov = Industrial laboratory. Materials diagnostics, 2001, vol. 67, no. 7. pp. 62-71. (In Russian).

21. R 50.1.037-2002. Rekomendatsiipo standartizatsii. Prikladnaya statistika. Pravila prover-ki soglasiya opytnogo raspredeleniya s teoreticheskim. Ch. 2. Neparametricheskie kriterii [Recommendations for standardization. Applied statistics. Rules for checking the agreement of the experimental distribution with the theoretical one. Pt. 2. Nonparametric tests]. Moscow, Standards Publ., 2002. 64 p.

22. Lemeshko B.Yu., Lemeshko S.B. Distribution models for nonparametric tests for fit in verifying complicated hypotheses and maximum-likelihood estimators. Pt. 1. Measurement Techniques, 2009, vol. 52, no. 6, pp. 555-565.

23. Lemeshko B.Yu., Lemeshko S.B. Models for statistical distributions in nonparametric fitting tests on composite hypotheses based on maximum-likelihood estimators. Pt. 2. Measurement Techniques, 2009, vol. 52, no. 8, pp. 799-812.

24. Lemeshko B.Yu., Lemeshko S.B., Postovalov S.N. Statistic distribution models for some nonparametric goodness-of-fit tests in testing composite hypotheses. Communications in Statistics. Theory and Methods, 2010, vol. 39, no. 3, pp. 460-471.

25. Lemeshko B.Yu., Lemeshko S.B. Models of statistic distributions of nonparametric good-ness-of-fit tests in composite hypotheses testing for double exponential law cases. Communications in Statistics. Theory and Methods, 2011, vol. 40, no. 16, pp. 2879-2892.

26. Lemeshko B.Yu., Gorbunova A.A. Application of nonparametric Kuiper and Watson tests of goodness-of-fit for composite hypotheses. Measurement Techniques, 2013, vol. 56, no. 9, pp. 965-973.

27. Lemeshko B.Yu., Lemeshko S.B., Postovalov S.N., Chimitova E.V Statisticheskii analiz dannykh, modelirovanie i issledovanie veroyatnostnykh zakonomernostei. Komp'yuternyi podkhod [Statistical data analysis, simulation and study of probability regularities. computer approach]. Novosibirsk, NSTU Publ., 2011. 888 p.

28. Lemeshko B.Yu., Lemeshko S.B., Rogozhnikov A.P. Interactive investigation of statistical regularities in testing composite hypotheses of goodness of fit. Statistical models and methods for reliability and survival analysis. Ed. by V. Couallier, L. Gerville-Reache, C. Huber-Carol. Hoboken, NJ, Wiley-ISTE, 2013, ch. 5, pp. 61-76.

29. Lemeshko B.Yu., Lemeshko S.B., Blinov P.Yu., Veretel'nikova I.V., Novikova A.Yu. Statisticheskii analiz interval'nykh nablyudenii odnomernykh nepreryvnykh sluchainykh velichin "In-terval'naya statistika 5.4" [Statistical analysis of interval observations of one-dimensional continuous random variables "Interval statistics 5.4"]. The certificate on official registration of the computer program. No. 2018666213, 2018. Available at: https://ami.nstu.ru/~headrd/ISW.htm. (accessed 22.01.2021).

30. Lemeshko B.Yu. Lemeshko S.B., Semenova M.A. K voprosu statisticheskogo analiza bol'shikh dannykh [To question of the statistical analysis of big data]. Vestnik Tomskogo gosudar-stvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika = Tomsk State University Journal of Control and Computer Science, 2018, no. 44. pp. 40-49. DOI: 10.17223/19988605/44/5.

31. Lemeshko B.Yu., Blinov P.Yu. Kriterii proverki otkloneniya raspredeleniya ot ravnomernogo zakona: rukovodstvo po primeneniyu [Tests for checking the deviation from uniform distribution law. Guide on the application]. Moscow, Infra-M Publ., 2015. 183 p. DOI: 10.12737/11304.

32. Lemeshko B.Yu. Kriterii proverki otkloneniya raspredeleniya ot normal'nogo zakona: rukovodstvo po primeneniyu [Tests for checking the deviation from normal distribution law. Guide on the application]. Moscow, Infra-M Publ., 2015. 160 p. DOI: 10.12737/6086.

33. Lemeshko B.Yu., Blinov P.Yu. Kriterii proverki otkloneniya ot eksponentsial'nogo zakona: rukovodstvo po primeneniyu [Tests for checking the deviation from exponential distribution law. Guide on the application]. Moscow, Infra-M Publ., 2021. 352 p. DOI 10.12737/1097477.

34. Lemeshko B.Yu. Kriterii proverki gipotez ob odnorodnosti: rukovodstvo po primeneniyu [Tests for homogeneity. Guide on the application]. 2nd ed., rev. and add. Moscow, Infra-M Publ., 2021. 248 p. DOI 10.12737/986695.

35. Pearson E.S., D'Agostino R.B., Bowman K.O. Tests for departure from normality: comparison of powers. Biometrika, 1977, vol. 64, pp. 231-246. DOI: 10.1093/biomet/64.2.427-a.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

36. Tricker A.R. The effect of rounding on the significance level of certain normal test statistics. Journal of Applied Statistics, 1990, vol. 17, no. 1, pp. 31-38. DOI: 10.1080/757582644.

37. Tricker A.R. The effect of rounding on the power level of certain normal test statistics. Journal of Applied Statistics, 1990, vol. 17, no. 2, pp. 219-228. DOI: 10.1080/757582833.

38. Deidda R., Puliga M. Sensitivity of goodness-of-fit statistics to rainfall data rounding off. Physics and Chemistry ofthe Earth, 2006, vol. 31, pp. 1240-1251. DOI: 10.1016/j.pce.2006.04.041.

39. Lemeshko B.Yu., Lemeshko S.B. Effect of the roundoff on the properties of criteria for testing statistical hypotheses. Optoelectronics, Instrumentation and Data Processing, 2020, vol. 56, no. 3, pp. 35-45. DOI: 10.3103/S8756699020030103. Translated from Avtometriya, 2020, vol. 56, no. 3, pp. 35-45. DOI: 10.15372/AUT20200305.

40. Lemeshko B.Yu., Lemeshko S.B. O vliyanii oshibok okrugleniya na raspredeleniya statistik kriteriev soglasiya [About the influence of rounding errors on distributions of statistics of the good-ness-of-fit tests]. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika = Tomsk State University Journal of Control and Computer Science, 2020, no. 53. pp. 47-60. DOI: 10.17223/19988605/53/5.

41. Lemeshko B.Y., Lemeshko S.B. About the effect of rounding on the properties of tests for testing statistical hypotheses. Journal of Physics: Conference Series, 2021, vol. 1715, p. 012063. DOI: 10.1088/1742-6596/1715/1/012063.

Для цитирования:

Лемешко Б.Ю., Лемешко С.Б. Проблемы применения непараметрических критериев согласия в задачах обработки результатов измерений // Системы анализа и обработки данных. -2021. - № 2 (82). - С. 47-66. - DOI: 10.17212/2782-2001-2021-2-47-66.

For citation:

Lemeshko B.Yu., Lemeshko S.B. Problemy primeneniya neparametricheskikh kriteriev soglasiya v zadachakh obrabotki rezul'tatov izmerenii [Problems of nonparametric goodness-of-fit test application in tasks of measurement results processing]. Sistemy analiza i obrabotki dannykh = Analysis and Data Processing Systems, 2021, no. 2 (82), pp. 47-66. DOI: 10.17212/2782-20012021-2-47-66.

ISSN2782-2001, http://journals.nstu.ru/vestnik Analysis and data processing systems Vol. 82, No 2, 2021, pp. 47-66

i Надоели баннеры? Вы всегда можете отключить рекламу.