Научная статья на тему 'НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ ПРИ ПРОВЕРКЕ НОРМАЛЬНОСТИ В УСЛОВИЯХ ОКРУГЛЕНИЯ ИЗМЕРЕНИЙ'

НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ ПРИ ПРОВЕРКЕ НОРМАЛЬНОСТИ В УСЛОВИЯХ ОКРУГЛЕНИЯ ИЗМЕРЕНИЙ Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
117
24
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОВЕРКА НОРМАЛЬНОСТИ / НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ / СЛОЖНАЯ ГИПОТЕЗА / РАСПРЕДЕЛЕНИЕ СТАТИСТИКИ / ОШИБКИ ОКРУГЛЕНИЯ / ДОСТИГНУТЫЙ УРОВЕНЬ ЗНАЧИМОСТИ / ОШИБКА 1-ГО РОДА / ОШИБКА 2-ГО РОДА / ИМИТАЦИОННОЕ МОДЕЛИРОВАНИЕ

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — Лемешко Борис Юрьевич, Лемешко Станислав Борисович

При анализе рядов измерений в различных приложениях в качестве обязательной процедуры рассматривается проверка принадлежности ошибок измерений нормальному закону. В этих целях могут использоваться различные специальные критерии проверки гипотез о нормальности, могут применяться непараметрические критерии согласия или критерии типа хи-квадрат. При использовании для проверки нормальности непараметрических критериев согласия необходимо учитывать, что проверяется сложная гипотеза. При проверке сложной гипотезы распределения статистик критериев согласия существенно отличаются от классических, имеющих место при проверке простых гипотез. Известно, что наличие ошибок округления может существенно изменять распределения статистик критериев. В таких ситуациях игнорирование факта влияния может приводить к некорректным выводам о результатах проверки нормальности. Метрологи при проведении высокоточных измерений, как правило, не допускают и мысли о возможном влиянии ошибок округления D на результаты статистического анализа. Этим самым допускается возможность некорректности выводов, так как влияние округления отсутствует не просто при малых D, а при значениях D, много меньших среднеквадратического отклонения s закона распределения ошибок измерения, и объемах выборок n, не превышающих некоторых максимальных значений. При объемах выборок больших, чем эти максимальные значения, реальные распределения статистик критериев отклоняются от асимптотических в сторону больших значений статистик. В работе на реальных и хорошо знакомых данных с использованием методов статистического моделирования демонстрируется зависимость распределений статистик непараметрических критериев согласия при проверке нормальности от соотношения D и s при конкретных значениях n. Показывается и реализуется возможность корректного применения критериев в условиях влияния на выводы ошибок округления.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — Лемешко Борис Юрьевич, Лемешко Станислав Борисович

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NONPARAMETRIC GOODNESS-OF-FIT TESTS FOR NORMALITY TESTING UNDER ROUNDING-OFF MEASUREMENTS

When analyzing measurement series in various applications, the verification of whether measurement errors belong to the normal law is considered as a mandatory procedure. For this purpose, various special tests for testing hypotheses about normality can be used; non-parametric tests of goodness or chi-square tests can be used. When using nonparametric goodness-of-fit tests to test normality, it must be taken into account that a complex hypothesis is being tested. When testing a complex hypothesis, the distributions of the statistics of the goodness-of-fit tests differ significantly from the classical ones that occur when testing simple hypotheses. It is known that the presence of rounding errors can significantly change the distribution of test statistics. In such situations, ignoring the fact of influence can lead to incorrect conclusions about the results of the normality test. In metrology, when carrying out high-precision measurements, as a rule, scientists do not even allow thoughts about the possible influence of D rounding errors on the results of statistical analysis. This allows the possibility of incorrect conclusions since there is no influence not only at small D, but at values of D much less than the standard deviation s of the measurement error distribution law and sample sizes n not exceeding some maximum values. For sample sizes larger than these maximum values, the real distributions of the test statistics deviate from the asymptotic ones towards larger statistics values. In this work, based on real and well-known data, using statistical modeling methods, we demonstrate the dependence of the distributions of statistics of nonparametric goodness-of-fit tests when testing normality on the ratio of D and s for specific n. The possibility of correct application of the tests under the influence of rounding errors on the conclusions is shown and implemented.

Текст научной работы на тему «НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ ПРИ ПРОВЕРКЕ НОРМАЛЬНОСТИ В УСЛОВИЯХ ОКРУГЛЕНИЯ ИЗМЕРЕНИЙ»

ISSN 2782-2001 Системы анализа и обработки данных том 86, № 2, 2022, с. 21-38

http://journals.nstu.ru/vestnik Analysis and data processing systems Vol. 86, No. 2, 2022, pp. 21-38

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ТЕЛЕКОММУНИКАЦИИ

INFORMATION

TECHNOLOGIES

AND TELECOMMUNICATIONS

УДК 519.23 Б01: 10.17212/2782-2001-2022-2-21-38

Непараметрические критерии согласия при проверке нормальности в условиях округления измерений*

Б.Ю. ЛЕМЕШКО а, С Б. ЛЕМЕШКО "

630073, РФ, г. Новосибирск, пр. Карла Маркса, 20, Новосибирский государственный технический университет

а lemeshko@ami.nstu. ги ь skyer@mail. ги

При анализе рядов измерений в различных приложениях в качестве обязательной процедуры рассматривается проверка принадлежности ошибок измерений нормальному закону. В этих целях могут использоваться различные специальные критерии проверки гипотез о нормальности, могут применяться непараметрические критерии согласия или критерии типа хи-квадрат.

При использовании для проверки нормальности непараметрических критериев согласия необходимо учитывать, что проверяется сложная гипотеза. При проверке сложной гипотезы распределения статистик критериев согласия существенно отличаются от классических, имеющих место при проверке простых гипотез.

Известно, что наличие ошибок округления может существенно изменять распределения статистик критериев. В таких ситуациях игнорирование факта влияния может приводить к некорректным выводам о результатах проверки нормальности.

Метрологи при проведении высокоточных измерений, как правило, не допускают и мысли о возможном влиянии ошибок округления А на результаты статистического анализа. Этим самым допускается возможность некорректности выводов, так как влияние округления отсутствует не просто при малых А, а при значениях А, много меньших среднеквадратического отклонения ст закона распределения ошибок измерения, и объемах выборок п, не превышающих некоторых максимальных значений. При объемах выборок больших, чем эти максимальные значения, реальные распределения статистик критериев отклоняются от асимптотических в сторону больших значений статистик.

В работе на реальных и хорошо знакомых данных с использованием методов статистического моделирования демонстрируется зависимость распределений статистик непараметрических критериев согласия при проверке нормальности от соотношения А и ст при конкретных значениях п. Показывается и реализуется возможность корректного применения критериев в условиях влияния на выводы ошибок округления.

*

Статья получена 17марта 2022 г.

Ключевые слова: проверка нормальности, непараметрические критерии согласия, сложная гипотеза, распределение статистики, ошибки округления, достигнутый уровень значимости, ошибка 1-го рода, ошибка 2-го рода, имитационное моделирование

ВВЕДЕНИЕ

При анализе рядов измерений в различных приложениях в качестве обязательной процедуры рассматривается проверка принадлежности ошибок измерений нормальному закону. В этих целях могут использоваться различные специальные критерии проверки гипотез о нормальности, могут применяться непараметрические критерии согласия или критерии типа хи-квадрат [1].

При использовании для проверки нормальности непараметрических критериев согласия необходимо учитывать, что проверяется сложная гипотеза. При проверке сложной гипотезы распределения статистик критериев согласия существенно отличаются от классических, имеющих место при проверке простых гипотез. Игнорирование этого факта является одной из наиболее распространенных ошибок при применении непараметрических критериев согласия [2].

Известно, что наличие ошибок округления может существенно изменять распределения статистик критериев [3-5]. В таких ситуациях пренебрежение фактом влияния может приводить к некорректным выводам о результатах проверки нормальности.

В метрологии при проведении высокоточных измерений, как правило, не допускают и мысли о возможном влиянии ошибок округления А на результаты статистического анализа. В результате возрастает риск некорректности выводов, так как влияние округления отсутствует не просто при малых А, а при значениях А, много меньших среднеквадратического отклонения с закона распределения ошибок измерения, и объемах выборок п, не превышающих некоторых максимальных значений. При объемах выборок бо льших, чем эти максимальные значения, реальные распределения статистик критериев отклоняются от асимптотических в сторону бо льших значений статистик [6].

В настоящей статье на реальных и хорошо знакомых данных [7] с использованием методов статистического моделирования демонстрируется зависимость распределений статистик непараметрических критериев согласия от соотношения между А и с и от объемов выборок п при проверке гипотезы о нормальности.

1. ПРИМЕНЯЕМЫЕ ПРИ ПРОВЕРКЕ НОРМАЛЬНОСТИ НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ

В работе рассматривается применение восьми непараметрических критериев согласия.

В критерии Колмогорова (К) [8] (в отечественной практике) используется статистика с поправкой Большева [9] в виде

„ /-_ 1 6пБп +1

=4пВп +—г= пг , (1)

6у1 п 6у/ п

i -1

где Dn = max ((, Dn ), D+ = max -j — - F(xi, 9) I, Dn = max -j F(xi, 9) -

^ ' 1<—<n [ n J 1<—<n [ - J

Статистика критерия Крамера - Мизеса - Смирнова (CMS) имеет вид [9]

I 2

Sro = n®2 + Zi F(x—, 9) - 2— 1

12n

i=1

2n

(2)

Статистика критерия Андерсона - Дарлинга (АБ) [10, 11], как правило, применяется в виде

i=1

Sq =-n - 211^- ln F(x—, 9) + f 1 Iln(1 - F(x—, 9)) I (3)

2n

2n

В критерии Купера (Ku) [12] можно использовать статистику в виде [13]

V'

mod

(4)

Статистика критерия Ватсона (W) [14, 15] используется в форме

Щ = Z|F (x—, 9)-i=1

i -1/2

2 ( 1 n

- n

2

Z F (x—, 9)--ni=1 2

1

12n

(5)

В критериях Жанга [16, 17] статистики задаются выражениями:

(

Zk = max

1<—<n

— - -21 log

2 J nF(xt, 9)

n-—+^ I log

n - — +1/2

iFFx—l))

, (6)

Za =-z

—=1

log {F (x—, 9)) log {1 - F (x—, 9))

n - — +1/2

— -1/2

(7)

zc = Z

—=1

log

[F (x{, 9)]-1 -1

(n -1/ 2)/ (— -3/4) -1

(8)

Критерии Жанга являются развитием критериев со статистиками (1)-(3).

Модели распределений статистик (1)-(5), имеющие место при проверке нормальности (в отсутствие влияния ошибок округления) с оцениванием параметров нормального закона методом максимального правдоподобия, получены в [18-20] и представлены в табл. 1.

Таблица 1 Table 1

Модели распределений статистик (1)-(5) при проверке нормальности Models of statistics distributions (1)-(5) when testing normality

№ п/п Критерий Модель распределения статистики

1 Колмогорова у(6.4721; °.°58°; °.262°)

2 Крамера - Мизеса - Смирнова Бш(4.1153; 4.1748; 11.°35; °.5116; °.°°9)

3 Андерсона - Дарлинга Бш(4.7262; 4.6575; 9.4958; 2.717; °.°775)

4 Купера Бш(7.4917; 8.°°16; 2.4595; 2.1431; °.4937)

5 Ватсона Бш(3.523°; 4.4°77; 9.2281; °.4785; °.°1°4)

В табл. 1 через Вш(90,0j, 02,63,64) обозначено бета-распределение III рода с плотностью

f (x) =

ее° е2

езВ(е°, е1)

x -е

е° -1

°

е

3

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

1 -

x -е4

е,-1

V>1

е

3

1+(е2 -1)

x -е4

е° +е1

е

3

через у (0°, 01,02) - гамма-распределение с функцией плотности

1

f (x) = ■

е

.(x-е2)е°-V^)^.

61° Г(0о)

Распределения статистик (6)-(8), в том числе при проверке нормальности, зависят от объемов выборок п. Поэтому, применяя соответствующие критерии, для вычисления достигнутого уровня значимости рт[ие в программном обеспечении (как в [21]) приходится предусматривать использование интерактивного режима моделирования распределений статистик.

2. ВЛИЯНИЕ ОКРУГЛЕНИЯ НА РАСПРЕДЕЛЕНИЯ СТАТИСТИК

Измерения всегда фиксируются с некоторой погрешностью округления. Возможность влияния ошибок округления на статистические выводы давно признавалась многими авторами [22-25]. Вопрос заключался лишь в том, как реально наличие ошибок округления сказывается на распределениях статистик критериев.

В ситуациях, когда ошибки округления Д«о, где о - среднеквадратичное отклонение ошибки измерения, и п меньше некоторого птах, зависящего от п и а, влиянием Д на распределения статистик можно пренебречь [6] и пользоваться асимптотическими результатами, имеющими место при проверке простых и сложных гипотез.

При соизмеримости Д и а, когда значения Д и а величины одного порядка, всё меняется. Влияние ошибок округления на распределения статистик критериев проверки различных гипотез рассматривалось нами в [2-5].

Результаты, полученные в [2], касающиеся критериев со статистиками (1)-(5) и имеющие отношение к проверке нормальности, кратко можно охарактеризовать следующим образом:

- наличие ошибок округления приводит к появлению зависимости а(8|И°) от п;

- факт наличия округлений в анализируемых данных исключает возможность использования асимптотических распределений статистик в условиях больших выборок;

- в условиях соизмеримости Д и а распределения 0(Бп\Истатистик

могут значительно отличаться от асимптотических и при относительно небольших объемах выборок;

- вследствие наличия округлений потеря свойства «свободы от распределения» может происходить и в условиях проверки простых гипотез;

- на распределения статистик (6)-(8), которые зависят от п и в отсутствие ошибок округления, все вышеперечисленные факторы, связанные с Д , воздействуют аналогичным образом.

В качестве демонстрационного примера на рис. 1 в условиях соизмеримости Д и а иллюстрируется влияние Д на распределение статистики (1) критерия Колмогорова в следующей ситуации: проверяется гипотеза Ио о принадлежности выборок нормальному закону распределения при п = 50 с вычислением оценок максимального правдоподобия (ОМП) параметров ц и а закона. Приведенные на рисунке зависимости построены на основе результатов статистического моделирования распределений статистик в условиях округления данных с использованием возможностей системы ISW [21]. Аналогично на рис. 2 показано, как меняются распределения статистики (1) в зависимости от объема выборки п при справедливости гипотезы И о о нормальности при фиксированной ошибке округления Д = 0.1а и использовании ОМП. Мы можем видеть, что и при росте Д, и при росте п распределения 0(|И°) всё дальше отклоняются от асимптотического распределения статистики, имеющего место в отсутствие ошибок округления, модель которого приведена в табл. 1.

Таким же образом в этих условиях меняются распределения статистик (2)-(8) других непараметрических критериев согласия.

3. ПРОВЕРКА НОРМАЛЬНОСТИ В УСЛОВИЯХ ОКРУГЛЕНИЯ ИЗМЕРЕНИЙ

В работе [7] результаты измерений характеристик ирисов были использованы для решения задачи таксономии. Заимствованные в [7] результаты измерений в сантиметрах представлены в табл. 2.

Рис. 1. Зависимость распределения статистики (1) критерия Колмогорова от Д при справедливости сложной гипотезы H0 о принадлежности выборки нормальному закону (в случае ОМП) при n = 50

Fig. 1. Dependence of the distribution of statistic (1) of the Kolmogorov test on Д under the validity of the composite hypothesis Ho that the sample belongs to the normal law (in the case of MLE) for n = 50

1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0

i7= 50; Д = 0 УУ^ rSfyS- .......Jf...............

17 = 50 ///У 7 ■ и = 5000 7

\ / / / ! / / j / | | \ /

n = 100 ; /7/ ТУ 7 4 г? = 2000 j

iff /а к /

jt = 200 ^fffj/ \ f 17=1000 J

......... }ш -l^i j \ \ /

\ п= 500 /

УУУу, У У У

■b: —►

0,2 OA 0,6 0,8 1,0 1,2 1A 1,6 1,8 2,0

Рис. 2. Зависимость распределения статистики (1) критерия Колмогорова от объема выборки n при справедливости сложной гипотезы H0 о принадлежности выборки нормальному закону (в случае ОМП) при Д = 0.1 ст

Fig. 2. Dependence of the distribution of statistic (1) of the Kolmogorov test on the sample size n with the correctness of the composite hypothesis H0 that the sample belongs to the normal law (in the case of MLE) at Д = 0.1 ст

В табл. 2 для каждого из трех видов ириса (Iris setosa, Iris versicolor, Iris virginica) представлены измерения четырех характеристик для 50 представителей каждого вида: Sepal length - длина чашелистика, Sepal width - ширина чашелистика, Petal length - длина лепестка, Petal width - ширина лепестка. Погрешность округления А = 0.1 одна и та же для всех измерений.

В выборках непрерывных одинаково распределенных случайных величин вероятность появления двух одинаковых значений равна нулю. В рядах реальных измерений вследствие естественного округления бывают повторяющиеся значения, и иногда их много. В столбцах табл. 2 также наблюдаются повторяющиеся значения. Посмотрим, как это отражается на результатах проверки гипотезы о принадлежности измерений характеристик ирисов нормальному закону.

Результаты проверки принадлежности всех 12 выборок нормальным законам по восьми рассматриваемым критериям для каждого из трех видов ириса представлены в табл. 3-5.

Для каждой выборки приводятся ОМП параметров ц и а нормального закона, вычисленные значения S статистик применяемых критериев согласия, значения достигнутого уровня значимости pvaiue, рассчитанного по асимптотическому G(S\Hо) распределению статистики в предположении об отсутствии ошибок округления (при А = 0) и полученного по реальному распределению G(Sw|Ho) (при А = 0.1 и при соответствующей ОМП для а). В последнем случае оценка pva¡ue находилась по смоделированному в интерактивном режиме реальному распределению G(Sn|Ho) (при А = 0.1 и конкретном а). Такая возможность реализована в [21].

Как можно видеть, оценки pva[ue , вычисленные по реальному распределению G(Sn \Hо) , кардинально отличаются от значений pva¡ue , вычисленных по асимптотическому распределению статистики G(S|Ho). И если пренебречь влиянием ошибок округления на распределения статистик критериев, то во многих случаях гипотеза о нормальности будет несправедливо отклоняться.

В данном случае надо обратить внимание на то, что каждой проверке по каждому критерию при А = 0.1 и n = 50 соответствует свое распределение статистики G(Sn|Ho), зависящее от а нормального закона. То есть для анализа 12 выборок по каждому из восьми критериев мы должны использовать 12 различных распределений G(S50 |Ho) статистики применяемого критерия, по которому и вычисляется pva¿ue .

В отсутствие влияния округлений распределения G(Sn|Ho) статистик (1)-(5) быстро сходятся к асимптотическим G(S|Ho) распределениям этих статистик: отклонением G(Sn|Ho) от G( S|Ho) можно пренебречь, как правило, при n > 25.. .30. При наличии влияния ошибок округления (как в данном случае) распределения G(Sn|Ho) не сходятся к асимптотическим G(S|Ho), а с ростом n всё дальше отклоняются от них.

Таблица 2 Table 2

Результаты измерений характеристик ирисов Results of measurements of the irises characteristics

№ п/п Iiis setosa Iiis versicolor Iris virginica

Sepal length Sepal width Petal length Petal width Sepal length Sepal width Petal length Petal width Sepal length Sepal width Petal length Petal width

1 5.1 3.5 1.4 0.2 7.0 3.2 4.7 1.4 6.3 2.2 6.0 2.5

2 4.9 3.0 1.4 0.2 6.4 3.2 4.5 1.5 5.8 2.5 5.1 1.9

3 4.7 3.2 1.3 0.2 6.9 3.1 4.9 1.5 7.1 2.5 5.9 2.1

4 4.6 3.1 1.5 0.2 5.5 2.3 4.0 1.3 6.3 2.5 5.6 1.8

5 5.0 3.6 1.4 0.2 6.5 2.8 4.6 1.5 6.5 2.5 5.8 2.2

6 5.4 3.9 1.7 0.4 5.7 2.8 4.5 1.3 7.6 2.6 6.6 2.1

7 4.6 3.4 1.4 0.3 6.3 3.3 4.7 1.6 4.9 2.6 4.5 1.7

8 5.0 3.4 1.5 0.2 4.9 2.4 3.3 1.0 7.3 2.7 6.3 1.8

9 4.4 2.9 1.4 0.2 6.6 2.9 4.6 1.3 6.7 2.7 5.8 1.8

10 4.9 3.1 1.5 0.1 5.2 2.7 3.9 1.4 7.2 2.7 6.1 2.5

11 5.4 3.7 1.5 0.2 5.0 2.0 3.5 1.0 6.5 2.7 5.1 2.0

12 4.8 3.4 1.6 0.2 5.9 3.0 4.2 1.5 6.4 2.8 5.3 1.9

13 4.8 3.0 1.4 0.1 6.0 2.2 4.0 1.0 6.8 2.8 5.5 2.1

14 4.3 3.0 1.1 0.1 6.1 2.9 4.7 1.4 5.7 2.8 5.0 2.0

15 5.8 4.0 1.2 0.2 5.6 2.9 3.6 1.3 5.8 2.8 5.1 2.4

16 5.7 4.4 1.5 0.4 6.7 3.1 4.4 1.4 6.4 2.8 5.3 2.3

17 5.4 3.9 1.3 0.4 5.6 3.0 4.5 1.5 6.5 2.8 5.5 1.8

18 5.1 3.5 1.4 0.3 5.8 2.7 4.1 1.0 7.7 2.8 6.7 2.2

19 5.7 3.8 1.7 0.3 6.2 2.2 4.5 1.5 7.7 2.8 6.9 2.3

20 5.1 3.8 1.5 0.3 5.6 2.5 3.9 1.1 6.0 2.9 5.0 1.5

21 5.4 3.4 1.7 0.2 5.9 3.2 4.8 1.8 6.9 2.9 5.7 2.3

22 5.1 3.7 1.5 0.4 6.1 2.8 4.0 1.3 5.6 3.0 4.9 2.0

23 4.6 3.6 1.0 0.2 6.3 2.5 4.9 1.5 7.7 3.0 6.7 2.0

24 5.1 3.3 1.7 0.5 6.1 2.8 4.7 1.2 6.3 3.0 4.9 1.8

25 4.8 3.4 1.9 0.2 6.4 2.9 4.3 1.3 6.7 3.0 5.7 2.1

26 5.0 3.0 1.6 0.2 6.6 3.0 4.4 1.4 7.2 3.0 6.0 1.8

27 5.0 3.4 1.6 0.4 6.8 2.8 4.8 1.4 6.2 3.0 4.8 1.8

28 5.2 3.5 1.5 0.2 6.7 3.0 5.0 1.7 6.1 3.0 4.9 1.8

29 5.2 3.4 1.4 0.2 6.0 2.9 4.5 1.5 6.4 3.0 5.6 2.1

30 4.7 3.2 1.6 0.2 5.7 2.6 3.5 1.0 7.2 3.0 5.8 1.6

31 4.8 3.1 1.6 0.2 5.5 2.4 3.8 1.1 7.4 3.0 6.1 1.9

32 5.4 3.4 1.5 0.4 5.5 2.4 3.7 1.0 7.9 3.0 6.4 2.0

33 5.2 4.1 1.5 0.1 5.8 2.7 3.9 1.2 6.4 3.0 5.6 2.2

34 5.5 4.2 1.4 0.2 6.0 2.7 5.1 1.6 6.3 3.1 5.1 1.5

35 4.9 3.1 1.5 0.2 5.4 3.0 4.5 1.5 6.1 3.1 5.6 1.4

36 5.0 3.2 1.2 0.2 6.0 3.4 4.5 1.6 7.7 3.1 6.1 2.3

37 5.5 3.5 1.3 0.2 6.7 3.1 4.7 1.5 6.3 3.1 5.6 2.4

38 4.9 3.6 1.4 0.1 6.3 2.3 4.4 1.3 6.4 3.2 5.5 1.8

39 4.4 3.0 1.3 0.2 5.6 3.0 4.1 1.3 6.0 3.2 4.8 1.8

40 5.1 3.4 1.5 0.2 5.5 2.5 4.0 1.3 6.9 3.2 5.4 2.1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

41 5.0 3.5 1.3 0.3 5.5 2.6 4.4 1.2 6.7 3.2 5.6 2.4

42 4.5 2.3 1.3 0.3 6.1 3.0 4.6 1.4 6.9 3.2 5.1 2.3

43 4.4 3.2 1.3 0.2 5.8 2.6 4.0 1.2 5.8 3.3 5.1 1.9

44 5.0 3.5 1.6 0.6 5.0 2.3 3.3 1.0 6.8 3.3 5.9 2.3

45 5.1 3.8 1.9 0.4 5.6 2.7 4.2 1.3 6.7 3.3 5.7 2.5

46 4.8 3.0 1.4 0.3 5.7 3.0 4.2 1.2 6.7 3.4 5.2 2.3

47 5.1 3.8 1.6 0.2 5.7 2.9 4.2 1.3 6.3 3.4 5.0 1.9

48 4.6 3.2 1.4 0.2 6.2 2.9 4.3 1.3 6.5 3.6 5.2 2.0

49 5.3 3.7 1.5 0.2 5.1 2.5 3.0 1.1 6.2 3.8 5.4 2.3

50 5.0 3.3 1.4 0.2 5.7 2.8 4.1 1.3 5.9 3.8 5.1 1.8

Результаты проверки гипотез о принадлежности нормальному закону характеристик для Iris setosa Results of testing the hypotheses about the belonging to the normal law of characteristics for Iris setosa

№ n/n Критерий Test Sepal length Sepal width Petal length Petal width

ц = 5.006, a = 0.3489 ц = 3.428, CT = 0.3753 ц = 1.462, CT = 0.1719 ц = 0.246, CT = 0.1043

S Pvalue S Pvalue S Pvalue S Pvalue

A = 0 A = 0.1 A = 0 A = 0.1 A = 0 A = 0.1 A = 0 A = 0.1

1 К 0.828 0.106 0.479 0.758 0.192 0.614 1.102 0.006 0.521 2.501 0.000 0.000

2 CMS 0.071 0.269 0.659 0.074 0.248 0.558 0.187 0.009 0.429 0.982 0.000 0.0001

3 AD 0.414 0.339 0.731 0.484 0.231 0.496 0.999 0.013 0.522 4.747 0.000 0.0001

4 Ku 1.511 0.047 0.388 1.420 0.086 0.485 2.110 0.000 0.343 4.148 0.000 0.0004

5 W 0.070 0.229 0.627 0.072 0.217 0.540 0.188 0.004 0.402 0.940 0.000 0.0001

6 ¿A 3.312 0.636 0.828 3.356 0.148 0.220 3.365 0.107 0.520 3.706 0.000 0.001

7 Zc 5.643 0.518 0.689 6.690 0.376 0.515 8.390 0.216 0.756 41.661 0.0002 0.002

8 ZK 1.175 0.262 0.630 1.168 0.078 0.249 0.206 0.019 0.610 12.067 0.000 0.000

о

Результаты проверки гипотез о принадлежности нормальному закону характеристик для Iris versicolor Results of testing hypotheses about belonging to the normal law of characteristics for Iris versicolor

№ п/п Критерий Test Sepal length Sepal width Petal length Petal width

ц = 5.936, a = 0.5110 ц = 2.770, CT = 0.3106 ц = 4.260, CT = 0.4652 ц = 1.3260, CT = 0.1958

S Pvalue S Pvalue S Pvalue S Pvalue

A = 0 A = 0.1 A = 0 A = 0.1 A = 0 A = 0.1 A = 0 A = 0.1

1 К 0.716 0.265 0.557 0.888 0.061 0.415 0.860 0.079 0.259 1.065 0.010 0.453

2 CMS 0.059 0.395 0.602 0.105 0.094 0.345 0.091 0.147 0.262 0.154 0.023 0.467

3 AD 0.374 0.421 0.613 0.573 0.139 0.450 0.562 0.149 0.254 0.975 0.015 0.319

4 Ku 1.282 0.199 0.519 1.403 0.097 0.678 1.252 0.232 0.623 1.886 0.001 0.432

5 W 0.057 0.362 0.576 0.098 0.093 0.373 0.076 0.191 0.359 0.153 0.014 0.451

6 ZA 3.313 0.624 0.717 3.320 0.500 0.742 3.354 0.155 0.201 3.387 0.050 0.214

7 ¿C 6.214 0.441 0.515 5.900 0.483 0.691 8.593 0.203 0.256 12.31 0.055 0.226

8 ZK 0.849 0.520 0.742 1.348 0.176 0.568 1.285 0.204 0.399 2.563 0.008 0.283

t4

ja

I

I §

о

Ьз &

I §

Результаты проверки гипотез о принадлежности нормальному закону характеристик для Iris virginica Results of testing hypotheses about belonging to the normal law of characteristics for Iris virginica

№ n/n Критерий Test Sepal length Sepal width Petal length Petal width

ц = 6.5880, a = 0.6295 ц = 2.9740, CT = 0.3193 ц = 5.552, CT = 0.5463 ц = 2.0260, CT = 0.2719

S Pvalue S Pvalue S Pvalue S Pvalue

A = 0 A = 0.1 A = 0 A = 0.1 A = 0 A = 0.1 A = 0 A = 0.1

1 К 0.841 0.095 0.202 0.925 0.042 0.314 0.843 0.092 0.238 0.895 0.057 0.504

2 CMS 0.089 0.155 0.210 0.106 0.093 0.313 0.087 0.165 0.250 0.121 0.059 0.308

3 AD 0.557 0.153 0.204 0.611 0.112 0.355 0.619 0.108 0.159 0.760 0.048 0.245

4 Ku 1.331 0.151 0.336 1.744 0.008 0.170 1.322 0.159 0.411 1.746 0.008 0.259

5 W 0.085 0.140 0.198 0.102 0.081 0.308 0.074 0.201 0.322 0.121 0.044 0.273

6 ZA 3.332 0.334 0.377 3.342 0.238 0.389 3.356 0.146 0.175 3.356 0.146 0.296

7 Zc 6.711 0.373 0.420 7.263 0.314 0.486 9.466 0.148 0.178 9.737 0.133 0.275

8 ZK 1.306 0.194 0.296 1.496 0.124 0.439 1.554 0.107 0.201 2.076 0.028 0.230

Проведенные исследования показали, что и при проверке простых гипотез о принадлежности выборок нормальному закону (в условиях влияния А)

распределения статистик 0(Бп\Но) непараметрических критериев согласия

становятся зависящими от п, от А и от значения параметра масштаба о,

а с ростом п всё больше отклоняются от асимптотических 0(£|Но) .

Отметим также, что в общем случае проверки сложной гипотезы о принадлежности выборки некоторому закону Г(х, 0) к факторам, влияющим

на распределения статистик С(£|Но) при сложной гипотезе [13], добавляется

зависимость от п, А и от значений оценок параметров формы и масштаба закона Г(х, 0) .

Для проверки нормальности кроме непараметрических критериев согласия может применяться более трех десятков специальных критериев [26], ориентированных только на проверку принадлежности выборок нормальному закону, в том числе описанных в [27-36]. Часть из этих критериев обладает определенными преимуществами по сравнению с непараметрическими критериями согласия, в частности, выигрывают в мощности относительно определенных конкурирующих гипотез. Однако и на распределениях статистик специальных критериев нормальности в аналогичных ситуациях сказывается влияние ошибок округления [4].

ЗАКЛЮЧЕНИЕ

Таким образом, применяя непараметрические критерии согласия для проверки гипотезы о принадлежности выборок нормальному закону распределения, следует учитывать возможное влияние ошибок округления на распределения статистик критериев.

Ошибки округления есть всегда. В ситуации, когда А«о и п меньше некоторого птах, зависящего от п и о, влиянием А на распределения статистик можно пренебречь. Но при п > птах реальные распределения статистик отклоняются от асимптотических, использование которых при проверке увеличивает вероятности ошибок 1-го рода - отклонения верной гипотезы Но .

В условиях соизмеримости А и а отклонение реальных распределений статистик от асимптотических (или от имеющих место в отсутствие округлений при зависимости распределений статистик от п ) может проявляться при относительно малых объемах выборок. Это подтверждает рассмотренный пример с характеристиками ирисов. А с ростом п эта проблема только усугубляется.

С выборками такого рода сталкиваются не только в биологии, зоологии, медицине и других науках, где в связи со спецификой измеряемых величин ошибки округления А всегда достаточно велики.

С такого же рода выборками сталкиваются при высокоточных измерениях в технических приложениях, когда измерения осуществляются на пределе точности измерительных систем. Общим и в том и в другом случае является проведение измерений на пределе точности.

Не следует считать, что ошибки округления могут изменять свойства только критериев согласия. Ошибки округления влияют на распределения статистик специальных критериев, ориентированных только на проверку нормальности. Под их влиянием изменяются свойства критериев равномерности, экспоненциальности и других десятков и сотен критериев, предназначенных для проверки различных гипотез.

Решать обозначенную проблему применения критериев проверки различных гипотез в условиях влияния ошибок округления можно единственным способом: разработать программное обеспечение, позволяющее методами статистического моделирования исследовать распределения статистик критериев (или находить оценки pvalue) в конкретных условиях приложения и при конкретном значении А . Таким примером является система [21], в рамках которой проведены настоящие исследования.

СПИСОК ЛИТЕРАТУРЫ

1. Лемешко Б.Ю. Критерии проверки отклонения распределения от нормального закона: руководство по применению. - M.: Инфра-М, 2015. - 160 с. - (Научная мысль. Математическая статистика). - DOI: 10.12737/6086.

2. Лемешко Б.Ю., Лемешко С.Б. Проблемы применения непараметрических критериев согласия в задачах обработки результатов измерений // Системы анализа и обработки данных. -2021. - № 2 (82). - С. 47-66. - DOI: 10.17212/2782-2001-2021-2-47-66.

3. Лемешко Б.Ю., Лемешко С.Б. Влияние округления на свойства критериев проверки статистических гипотез // Автометрия. - 2020. - Т. 56, № 3. - С. 35-45. - DOI: 10.15372/AUT20200305.

4. Лемешко Б.Ю., Лемешко С.Б. О влиянии ошибок округления на распределения статистик критериев согласия // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. - 2020. - № 53. - С. 47-60. - DOI: 10.17223/19988605/53/5.

5. Lemeshko B. Y., Lemeshko S.B. About the effect of rounding on the properties of tests for testing statistical hypotheses // Journal of Physics: Conference Series. - 2021. - Vol. 1715. 012063. DOI: 10.1088/1742-6596/1715/1/012063.

6. Лемешко Б.Ю. Лемешко С.Б., Семёнова М.А. К вопросу статистического анализа больших данных // Вестник Томского государственного университета. Управление, вычислительная техника и информатика. - 2018. - № 44. - С. 40-49. - DOI: 10.17223/19988605/44/5.

7. FisherR.A. The use of multiple measurements in taxonomic problems // Annals of Eugenics. -1936. - Vol. 7. - P. 179-188.

8. Kolmogoroff A.N. Sulla determinazione empirica di una legge di distribuzione // Giornale del Istituto Italiano degli Attuari. - 1933. - Vol. 4, N 1. - P. 83-91.

9. БольшевЛ.Н., СмирновН.В. Таблицы математической статистики. - М.: Наука, 1983. -

416 с.

10. Anderson T.W., Darling D.A. Asymptotic theory of certain "Goodness of fit" criteria based on stochastic processes // The Annals of Mathematical Statistics. - 1952. - Vol. 23. - P. 193-212.

11. Anderson T. W., Darling D.A. A test of goodness of fit // Journal of the American Statistical Association. - 1954. - Vol. 29. - P. 765-769.

12. Kuiper N.H. Tests concerning random points on a circle // Indagationes Mathematicae (Proceedings). - 1960. - Vol. 63. - P. 38-47.

13. Лемешко Б.Ю. Непараметрические критерии согласия: руководство по применению. -М.: Инфра-М, 2014. - 163 с. - DOI: 10.12737/11873.

14. Watson G.S. Goodness-of-fit tests on a circle. 1 // Biometrika. - 1961. - Vol. 48, N 1-2. -P. 109-114.

15. Watson G.S. Goodness-of-fit tests on a circle. 2 // Biometrika. - 1962. - Vol. 49, N 1-2. -P. 57-63.

16. Zhang J. Powerful goodness-of-fit and multi-sample tests: PhD Thesis / York University. -Toronto, 2001. - 113 p. - URL: http://www.collectionscanada.gc.ca/obj/s4/f2/dsk3/ftp05/ NQ66371.pdf (дата обращения: 27.05.2022).

17. Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio // Journal of the Royal Statistical Society: Series B. - 2002. - Vol. 64, N 2. - P. 281-294.

18. Lemeshko B.Yu., Lemeshko S.B. Distribution models for nonparametric tests for fit in verifying complicated hypotheses and maximum-likelihood estimators. Pt. 1 // Measurement Techniques. -2009. - Vol. 52, N 6. - P. 555-565.

19. Lemeshko B.Yu., Lemeshko S.B., Postovalov S.N. Statistic distribution models for some non-parametric goodness-of-fit tests in testing composite hypotheses // Communications in Statistics. Theory and Methods. - 2010. - Vol. 39, N 3. - P. 460-471.

20. Lemeshko B.Yu., Gorbunova A.A. Application of nonparametric Kuiper and Watson tests of goodness-of-fit for composite hypotheses // Measurement Techniques. - 2013. - Vol. 56, N 9. -P. 965-973.

21. Статистический анализ интервальных наблюдений одномерных непрерывных случайных величин «Интервальная статистика 5.4»: свидетельство о гос. регистрации программы для ЭВМ № 2018666213 / Лемешко Б.Ю., Лемешко С.Б., Блинов П.Ю., Веретельникова И.В., Новикова А.Ю. - Заявка № 2018663206; заявл. 22.11.2018; зарег. 13.12.2018. - URL: https://ami.nstu.ru/ ~headrd/ISW.htm (дата обращения: 27.05.2022).

22. Pearson E.S., D 'Agostino R.B., Bowman K.O. Tests for departure from normality: comparison of powers // Biometrika. - 1977. - Vol. 64. - P. 231-246. - DOI: 10.1093/biomet/64.2.427-a.

23. TrickerA.R. The effect of rounding on the significance level of certain normal test statistics // Journal of Applied Statistics. - 1990. - Vol. 17, N 1. - P. 31-38. - DOI: 10.1080/757582644.

24. Tricker A.R. The effect of rounding on the power level of certain normal test statistics // Journal of Applied Statistics. - 1990. - Vol. 17, N 2. - P. 219-228. - DOI: 10.1080/757582833.

25. Deidda R., Puliga M. Sensitivity of goodness-of-fit statistics to rainfall data rounding off // Physics and Chemistry of the Earth. - 2006. - Vol. 31. - P. 1240-1251. - DOI: 10.1016/ j.pce.2006.04.041.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

26. Uyanto S.S. An extensive comparisons of 50 univariate goodness-of-fit tests for normality // Austrian Journal of Statistics. - 2022. - Vol. 51. - P. 45-97.

27. Frosini B.V. A survey of a class of goodness-of-fit statistics // Metron. - 1978. - Vol. 36, N 1-2. - P. 3-49.

28. Epps T. W., Pulley L.B. A test for normality based on the empirical characteristic function // Biometrika. - 1983. - Vol. 70. - P. 723-726.

29. Hegazy Y.A.S., Green J.R. Some new goodness-of-fit tests using order statistics // Journal of the Royal Statistical Society: Series C (Applied Statistics). - 1975. - Vol. 24, N 3. - P. 299-308.

30. DavidH.A., Hartley H.O., Pearson E.S. The distribution of the ratio? In a single normal sample, of range to standard deviation // Biometrika. - 1964. - Vol. 512, N 3-4. - P. 484-487.

31. GearyR.C. Testing for Normality // Biometrika. - 1937. - Vol. 34. - P. 209-242.

32. D'Agostino R.B. Transformation to normality of the null distribution of g1 // Biometrika. -1970. - Vol. 57 (3). - P. 679-681.

33. Chen L., Shapiro S.S. An alternative test for normality based on normalized spacings // Journal of Statistical and Simulation. - 2012. - Vol. 53. - P. 269-288.

34. Desgagne A., MicheauxP.L. de. A powerful and interpretable alternative to the Jarque-Bera test of normality based on 2nd-power skewness and kurtosis, using the rao's score test on the APD family // Journal of Applied Statistics. - 2018. - Vol. 45, N 13. - P. 2307-2327.

35. Gel Y.R., Gastwirth J.L. A robust modification of the Jarque-Bera test of normality // Economics Letters. - 2008. - Vol. 99, N 1. - P. 30-32.

36. Zamanzade E., Arghami N.R. Testing normality based on new entropy estimators // Journal of Statistical Computation and Simulation. - 2012. - Vol. 82, N 11. - P. 1701-1713.

Лемешко Борис Юрьевич, доктор технических наук, профессор, профессор кафедры теоретической и прикладной информатики Новосибирского государственного технического университета. Основное направление научных исследований - компьютерные технологии исследования статистических и вероятностных закономерностей. Имеет более 400 печатных работ, в том числе 20 монографий и учебных пособий. E-mail: lemeshko@ ami.nstu.ru

Лемешко Станислав Борисович, кандидат технических наук, старший научный сотрудник Центра статистических технологий Новосибирского государственного технического университета. Основное направление научных исследований - компьютерные технологии моделирования и исследования статистических закономерностей. Имеет 68 печатных работ, в том числе одну монографию. E-mail: skyer@mail.ru

Lemeshko Boris Yu., D.Sc. (Eng,), Professor, Professor at the Department of Theoretical and Applied Informatics, Novosibirsk State Technical University. The main field of his scientific research is computer technologies for the study of statistical and probabilistic laws. He has more than 400 publications, including 20 monographs and textbooks. E-mail: lemeshko@ami.nstu.ru

Lemeshko Stanislav B., PhD (Eng.), senior researcher, Center for Statistical Technology, Novosibirsk State Technical University. The main field of his scientific research is computer modeling technologies and research on statistical laws. He has 68 publications, including 1 monograph. E-mail: skyer@mail.ru

DOI: 10.17212/2782-2001-2022-2-21-38

Nonparametric goodness-of-fit tests for normality testing under rounding-off measurements*

B.Yu. LEMESHKOa, S.B. LEMESHKOb

Novosibirsk State Technical University, 20 K. Marx Prospekt, Novosibirsk, 630073, Russian Federation

" lemeshko@ami.nstu.ru b skyer@mail.ru Abstract

When analyzing measurement series in various applications, the verification of whether measurement errors belong to the normal law is considered as a mandatory procedure. For this purpose, various special tests for testing hypotheses about normality can be used; non-parametric tests of goodness or chi-square tests can be used.

When using nonparametric goodness-of-fit tests to test normality, it must be taken into account that a complex hypothesis is being tested. When testing a complex hypothesis, the distributions of the statistics of the goodness-of-fit tests differ significantly from the classical ones that occur when testing simple hypotheses.

It is known that the presence of rounding errors can significantly change the distribution of test statistics. In such situations, ignoring the fact of influence can lead to incorrect conclusions about the results of the normality test.

In metrology, when carrying out high-precision measurements, as a rule, scientists do not even allow thoughts about the possible influence of A rounding errors on the results of statistical analysis. This allows the possibility of incorrect conclusions since there is no influence not only at small A, but at values of A much less than the standard deviation <r of the measurement error distribution law and sample sizes n not exceeding some maximum values. For sample sizes larger

*

Received 17 March 2022.

36

E.rn. №memko, C.E. MEMEWKO

than these maximum values, the real distributions of the test statistics deviate from the asymptotic ones towards larger statistics values.

In this work, based on real and well-known data, using statistical modeling methods, we demonstrate the dependence of the distributions of statistics of nonparametric goodness-of-fit tests when testing normality on the ratio of A and a for specific n. The possibility of correct application of the tests under the influence of rounding errors on the conclusions is shown and implemented.

Keywords: normality check, nonparametric goodness-of-fit tests, composite hypothesis, distribution of statistics, round-off errors, achieved significance level, error of the 1st kind, error of the 2nd kind, simulation

REFERENCES

1. Lemeshko B.Yu. Kriterii proverki otkloneniya raspredeleniya ot normal'nogo zakona: rukovodstvo po primeneniyu [Tests for checking the deviation from normal distribution law. Guide on the application]. Moscow: INFRA-M, 2015, 160 p. DOI: 10.12737/6086.

2. Lemeshko B.Yu., Lemeshko S.B. Problemy primeneniya neparametricheskikh kriteriev soglasiya v zadachakh obrabotki rezul'tatov izmerenii [Problems of nonparametric goodness-of-fit test application in tasks of measurement results processing]. Sistemy analiza i obrabotki dannykh = Analysis and Data Processing Systems, 2021, no. 2 (82), pp. 47-66. DOI: 10.17212/2782-2001-2021-2-47-66.

3. Lemeshko B.Yu., Lemeshko S.B. Effect of the roundoff on the properties of criteria for testing statistical hypotheses. Optoelectronics, Instrumentation and Data Processing, 2020, vol. 56, no. 3, pp. 35-45. DOI: 10.3103/S8756699020030103. Translated from Avtometriya, 2020, vol. 56, no. 3, pp. 35-45. DOI: 10.15372/AUT20200305.

4. Lemeshko B.Yu., Lemeshko S.B. O vliyanii oshibok okrugleniya na raspredeleniya statistik kriteriev soglasiya [About the influence of rounding errors on distributions of statistics of the goodness-of-fit tests]. Vestnik Tomskogo gosudarstvennogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika = Tomsk State University Journal of Control and Computer Science, 2020, no. 53. pp. 47-60. DOI: 10.17223/19988605/53/5.

5. Lemeshko B.Y., Lemeshko S.B. About the effect of rounding on the properties of tests for testing statistical hypotheses. Journal of Physics: Conference Series, 2021, vol. 1715, 012063. DOI: 10.1088/1742-6596/1715/1/012063.

6. Lemeshko B.Yu. Lemeshko S.B., Semenova M.A. K voprosu statisticheskogo analiza bol'shikh dannykh [To question of the statistical analysis of big data]. Vestnik Tomskogo gosudarstven-nogo universiteta. Upravlenie, vychislitel'naya tekhnika i informatika = Tomsk State University Journal of Control and Computer Science, 2018, no. 44. pp. 40-49. DOI: 10.17223/19988605/44/5.

7. Fisher R.A. The use of multiple measurements in taxonomic problems. Annals of Eugenics, 1936, vol. 7, pp. 179-188.

8. Kolmogoroff A.N. Sulla determinazione empirica di una legge di distribuzione. Giornale del Istituto Italiano degli Attuari, 1933, vol. 4, no. 1, pp. 83-91.

9. Bol'shev L.N., Smirnov N.V. Tablitsy matematicheskoi statistiki [Tables for mathematical statistics]. Moscow, Nauka Publ., 1983. 416 p.

10. Anderson T.W., Darling D.A. Asymptotic theory of certain "Goodness of fit" criteria based on stochastic processes. The Annals of Mathematical Statistics, 1952, vol. 23, pp. 193-212.

11. Anderson T.W., Darling D.A. A test of goodness of fit. Journal of the American Statistical Association, 1954, vol. 29, pp. 765-769.

12. Kuiper N.H. Tests concerning random points on a circle. Indagationes Mathematicae (Proceedings), 1960, vol. 63, pp. 38-47.

13. Lemeshko B.Yu. Neparametricheskie kriterii soglasiya: rukovodstvo po primeneniyu [Nonparametric goodness-of-fit tests. Guide on the application]. Moscow, Infra-M Publ., 2014. 163 p. DOI: 10.12737/11873.

14. Watson G.S. Goodness-of-fit tests on a circle. 1. Biometrika, 1961, vol. 48, no. 1-2, pp. 109-114.

15. Watson G.S. Goodness-of-fit tests on a circle. 2. Biometrika, 1962, vol. 49, no. 1-2, pp. 57-63.

16. Zhang J. Powerful goodness-of-fit and multi-sample tests. PhD Thesis. York University. Toronto, 2001. 113 p. Available at: http://www.collectionscanada.gc.ca/obj/s4/f2/dsk3/ftp05/ NQ66371.pdf (accessed 27.05.2022).

17. Zhang J. Powerful goodness-of-fit tests based on the likelihood ratio. Journal of the Royal Statistical Society: Series B, 2002, vol. 64, no. 2, pp. 281-294.

18. Lemeshko B.Yu., Lemeshko S.B. Distribution models for nonparametric tests for fit in verifying complicated hypotheses and maximum-likelihood estimators. Pt. 1. Measurement Techniques, 2009, vol. 52, no. 6, pp. 555-565.

19. Lemeshko B.Yu., Lemeshko S.B., Postovalov S.N. Statistic distribution models for some non-parametric goodness-of-fit tests in testing composite hypotheses. Communications in Statistics. Theory andMethods, 2010, vol. 39, no. 3, pp. 460-471.

20. Lemeshko B.Yu., Gorbunova A.A. Application of nonparametric Kuiper and Watson tests of goodness-of-fit for composite hypotheses. Measurement Techniques, 2013, vol. 56, no. 9, pp. 965-973.

21. Lemeshko B.Yu., Lemeshko S.B., Blinov P.Yu., Veretel'nikova I.V., Novikova A.Yu. Statis-ticheskii analiz interval'nykh nablyudenii odnomernykh nepreryvnykh sluchainykh velichin "Inter-val'naya statistika 5.4" [Statistical analysis of interval observations of one-dimensional continuous random variables "Interval statistics 5.4"]. The certificate on official registration of the computer program. No. 2018666213, 2018. Available at: https://ami.nstu.ru/~headrd/ISW.htm. (accessed 27.05.2022).

22. Pearson E.S., D'Agostino R.B., Bowman K.O. Tests for departure from normality: comparison of powers. Biometrika, 1977, vol. 64, pp. 231-246. DOI: 10.1093/biomet/64.2.427-a.

23. Tricker A.R. The effect of rounding on the significance level of certain normal test statistics. Journal of Applied Statistics, 1990, vol. 17, no. 1, pp. 31-38. DOI: 10.1080/757582644.

24. Tricker A.R. The effect of rounding on the power level of certain normal test statistics. Journal of Applied Statistics, 1990, vol. 17, no. 2, pp. 219-228. DOI: 10.1080/757582833.

25. Deidda R., Puliga M. Sensitivity of goodness-of-fit statistics to rainfall data rounding off. Physics and Chemistry ofthe Earth, 2006, vol. 31, pp. 1240-1251. DOI: 10.1016/j.pce.2006.04.041.

26. Uyanto S.S. An extensive comparisons of 50 univariate goodness-of-fit tests for normality. Austrian Journal of Statistics, 2022, vol. 51, pp. 45-97.

27. Frosini B.V. A survey of a class of goodness-of-fit statistics. Metron, 1978, vol. 36, no. 1-2, pp. 3-49.

28. Epps T.W., Pulley L.B. A test for normality based on the empirical characteristic function. Biometrika, 1983, vol. 70, pp. 723-726.

29. Hegazy Y.A.S., Green J.R. Some new goodness-of-fit tests using order statistics. Journal of the Royal Statistical Society: Series C (AppliedStatistics), 1975, vol. 24, no. 3, pp. 299-308.

30. David H.A., Hartley H.O., Pearson E.S. The distribution of the ratio? In a single normal sample, of range to standard deviation. Biometrika, 1964, vol. 512, no. 3-4, pp. 484-487.

31. Geary R.C. Testing for Normality. Biometrika, 1937, vol. 34, pp. 209-242.

32. D'Agostino R.B. Transformation to normality of the null distribution of g1. Biometrika, 1970, vol. 57 (3), pp. 679-681.

33. Chen L., Shapiro S.S. An alternative test for normality based on normalized spacings. Journal of Statistical and Simulation, 2012, vol. 53, pp. 269-288.

34. Desgagne A., Micheaux P.L. de. A Powerful and interpretable alternative to the Jarque-Bera test of normality based on 2nd-power skewness and kurtosis, using the rao's score test on the APD family. Journal of Applied Statistics, 2018, vol. 45, no. 13, pp. 2307-2327.

35. Gel Y.R., Gastwirth J.L. A robust modification of the Jarque-Bera test of normality. Economics Letters, 2008, vol. 99, no. 1, pp. 30-32.

36. Zamanzade E., Arghami N.R. Testing normality based on new entropy estimators. Journal of Statistical Computation and Simulation, 2012, vol. 82, no. 11, pp. 1701-1713.

Для цитирования:

Лемешко Б.Ю., Лемешко С.Б. Непараметрические критерии согласия при проверке нормальности в условиях округления измерений // Системы анализа и обработки данных. - 2022. -№ 2 (86). - С. 21-38. - DOI: 10.17212/2782-2001-2022-2-21-38.

For citation:

Lemeshko B.Yu., Lemeshko S.B. Neparametricheskie kriterii soglasiya pri proverke normal'nosti v usloviyakh okrugleniya izmerenii [Nonparametric goodness-of-fit tests for normality testing under rounding-off measurements]. Sistemy analiza i obrabotki dannykh = Analysis and Data Processing Systems, 2022, no. 2 (86), pp. 21-38. DOI: 10.17212/2782-2001-2022-2-21-38.

ISSN2782-2001, http://journals.nstu.ru/vestnik Analysis and data processing systems Vol. 86, No 2, 2022, pp. 21-38

i Надоели баннеры? Вы всегда можете отключить рекламу.