АВИАЦИОННАЯ И РАКЕТНО-КОСМИЧЕСКАЯ ТЕХНИКА
УДК 53.083.91
РЕКОМЕНДАЦИИ ПО ПРИМЕНЕНИЮ РЯДА КРИТЕРИЕВ ПРОВЕРКИ ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ ОТ НОРМАЛЬНОГО ЗАКОНА В ПРАКТИКЕ ИНЖЕНЕРНОГО СТАТИСТИЧЕСКОГО АНАЛИЗА
© 2017 Л.Н. Александровская, А.В. Кириллин
Московский авиационный институт (национальный исследовательский университет)
Статья поступила в редакцию 09.01.2017
Проведена классификация ряда критериев согласия выборочных данных с нормальным законом распределения вероятностей и выданы некоторые рекомендации по применению этих критериев в практике инженерного статистического анализа. Предложен оригинальный подход к тестированию рассмотренных критериев, основанный на логике построения критериев значимости, и позволивший при выборе в качестве эталонного стандартное нормальное распределение располагать критерии в порядке их предпочтения. Данный подход был апробирован ранее в задачах оценки адекватности статистических математических моделей и оценки степени статистического подобия при объединении информации о показателях качества сложных технических систем, полученной в процессе их экспериментальной отработки. Однако распространение этого подхода на задачи сравнения критериев согласия данных измерений с нормальным законом распределения вероятностей потребовало проведения дополнительных исследований, связанных с отсутствием программ и таблиц процентных точек статистик критериев нормальности. В статье представлены результаты использования для решения поставленной задачи экспертно-статистического метода Тагути.
Ключевые слова: проверка отклонения распределений вероятностей от нормального закона, критерии значимости, квантили распределения, уровень значимости, критерии Гири, Романовского, Шапиро-Уилка, Шапиро-Франчиа, Шпигельхальтера, Дейвида-Хартли-Пирсона, Эппса-Палли, Хе-гази-Грина, Фросини, Саркади, функция потерь Тагути.
Статья подготовлена при финансовой поддержке Министерства образования и науки Российской Федерации в рамках выполнения государственного задания в сфере научной деятельности №2014/92 (тема 1636/14)
ВВЕДЕНИЕ
Нормальный закон распределения вероятностей случайных величин занимает центральное место как в классической математической статистике, так и в практических приложениях. Полнота теоретических исследований, относящихся к нормальному закону, а также его сравнительно простые математические свойства делает его наиболее привлекательным и удобным в применении. Широкое его использование связано в первую очередь с центральной предельной теоремой. Действительно, в самых различных областях наблюдается суммарный аддитивный эффект большого количества независимых факторов, приводящий к нормальному распределению отклика. Даже в случае отклонения исследуемых экспериментальных данных
Александровская Лидия Николаевна, доктор технических наук, профессор кафедры «Испытания летательных аппаратов». E-mail: [email protected] Кириллин Андрей Викторович, старший преподаватель кафедры «Испытания летательных аппаратов». E-mail: [email protected]
от нормального закона существует по крайней мере два пути его целесообразного использования: использовать его в качестве первого приближения, что достаточно часто дает приемлемые практические результаты или подобрать нормализующее преобразование, например, преобразование Джонсона [1-3]. Удобным для статистического анализа является и свойство «самовоспроизводимости» нормального закона, заключающееся в том, что сумма нормально распределенных случайных величин также подчиняется нормальному закону. Кроме того, с помощью нормального распределения выведен ряд других важных распределений, построены различные статистические критерии и пр. (например, х2, t и ^-распределения и опирающиеся на них критерии).
Именно поэтому проверка возможности описания распределения экспериментальных данных нормальным законом распределения занимает центральное место в комплексе алгоритмов обработки измерительной информации.
В случае принятия гипотезы нормальности используются эффективные параметрические ал-
горитмы обработки измерительной информации, так же как алгоритмы выявления аномальных измерений, фильтрации, допускового контроля, оценки соответствия вероятностных показателей качества продукции предъявляемым требованиям и пр. При отклонении гипотезы нормальности обычно переходят на алгоритмы непараметрической статистики, не зависящие от вида закона распределения, однако требующие существенно большего объема выборок.
Вообще говоря, все критерии согласия, позволяющие исследовать вид распределения вероятности, могут быть использованы для проверки нормальности. Однако рассмотренные ниже критерии специально приспособлены для этого частного случая и имеют наибольшую мощность по сравнению с универсальными критериями согласия.
1. КЛАССИФИКАЦИЯ КРИТЕРИЕВ ПРОВЕРКИ НОРМАЛЬНОСТИ
Параметрические критерии основаны на использовании свойств оценок моментов распределений [4,5].
При этом вычисляются выборочные оценки:
Соответствующие критерии проверки нормальности, называемые иногда критериями Романовского, имеют вид
1 - ш.
■< и
1-^2 :
< и
\Ь2- т
1-а/2 '
< и,-а/2, (3)
где т(, ть , о л , о ^ , оь- соответственно математические ожидания и средне-квадратиче-
ские отклонения выборочных оценок
Ь2 ; и 1-а/2 - квантиль стандартного нормального распределения уровня 1 - а/2.
Процентные точки ,
' ^1(1-^2)' Ь2 а/2 ' Ь2(1-^2)
или 2 =
приведены в таблицах [4] при различных п и а.
Так как значения моментных отношений (1) могут иметь место и для распределений, отличных от нормального, то близость теоретических и выборочных значений не обязательно свидетельствует о нормальности теоретического распределения. Поэтому критерии (3) служат главным образом для выявления отклонения от нормальности, т.е. для проверки гипотез
й Ф^!2/я ; Ф 0; Р2 Ф 3 Карл Пирсон показал, что распределение статистики довольно быстро приближается к нормальному, тогда как распределение Ь2 даже при больших п оказывается далеким от нормального. Роберт Гири
предложил заменить критерий Ь2 критерием (,
так как распределение статистики ( удовлетворительно аппроксимируется нормальным при п > 50.
При объемах выборки п > 50 статистики нормированного среднего абсолютного ф! и Ь2 приближенно имеют распределения
N(0;6/п); Ь2 ~ N (3; 24/п), на основе которых строится критерий Крамера.
Чтобы избежать двумерности задачи при использовании статистик -у/Ь и Ь2 в [5] рассмотрена совместная статистика
1 "
математического ожидания х = — V х1;
п ,=1
1 п
дисперсии 52 =_У (х. - х)2
п ,=1
■ = ^ V х )2;
отклонения ( = — V |х, - хI; п5
1 п
- показателя асимметрии = —3^(х -х)3;
п5 ¡=1
1 п
- показателя эксцесса Ъ2 =—- V (х, - *) ,
пБ ¡=1
где х, - измеренное значение случайной величины; п - объем выборки.
Для нормального закона распределения истинные значения этих характеристик равны
а = Р1 = 0; Р2 = 3, (1)
выборочные оценки асимптотически нормальны с параметрами [4]
(1) п п (Ь2 - 3)2
6 24
которая асимптотически распределена как ^-распределение. Однако, т.к. составляющей совместной статистики является Ь2-статистика, совместная статистика плохо сходится к асимптотическому распределению и ее не рекомендуется использовать для выборок малого объема.
На практике из данной группы критериев наиболее часто применяется критерий, основанный на статистике ( (называемый иногда критерием Гири) и критерий Крамера. Принятое при этом решение о ненормальности исследуемого распределения не требует дальнейшего уточнения, в то время, как решение о нормальности может быть уточнено на основе более мощных критериев.
ь
1
Критерии основанные на сравнении параметрических и непараметрических выборочных оценок [5-7,15]. Критерий Шапиро-Уилка [5,7,15] базируется на сравнении линейной комбинации разностей порядковых статистик
а
п-1+1
Х{ш-\+\) Х(,
где к = п/2 - для четных п ; к = (п -1)/2 - для нечетных п ; и параметрической оценки
52
■ п
=1( х- х )2,
1=1
где х(1) < ... < Х(
<... < х.
п-1+1
п-1+1
I
\1/2
т.
у
где тп - математическое ожидание г-й порядковой статистики стандартного нормального распределения
I —
да.
Ф-1
8
1
п + —
V 4 у
: иг
при р =
. 3
I —
_8_
1
п + — 4
Ф-1 - обратная функция стандартного нормального распределения.
Для упрощения нахождения обратной функции Ф-1 можно использовать аппроксимацию
ир = 4,91
р014 - (1 - р))
Близким к критерию Шапиро-Уилка является критерий Дэйвида-Хартли-Пирсона, основанный на сравнении размаха выборки с оценкой средне-квадратического отклонения [4]
и = г/51 ,
где г = х( п/- Х
1
п -
71( Х1- х)
11=1
- не-
Т = {{п-1)+ Е (п-1)}п-1,
1 _!_ где с = — (и!)я-1; Е = 2п
а
{ п / - порядковые статистики, а коэффициенты ап-1+1, табулированы для п < 50 [7, 15].
Гипотеза о нормальности принимается при больших значениях статистики Ж = Ь2/{ 52 • п). Процентные точки статистики Ж табулированы, начиная с п = 3 [5,7,15].
При больших объемах выборки п > 50 используется приближенный критерий Шапиро-Франчиа, в котором вместо табулированных коэффициентов ап +1 используются выражения
т
а„
7(п - 1)п
Гипотезы нормальности отклоняются при больших значениях статистики Т . Процентные точки также табулированы [6]. Там же анализируются ограничения, затрудняющие использования данного критерия.
Критерий Эппса-Палли основан на сравнении характеристических функций выборочных данных и нормального распределения [5,7]. Статистика критерия вычисляется по формуле
Т
-1 с
П 2 " к-1
= 1 + ——+ —УУехр
•Л
/ /
П к=2 ] =1
-(( " Хк )2
252
- \/2 ^ ехр
м
- х))
452
Гипотеза нормальности принимается при больших значениях этого критерия. Вычисления критерия достаточно сложны и осуществляются в соответствии с алгоритмом приведенном в ГОСТ Р ИСО 5479-2003 [7]. Там же приведены процентные точки.
Критерий применим при п > 8 и является сильным конкурентом критерия Шапиро-Уил-ка. Заметим однако, что характеристические функции не являются привычным инженерным методом.
Критерии, базирующиеся на сравнении нормального распределения и эмпирических функций распределения выборочных данных [4,6]. Статистика критерия Фросини [6] имеет вид:
1 " в =-т I
Ып г=1
ф
ы-
I - 0,5
где 2 (./ = { х. - х )/5 - центрированные и нормированные случайные величины, упорядоченные по возрастанию.
Процентные точки статистики Вп табулированы [6]. Основным недостатком критерия Фросини является отклонение от нормальности случайных величин при небольших объемах выборки, за счет возникающих погрешностей оценок х и 5.
От этого недостатка свободен критерий Хе-гази-Грина [6] со статистиками:
смещенная оценка дисперсии.
Процентные точки статистики и приведены в [6].
Комбинированный критерий Шпигельхаль-тера [6] базируется на комбинации статистики критериев Гири и Дэйвида-Хартли-Пирсона [6] и имеет вид
Г. =11
П г =1
г.
"Лг
Г = £ Ё(()- Лг I
п г=1
где
2( 1 )= { х( 1 )-: - несмещенная оценка вероятности, соответствующей г-ой порядковой статистики 2(.
(х( 1 )-х)) , Л, = ф-1 (((П +1))/(п +1)
Здесь, в отличие от критерия Фросини, сравниваются не вероятности, а случайные величины, соответствующие этим вероятностям.
Известен также критерий Саркади [4], представляющий собой модификацию известного критерия согласия ю2 для проверки нормальности распределения [4]. В этом критерии путем проведения ряда преобразований также удается исключить зависимость от точности оценок X и Б2.
Формируются центрированные случайные величины
1 /_
Л
= х,
(■+1)
у/П
+
-( + х(]) ),
или
^) = ХС
--#=-( ' V« + Х( ) ) , / = 1
п-1.
Далее формируются нормированные случайные величины
^(() = л(')/(+1) " "'" >
При гипотезе нормальности величины С. имеют ¿-распределение Стьюдента с (п -1 -1) степенями свободы.
Значения функции распределения
2 + - + Сп),/ = 1 • п-2.
J(i1 (()), где í1 - обратная функция ¿¿-распределения, равномерно распределены на интервале [0,1].
Проверка нормальности осуществляется по ю2-критерию, процентные точки соответствующей статистики табулированы [4]:
(п - 2 )ю2 =
1
12(п - 2)
п-2
+1
г=1
2г -1 2 (п - 2)
Есть данные, что критерий Саркади применим для выборок малого объема п > 3.
2. ПРОБЛЕМЫ СРАВНЕНИЯ КРИТЕРИЕВ ПРОВЕРКИ ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЙ ОТ НОРМАЛЬНОГО ЗАКОНА
возможности осуществления маловероятного события, нулевая гипотеза отвергается; в противоположном случае считается, что полученные экспериментальные данные не противоречат нулевой гипотезе и последняя принимается.
Заметим, что утверждение «нулевая гипотеза не верна» более категорично, чем «экспериментальные данные не противоречат нулевой гипотезе».
Для расчета мощности критериев значимости необходимо задать альтернативную гипотезу. При проверке нормальности распределений задание альтернативной гипотезы затруднительно.
Действительно, если исследуемое распределение не подчиняется нормальному закону распределения, то какому из множества законов распределения оно подчиняетя? Перебирать все возможные распределения невозможно.
В [5, 6] в качестве альтернативных гипотез рассмотрено 3 распределения, в том числе семейство распределений Лапласа и логистическое распределение, что снижает практическую ценность проведенных исследований.
Процентные точки, приведенные в работах [47] рассчитаны при условии нормальности исследуемого распределения. Каждой из альтернативных гипотез будет соответствовать другое распределение используемых статистик. При этом вывести аналитическое выражение этих альтернативных распределений чрезвычайно сложно и единственно возможным методом расчета мощности сравниваемых критериев является статистическое моделирование достаточно большого объема, что также затруднительно в инженерной практике.
В данной работе предлагается другой подход к сравнению критериев, основанный на логике функционирования критериев значимости.
3. ВОЗМОЖНЫЕ ПОДХОДЫ К РЕШЕНИЮ
ЗАДАЧИ СРАВНЕНИЯ РЯДА КРИТЕРИЕВ
СОГЛАСИЯ С НОРМАЛЬНЫМ ЗАКОНОМ РАСПРЕДЕЛЕНИЯ
Все критерии согласия, как классические, так и проверки отклонения распределений от нормального закона относятся к так называемым критериям значимости, базирующихся на ряде общих принципов [8-10]:
- выбирается исследуемая статистика;
- определяется теоретическое распределение данной статистики, соответствующее проверяемой нулевой гипотезе (в данном конкретном случае - гипотезе о нормальности);
- выбираются значения малых с точки зрения исследователя вероятностей, ограничивающих критическую область (выбор уровня значимости);
- если экспериментальные значения статистики попадают в критическую область, то в соответствии с принципом практической не-
Авторы не ставили перед собой объемной задачи сравнения всех перечисленных критериев согласия, а только более скромную задачу иллюстрации предлагаемых подходов на примере исследования отдельных представителей каждого класса критериев.
Рассмотренные выше особенности приведенных критериев проверки нормальности позволяют выделить из каждой группы критериев критерии, наиболее удобные для практического использования. Кроме того, необходимо учитывать, что проблема проверки нормальности распределения наиболее остро стоит для малых выборок, характерных для испытаний сложных технических систем, например систем летательных аппаратов [8-10].
Действительно, из теории порядковых статистик известно [9], что доля произвольного распределения Я, заключенного между минимальным х( 1) и максимальным х(п/ значениями, с доверительной вероятностью у составляет пЯ"- -(и - 1)Я" = 1 - у.
Например, при п = 20 эта доля составляет при у = 0,9 всего лишь Я « 0,785 .
Таким образом, из общей функции распределения [0,1] для проверки нормальности «вырезается» фрагмент Я = 0,785. Естественно, по такому небольшому фрагменту различить распределения чрезвычайно сложно. Именно поэтому нулевой гипотезе соответствует не решение «эмпирическая функция распределения соответствует нормальному закону», а более осторожное решение «эмпирическая функция распределения не противоречит нормальному закону».
Исходя из всего вышеперечисленного для сравнения выбираем:
- из 1-й группы параметрических критериев - критерий Гири;
- из 2-й группы - критерии Шапиро-Уилка и Дэйвида-Хартли-Пирсона;
- из 3-й группы - критерии Хегази-Грина 1 и 2.
Проведено тестовое статистическое моделирование при выборе в качестве эталонного распределения - стандартного нормального распределения с нулевым математическим ожиданием и единичной дисперсией. Объем моделирования составил 10 выборок по 20 реализаций в каждой. Решение о предпочтительности того или иного критерия принималось на основе сравнения при использовании двух основных подходов: математико-статистического и экспертно-статистического.
Математико-статистический подход. Сравнение критериев ведется с использованием аппарата математической статистики. В соответствии с принципом применения критериев значимости уровень значимости а определяет размер критической области отклонения проверяемой (нулевой) гипотезы Н0. При этом малым значениям уровня значимости соответствует малый размер критической области, т.е. область принятия нулевой гипотезы расширяется. В пределе, при а ^ 0, любые экспериментальные данные считаются не противоречащими нулевой гипотезе. Естественно степень доверия к такому решению мало. В [8-13] введено понятие критического уровня значимости, по аналогии с критической областью, - это граничный уровень значимости, при котором еще может быть принята нулевая гипотеза. При правосторонней критической области:
акР = Р (0 > 0ЭКС.) = 1 -Р (0экс,/Н0); при левосторонней критической области:
а
кр
= F (0 < 0ЭКС.) = F (0ЭКС./H0);
для двусторонних критериев:
акР = 2 min [ F (0ЭКС./ H 0) ;1 - F (0ЭКС. / H0)], где 8 - значение статистики, вычисленное по
^ экс. '
выборке; F - функция распределения вероятности статистики 8.
В [14] используется аналогичный термин -достигнутый уровень значимости. При больших значениях критического уровня значимости экспериментальные данные близки к ожидаемым теоретическим результатам, соответствующим нулевой гипотезе и наоборот. Данный подход был использован в задачах оценки адекватности статистических математических моделей, в задачах оценки статистического подобия при объединении информации о показателях качества сложных технических систем, полученной на различных этапах их экспериментальной отработки [8-13]. Однако в этих задачах имели место типовые законы распределения вероятностей - биномиальный, нормальный, Стьюдента, Пирсона, Фишера.
Для этих законов имеются как программы расчета квантилей (процентных точек), включенные в пакеты прикладных программ по математической статистике, так и достаточно полные таблицы, представленные в многочисленных справочных изданиях, например в [4].
Попытки применить данный подход к решению сравнительного анализа критериев проверки нормальности распределений натолкнулась на отсутствие подробной информации для специфических распределений статистик исследуемых критериев согласия.
Исключением являются графики функций распределений соответствующих вероятностей, приведенные в [5, 6]. Однако, использование этих графиков для определения значений а^ не позволяет получить достаточную точность.
Экспертно-статистический метод. Сравнение критериев ведется с использованием математического аппарата допускового измерительного контроля качества продукции.
Традиционная схема принятия решения о согласии/несогласии экспериментальных данных с нулевой гипотезой нормальности исследуемого распределения вероятностей состоит в сравнении рассчитанной статистики критерия с выбранной процентной точкой функции распределения этой статистики.
В допусковом контроле этой схеме соответствует модель контроля Тейлора [10,16].
При использовании подхода Ф.У. Тейлора принято считать одинаково качественной всю продукцию, значения контролируемых параметров которой находятся внутри соответствующих допустимых интервалов. Потеря качества по Тейлору Fn иллюстрирует рис. 1а.
В основе подхода Г. Тагути лежит оценка качества по отклонению контролируемых параме-
тров от середины допустимого интервала. При этом потеря качества оценивается функцией (рис. 1 б):
Fi =
X, -
Amax ^ Amir 2
\2
где Amax и Amin - нижний и верхний допустимые пределы; xt - значение измеряемого параметра; x0 = (Amax + Amin )/2 - середина допустимого интервала.
Используется также приведенная величина потери качества:
Fi =
X -
Amax ^ Amir
- для правостороннего критерия (Хегази-Гри-на T1 и T2) отсчет ведется от нуля, т.е. x0= 00= 0,
T = 0max, и имеем FU =(0экс./0тах ), отКУДа при 0ЭкС.= 0, Fn = 0 (рис. 2 а);
- для левостороннего критерия (Шапиро-Уилка) должны выполняться условия: 0экс= 1,
Fn = 0; при 0экс. = 0min, Fn = 1, т.е. прим2ем ^ 1 и T = 1 - 0min F = [(1 - 0_ )/(l - 0mm )] (рис. 2б),
где 0 , 0 . - процентные точки статистик кри-
max min
терия для выбранного уровня значимости а, например, а = 0,01;
- для двустороннего критерия (Гири, Дэйви-да-Хартли-Пирсона):
F =
где Т = Дтах - Дшп .
При х1 = х0 потеря качества равна = 0;
при X = Amin или X = Дпах - РП = 1
Применительно к решаемой задаче будем использовать:
2(0ЭКС. -0О)
где 0О - совпадает с медианой распределения статистики 0, T = 0 - 0О для 0 > 0О или T = 0О - 0 .
max 0 ^ экс. 0 0 min
для 0экс < 0О (рис. 2 в). Здесь ö0 - процентная точка статистик критерия при а/2.
а) б)
Рис. 1. Функции потери качества по Тейлору (а) и по Тагути (б)
0О 0экс.
а)
0min 0экс. 0О = 1
б)
0 . 0
min экс
е„ 0.
В)
Рис. 2. Функция потерь Тагути для правостороннего (а), левостороннего (б) и двустороннего (в) критериев проверки нормальности
Таблица 1. Значения процентных точек ряда критериев проверки нормальности при объемах выборки п = 20 ; п = 40
Критерий 1 - а
0,85 0,9 0,95 0,975 0,99
Гири п = 20 0,741-0,870 0,790-0,878 0,713-0,889 0,697-0,899 0,644-0,91
п = 40 0,754-0,848 0,747-0,854 0,735-0,863 0,724-0,871 0,71-0,879
Дэйвида-Хартли-Пирсона п = 20 3,240-4,392 3,178-4,488 3,087-4,633 3,012-4,763 2,9274,915
п = 40 3,741-5,048 3,674-5,162 3,574-5,345 3,493-5,507 3,4015,708
Хегази-Грина (Т) п = 20 0,205 0,218 0,239 0,259 0,284
п = 40 0,151 0,161 0,177 0,191 0,210
Хегази-Грина (Т2) п = 20 0,072 0,082 0,100 0,118 0,143
п = 40 0,043 0,049 0,060 0,070 0,085
Шапиро-Уилка п = 20 0,925 0,92 0,905 0,875 0,868
п = 40 0,955 0,949 0,94 0,925 0,919
В табл. 2 сведены результаты расчетов функции потери качества Тагути.
На основе анализа средних значений потерь качества по Тагути, представленных в табл. 2, может быть построен ряд предпочтений сравниваемых критериев согласия с нормальным законом распределения. кр. Хегази-Грина (Т2) ^ кр. Гири ^ кр. Дэйвида-Хартли-Пирсона ^ кр. Шапиро-Уилка ^ кр. Хегази-Грина (Т1).
Предложенный подход не позволяет выявить степень предпочтения сравниваемых критериев для альтернативных гипотез существенно отличающихся от нормального закона распределения. Однако, практический опыт
Таблица 2. Значения функции пот проверки нормальности при а
показал, что даже при существенных отличиях от нормальности, например, точностных характеристик автоматической посадки самолетов в полном диапазоне воздействия возмущающих случайных факторов в области вероятностей от 0,1-0,9, а иногда 0,05-0,95 эти законы приблизительно нормальны [3]. При этом проверка нормальности с применением соответствующих критериев носит, в основном, демонстрационный характер.
Пример 1. Подтвердить требования к вертикальной скорости самолета при касании его взлетно-посадочной полосы, заданные в форме
Рг {V < ^ }= Я3
и качества Тагути ряда критериев 0,01 и объеме выборки п = 20
№ п/п выборки Критерии проверки нормальности
Гири Дэвида-Хартли -Пирсона Хегази-Грина (Т) Хегази-Грина (Т) Шапиро-Уилка
1. 0,285 0,864 0,2 0,05 0,76
2. 0,239 0,216 0,23 0,07 0,69
3. 0,177 0,124 0,268 0,078 0,32
4. 0,013 0,044 0,286 0,099 0,21
5. 0,01 0 0,298 0,108 0,143
6. 0,03 0 0,341 0,122 0,106
7. 0,08 0,0016 0,358 0,137 0,092
8. 0,12 0,184 0,495 0,2 0,05
9. 0,159 0,263 0,67 0,213 0,045
10. 0,353 0,284 0,97 0,253 0,025
Средние значения функции потерь 0,147 0,186 0,41 0,133 0,244
с достоверной вероятностью у при следующих значениях V = 1,5 м/с; Я = 0,95; у = 0,9.
шах ' ^ ' з ' ' ' '
В математической постановке подтверждение требований в заданной форме сводится к построению одностороннего толерантного интервала и условию
X + к8 < Гтах ,
где к > и^ - индекс наблюдения, больший, чем квантиль стандартного нормального распределения ик и табулированный для нормального распределения вероятностей исследуемого параметра [18].
Таким образом, первым этапом процедуры подтверждения заданных требований является проверка гипотезы нормальности вертикальной скорости.
Исходные данные: п = 28, х = 0,61 м/с, £ = 0,413, ¿1 = 0,42, имеется вариационный ряд измерений вертикальной скорости при проведении натурных испытаний в диапазоне 0,05 *1,4 м/с.
В табл. 3 приведены результаты расчетов статистик ряда критериев и соответствующих потерь качества по Тагути при выборе уровня значимости а = 0,01.
ограниченном интервале вероятностей R < 0,95 по всем пяти критериям принимается решение о возможности использования нормального закона.
В том случае коэффициент k = 2,08 и с доверительной вероятностью у = 0,9 подтверждается значение V = 1,48 м/с.
max '
ЗАКЛЮЧЕНИЕ
Современное понятие измерений определено как «алгоритмическая операция, которая данному наблюдаемому состоянию объекта, процесса, явления ставит в соответствие определенное обозначение: число, номер или символ» [17]. Под такое определение подпадают ординаты функции потери качества по Тагути.
Внедряемая в настоящее время в метрологию концепция неопределенности также расширяет понятие измерений, придавая большее значение различным экспертным методам [19,20]. В связи с этим, предложенный подход может быть включен в математическое обеспечение систем обработки измерительной информации. Его можно также рекомендовать для решения ряда задач, характеризующихся недостаточным объ-
Таблица 3. Расчетные статистики ряда критериев проверки нормальности распределения вероятности вертикальной скорости
Критерии проверки нормальности
Критерий Критерий Критерий Критерий Критерий
Гири Дэвида- Хегази-Грина Хегази-Грина Шапиро-
Хартли-Пирсона (T) (T) Уилка
Статистика 0,806 3,2 0,245 0,093 0,9
критерия
Интервал 0,694-0,895 3,1-5,3 0-0,247 0-0,114 0,896-1
принятия
решения о
нормальности
Значения 0,012 0,826 0,975 0,665 0,924
функции
потерь
Первые два места, как и при тестовом моделировании занимают критерии Хегази-Грина (Т2) и Гири, причем здесь приоритет принадлежит критерию Гири. Ряд предпочтений остальных критериев сохраняется, как и при тестовом моделировании.
кр. Дэйвида-Хартли-Пирсона ^ кр. Шапиро-Уилка ^ кр. Хегази-Грина (Т1) В некоторых работах, например, в [9] есть данные, что распределение вертикальной скорости некоторых гражданских самолетов, например, Бо1^-737, описывается логарифмически-нормальным распределением. Однако в
емом измерительной информации, например, для сравнения многочисленных методов выявления аномальных измерений, методов непараметрической статистики и пр., где затруднительно формулировать альтернативные гипотезы и использовать классический математический аппарат расчета мощности критериев.
СПИСОК ЛИТЕРАТУРЫ
1. Александровская Л.Н., Кузнецов А.Г., Солонников Ю.И. Использование нормального закона распределения вероятностей в задачах оценки соответ-
ствия // Законодательная и прикладная метрология. 2010. № 1. С. 5-12.
2. Александровская Л.Н., Кузнецов А.Г., Солонников Ю.И. Об использовании нормального закона распределения вероятностей в задачах менеджмента безопасности // Методы менеджмента качества. 2010. № 5. С. 44-47.
3. Александровская Л.Н., Борисов В.Г., Ардалионова А.Е. Использование нормального закона распределения вероятностей в задачах оценки соответствия требованиям к безопасности на примере системы автоматической посадки самолетов. // Труды ФГУП «НПЦАП» им. Н.А. Пилюгина. Системы и приборы управления. 2012. № 4. С. 20-28.
4. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983. 436 с.
5. Лемешко Б.Ю., Лемешко С.Б. Сравнительный анализ критериев проверки отклонения распределения от нормального закона // Метрология. 2005. №2. С. 3-24.
6. Лемешко Б.Ю., Рогожников А.П. Исследование особенностей и мощности некоторых критериев нормальности // Метрология. 2009. № 4. С. 3-24.
7. ГОСТ Р ИСО 5479-2002 Статистические методы. Проверка отклонения распределения вероятностей от нормального распределения. М.: Издательство стандартов. 2002. 27 с.
8. Теоретические основы испытаний и экспериментальная отработка сложных технических систем / Л.Н. Александровская, В.И. Круглов, А.Г. Кузнецов и др.: Учебное пособие. М.: Логос. 2003. 736 с.
9. Крюков С.П., Бодрунов С.Д., Александровская Л.Н. Анализ и оценивание рисков в задачах менеджмента безопасности сложных технических систем. СПб.: Корпорация «Аэрокосмическое оборудование». 2007. 460 с.
10. Безопасность и надежность технических систем
/ Л.Н. Александровская, И.З. Аронов, В.И. Круглов и др.: Учебное пособие. М.: Университетская книга. Логос. 2008. 376 с.
11. Александровская Л.Н., Кузнецов А.Г., Мазур В.Н., Хлгатян С.В. Методы подтверждения соответствия точностных характеристик систем управления самолетов нормам летной годности // Авиакосмическое приборостроение. 2002. № 1. С. 31-39.
12. Александровская Л.Н., Розенталь О.М. Оптимизация водно-экологического нормирования // Водные ресурсы. 2011. Т. 38. № 11. С. 108-119.
13. Александровская Л.Н., Кузнецов А.Г. Байесовский подход: проблемы и решения // Авиакосмическое приборостроение. 2005. № 12. С. 22-32.
14. Лемешко Б.Ю. Критерии проверки отклонения распределения от нормального закона. Руководство по применению. М.: ИНФРА-М. 2015. 160 с.
15. Хан Г., Шапиро С. Статистические модели в инженерных задачах. М.: Мир. 1969. 396 с.
16. Александровская Л.Н., Афанасьев А.П., Лисов А.А. Современные методы обеспечения безотказности сложных технических систем: Учебник. М.: Логос. 2001. 208 с.
17. Перегудов Ф.И., Тарасенко Ф.П. Введение в системный анализ. М.: Высшая школа. 1989. 367 с.
18. ГОСТ Р ИСО 16269-6-2005 Статистические методы. Статистическое представление данных. Определение статистических толерантных интервалов. М.: Стандартинформ, 2015. 29 с.
19. Руководство 1СОМ 106:2012 Роль неопределенности измерений при оценке соответствия. Перевод НПО «Профессионал». СПб.: 2014. 106 с.
20. Александровская Л.Н., Розенталь О.М. Комментарии к Руководству 1СОМ 106:2012 Роль неопределенности измерений при оценке соответствия // Законодательная и прикладная метрология. 2016. № 1.
RECOMMENDATIONS FOR THE USE SOME OF TESTS FOR THE PROBABILITY DISTRIBUTION OF DEVIATION FROM THE NORMAL DISTRIBUTION LAW IN PRACTICE OF THE STATISTICAL ENGINEERING ANALYSIS
© 2017 L.N. Aleksandrovskaya, A.V. Kirillin
Moscow Aviation Institute (National Research University)
Authors have made the classification of some criteria consent of sample data with a normal probability distribution law and given some guidance on the application of these criteria in the practice of engineering statistical analysis. Authors have offered the original approach to tests ofconsidered criteria based on the logic of design the significance criteria, and allowing to placed criteria in order of preference selected as a choice of etalon the standard normal distribution. This approach was tested previously in tasks assessing the adequacy of the statistical mathematical models and statistical assessment of the similarity by combining information on the quality of performance of complex technical systems, obtained in the process of experimental testing. However, the extension of this approach to the problem of comparing the consent criteria of measurement data with the normal probability distribution law required additional research related to the lack of programs and tables of percentage points statistics normality tests. The article presents the results of the use to solve the problem of interval estimation and expertly statistical method Taguchi.
Keywords: check deviations from the normal probability distribution law, significance tests, significance levels, Geary test, Romanovsky, Shapiro-Wilk, Shapiro-Francia, Spiegelhalter, David-Hartley-Pearson, Epps-Pally, Hegazy-Green, Frosini, Sarkadi, Taguchi loss function.
This article has been prepared with financial support of the Ministry of Education and Science of the Russian Federation within the framework of the State Assignment in the area of Scientific Activity No. 2014/92 (theme 1636/14).
Lidiya Aleksandrovskaya, Doctor of Technics, Professor at
the Flight Vehicles Tests Department.
E-mail: [email protected]
Andrey Kirillin, Senior Lecturer at the Flight Vehicles Tests
Department. E-mail: [email protected]