Повышение точности статистических оценок дополнительным смещением табличных распределений

Воловик Александр Васильевич; Клавдиев Александр Александрович; Трушников Вячеслав Евстафьевич

УДК 51:62.192

A.B. Воловик, A.A. Клавдиев, B.E. Трутников

ПОВЫШЕНИЕ ТОЧНОСТИ СТАТИСТИЧЕСКИХ ОЦЕНОК ДОПОЛНИТЕЛЬНЫМ СМЕЩЕНИЕМ ТАБЛИЧНЫХ РАСПРЕДЕЛЕНИЙ

В основе предлагаемого подхода лежит одно из свойств статистик, заключающееся в том, что несмещенную состоятельную оценку часто удается получить из смещенной состоятельной оценки путем умножения ее на подходящую функцию от n. Суть состоит в дополнительном смещении оценок при n<10 для повышения их точности в условиях малой выборки.

Ключевые слова: нижняя доверительная граница, плотность распределения, статистическая оценка, плотность распределения, малая выборка, средняя наработка на отказ.

" Ш" абличным принято называть распределение некоторой статистики (функции наблюденных значений Хх, Х2,..., Хп), чей закон не зависит от неизвестных параметров, а зависит только от числа опытов П и вида закона распределения случайной величины X . Такого рода случайные величины играют большую роль в математической статистике, квантили их распределений давно и точно рассчитаны и служат основой для статистического анализа. Примером могут служить стандартное нормальное распределение, / - распределение Стьюдента, X2 и др.

В основе предлагаемого подхода лежит одно из свойств статистик [1], заключающееся в том, что несмещенную состоятельную оценку часто удается получить из смещенной состоятельной оценки путем умножения ее на подходящую функцию от п . Суть состоит в дополнительном смещении оценок при

П < 10 для повышения их точности в условиях малой выборки.

В теории надежности при оценке безотказности принято оперировать таким показателем, как средняя наработка на отказ (между отказами) [3—8]. В терминах математической статистики в этом случае речь идет о математическом ожидании наработки, оценка которой, по сути, является функцией наблюдаемых значений случайных величин (статистикой) и которая, в свою очередь, также случайна. Поэтому для важных (ответственных) объектов часто пользуются оценками границ доверительного интервала такой функции.

Не нарушая общности рассуждений, рассмотрим предлагаемый подход применительно к экспоненциальному распределению [2], которое в теории надежности имеет одно из основополагающих значений. В целях практической направленности выводов сузим задачу до вопроса безотказности изделий авиационной техники.

Средняя наработка ремонтируемого изделия между отказами (неисправностями) относится к среднестатистическим показателям надежности изделий авиационной техники [4, 5]. На практике точечной оценкой средней наработки между отказами является отношение суммарной наработки изделия к числу отказов (неисправностей) в течение этой наработки [6].

Поскольку точечные оценки являются случайными величинами, то для оценки вероятности уклонения полученной оценки параметра от его истинного значения Р. Фишер предложил вместо поиска функции 9(х1,х2,...,хп)от результатов испытаний, которая принимается за приближенное значение неизвестного параметра, указывать две функции 91 и 92 от результатов испытаний (но не от оцениваемого параметра), для которых вероятность покрытия неизвестного параметра отрезком (9а, 92) равна заданной величине. Функции 91 и 92 называются доверительными границами, а (91,92) — доверительным интервалом для параметра 9 [8]. Поэтому оценка достоверности и точности определения среднестатистических показателей (точечных оценок) производится методом доверительных интервалов путем определения нижней и верхней доверительных границ (НЛГ и ВДГ) для средней наработки [6]. При этом формально считают, что доверительный интервал со случайными границами накрывает фиксированную оценку параметра [13].

В общем случае для экспоненциального закона с функцией распределения

х

Р(х) = 1 - еь (х > 0) (1)

математическое ожидание Ь подчинено гамма-распределению [7, 9].

На рис. 1 изображены функции плотности распределения математического ожидания Ь для различных объемов выборки п .

Из рисунка видно, что объем выборки при малых значениях п сильно влияет на форму кривой, а, следовательно, и на границы доверительного интервала. Этим обстоятельством обусловлено использование предельных распределений для расчета доверительных границ среднего при п ^ ж .

При п > 10 асимптотика позволяет использовать табличные распределения для инженерных оценок.

При п < 10 отличие от предельных распределений существенно влияет на критическую область (см. рис. 2) в целом и нижнюю доверительную границу (НДГ) - в частности.

Роль %2 - распределения в статистике вообще и теории надежности - в частности трудно переоценить. Оно

№

Рис. 1. Плотности распределения математического ожидания Ь для различных объемов выборки п

Рис. 2. Функции распределения математического ожидания Ь для различных объемов выборки п

представляет собой распределение суммы квадратов г независимых случайнык величин, каждая из которык подчинена стандартному нормальному закону.

Особо следует остано-

2

виться на использовании % -

распределения при оценке доверительных границ для средней наработки. Его применение основано на том, что случайная величина

(п -1) О

V = ■

О

(2)

где О и О - дисперсия и ее оценка,

имеет %2- распределение с (п -1) степенями свободы [12]. То есть выражение

(2) используется для оценки доверительных границ дисперсии [1,12].

Поскольку только для экспоненциального закона математическое ожидание

М = у[О , то для определения границ доверительного интервала оценки среднего для него в [4] предложено использовать %2- распределение. При этом, для упрощения расчетов, используются коэффициенты г1 и г2 , которые вычисляются по формулам 2п 2п

где у1 =

%1-у1;2п

1 + У 2

.2

у1;2 п+2

(3)

2

односторонняя доверительная вероятность;

у2 = Р |ТН < Т < Тв} - двусторонняя доверительная вероятность.

Двусторонняя доверительная вероятность у2 связана с уровнем значимости

а выражением у2 = 1 - а . Тогда у1 = 1 -

а

Впоследствии указанный способ был закреплен в ГОСТ [2].

Результаты расчета НДГ средней наработки с использованием %2- распределения и теоретического гамма-распределения представлены на рисунке 3.

Из рисунка видно, что хотя асимптотически (при п ^ ж) кривые сливаются, но в диапазоне малых выборок (п < 10) различие существенно (до 40 %, при п = 2). Это и предопределило необходимость сведения к минимуму ошибок в данном диапазоне п .

В общем случае повышения точности оценки НДГ средней наработки можно достичь, используя табличные распределения путем дополнительного смещения

г1 =

в диапазоне п <10 . Теоретически это решается путем приравнивания соответствующих функций распределений среднего Р(Ь, п) и табличной функции распределения в(Ь, т) и нахождения из этого равенства функции

т = ф(п). (4)

Однако решение такого уравнения представляет определенные трудности, Рис. З.Сравнение НДГ средней наработки по х - связанные с трансцендент-

распредеяению с -пю^тмческин ностью. Поэтому для прак-

тических приложений представляется целесообразным найти приближенное решение путем подбора функции (4), обеспечивающей приемлемую точность в указанном диапазоне.

Так, повышения точности оценок НДГ можно добиться путем дополнительного смещения табличного %2- распределения относительно п на единицу. Для расчета НДГ средней наработки это означает, что вместо формулы [2] т = 2Тп

1Н = п ,

%1-а;2 п+2

где Т - средняя наработка изделия на отказ, можно использовать выражение

Т =

Н

2Т(п -1)

%1-а;2п

(5)

Для методики, изложенной в [4], предложенная процедура заключается в смещении данных в таблице Приложения 3 относительно П на 1. То есть, представленные в ней значения коэффициентов г2 следует сместить на одну строку ниже (это означает, что для одних и тех же значений у1 коэффициент т2, = г2, и т.д.). Кривые для НДГ средней наработки, построенные по [2 и 4]

2|п=2 2|п=1

практически совпадают, поэтому на рис. 4 они изображены одной кривой красного цвета.

Нетрудно видеть, что в результате дополнительного смещения удалось значительно повысить точность оценки НДГ, причем относительная ошибка не превышает 3 %.

Все сказанное выше относится к экспоненциально распределенной генеральной совокупности. Однако, представляет интерес обобщение данного подхода на более широкий класс распределений. Обычно о таких распределениях известны лишь характеристики рассеивания.

Рис. 4. Дополнительно смешенные оценки НДГ средней наработки

Нижнюю границу средней наработки в этом случае определяют двумя способами [8]:

- при известной дис-2

персии ст применяется формула

тн = Т - , (6)

Л/п

где Т - средняя наработка между отказами; а - уровень значимости; и1-а -квантиль стандартного нормального распределения; п - число наблюдений;

- при неизвестной дисперсии ст применяется формула

_ я т =т-\ ——

1Н 1 Ч-а I— > У1п

(7)

где t1-а - квантиль t — распределения Стьюдента для п -1 степеней свободы; я - оценка среднеквадратического отклонения.

Результаты расчетов НДГ ТН для различного представления распределений средней наработки в сформулированных выше условиях изображены на рис. 5.

Анализ рис. 5 показывает, что в условиях малой выборки распределение Стьюдента дает существенное отклонение от теоретического значения НДГ средней наработки, в частности для экспоненциального распределения генеральной совокупности.

Нормальное распределение при минимальной выборке ( п = 2 ) в этих условиях дает относительное расхождение с теоретическим значением до 60 % с дальнейшим снижением по мере увеличения п .

Область применения выражений (6) и (7) для оценки НДГ среднего распространяется на распределения, наблюдаемые переменные которых несильно отличаются от нормального при больших п в большинстве практических прило-

Рис. 5. Нижние доверительные границы средней жений [10]. Их использова-наработки ние при малых значениях п

Т„

40

Теоретическое

(гамма-распределение)

смешения

Н ормально е р а с-пределение со о№шеии«1

Рис. 6. Графики нижних доверительных границ средней наработки, рассчитанные по нормальному закону

TH = T - U1-

где и.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

ст

ТП+1

приводит к существенным погрешностям.

В этих условиях для повышения точности определения границ доверительного интервала при малых объемах выборок с использованием нормального и I -распределения Стьюдента целесообразно также ввести дополнительное смещение.

В частности, для НДГ, рассчитываемых с помощью нормального закона при п < 10, предлагается добавить смещение, заменив выражение (6) на формулу

(8)

.11_а - квантиль стандартного нормального распределения; ст = Т - средне-квадратическое отклонение экспоненциально распределенной генеральной совокупности.

Графики НДГ средней наработки, рассчитанных по теоретическому гамма-распределению и с использованием нормального закона по выражениям (6) и (8), представлены на рисунке 6. Из рисунка видно, что смещенная оценка расположена гораздо ближе к теоретическому значению НДГ. Относительная ошибка в диапазоне 0 < п < 10 составляет около 2 %.

Аналогичным образом, для повышения точности оценок, рассчитываемых с помощью t — распределения Стьюдента, при п < 10 можно добавить смещение, заменив выражение (7) на формулу в

T = T -1

*Н 1 1-a,2n+2

n + 2

(9)

где и

- квантиль и -распределения Стьюдента с 2п + 2 степенями свобо-

ды; в = Т - оценка среднеквадратического отклонения экспоненциально распределенной генеральной совокупности.

Графики нижних доверительных границ средней наработки, рассчитанных по теоретическому гамма-распределению и с использованием I -распределения Стьюдента по выражениям (7) и (9) представлены на рис. 7.

Из рисунка видно, что и в этом случае смещенная оценка расположена гораздо ближе к теоретическому значению НДГ. Относительная ошибка в диапазоне 2 < п < 10 составляет от 15 % при минимальном объеме выборки п = 2 до 1,7 % - при п = 10 .

Подтверждение правильности подхода и работоспособности предложенных рекомендаций по дополнительному смещению табличных распределений для

выборок малого объема проведено методом статистических испытаний. Проверка осуществлена для наиболее показательного случая объема выборки п = 2 .

Нижние доверительные границы средней наработки Тн с дополнительным сме-

Рис. 7. Графики нижних доверительных границ средней наработки, рассчитанных по t - распределению Стьюдента

щением определялись по выражениям (8) и (9) с использованием таблиц нормального и t - распределения Стьюдента. Сравнение проводилось с теоретическим гамма-распределением оценки среднего для экспоненциально распределенной генеральной совокупности.

Вычислительный эксперимент показал хорошую сходимость опытных данных и табличных с дополнительным смещением. В целом эксперимент подтвердил возможность использования дополнительного смещения. Кроме того, результаты исследований показывают, что при п ^ ж НДГ средней наработки стремится к Т , что подтверждает состоятельность оценок.

Таким образом, в результате анализа различных способов определения НДГ средней наработки изделий на отказ установлено, что в условиях малой выборки (п < 10) наблюдений наиболее точным из классических является способ

на основе %2- распределения. Исследованная область его использования ограничена экспоненциальным распределением.

Наименее точным из рассмотренных является способ, базирующийся на использовании t - распределения Стьюдента. Нормальное распределение дает расхождение с теоретическим гамма-распределением до 60 % при минимальном объеме испытаний (п = 2) .

Дополнительное смещение табличных распределений позволяет существенно повысить точность определения НДГ средней наработки в условиях малого числа наблюдений (п < 10).

Рис. 8. Результаты решения примера различными способами

В случаях не экспоненциальных генеральных совокупностей, где применение %2- распределения требует дополнительного обоснования, целесообразно использовать табличные стандартного нормального и t -распределения Стьюдента с дополнительным смещением, что также позволит эффективно решать задачи и для выборок малого объема.

В заключение рассмотрим пример, иллюстрирующий возможности введения дополнительного смещения при расчете НДГ средней наработки.

Пусть в результате испытаний получена выборка случайной наработки некоторого объекта между отказами Т1 = 315 ч, Т2 = 11 ч, Т3 = 179 ч. Необходимо с доверительной вероятностью 0,9 рассчитать оценки НДГ средней наработки различными способами.

Результаты расчетов приведены на рис. 8.

Анализируя рис. 8, нетрудно убедиться, что точность оценки НДГ средней наработки с использованием дополнительного смещения намного выше даже в условиях чрезвычайно малого объема наблюдений.

Таким образом, в условиях, когда нет возможности рассчитать теоретические значения НДГ средней наработки (теоретических значений), повышению точности их оценок может служить дополнительное смещение табличных распределений.

1. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. - М.: Наука, 1984. - 832с.

2. ГОСТ Р 50779.26-2007 Статистические методы. Точечные оценки, доверительные, предикционные и толерантные интервалы для экспоненциального распределения.

3. ГОСТ Р 27.002-2009 Надежность в технике. Термины и определения.

4. Руководство по определению надежности изделий авиационной техники при их разработке, испытаниях и эксплуатации. Часть IV. Выпуск 41000. - М.: МАП, МГА и МО СССР, 1972.

5. Методика количественной оценки безотказности авиационных двигателей по результатам эксплуатации. - ЦИАМ, Гос-НИИ ГА, в/ч 75360, 1991.

6. Когге Ю.К., Майский Р.А. Основы надежности авиационной техники. - М.: Машиностроение, 1993.

7. ОСТ В1 00094-73 Надежность изделий авиационной техники. Методы анализа безотказности по данным эксплуатации.

КОРОТКО ОБ АВТОРАХ -

- СПИСОК ЛИТЕРАТУРЫ

8. Гнеденко Б.В., Беляев Ю.К., Соловьев А.Д. Математические методы в теории надежности. - М.: Наука, 1965. - 524 с.

9. ГОСТ Р 50779.10-2000 Статистические методы. Вероятность и основы статистики. Термины и определения.

10. ГОСТ Р 50779.21-2004 Статистические методы. Правила определения и методы расчета статистических характеристик по выборочным данным. Часть 1 Нормальное распределение.

11. ГОСТ Р 50779.22-2005 (ИСО 26.02:1980) Статистические методы. Статистическое представление данных. Точечная оценка и доверительный интервал для среднего.

12. Вентцель Е.С. Теория вероятностей.- М.: Госиздат физмат. литературы, 1962.- 564с.

13. Джонсон Н., Лион Ф. Статистика и планирование эксперимента в технике и науке. Методы обработки данных. - М.: Мир, 1980. - 510 с. ЕШ

Воловик Александр Васильевич — кандидат технических наук, старший научный сотрудник, [email protected], ОАО «Климов»,

Клавдиев Александр Александрович — кандидат технических наук, доцент, [email protected],

Трутников Вячеслав Евстафьевич — доктор технических наук, доцент, [email protected], Национальный минерально-сырьевой университет «Горный».

Повышение точности статистических оценок дополнительным смещением табличных распределений Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Воловик Александр Васильевич, Клавдиев Александр Александрович, Трушников Вячеслав Евстафьевич

Похожие темы научных работ по математике , автор научной работы — Воловик Александр Васильевич, Клавдиев Александр Александрович, Трушников Вячеслав Евстафьевич

IMPROVING THE ACCURACY OF ESTIMATES OF STATISTICAL DISTRIBUTIONS ADDITIONAL OFFSET TABULAR

Текст научной работы на тему «Повышение точности статистических оценок дополнительным смещением табличных распределений»