УДК 519.2
Вестник СибГАУ Т. 16, № 1. С. 143-152
ПОСТРОЕНИЕ ВЕРОЯТНОСТНЫХ МОДЕЛЕЙ НАДЕЖНОСТИ ПО ВЫБОРКАМ ТЕКУЩИХ СОСТОЯНИЙ
Е. В. Чимитова
Новосибирский государственный технический университет Российская Федерация, 630073, г. Новосибирск, ул. Карла Маркса, 20 E-mail: chimitova@corp.nstu.ru
Рассматриваются вопросы построения вероятностной модели отказов по результатам испытаний на надежность устройств одноразового срабатывания. Прежде всего, речь идет об устройствах, от безотказной работы которых непосредственно зависит готовность космических аппаратов выполнять свои функции. В частности, это устройства для крепления и расфиксации подвижных элементов конструкции космического аппарата: солнечных панелей, радиолокационных антенн, раскрываемых штанг приборов и прочего оборудования. В случае успешного срабатывания устройства мы имеем цензурированное справа наблюдение; если же устройство не сработало, значит отказ произошел до момента времени тестирования и мы получаем цензу-рированное слева наблюдение. Полученную в результате выборку цензурированных слева и цензурированных справа наблюдений (без полных наблюдений) называют выборкой текущих состояний.
Для ряда распределений, наиболее часто используемых в задачах теории надежности, проведено исследование отношения информационного количества Фишера о параметрах в выборке текущих состояний к информации Фишера в полной выборке. В результате максимизации информационного количества Фишера получены оптимальные моменты времени тестирования изделий одноразового срабатывания (с позиции точности оценок максимального правдоподобия).
Предложен алгоритм вычисления непараметрической оценки функции распределения по выборкам текущих состояний, обеспечивающий максимум функции правдоподобия по значениям функции распределения в точках, соответствующих моментам времени тестирования устройств. С использованием метода Монте-Карло проведено исследование статистических свойств непараметрической оценки в зависимости от объема выборки и числа моментов тестирования.
Для проверки адекватности построенной вероятностной модели по выборкам текущих состояний автором предложены статистические критерии согласия типа Колмогорова, Крамера-Мизеса-Смирнова, хи-квадрат и Уайта, применение которых предполагает нахождение неизвестных условных распределений статистик G(S\H0) применяемых критериев с использованием метода Монте-Карло. Проведен сравнительный анализ критериев по мощности, в результате которого в качестве наиболее предпочтительного рекомендуется критерий согласия типа хи-квадрат.
Ключевые слова: надежность устройств одноразового срабатывания, выборки текущих состояний, метод максимального правдоподобия, непараметрическая оценка функции распределения, критерии согласия, модель ускоренных испытаний, метод Монте-Карло.
Vestnik SibGAU Vol. 16, No. 1, P. 143-152
THE CONSTRUCTION OF PROBABILISTIC RELIABILITY MODELS ON THE BASIS OF CURRENT STATUS DATA
E. V. Chimitova
Novosibirsk State Technical University 20, Karla Marksa Str., Novosibirsk, 630073, Russian Federation E-mail: chimitova@corp.nstu.ru
In this paper, I consider the problems, which arise in construction of probabilistic lifetime models on the basis of data, obtained from the reliability experiment on one-shot devices. First of all, we are interested in reliability of those one-shot devices, which provide the ability of a spacecraft to perform its functions. In particular, the examples are the devices for fixing and unfixing mobile elements of a spacecraft: solar panels, radar antennas, disclosing bar devices and other equipment. One-shot devices are tested at some predetermined inspection times, and the experiment results in reporting the status of devices instead of an actual failure time. The failure time here is either left censored, if the test
outcome is a failure, or right censored, if the test outcome is a success. The obtained sample of left censored and right censored observations (without complete observations), is called a current status sample.
For a number of distributions, which are frequently used in reliability theory, I have investigated the ratio of the Fisher information about distribution parameters in a current status sample to the Fisher information in a complete sample of observations. As a result of maximization of the Fisher information, I have obtained the optimal inspection times (from the position of minimal variance of maximum likelihood estimates).
I have proposed an algorithm for calculation of nonparametric estimator of lifetime distribution function by current status samples, which provides the maximum of the likelihood function by the values of distribution function at the points of inspection times. I have investigated the statistical properties of obtained nonparametric estimator depending on the sample size and the number of inspection times with Monte Carlo method.
For testing adequacy of constructed probabilistic model by current status samples, the author has proposed the goodness-of-fit tests of Kolmogorov, Cramer-von Mises-Smirnov, chi-square and White types. The application of these tests requires the simulation of unknown conditional statistic distributions G(S|H0) for applied tests with Monte Carlo method. As the result of comparative analysis ofproposed tests by power the chi-square type test can be recommended as the most preferable one.
Keywords: reliability of one-shot devices, current status samples, maximum likelihood method, nonparametric estimator of distribution function, goodness-of-fit tests, accelerated failure time model, Monte Carlo method
Введение. В результате испытаний на надежность устройств одноразового срабатывания в некоторые детерминированные моменты времени вместо выборки отказов получают данные о состоянии устройств на моменты времени тестирования. В случае успешного срабатывания устройства мы имеем цензуриро-ванное справа наблюдение; если же устройство не сработало, значит, отказ произошел до момента времени тестирования и мы получаем цензурированное слева наблюдение. Таким образом, полученная выборка будет содержать цензурированные слева и цен-зурированные справа наблюдения, при этом в выборке не будет ни одного полного наблюдения. Такие выборки являются частным случаем выборок интервальных наблюдений и называются выборками текущих состояний (current status data). Примерами устройств одноразового срабатывания служат, в первую очередь, устройства для крепления и расфиксации подвижных элементов конструкции космического аппарата: солнечных панелей, радиолокационных антенн, раскрываемых штанг приборов и прочего оборудования. Безотказность работы этих устройств непосредственно влияет на готовность космических аппаратов выполнять свои функции. Проблемы обеспечения безотказности функционирования механических устройств одноразового срабатывания на космических аппаратах рассматриваются в [1]. К устройствам одноразового срабатывания также относятся различные электровзрывные устройства, автомобильные подушки безопасности и др.
В последнее время большую популярность завоевали непараметрические методы, которые не требуют знания априорной информации о виде закона распределения результатов измерений. В [2; 3] исследовалась непараметрическая ОМП для выборок текущих состояний с учетом различных типов отказа. Кроме того, данные о текущем состоянии можно рассматривать как частный случай интервальных данных. В [4] Тернбуллом был предложен итерационный алгоритм вычисления непараметрической оценки функции надежности по интервальным данным, который применим и для рассматриваемых выборок.
Вследствие высокой надежности устройств одноразового срабатывания, за отведенное на эксперимент время может быть не выявлено ни одного неработоспособного устройства, поэтому испытания обычно проводят при повышенных нагрузках и по полученным данным строят регрессионную модель надежности, например, модель ускоренных испытаний [5; 6], по которой осуществляется прогноз надежности изделий для нормальных условий эксплуатации. В [7-9] представлен ЕМ-алгоритм для вычисления оценок максимального правдоподобия (ОМП) параметров модели ускоренных испытаний в случае экспоненциального распределения отказов и распределения Вей-булла.
Основной проблемой при построении вероятностной модели надежности по выборкам текущих состояний является проверка гипотезы об адекватности полученной модели. Классические критерии согласия, такие как критерий Колмогорова, Крамера-Мизеса-Смирнова, Андерсона-Дарлинга, х2 Пирсона, для выборок текущих состояний неприменимы. В литературе, посвященной статистическим методам анализа интервальных выборок, рассмотрены некоторые подходы к проверке статистической гипотезы о согласии. В частности, в [10] рассматривается подход, основанный на преобразовании выборки текущих состояний в псевдополную выборку, по которой и осуществляется проверка гипотезы о согласии. В [11] предлагается параметрический критерий проверки гипотезы о согласии H0 против конкурирующих гипотез H1, соответствующих более общим моделям. В [12] для проверки гипотезы о согласии по интервальным выборкам ис-
2
пользуется критерий типа х , для вычисления статистики которого применяется процедура рандомизации. Однако рассмотренные подходы не учитывают специфику выборок текущих состояний, и их применение будет неэффективным.
В данной работе с использованием метода Монте-Карло исследуются статистические свойства ОМП параметров распределений в зависимости от способа выбора моментов тестирования устройств, а также предлагается алгоритм вычисления непараметрической ОМП функции распределения отказов на основе
выборок текущих состояний. Далее автором предлагаются критерии согласия для проверки адекватности вероятностных моделей надежности по выборкам текущих состояний и проводится исследование методами статистического моделирования мощности предложенных критериев.
Статистические свойства ОМП параметров по выборкам текущих состояний. Рассмотрим эксперимент на надежность, в котором п устройств одноразового срабатывания, принадлежащих одной генеральной совокупности, тестируются в моменты времени /ь /2, •••, 4, к < п . Обозначим через п количество объектов, тестируемых в момент времени , к
£ П = п . В результате эксперимента часть объектов
г=1
успешно сработала, в то время как остальные оказались в неработоспособном состоянии. Таким образом, полученную выборку наблюдений можно записать в следующем виде:
Хп = {,Кг,пг), г = 1, ...,к},
(1)
где К. - количество устройств, оказавшихся в неработоспособном состоянии на момент времени тестирования , что свидетельствует о том, что отказ произошел до момента времени (цензурированные слева наблюдения).
Предположим, что наблюдаемая случайная величина Т - время, в течение которого устройство находится в работоспособном состоянии, т. е. способно к безотказному срабатыванию, принадлежит параметрическому семейству распределений Е (/; 6), бе © . Неизвестный параметр 6 (в общем случае векторный) можно оценить методом максимального правдоподобия. ОМП 0 параметра 6 называется точка параметрического множества ©, в которой функция правдоподобия
Ь (Хп; 6 ) = еир Ь (Хп; 6).
6е©
3) при выполнении условий регулярности модели ОМП обладают свойствами асимптотической эффективности и нормальности:
4п (6 - 6) —— I ^ N (о, I- '(6)),
п ^да .
где 1п (6) - информационное количество Фишера о параметре 6 , содержащееся в выборке Хп.
Информацией Фишера о параметре 6, содержащейся в выборке Хп, называется дисперсия вклада выборки:
1п (6) = Б [и (Хп; 6)]= Б
51п Ь (Хп; 6)
56
Поскольку М\П (Хп;6)] = 0, то продифференцировав это выражение по 6 , получим:
1п (6) = -М
521п Ь(Хп; 6) 562
5Е(¿г; 6) 5Е(¿г; 6)
(2)
=1Е (Гг; 6) (1 - Е (Гг; 6)) 56
56Т
Логарифм функции правдоподобия для выборки текущих состояний вида (1) имеет вид
Матрица 1п (6) зависит от моментов тестирования /2,..., ¿к, следовательно, выбор моментов тестирования напрямую влияет на свойства и точность ОМП. Если до начала эксперимента на надежность устройств одноразового срабатывания имеется априорная информация о виде закона распределения отказов, то моменты времени тестирования и количество устройств, тестируемых в каждый момент времени, могут быть выбраны оптимальным образом в результате максимизации функционала от информационной матрицы Фишера (2).
Оптимальные моменты времени тестирования ¿2,..., ¿к устройств одноразового срабатывания будем искать в виде дискретного нормированного плана
¿1, ¿2, ..., ¿к
Р^ P2,..., Рк
1пЬ (Хп;6) = £((1пЕ«г;6) + (п - К)1п(1 - Е^;6))). где £рг = 1, Рг = Щ / п, решая задачу
г=1
Если функция правдоподобия дифференцируема по 6 , то для нахождения ОМП векторного параметра
6 = (61,62, ...,6s)Т решают систему уравнений правдоподобия:
51п Ь( Хп, 6)
г=1
det 1п (6) ^ тах
¿1 ,^2,---,?к; п1,---,пк
(3)
при ограничениях
56 г
■ = о, г = 1,..., ^.
Широкое применение ОМП обусловлено тем, что при достаточно больших объемах выборок для них характерны следующие свойства.
1) асимптотическая несмещенность: М6 ^ 6,
п ^да ;
2) состоятельность: 6 ——»6, п ^да;
0 < < ¿2 <... < ¿к , £пг = п, п е N , г = 1,к .
г=1
В результате решения задачи (3) при различных объемах выборок были получены следующие оптимальные планы ек для различных предположений о виде распределения отказов:
- в случае экспоненциального распределения отказов с функцией плотности
/ ( е) = —ехр
Г г ^
■ч V
е > о, г > о
оптимальный план состоит из одной точки:
е, =
1.594 • 1
- в случае распределения Вейбулла с функцией плотности
/ ( е)=-
Г - Т2
>1 V
ехр
Г Г I ^2 ^
Л V
> о, г > о
оптимальный план состоит из двух моментов тестирования и имеет вид
е2 = 1(0,262 •б,)2 (2,665 •в,)2 1 . [ 0,5 0,5 ]
- в случае логнормального распределения с функцией плотности
/ ( е)=
1
(
г •е2Т2л
ехр
4Ш2
V 2в2
Г - ?
Vе! V
1' 2
> о, г > о
оптимальный план также является инвариантным относительно значений параметров:
е2 =
е1 • о,з2ов2 е1 • 3,121е
о, 5
о, 5
- в случае гамма-распределения моменты времени тестирования не являются инвариантными относительно значений параметра формы; при е2 = 1 полученный оптимальный план имеет вид
о,14о •е1 2,2о5 •е1
о,5
о,5
Интересным оказался тот факт, что оптимальное время тестирования для экспоненциального распределения совпало с точкой асимптотически оптимального группирования, полученной в результате минимизации потерь информации Фишера от группирования [13]. Однако для других рассмотренных распределений точки оптимального плана несколько отличаются от точек асимптотически оптимального группирования.
Об эффективности оценивания параметров по выборке текущих состояний по сравнению с оцениванием по полной выборке будем судить по величине отношения 1п (е)/ /*(е), где /П(е) - количество информации Фишера в полной выборке.
В табл. 1 для рассматриваемых законов распределения представлены либо значения 1п (е)/ /П(е) для скалярных параметров, либо значения отношения определителей соответствующих информационных матриц det 1п (е)Ме! /*(е) в случае векторного параметра в зависимости от плана эксперимента. Моменты времени тестирования, за исключением случая использования оптимального плана, выбирались таким образом, чтобы вероятности попадания в интервалы между соседними моментами тестирования были равными:
Ъ = Е-
к +1
; = 1, к,
(4)
где Е (•) - функция, обратная к функции распределения Е(г).
Асимптотическая дисперсия является теоретической характеристикой точности оценивания. Реальную же картину того, насколько точно можно оценить параметры закона по выборке текущих состояний в зависимости от объема выборки п, могут дать результаты исследования методами статистического моделирования. Для этого необходимо оценить величину относительной эффективности: Бе /б) - в случае скалярного параметра или det Б)*/det £Ю - в случае векторного параметра, где е* - ОМП неизвестного
параметра распределения по полной выборке, е -ОМП по выборке текущих состояний.
Рассмотрим изменение относительной эффективности оценивания в зависимости от степени цензурирования и объема выборки п на примере ОМП параметров масштаба и формы распределения Вейбулла. Результаты моделирования представлены в табл. 2. Количество N моделируемых выборок, по которым исследовались законы распределения оценок по выборкам объема п, было взято равным 1оо ооо.
Отношение количества информации Фишера в выборке текущих состояний к количеству информации в полной
Таблица 1
О параметре экспоненциального распределения О векторе параметров распределения Вейбулла О векторе параметров логнормального распределения О векторе параметров гамма-распределения, е2 = 1
Опт. о,6476 о,о638 о,о993 о,о361
к = 1 о,48о5 - - -
к = 2 о,4661 о,о3оо о,о328 о,о112
к = 5 о,4442 о,о535 о,о579 о,о199
к = 1о о,4298 о,о6о5 о,о648 о,о224
к = 2о о,4193 о,о626 о,о666 о,о23о
к = 5о о,411о о,о627 о,о663 о,о229
Относительная эффективность оценивания вектора параметров распределения Вейбулла по выборкам текущих состояний по сравнению с оцениванием по полной выборке в зависимости от объема выборки п
Таблица 2
n = 200 n = 300 n = 500 n = 700 n = 1000
Опт. 82 0,0563 0,0577 0,0603 0,0619 0,0621
k = 2 0,0216 0,0250 0,0271 0,0279 0,0285
k = 5 0,0491 0,0495 0,0512 0,0523 0,0518
k = 10 0,0554 0,0568 0,0579 0,0588 0,0585
Как видно из табл. 2, с ростом объема выборок величина стремится к ай I* (0) Мй I* (0).
*
В случае использования оптимального плана е2 при
больших объемах выборок ОМП обладает меньшей дисперсией по сравнению со случаями использования большего числа моментов тестирования к. Аналогичные закономерности были получены при исследовании свойств ОМП параметров логнормального и гамма-распределения.
Непараметрическая оценка функции распределения по выборкам текущих состояний. В условиях отсутствия априорной информации о распределении Р(0 оценку неизвестной функции распределения в точках /ь /2, ..., 4 можно найти в результате условной максимизации функции правдоподобия:
1п Ь (X*) = £ (( 1п Р + (п - Кг )1п (1 - Р)) тах
,=1 р1,-,рк
при ограничениях
£1 < Р2 <... < Рк , Р > 0, ..., Рк > 0,
где через Р1, Р2, ..., Рк для краткости обозначены значения £(4), Р(/2), ..., Р(4) соответственно.
Опираясь на теорему Лагранжа, несложно показать, что решение сформулированной задачи условной оптимизации может быть найдено в соответствии со следующим алгоритмом:
К
1. Вычислить начальные значения Р =—L.
п,
2. Если найденные значения £1,...,Рк удовлетворяют ограничениям Р1 < Р2 <... < Рк, то решение найдено, иначе перейти на шаг 3.
3. Найти наименьший номер 1 < к, для которого
Р >
4. Пересчитать значения, удовлетворяющие неравенству Р > Р+1 >... > Р+т, следующим образом:
1+т
Р = = Р = ^ ^
текущих состояний (1) можно записать следующим образом:
'+т 1+т
ХП,
] =
5. Повторять шаги 3, 4 до тех пор, пока не выполнится ограничение Р < Р2 <... < Рк.
Таким образом, непараметрическую оценку неизвестной функции распределения Р(/) по выборке
F(t) =
0, t < t,.
Р, t, < t < t2,
(5)
Fk
tk <t-
C использованием методов статистического моделирования исследуем скорость сходимости оценки (5) к истинной функции распределения. В качестве расстояния между непараметрической оценкой и соответствующей функцией распределения рассмотрим статистику Колмогорова
Dn = sup Ft) - F (t)|.
0<t<tk 1 1
Для построения зависимости расстояния между оценкой Fr(t) и истинной функцией распределения F(t) от объема выборки при фиксированном количестве моментов тестирования k генерировались выборки вида (1) объемом n из распределения F(t), по каждой из которых вычислялись значения статистики Dn. Задаваемые моменты тестирования (моменты испытания устройств) вычислялись в соответствии с (4).
Исследования были проведены при объемах выборок n = 20, 40, 60, ..., 980, 1000 и k = . На рисунке представлены графики полученных зависимостей значения Dn от n, усредненного по 10000 выборок, при k = 5, 10, 20 и 40.
Как видно на рисунке, расстояние от непараметрической оценки Fr(t) до истинной функции распределения F(t) с ростом объема выборки и числа моментов тестирования уменьшается. Полученные зависимости хорошо аппроксимируются степенными функциями вида MDn = а0 и-™1 . В частности, вычисленные с использованием метода наименьших квадратов оценки параметров этой зависимости и соответствующий коэффициент детерминации при различных k принимают следующие значения:
- при k = 5: а0 = 0,53, (1 = 0,12 , R2 = 0,971;
- при k = 10: (0 = 0,66 , (1 = 0,20 , R2 = 0,990 ;
- при k = 20: а0 = 0,82, (1 = 0,26, R2 = 0,998;
- при к = 40: а0 = 0,87, а = 0,27, К2 = 0,999.
Естественно, что скорость сходимости с ростом числа моментов тестирования увеличивается. В результате проведенного исследования можно говорить о состоятельности непараметрической оценки £(/).
Зависимость усредненного расстояния Колмогорова Бп от объема выборки при различном числе моментов тестирования к
Построение критериев согласия для выборок текущих состояний. Задача проверки адекватности модели надежности, полученной по выборке текущих состояний, приводит к необходимости построения критериев согласия, способных по таким данным осуществлять проверку статистической гипотезы вида
Н0: ^(0 е{{ 6), 9е©}.
Рассмотрим классический подход, основанный на том, что в качестве статистики соответствующего критерия берется расстояние между некоторой непараметрической оценкой функции распределения и ^о(/;6). В данном случае непараметрическая оценка Ё^) неизвестной функции распределения Е(() вычисляется в соответствии с выражением (5).
Статистику Колмогорова Бп, рассмотренную в предыдущем разделе в качестве расстояния между непараметрической оценкой Р^) и истинной функцией распределения можно взять за основу при построении критерия согласия для выборок текущих состояний. В этом случае статистика критерия типа Колмогорова имеет вид
Бп = зпр |£(/) - 6)1.
о<г <гк 1 1
(6)
Аналогично, статистику критерия типа Крамера-Мизеса-Смирнова можно определить следующим образом:
к
®2 = Д( ^)- ^о (/; б))' еШ0 (; 6). (7)
о
В качестве статистики критерия согласия может также выступать статистика типа х2 вида
«=1и - Е)2
I=1 Е,
(8)
где и1 = п|/7(/|) - эмпирическое число отказов к моменту времени /,; Е1 = п; 6) - ожидаемое число отказов к моменту времени в соответствии с проверяемой гипотезой, I = 1, к .
При проверке сложной гипотезы в качестве значений параметров распределения ЕоЦ;6) используется их оценка, полученная, например, методом максимального правдоподобия.
В [14] Уайтом был предложен подход к выявлению неверной спецификации вероятностной модели в случае, когда параметры модели оцениваются методом максимального правдоподобия. Его подход основан на различном представлении информационного количества Фишера о параметре регулярного распределения, содержащегося в выборке. В данной работе для проверки сложной гипотезы о согласии предлагается использовать статистику вида
Б™ =4п
л* А (6)- л* Вп (6 )|
л* Вп (6)
(9)
где
А,
(6)
1 к
=41
1=1
К
д 21п ^ (; 6)
да2
+( -К )-
д21п (1 - ^ (; 6 ))
д62
( )=11
У ' п I=1
^ 51п^о (;6))д 1п(;6)
В166 > = п 1=1К, д6 д6
V
+-1 (п - К ))1п (! - ро (; 6)) I д 1п ( - ро (; 6))
п
1=1
д6
у
д6
0 - ОМП параметра распределения 0). При справедливости гипотезы Н0 оценки информационной матрицы Ап и Вп должны быть близкими, в противном случае, если модель р (/; 0) неверна, то различие между данными оценками будет существенным.
Гипотеза о согласии Н0 отвергается при больших значениях статистик (6)-(9).
Проверку гипотез с нахождением неизвестных условных распределений О(Б | Н0) статистик применяемых критериев с использованием метода Монте-Карло можно осуществлять на основе следующего алгоритма.
1. По имеющейся выборке текущих состояний Хп методом максимального правдоподобия найти оценку 0 неизвестного вектора параметров распределения F0(t; 0) и вычислить значение Б** статистики соответствующего критерия.
2. Смоделировать эмпирическое распределение Оы(Бп | Н0) статистики критерия:
2.1. Сгенерировать полную выборку псевдослучайных величин объемом п в соответствии с распределением р^; 0).
2.2. В соответствии с заданными в исходной выборке Хп моментами времени тестирования ..., 4 и количеством тестируемых в этот момент элементов п1, п2, ..., пк преобразовать полученную на шаге 2 полную выборку в выборку текущих состояний Уп .
2.3. По выборке текущих состояний Уп оценить параметры распределения 0) и вычислить значение статистики соответствующего критерия согласия (6)-(8) или (9).
Повторить шаги 2.1-2.3 N раз. В результате получается выборка статистик Б^, ..., ^
3. По смоделированной выборке статистик [?п,Б2, ..., SnN| объемом N строится эмпирическая функция распределения ОN(Бп | Н0). Проверяемая гипотеза Н0 отклоняется, если 1 - ОЬ1 (Б* | Н0) < а , где Бп - значение статистики соответствующего критерия согласия по выборке Хп .
Количество моделируемых выборок N следует выбирать достаточно большим. В частности, при N = 16600 абсолютная погрешность моделирования [13]
О (Б^Н 0) - О (Бп^ 0) < 0,01.
Отметим, что п. 2 алгоритма может выполняться в интерактивном режиме, обеспечивая нахождение ОN (Бп | Н0) и оценку достигнутого уровня значимости 1 - ОN (Б* | Н0) в ходе проводимого анализа.
Мощность критериев согласия по выборкам текущих состояний. Для оценки мощности и сравнительного анализа критериев по выборкам текущих состояний моделировались распределения статистик по законам, соответствующим справедливости прове-
ряемой гипотезы Н0 или конкурирующей Н1. В качестве примера рассмотрим результаты исследования мощности критериев при проверке сложной гипотезы Н0 о принадлежности выборки экспоненциальному закону распределения с неизвестным параметром масштаба 0! > 0 относительно шести различных конкурирующих гипотез:
- Н : распределение Вейбулла с параметрами 01 = 1, 02 = 0,5;
- Н12 : распределение Вейбулла с параметрами 0! = 1, 02 = 1,5;
- Н13: распределение Вейбулла с параметрами 0! = 1, 02 = 2;
- Н4 : гамма-распределение с параметрами 01 = 1, 02 = 0,5;
- Н15 : гамма-распределение с параметрами 01 = 1, 02 = 1,5;
- Н16: гамма-распределение с параметрами 01 = 1,
02 = 2.
В табл. 3 приведены оценки мощности рассмотренных критериев согласия при различном числе моментов тестирования и объеме выборки п = 200. Моменты тестирования выбирались в соответствии с выражением (4). Оценки мощности вычислялись при уровне значимости а = 0,01.
Анализируя результаты, представленные в табл. 3, можно отметить, что с ростом числа моментов тестирования мощность критериев увеличивается. Выбор критерия, наиболее предпочтительного по мощности, является неоднозначным: относительно конкурирующих гипотез Н2, н3, Н5 и Н16 наиболее мощным среди рассматриваемых оказывается критерий типа Крамера-Мизеса-Смирнова, в то же время относительно Н и Н4 он сильно проигрывает критериям Уайта и типа х2. Если принять во внимание, что в первом случае критерий типа х2 на основе статистики (8) по мощности лишь незначительно уступает критерию типа Крамера-Мизеса-Смирнова, а во втором - существенно превосходит его, то в качестве наиболее предпочтительного (среди критериев, предложенных в данной работе) можно рекомендовать критерий типа х2.
Модель ускоренных испытаний. Испытания на надежность, как правило, проводятся при повышенных нагрузках, в качестве которых могут выступать температура, напряжение, давление и другие условия. Обозначим вектор объясняющих переменных (нагрузок) через х = (х(1), х(2), ..., х(г-1) . Диапазон значений
переменных х(1), х(2), ..., х( 1 -1 определяется условиями эксперимента и представляет собой отрезок числовой прямой. В момент времени ti устройства тестируются при различных значениях вектора нагрузок:
хл,xi2, ...,хт , i = 1к .
Таблица 3
Оценки мощности критериев согласия для выборок текущих состояний при различном числе моментов тестирования, выбранных в соответствии с равновероятным разбиением
Тип критерия согласия H0: экспоненциальное распределение
Hi н2 H3 H4 H6
k = 5
Колмогорова 0,63 0,31 0,83 0,38 0,14 0,37
Крамера-Мизеса-Смирнова 0,69 0,50 0,89 0,39 0,27 0,54
Хи-квадрат 1,00 0,49 0,85 0,94 0,26 0,52
Уайта 1,00 0,40 0,52 0,91 0,27 0,42
k = 10
Колмогорова 0,71 0,45 0,84 0,39 0,23 0,45
Крамера-Мизеса-Смирнова 0,90 0,64 0,97 0,58 0,34 0,68
Хи-квадрат 1,00 0,54 0,90 0,96 0,29 0,58
Уайта 1,00 0,45 0,60 0,93 0,29 0,47
k = 20
Колмогорова 0,85 0,53 0,93 0,50 0,27 0,56
Крамера-Мизеса-Смирнова 0,95 0,70 0,98 0,66 0,38 0,74
Хи-квадрат 1,00 0,59 0,94 0,96 0,32 0,64
Уайта 1,00 0,48 0,64 0,95 0,30 0,50
Таким образом, все п устройств можно разделить
к
на М = ^ групп в соответствии с различными
г=1
условиями проведения испытаний (различными моментами времени тестирования и значениями вектора объясняющих переменных). Обозначим через п^
количество устройств, тестируемых в г'-й момент времени при значении вектора объясняющих перемен-
к т
ных Ху , = п . Полученную в результате экс-
г =1 з =1
перимента выборку текущих состояний можно записать в следующем виде:
распределения: экспоненциальное, логнормальное, Вейбулла, гамма-распределение и др.
Оценки максимального правдоподобия неизвестных параметров АРТ-модели по выборке текущих состояний (10) могут находиться в результате максимизации логарифмической функции правдоподобия
1п Ь (Хп ;Р, е) =
(
k mi
=z Z
i=1 j=1
Kj ln F0
ti
r (X,; P)
+П - Kj)ln
1 - Fn
r (X,,; P)
Xn = |(t, x,j, К,,nj), i = 1, ...,k, j = 1, ...,mt j, (10) по параметрам в и 0.
где К'З - количество устройств, оказавшихся в неработоспособном состоянии на момент времени тестирования ti при значении вектора нагрузок
Для проверки адекватности полученной АРТ-модели формируется выборка так называемых остатков [15]
Xij (x()' j , ..., xj ) .
Rn
r, =
-i-, К,,, n,
r (Xj; P) j j
i = 1, ..., k, j = 1, ..., mi
Модель ускоренных отказов (Accelerated Failure Time model - AFT) определяется через базовую функцию надежности следующим образом:
5 (t | x) = ¿0
t
r (X; P)
(11)
где г(х ; Р) - положительно определенная функция, которая чаще всего параметризуется следующим образом:
г (Х; Р) = ехр|р0 + Р1Х(1) +... + Ргх(г)},
5"0 ^) = 1 - (t) - базовая функция надежности. В параметрических АРТ-моделях базовая функция надежности определяется некоторым параметрическим семейством распределений (t; е). В качестве базовых законов, как правило, используются следующие
которая представляет собой выборку текущих состояний вида (1). Если модель (11) верна, то выборка остатков Яп должна принадлежать базовому закону
распределения е) с единичным параметром
масштаба. Для проверки гипотезы о согласии выборки остатков с базовым законом распределения можно использовать предложенные в данной работе критерии типа Колмогорова, Крамера-Мизеса-Смирнова, X2 и Уайта.
Заключение. В данной работе рассмотрены основные задачи, возникающие при построении вероятностной модели: непараметрическое оценивание функции распределения, оценивание параметров распределений и проверка статистической гипотезы о согласии. В результате исследования точности оценок максимального правдоподобия по выборкам
текущих состояний показано, что увеличение числа моментов тестирования k не приводит к повышению точности ОМП параметров распределений. Для распределений Вейбулла, гамма, экспоненциального и логнормального найдены оптимальные моменты времени тестирования устройств одноразового срабатывания в виде дискретных нормированных планов эксперимента, инвариантных относительно значений параметров (за исключением параметра формы гамма-распределения).
Предложен алгоритм построения непараметрической оценки функции распределения по выборкам текущих состояний. Показано, что с ростом объема выборки и числа моментов тестирования расстояние Колмогорова между непараметрической оценкой и истинной функцией распределения стремится к нулю, что указывает на ее состоятельность.
Для проверки адекватности построенной вероятностной модели по выборке текущих состояний в работе предложены критерии согласия, применение которых предполагает нахождение неизвестного условного распределения статистики критерия с использованием метода Монте-Карло. В результате сравнительного анализа предложенных критериев по мощности сделан вывод о предпочтительности критерия типа хи-квадрат.
Благодарности. Исследование выполнено при поддержке Министерства образования и науки Российской Федерации в рамках проектной части государственного задания в сфере научной деятельности № 2.541.2014K от 17.07.2014 г.
Acknowledgment. This work was supported by the Ministry of Education and Science of the Russian Federation, as the project part of the State task (project 2.541.2014К from 17.07.2014).
Библиографические ссылки
1. Похабов Ю. П. Особенности обеспечения безотказности функционирования механических устройств одноразового срабатывания на космических аппаратах // Вестник СибГАУ. 2012. № 2 (42). С. 96-100.
2. Jewell N. P., Van der Laan M. J., Henneman T. Nonparametric estimation from current status data with competing risks // Biometrika. 2003. Vol. 90. P. 183-197.
3. Groeneboom P., Maathuis M. H., Wellner J. A. Current status data with competing risks: Consistency and rates of convergence of the MLE // Ann. Statist. 2008. Vol. 36, No. 3. P. 1031-1063.
4. Turnbull B. W. The empirical distribution function with arbitrarily grouped, censored, and truncated data // J. R. Statist. Soc. Ser. B. 1976. Vol. 38. P. 290-295.
5. Bagdonavicius V., Nikulin M. Accelerated life models: modeling and statistical analysis. Boca Raton, Chapman and Hall/CRC, 2002. 360 p.
6. Галанова Н. С., Лемешко Б. Ю., Чимитова Е. В. Применение непараметрических критериев согласия к проверке адекватности моделей ускоренных испытаний // Автометрия. 2012. № 6. С. 53-68.
7. Balakrishnan N., Ling M. H. Multiple-stress model for one-shot device testing data under exponential
distribution // IEEE Transactions on Reliability. 2012. Vol. 61. P. 809-821.
8. Balakrishnan N., Ling M. H. EM algorithm for one-shot device testing under the exponential distribution // Computational Statistics and Data Analysis. 2012. Vol. 56. P. 502-509.
9. Balakrishnan N., Ling M. H. Expectation maximization algorithm for one-shot device accelerated life testing with Weibull lifetimes, and variable parameters over stress // IEEE Transactions on Reliability. 2013. Vol. 62. P. 537-551.
10. Ren J. J., Goodness-of-fit tests with interval censored data // Scandinavian Journal of Statistics. 2003. Vol. 30. P. 211-226.
11. Nysen R., Aerts M., Faes C. Testing goodness-of-fit of parametric models for censored data // Statistics in Medicine. 2012. Vol. 31. P. 2374-2385.
12. Calle M. L., G'omez G. A sampling-based chi-squared test for interval-censored data // In Statistical models and methods for biomedical and technical systems / Editors: F. Vonta, M. Nikulin, N. Limnios, H. Huber-Carol Birkhauser, 2008. 556 p.
13. Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход : монография / Б. Ю. Лемешко [и др.]. Новосибирск : Изд-во НГТУ, 2011. 888 с. ^ерия «Монографии НГТУ»).
14. White H. Maximum Likelihood Estimation of Misspecified Models // Econometrica. 1982. Vol. 50. P. 1-25.
15. Balakrishnan N. [et al.]. Testing Goodness of Fit of Parametric AFT and PH Models with Residuals // Communications in Statistics - Simulation and Computation. 2013. Vol. 42, № 6. P. 1352-1367.
References
1. Pokhabov Yu. P. [Distinctive features of maintenance of flawlessness of nonreusable mechanical devices functioning on space vehicles]. Vestnik SibGAU. 2012, no. 2 (42), p. 96-100 (In Russ.).
2. Jewell N. P., Van der Laan M. J., Henneman T. Nonparametric estimation from current status data with competing risks. Biometrika, 2003, vol. 90, p. 183-197.
3. Groeneboom P., Maathuis M. H., Wellner J. A. Current status data with competing risks: Consistency and rates of convergence of the MLE. Ann. Statist., 2008, vol. 36, no. 3, p. 1031-1063.
4. Turnbull B. W. The empirical distribution function with arbitrarily grouped, censored, and truncated data. J. R. Statist. Soc. Ser. B, 1976, vol. 38, p. 290-295.
5. Bagdonavicius V., Nikulin M. Accelerated life models: modeling and statistical analysis. Boca Raton, Chapman and Hall/CRC, 2002, 360 p.
6. Galanova N. S., Lemeshko B. Yu., Chimitova E. V. Using nonparametric goodness-of-fit tests to validate accelerated failure time models. Optoelectronics, Instrumentation and Data Processing, 2012, no. 48 (6), p. 580-592.
7. Balakrishnan N., Ling M. H. Multiple-stress model for one-shot device testing data under exponential distribution. IEEE Transactions on Reliability, 2012, vol. 61, p. 809-821.
BecmHUK CuôrAY. TOM 16, № 1
8. Balakrishnan N., Ling M. H. EM algorithm for one-shot device testing under the exponential distribution. Computational Statistics and Data Analysis, 2012, vol. 56, p. 502-509.
9. Balakrishnan N., Ling M. H. Expectation maximization algorithm for one-shot device accelerated life testing with Weibull lifetimes, and variable parameters over stress. IEEE Transactions on Reliability, 2013, vol. 62, p. 537-551.
10. Ren J. J. Goodness-of-fit tests with interval censored data. Scandinavian Journal of Statistics, 2003, vol. 30, p. 211-226.
11. Nysen R., Aerts M., Faes C. Testing goodness-of-fit of parametric models for censored data. Statistics in Medicine, 2012, vol. 31, p. 2374-2385.
12. Calle M. L., G'omez G. A sampling-based chi-squared test for interval-censored data. In Statistical models and methods for biomedical and technical systems. Editors: Vonta F., Nikulin M., Limnios N., Huber-Carol H. Birkhauser, 2008, 556 p.
13. Lemeshko B. Yu., Lemeshko S. B., Postovalov S. N., Chimitova E. V. Statisticheskiy analiz dannykh, modelirovanie i issledovanie veroyatnostnykh zakonomernostey. Komp'yuternyy podkhod [Statistical data analysis, simulation and study of probability regularities computer approach]. Novosibirsk, NSTU Publ., 2011, 888 p.
14. White H. Maximum Likelihood Estimation of Misspecified Models. Econometrica, 1982, vol. 50, p. 1-25.
15. Balakrishnan N., Chimitova E., Galanova N., Vedernikova M. Testing Goodness-of-Fit of Parametric AFT and PH Models with Residuals. Communications in Statistics - Simulation and Computation, 2013, vol. 42, no. 6, p. 1352-1367.
© ^HMHTOBa E. B., 2015