_______УЧЕНЫЕ ЗАПИСКИ Ц А Г И
Том XIX / 98 8
М 1
УДК 629.735.33.083.018 629.735.33.017.1
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ И ПОСТРОЕНИЕ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ ПО ВЫБОРОЧНЫМ ДАННЫМ ТИПА ОСМОТРОВ
А. А. Белайчук
Рассмотрена возможность применения критерия отношения правдоподобий к данным контроля целостности элементов планера авиационных конструкций в эксплуатации. Методом Монте-Карло показано, что применение критерия отношения правдоподобий дает лучшие результаты, чем использование асимптотической нормальности оценок максимального правдоподобия. На основе критерия разработаны методики проверки гипотез и построения доверительных интервалов, позволяющие повысить полноту и достоверность анализа данных эксплуатации. Применение методик иллюстрируют результаты обработки реальных данных эксплуатации на ЭВМ.
1. Постановка задачи. Одним из средств обеспечения безопасности и ресурса авиационных конструкций является контроль целостности элементов планера в эксплуатации (осмотри). Большинство повреждений, возникающих в эксплуатации, связаны с усталостью, поэтому наиболее интенсивно разрабатываются методы статистического анализа данных о наличии в элементах конструкции усталостных трещин [1—4]. По результатам обработки данных осмотров делаются выводы о долговечности элементов конструкции и о длительности роста трещин.
Необходимость разработки специальных ме(тодов для обработки данных осмотров вызвана тем, что эти данные существенно отличаются от обычно рассматриваемых в математической статистике и теории надежности. Формальное описание задачи может быть следующим.
Объектом статистического анализа является долговечность, под которой будет пониматься случайная величина — наработка до появления в элементе макротрещины или до его разрушения (развитие трещины в работе рассматриваться не будет). Долговечность измеряется в количестве летных часов, полетов или других аналогичных единицах. Рассматривается парк из N элементов, долговечности которых ¿=1,...,А^ независимо одинаково распределены. Вид функции распределения предполагается известным. В дальнейшем будем рассматривать два рас-
пределения, обычно используемые для описания усталостной долговечности — логарифмически-нормальное:
Будем использовать для этид двух законов обобщенное представление функции распределения логарифма долговечности:
и обозначения в = ((а, а); 0^0 = (—оо, оо) X (0, °о).
Для каждого элемента конструкции известны (заданы) наработки на моменты осмотров в выбранных единицах Ьц, /=1, ¿=1, N.
где — количество осмотров ¿-го элемента. Моменты осмотров различных элементов, вообще говоря, не совпадают. В тех случаях, когда каждый экземпляр конструкции содержит несколько одинаковых элементов, могут совпадать моменты осмотров элементов, принадлежащих одному экземпляру. Моменты осмотров предполагаются не зависящими от долговечностей элементов.
В результате осмотра устанавливается факт наличия или отсутствия в элементе усталостного повреждения. Наличие повреждения означает, что реализация долговечности меньше наработки, при которой проводится осмотр, отсутствие — что реализация/ больше. В результате проведения всех осмотров для каждого элемента определяются наработки, в интервале между которыми находится долговечность, причем НИЖНЯЯ! граница некоторых интервалов может равняться нулю (если повреждение обнаружено при первом осмотре), верхняя — бесконечности (если повреждение не обнаружено ни при одном осмотре). Если хотя бы для одного элемента нижняя граница интервала больше нуля, а верхняя — меньше бесконечности, то данные будем называть данными многоразового осмотра, в противном случае осмотр разовый. Логарифмы наработок, являющихся границами интервала |для ¿-й реализации долговечности, обозначим (хг, х+); — оо х~ < т+ <; оо.
По данным эксплуатации, представляющим собой совокупность интервалов (т~, т+), требуется сделать статистические выводы о параметрах распределения долговечности (ц, о).
Успехи, достигнутые к настоящему времени в разработке методов анализа данных эксплуатации, связаны, в основном, с использованием метода<максимума правдоподобия (МП). В качестве оценок парамет-
ров принимаются значения ([х ,с), максимизирующие функцию правдоподобия
где
и Вейбулла:
Леж(й) = е(-^)
л л
Ь
и ее логарифм /((а, а)=1п/.(|л, о).
Недостатком метода МП является неопределенность свойств оценок при имеющихся небольших, объемах данных. При выполнении некоторых условий регулярности при неограниченном увеличении объема выборки распределение оценок МП сходится к нормальному. Однако, как показывает моделирование типичных выборочных ситуаций по методу Монте-Карло, распределение оценок в действительности сильно отличается от нормального. Явно недостаточное внимание уделялось разработке методов проверки гипотез и интервального оценивания. В данной статье в качестве общего подхода к решению этих задач предлагается использование критерия отношения правдоподобий (ОП).
2. Распределение отношения правдоподобий по данным осмотров. Сделаем два дополнительных допущения о процедуре проведения осмотров при неограниченном увеличении объема выборки.
1) При N—>-00 количество различных наработок неограниченно возрастает.
2) Существуют такие постоянные дч, <72, что при N^-оо для всех справедливо неравенство
Тогда оценки МП параметров по данным осмотров в рассматриваемой задаче состоятельны и асимптотически эффективны (2]. Из состоятельности и асимптотической эффективности оценок следует, что статистика ОП
где 0О— генеральное значение параметра, асимптотически распределена по х2 с двумя степенями свободы [5, 61- Отсюда ¡в свою' очередь следует, что эквивалентная статистика
асимптотически распределена равномерно на интервале (О, 1).
Сравним асимптотическое распределение статистики 1г с истинным. Для этого воспользуемся методом Монте-Карло.
При моделировании разовых осмотров по методу Монте-Карло предполагалось, что логарифм наработки на момент осмотра является нормально распределенной случайной величиной (это предположение, как правило, не противоречит реальным данным эксплуатации). Не ограничивая общности, можно задать параметры распределения логарифма долговечности равным (О, 1), параметры распределения логарифма наработки равным Ц(, <т/. Вместо параметра удобнее задавать ожидаемую долю поврежденных элементов в выборке р\ параметр цг при этом выражается через р и аг. Третий варьируемый параметр — объем выборки N. Были выбраны следующие конкретные значения: N=10; 50; 200; р = 0,05; 0,1; 0,2; .Ст( = 0,1; 0,3; 1. Такой диапазон параметров охватывает практически все реальные ситуации разовых осмотров.
Для моделирования данных многоразовых осмотров необходимо выбрать график их проведения. Поскольку процедуры назначения осмотров в эксплуатации отличаются большим разнообразием, какая-либо общность моделирования многоразовых осмотров становится недости-
О<0х<*у <?*<«>.
ИГ = 2[/(в)-/(в0)],
(2)
(3)
жимой. Моделирование таких данных проводилось в предположении, что интервал между осмотрами пренебрежимо мал. При этом данные многоразового осмотра сводятся к данным с цензурированием в переменной точке: для каждого осмотренного элемента такие данные содержат либо реализацию долговечности, либо наработку, при которой наблюдение за состоянием элемента было прекращено до появления трещины. Распределение цензурирующей наработки, так же как и распределение наработки на момент разового осмотра, определяется наработками различных экземпляров конструкции в определенный календарный момент времени, поэтому методики их моделирования одинаковы. Моделируя для каждой комбинации параметров данные разового осмотра и данные с цензурированием в переменной точке, мы охватываем таким образом весь диапазон данных многоразовых осмотров от наименее до наиболее информативных.
Для двух распределений долговечности (логнормального и Вейбул-ла) и для двух типов данных (разовых осмотров и данных с цензурированием в переменной точке) на ЭВМ было смоделировано по 100 выборок при 27 комбинациях параметров. Для тех из них, для которых оценки МП для функции правдоподобия (1) существовали, они были найдены численно методом Пауэлла [7] и по оценкам были вычислены реализации ОП (3). Предварительный графический анализ показал
близость эмпирической функции распределения (ЭФР) к асимптотической.. На рис. 1 изображена ЭФР 1г при М = 50;р = 0,3; аг = 0,1 и 90%-ные доверительные интервалы, следующие из критерия Колмогорова—Смирнова. Для сравнения на рис. 2 на нормальной вероятностной бумаге построена ЭФР оценки МП параметра а при тех же параметрах. Как видно из графика, распределение оценки даже приближенно нельзя считать нормальным.
Для проверки гипотезы о равномерном распределении были выбраны следующие направления отклонения от равномерности:
/711г(и|е)==и1+', 1е)=1 — (1 — иу+г.
р
+
0,95-
п пп _
+
.+
и
6
б
+
Рис. 2
Эти распределения принадлежат экспоненциальному типу и для них существуют полные достаточные статистики:
где уг — наблюдаемые значения 1г, т. — количество реализаций при одних значениях параметров моделирования. При е = 0 статистики распределены одинаково, асимптотическое распределение — нормальное со средним 0 и дисперсией 1.
Критерии, основанные на статистиках Т1 и Т2, требуют отвергнуть гипотезу е = 0 на уровне значимости 10% для данных разового осмотра и принять — для данных с цензурированием в переменной точке. В частности, при логнормальном распределении долговечности среднее значение Г1 для 27 комбинаций параметров для данных разового осмотра оказалось равным 0,57; среднее значение Т2 равно —0,84.* Для данных с цензурированием в переменной точке соответствующие величины равны 0,23; —0,17. 90%-ный двусторонний интервал для двух средних из27 величин, распределенных нормально с параметрами (0, 1), есть (—0,38; 0,38).
Отклонение для данных разовых осмотров гипотезы о равномерном распределении не означает, что истинное распределение далеко от него, поскольку гипотеза о сравнении распределения с асимптотическим при любом объеме выборочных данных и при любом уровне значимости будет отвергаться при достаточно большом объеме моделирования. Такой результат свидетельствует лишь о том, что объем моделирования достаточен для того, чтобы оценить расхождение между истинным распределением и асимптотическим. Проведем такое оценивание.
Средние значения Г1 и Т2 по данным моделирования смещены от нуля в разные стороны приблизительно на одинаковое расстояние. Это дает основание принять для ОП плотность распределения с одним параметром следующего вида:
т
т
Это распределение также принадлежит экспоненциальному типу, асимптотическому распределению по-прежнему соответствует е = 0. В предположении малости параметра е оценка МП для него имеет следующий вид:
® = -^21пТ=Т,* ГАе С==4Х(- 1У+1/У«»3,29.
уь /=1
л
Оценки е при N=10; 50; 200, полученные в предположении, что величина параметра зависит лишь от объема выборки, приведены в табл. 1.
Таблица 1
Тип данных Распределение долговечности Объем выборки N
10 50 200
Разовый осмотр Логнормальное 0,12 0,03 0,04
Вейбулла 0,16 0,06 0,02
Цензурирование в переменной точке Логнормальное 0,03 0,01 0,01
При столь малых значениях параметра отличие функции распределения с плотностью (4) от функции равномерного распределения существенно лишь при малых значениях аргумента. Значения аппроксимирующей функции распределения при некоторых характерных значениях аргумента и параметра е приведены в табл. 2.
Таблица 2
е К 0,03 0,06 0,12
0,1 0,090 0,082 0,066
0,01 0,0084 0,0071 0,0050
0,001 0,00079 0.00062 0,00038
Поскольку асимптотическое распределение ОП используется для построения критерия проверки гипотез о параметрах, данные, приведенные в табл. 2, можно прокомментировать следующим образом. При объеме выборки 50 функция распределения от 0,1 равна приблизительно 0,08—0,09. Следовательно, критерий с номинальным уровнем значимости 10% будет отвергать истинную гипотезу с вероятностью 8—9% . Поскольку уровень значимости выбирается достаточно произвольно, полуторакратную ошибку в его оценке можно считать допустимой. К тому же асимптотическое распределение дает ошибку «в запас», т. е. несколько завышает уровень значимости критерия. Минимальный уровень значимости, обычно используемый на практике, равен 0,01. Учитывая эти соображения, на основе данных табл. 1 и 2 можно сделать следующий вывод:
распределение статистик отношения правдоподобий (2, 3) по данным разовых и многоразовых осмотров с достаточной точностью ап-
проксимируется асимптотическим при объеме выборки, примерно равном 50, и количестве элементов с трещинами, не меньшем ~5.
Примечательно, что распределение ОП сходится к асимптотическому быстрее, чем распределение оценок МП, хотя в теории сходимость .распределения ОП доказывается исходя из сходимости распределения оценок [5, 6]. Распределение статистики ОП близко к асимптотическому уже при N=50, в то время как распределение оценок МП параметров при таком объеме выборки явно далеко от асимптотического (см. рис. 2). Возможная причина ускоренной сходимости отношения правдоподобий— его инвариантность относительно преобразований параметров.
3. Проверка гипотез о параметрах и построение доверительных интервалов. Предположим, что оценка МП параметра 0 = (ц., о) существует. Статистика (2) позволяет проверять простую гипотезу о параметре Я0: 0 = 0О против альтернативы ЯА: 0£й\{0о}; критическая область с уровнем значимости а задается неравенством
2(/(в)-/(0о))>с?_,, (5)
где С‘р — ^-квантиль х2-распределения с I степенями свободы.
Доказательство состоятельности и асимптотически наибольшей мощности критерия ОП среди инвариантных асимптотически несмещенных критериев [5] основывается на состоятельности и асимптотической эффективности оценки МП и может быть распространено на данные осмотров.
Неравенство (5), в котором 0О рассматривается как переменная, задает (1—а)-доверительную область для параметров 0. Подставляя выражение для квантили ^-распределения с двумя степенями свободы, получим у-доверительную область:
(о = {0:/(0) —/(0)< —1п(1 —Т)). . (6)
Граница ^-доверительной области, основанной на правдоподобии, совпадает с линией уровня 1 — ? нормированной функции правдоподобия Ь (6) = I (Ь)/Ь (0).
Гипотеза о компоненте параметра 0\ ¿=1, 2 вида //О:0£2О = = {0' = 0£} против альтернативы НА : 0 £ 2\20 проверяется критерием, основанным на статистике
и^ = 2(/(6)— Бир /(©))- (7)
еЧ
Асимптотически статистика (7) распределена по %2 с одной степенью свободы. Моделирование по методу Монте-Карло показывает, что асимптотическое распределение можно применять при условиях, сформулированных выше для статистики (2). Критическая область уровня значимости а задается неравенством
2(/(0)-8ир/(0))>(^_а/2)2, где Ар—¡3-квантиль нормального распределения.
Границы у-доверительного интервала для 0* определяются следующим образом:
6min = inf 0‘, бшах = SUp 0‘, (8)
0
где О) = {о ; I (в) - I (6) < -±- (6j+l)2} • (9)
Из соотношения (8) следует, что доверительный интервал для компоненты параметра 0* является проекцией области (9) на ось 03-* = О. Области (5) и (9) отличаются только величиной константы в правой части неравенства, поэтому можно говорить о подобии интервалов и областей: доверительная область для двумерного параметра задает одновременно границы интервалов для компонент параметра большего доверительного уровня. Так, 75%-ная область задает границы приблизительно 90%-ных интервалов, а 90%-ная область соответствует приблизительно 97%-ным интервалам для ¡л и ст.
Помимо параметров распределения долговечности, при проведении анализа данных эксплуатации оцениваются такие характеристики долговечности и надежности, как, например, вероятность появления усталостного повреждения или интенсивность отказов. Такие характеристики являются функциями наработки, зависящими от ст: h(u | ц, о). Наработку и будем рассматривать как фиксированный параметр. Точечная оценка h в силу инвариантности метода МП равна
А А А
h (и) =-- /г (и | ц., а).
Задача построения доверительных интервалов для функций сводится к рассмотренной задаче построения интервалов для компонент параметра при условии, что возможна замена переменных следующего вида:
б1' = Лс(«| в), 62' = e2'(0J.
Тогда интервал
Amin (и) = inf h (и | 0), Ашах («) = SUp А (и | 0),
egu) egm
где w — область (9), при любом заданном и содержит истинное значение А(и[0о) с вероятностью, не меньшей ?.
Отметим некоторые свойства доверительных областей и интервалов для параметров по данным осмотров.
1) Доверительные области и интервалы не пересекаются с полуплоскостью 0<О, так как легко доказывается, что при условии существования оценок функция правдоподобия по данным осмотров стремится к нулю при сг-Ч). Такое свойство выгодно отличает доверительные интервалы и области, основанные на правдоподобии, от интервалов и областей, основанных на нормальности оценок МП.
2) При достаточно больших у доверительные области и интервалы по данным разовых осмотров становятся неограниченными. Связано это с тем, что функция правдоподобия по данным разовых осмотров не
стремится к нулю при (х, 0-voo, [д,/<т = const. Условие ограниченности доверительной области записывается следующим образом:
Л
/(0)
п In
я
~ЛГ
— (N — п) In 1
*)]<«■
где п — суммарное количество элементов с трещинами; ¿=1 для доверительных интервалов; ¿ = 2 для областей.
Доверительные области и интервалы по данным многоразовых осмотров всегда ограничены.
4. Численный пример. В качестве иллюстрации рассмотрим результаты обработки реальных данных об усталостных повреждениях в эксплуатации четырех элементов конструкции крыла самолета, долговечности которых предполагаются распределенными по логнормальному закону с одинаковыми значениями параметров. Был проведен разовый осмо!р 96 элементов на 24 экземплярах. Величины наработок при осмотре (в полетах) ¿г и количество обнаруженных элементов с трещинами ^ для каждого экземпляра приведены в табл. 3.
Таблица 3
№ экз. к ri № экз. к О № экз. к п
1 5282 3 9 5915 4 17 4704 1
2 7488 1 10 3191 2 18 4000 2
3 3944 1 11 3012 1 19 ■ 3329 1
4 4000 0 12 4642 2 20 2646 1
5 4826 3 13 5085 1 21 4040 1
6 3652 2 14 5154 1 22 2137 0
7 3943 3 15 4359 1 23 4273 2
8 4788 1 16 4050 2 24 ' 3462 0
Максимум функции правдоподобия достигается при ¡¿ = 3,749; а = = 0,407 и равен — 61,447. (Принималось логнормальное распределение долговечности). 90%-ная квантиль распределения %2 с одной степенью •свободы равна 2,706, с двумя — 4,(605. Граница доверительной области (¡х, сг) задается равенством /(ц, о) =—61,447 — 4,605/2 = —63,750. Она изображена на рис. 9 сплошной линией. Для сравнения пунктиром показана граница доверительной области, построенной исходя из асимптотической нормальности оценок. Нормальная доверительная область включает область отрицательных. Метод, основанный на нормальности оценок, хуже и с точки зрения потребительской, поскольку она несколько смещена влево. Нижняя 95%-ная доверительная граница для параметра ц по двум методам отличается в данном случае на 0,043, т. е. метод, основанный на нормальности, занижает нижнюю границу для средней долговечности примерно на 10%.
Доверительная область, основанная на правдоподобии, оказалась неограниченной. Физический смысл такой ситуации заключается в том,
что имеющиеся данные не противоречат гипотезе о постоянной вероятности появления трещины, не зависящей от наработки.
На рис. 3 отмечены также-нижние 95%-ные доверительные границы для параметров ц, о, равные соответственно 3,657 и 0,225, и показано, как они соотносятся с границей области, задаваемой уравнением
I ([а, в) = —61,447 —2,706/2 = —62,800
(показана штрихпунктирной линией).
На рис. 4 изображена точечная оценка интенсивности отказов
О' [(>ё и —е)/°]
1 <11 I о»_____________________:_____________»‘б*--------------I
Л Vй I г, а) 1п 10 оц 1 _ 0[(^и — (*■)/<»]
(сплошная линия) и верхняя 95%-ная доверительная граница для нее (пунктирная линия). Рассматривая эти две зависимости, можно прийти.
3,6 2,657 3,7 3.6
Рис. 3
Рис. 4
к прямо противоположным выводам. Исходя из точечной оценки, интенсивность отказов при средней наработке парка (приблизительно равной 4000 полетов) достигла максимума и в дальнейшем будет постепенно снижаться, следовательно, профилактическая замена элементов без трещин по парку нецелесообразна. Если же принять во внимание погрешность оценивания и рассмотреть верхнюю доверительную границу, то такой вывод окажется необоснованным, поскольку интенсивность отказов может возрастать вплоть до наработки 8000 полетов.
В заключение отметим, что использование рассмотренных методов требует реализации их в виде программ для ЭВМ. Выше уже упоминалось, что для поиска оценок МП в работе использовался метод Пауэлла. Для поиска границ доверительных интервалов для параметров и функций требуется метод многомерной условной оптимизации. Применительно к рассмотренным задачам такой метод был разработан автором, он использует следующие их особенности: 1) имеется ровно одно ограничение — ограничение типа равенства, 2) целевая функция имеет более простой вид и вычисляется намного быстрее, чем функция, задающая ограничение. Разработанный метод классифицируется как метод понижения размерности, не использующий производные.
ЛИТЕРАТУРА
1. Артамоновский В. П., Кор до некий X. Б. Оценка максимального правдоподобия при простейшей группировке данных. — Теория вероятностей и ее применения, 1970, т. XV, № 1.
2. Артамоновский В. П. Об использовании метода максимального правдоподобия для оценки параметров распределения времени безотказной работы авиационных деталей.—: Труды РКИИГА, вып. 107, Рига, 1967.
3. М а к а р о в В. А., Мартынов Ю. А. Принципы машинного анализа надежности элементов планера. — В кн.: Динамика, выносливость и надежность авиационных конструкций и систем. — М.: МИИГА, 1979.
4. С е н и к В. Я. Анализ характеристик развития усталостных трещин в элементах авиационных конструкций по данным эксплуатации. — Труды ЦАГИ, 1975, № 1671.
5. Кокс Д., Хинкли Д. Теоретическая статистика.—М.: Мир,
1978.
6. У и л к с С. Математическая статистика. — М.: Мир, 1967.
7. Powell J. Function minimization without calculating derivatives.— Computer Journal, 1964, vol. 7, N 2.
Рукопись поступила 28/1 1986 г.