ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2013 Управление, вычислительная техника и информатика № 1(22)
УДК 519.248:62.192
В.А. Вааль, А. Векслер, Г.М. Кошкин
О НЕПАРАМЕТРИЧЕСКОМ ОЦЕНИВАНИИ ФУНКЦИИ ИНТЕНСИВНОСТИ ОТКАЗОВ И ЕЕ ПРОИЗВОДНЫХ
Для неизвестной функции интенсивности отказов и ее производных рассматривается класс непараметрических оценок ядерного типа. Доказывается сходимость предложенных оценок по распределению и в среднеквадратическом к неизвестной функции интенсивности и ее производным.
Ключевые слова: функция интенсивности отказов, непараметрическое ядерное оценивание, асимптотическая нормальность, среднеквадратическое отклонение.
Проектирование, изготовление и эксплуатация сложных технических и программных систем требует обеспечения их надежности как одного из свойств систем выполнять требуемые функции. С проблемой обеспечения надежности часто сталкиваются исследователи, которым необходимо оценивать надежность созданных опытных образцов приборов, установок и составляющих их элементов. В данной работе при расчете надежности элементов системы и прогнозировании отказов предлагается использовать наиболее полную характеристику надежности невосстанавливаемых элементов, которая называется функцией интенсивности отказов и имеет вид
Х( х) = = Лх>, а)
1 - Е(х) ф0
где Е(х) - функция распределения отказов невосстанавливаемого элемента; 5( х) = 1 - Е (х) - функция надежности; / (х) = Е" (х) = -5" (х) - плотность распределения, х > 0. Функция интенсивности Х(х) характеризует локальную надежность элемента в каждый данный момент времени х и позволяет оценить вероятность отказа за некоторый промежуток времени при условии, что до этого момента отказов не было. Таким образом, величина Х(х)а?х представляет собой условную вероятность отказа элемента в интервале (х, х + dx), при условии, что до момента х отказов не было. Заметим, что при расчете надежности системы удобно пользоваться известными значениями интенсивностей отказов элементов, так как получаемые при этом формулы просты и удобны для инженерной практики [1].
Более полной по сравнению с Х( х) характеристикой надежности невосстанавливаемого элемента может служить тройка (Х(х), X" (х), X " (х)}, где X "(х) -первая производная функции интенсивности, которая выражается формулой
X" (х) = /"(.ф(>) + . Г-(х (2)
5 (х)
и определяет скорость изменения функции интенсивности в точке х, а производная второго порядка имеет вид
X''(х) = /"(х)52 (х) + 3/(х)/'(х)5(х) + 2/3 (х) (3)
53( х)
и может использоваться при исследовании степени гладкости X( х).
1. Синтез оценок
Пусть Х1,...,X п - моменты отказов совокупности исследуемых элементов. Цель работы состоит в построении оценок тройки ^(х), X" (х), X "(х)} по наблюдениям (Хг > 0, г — 1, п} в условиях непараметрической априорной неопределенности, когда о функциях Е(х), а следовательно, и 5(х) имеются сведения только общего характера. В качестве непараметрических оценок подстановок тройки ^(х), X' (х), X " (х)} в соответствии с (1) - (3) и [2] возьмем
X п (х) = ^; (4)
5 п (х)
X. (х) =/(х*п м+/;(х); (
5п( х)
X "" (х) = Л (х)52 (х) + 3Л (х)/П (хК (х) + 2/ п (х) (6)
п 4( х) ,
1 п ( х - X )
где 5п (х) — — V КI----- I; К (и) - трижды дифференцируемая, строго монотонно
п,=1 I Кп )
убывающая функция, такая, что К (-ю) = 1, К (да) = 0; последовательность чисел К ^ 0; (X > 0, г — 1, п} — выборка независимых и одинаково распределенных случайных величин из генеральной совокупности с функцией выживаемости 5( х);
Л(х) —VК’Г^-Х); /(х) — ^2 VК -(х-Х
пК г—1 Г Кп ) пН1 г=!
Г " () -1 х - Хг
Л п (х) = — V К
г—1
Здесь 5п (х) - гладкая эмпирическая функция выживаемости; /п (х) — /п(0) (х) -непараметрическая ядерная оценка плотности распределения; /" (х) — /п(1)(х) и /"(х) — /(пт>(х) - соответственно оценки первой и второй производных плотности распределения.
2. Асимптотическая нормальность
При построении интервальных оценок заданной надежности для функции интенсивности и ее производных необходимо знать предельное распределение статистик Xn (х), X 'п (х) и X "п (х). Выясним, при каких условиях данные статистики имеют асимптотически нормальные распределения. Введем обозначения: ^ -
символ сходимости по распределению; N{a, ст } - нормальное распределение с
^ 2 параметрами a, ст2; L(r) = | (к(r)(м)) du.
—ад
Теорема 1. Пусть выполняются условия:
1) s(x) > 0, Х(x) > 0; для r = 1,2:
2) функции (r — 1)f(r—2) (x) + f(r—1) (x) абсолютно непрерывны на Я1;
3) при x ^ад, а> 0 K(x) = о(x| а), 1 — K(—x) = о(x| а); при x ^±оо K(r)(x) = о (| x|~а—r);
4) для всех xеЯ1 производные f( rd(-), j = 1,2, непрерывны;
5) sup | f(j+r)(x)| <ад, j = 0,2;
xeR1
для r = 0,1,2 :
6) lim -Jnh]+2r max (, h2 ) = 0, lim
и—^nn ' ' и—^nn
nh.
1+2r
= 0;
7) ¿(1 + г) <да.
Тогда при п
лК+2г [ХПГ)(х) -Х(г)(х)] ^ N -|о, МХ^1)+ Г) }, г = 0,1,2. (7)
Доказательство. Справедливость выражения (7) при г = 0 следует из теоремы 4 [3] при 5п = 0, ап = йп, т = 2, / =n = p = v = 1, а при г = 1 и г = 2 - из теоремы 2.10.1 [4].
На основе выражения (7) можно построить интервальные оценки для функции интенсивности Х(х). Например, интервальная оценка надежности 1 -а имеет следующий вид [5]:
( I , ЧГ/1Ч Л2 ( I , ЧГ/1Ч Л2
U „ nh 1—
< Х(х) <
2 /
и
nh 1—
(8)
где (7 а - квантиль уровня 1-----стандартного нормального распределения. Вы-
1 2 2 вод формулы (8) имеется в [5] и разделе 9.9 [6].
3. Среднеквадратическое отклонение
Одной из основных точностных характеристик оценки является ее среднеквадратическое отклонение (СКО) от истинного значения. При нахождении СКО оценок подстановок Хп (х), X 'п (х) и X "п (х) возникают трудности, обусловленные их возможной неограниченностью, например, когда оценки знаменателей в Xп (х), X П (х) и XП (х) принимают значения равные нулю. В связи с этим рас-
смотрим следующие кусочно-гладкие аппроксимации оценок уУп )(хХ г = 0,1,2:
Ф (г) (х), 5г) = Фг (х, 5г) = хПг)(х)/((1 + 5г |ХПТ) (х)|Тг))Рг, (9)
где тг > 0, Рг > 0, Ргтг > 1, 5г > 0.
Введем обозначения: 1п =(/1п,..., tsn) - векторная статистика с компонентами
У = tJn(х) = tJn(х;X1,...,хп), у 1 *; \КII = 4^ +...+- евклидова норма вектора tn, ф = ф(х) = (ф1(х),...,ф*(х)) - ограниченная вектор-функция; Яп - п-мерное евклидово пространство; Му |^п || = Е|^п -ф|^ - момент порядка V нормы отклонения оценки tn (х) от функции ф( х) в точке х.
Определение. Функция Н (г) принадлежит классу Гу * (ф), если
Н(г): Я* ^ Я1 и для некоторой фиксированной точки х функции ф = ф(х) существует е -окрестность ст = {г : -фг| <е, I = 1, *•}, в которой Н(г) и все ее част-
ные производные до V -го порядка включительно непрерывны и ограничены. Функцию, удовлетворяющую определению, будем обозначать Н(•) е Гу * (ф). Пусть N - множество натуральных чисел. Введем для тройки (т, к, т), где к, т е N, множество
Т (т)={(т,к): т>т(т)=2к/ (т - к-1) > 0, т > т0 =[3, к=1; 2к ,к > 2]}.
При нахождении СКО оценок нам потребуется следующий результат из [7], который сформулируем ниже в виде теоремы 2.
Пусть функция Н(ф): Я* ^ Я1 и ф = ф(х) = (ф(х),..., ф* (х)) - ограниченная вектор-функция; VH(ф) = (Н1(ф),..., Н* (ф)), Ну (ф) = дН (г)/д2у-| , у = 1, *;
С - неотрицательная постоянная.
Теорема 2. Пусть выполняются условия:
1) Н (г) еГ^ (ф);
2) для некоторого т > 3, т е N, Мт |^п || = О (2);
3) 8 = 8п = Cd-n'■;
4) Н (ф) Ф 0 или те N.
Тогда для любых (т, к) е Т(т)
Е[Ф(^,8)-Н(ф)]к -Е\уН(ф)(tn -ф)Т]'
= О(^п(к+1)/2). (10)
Чтобы использовать формулу (10), необходимо, согласно условию 2, знать порядок сходимости к нулю четвертого момента оценок &'п (х), /п (х), /п'(х) и
/п (х). Эти результаты приводятся ниже в виде лемм 1 и 2.
Лемма 1. Пусть выполняются условия:
1) в точке х функция надежности *(•) непрерывна;
2) К (х) = о (| х| а), 1 - К (-х) = о (| х| а) при х ^да, а> 0;
3) последовательность чисел hn = O (n 12а). при n ^ад, а > 0.
Тогда
M4 ISn (x)|| = E\\Sn (x) — s(x)\\4 = E(sn (x) — s(x))4 = O (n-2 ). (11)
Доказательство. Привлекая при p = 4 и m = 2 неравенство
m 1p _m_
£ lall <mP—1 £ hip, p > ^
¿=1 / ¿=1
имеем E(Sn (x) — s(x)d < 23 [E((x) — Esn (x))4 + b4 (Sn (x))],
где b (sn(x)) = Esn(x) — s(x) - смещение оценки sn(x). Согласно [8, с. 379-380],
E(sn (x) — Esn (x))4 = O (n1), а согласно лемме 2 [3], смещение
b (sn (x)) = O (a) = O ([n-^2a ]a) = O (n-^2).
Отсюда следует справедливость соотношения (11).
Теперь найдем порядок сходимости четвертого момента нормы отклонения
оценок f(nr)(x), r = 0,1,2 , от истинных функций f(r)(x). Обозначим
ад
T =| u2K(1)(u)du.
—ад
Лемма 2. Пусть выполняются условия:
ад
1) K' (u) < 0, K' (u) = K'(—u), sup K' (u) > —ад, | K' (u )du =—1, T <—ад;
2) при x ^ад, K(x) = о(|x| 2), 1 — K(—x) = о(|x| 2);
для r = 0,1,2 :
3) для всех x e Я1 производные fr (•) e Г2+г 1 (x);
4) sup | f(j+r)(x) <ад, j =0,2;
1
xeR1
5) lim
h 1 i h" + nFr,
nnn
= 0;
для г = 1,2 выполняются дополнительные условия:
6) функции (г -1)/(г-2)(х) + /(г-1)(х) абсолютно непрерывны на Я1;
да да
7) 11 К(г) (м) | йи + (г -1) | | К(г-1) (и) | с1и < да;
-да -да
8) при х ^±да К'(х) = о (|х| 3); для г = 2 выполняется условие:
9) при х ^ ±да К'(х) = о (|х| 4 ).
u
Тогда при п ^ да М/) (х)||=е/) (х) - /(г) (х)|4 = Е () (х) - /(г) (х))4 = О
г = 0,1, 2.
пк
14
-+кп
1+2г п
2
(12)
Доказательство. Рассуждая, как при доказательстве леммы 1 данной работы, и учитывая, что в силу леммы 3.2.3 [9] Е(/п(х)-/(х))4 = О((пкп) 2), а в силу
леммы 2.2.2 [10] Ь (/п (х)) = О (к2), получаем выражение (12) для г = 0. Случай
г = 1 и г = 2 следует из лемм 2.4.4 и 2.5.6 [4].
Найдем СКО оценок Хп (х), X’ (х) и Хп (х).
Теорема 3. Пусть для г = 0,1,2 выполнены следующие условия:
1) *(х) > 0;
2) выполнены условия лемм 1 и 2;
3) 8 г =
V пк п
14
1727 + кп
4) Х(г)(х) Ф 0.
Тогда для любых (тг ,2) е Т(т) при г = 0,1
Е[ф('х',8г ))<х)]2
Т2 к4
()( х)) *2( х)
- + 4г
X 2( х) (/'2)( х) )2 +Х4.)( х) / (2)( х)
. *(х) )
= О
( 1 . Л 2
1 + к4
V пк п
1+2г п
а при г = 2
Е [ф(2)( х),82 )-Х(2)( х)]
2 Х(х)Ц3) Т2к4
пкп *( х) 4
(41( <+9Х1(х> ()<х>)2
(13)
*2(х) *2(х)'
+ 6/(4) (х)/(3) (х)/(4) (х) + 6/(1)(х)*(х)+2/2(х) /(4) (х) /(2) (
* 2( х)‘
* 4( х)
-/(4)( х) / (2)( х)+
+9
( / (1)( х) *( х)+2 / 2( х)
*3( х)
(/ (2)( х))
2+18Х(х)
( /■ (Ч
=О
*( х) ( 1
2
/ (1)( х)*( х)+2 / 2( х)
*3( х)
/ (3)( х) / (2)( х)
■+кп
Пп5 у
(14)
3
3
Доказательство. Покажем справедливость соотношения (13). Для случая г = 0 в обозначениях условий теоремы 2 имеем: * = 2; г = (г1, г2); Н (г) = г1 / г2;
tn=(ЬпЛп)=(/п,^); ф=(фl,ф2), ф1 = ф2 = *(х); к=2; сп = О(пкп + к-).
Возьмем т = т0 = 4 и покажем, что М4||/п, = О (С-2). Это сразу следует
из соотношения (11) и соотношения (12) (при г = 0) и неравенства
М4 II /п , *п|| ^ 2 [ М4 || /п|| + М4| |*п| |].
г1
Далее, так как *(х) > 0, а при г2 > 0 функция — еГ22 (/, *), то все условия,
г2
необходимые для выполнения соотношения (10), для оценки Xп°Чх) = Х(х) при т>т0 =4 выполнены.
Аналогично для г = 1 имеем: * = 3; г = (г1, г2, г3); Н (г) =-
1п = (¿їй,,Ьп) = (/п,¿п,Л ); ф = (фі,Ф2>Фэ)> Фі = /(x), Ф2 = 5(хХ Фз = Г (х);
ёп = О (пИп3 + И-4), к = 2. Ясно, что
^4 II/й, ¿й, /п'|| * 4[МА/п\\ + М4 |У + М4 ||/п'||].
Теперь соотношение М4 II/„ , ¿п , /11 = О
-+И4
V пИп
вытекает из (11) и выражения
(12) при г = 0,1.
Перейдем к соотношению (14). По аналогии с доказательством (13) в обозна-
чениях теоремы 2 имеем: 5 = 4; г = (г1,г2,г3,г4); Н(г) =
2 4 22^ + 3Хі Хз І2 + 2 21
¿п = (t1n, ¿2п , ¿3п? ¿4п) = (/п , 5п , Л , /пУ; Ф = (Фі? Ф2? Фз? Ф4Х Фі = /(хХ Ф2 = 5(хХ
Ф3 = /'(х), ф4 = /"(х); й?п = О (пИ5п + И-4), к = 2. Ясно, что
МЛ
/п , 5п , /«, /п''I * 8 [М4 ||/п || + М4 ||5п || + М
Теперь соотношение М4 жения (12).
= О
/
+М,
/
].
- + И4
V пИп
вытекает из (11) и выра-
г
Заключение
Асимптотическая нормальность простых оценок подстановок (4), (5) и (6) позволяет исследователям и экспериментаторам строить для функции интенсивности Х(х) интервальные оценки (8) заданной надежности в условиях неопределенности.
Классические подходы не позволяют находить важные точностные характеристики оценок подстановок (4), (5) и (6) - их СКО. В работе построены кусочногладкие аппроксимации для Хп (х), X 'п (х) и X "п (х), задаваемые выражением (9), для которых найдены главные части асимптотических СКО (формулы (13) и (14)).
ЛИТЕРАТУРА
1. Барзилович Е.Ю., Беляев Ю.К., Каштанов В.А. и др. Вопросы математической теории надежности. М.: Радио и связь, 1983. 376 с.
2. Боровков А.А. Математическая статистика. Оценка параметров. Проверка гипотез. М.: Наука, 1984. 472 с.
3. Китаева А.В., Кошкин Г.М. Устойчивое с улучшенной скоростью сходимости непараметрическое оценивание многомерной функции интенсивности // Автоматика и телемеханика. 1997. № 5. С. 202-214.
4. Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание сигналов. М.: Наука, Физматлит, 1997. 336 с.
5. Вааль В.А., Кошкин Г.М. Интервальные непараметрические оценки функции интенсивности // Математическое моделирование и теория вероятностей: сб. научных трудов Томского университета / под ред. В.Н. Берцуна, А.М. Бубенчикова и Ю.К. Устинова. Томск: Изд-во ТГУ. 1998. С. 147-149.
6. Васильев В.А., Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание функционалов от распределений стационарных последовательностей. М.: Наука, 2004. 512 с.
7. Кошкин Г.М. Моменты отклонений оценки подстановки и ее кусочно-гладких аппроксимаций // Сибирский математический журнал. 1999. Т. 40. № 3. С. 605-618.
8. Крамер Г. Математические методы статистики. М.: Мир, 1975. 648 с.
9. Кошкин Г.М., Пивен И.Г. Непараметрическая идентификация стохастических систем. Хабаровск: РАН. Дальневосточное отделение, 2009. 336 с.
10. Alexander V. Dobrovidov, Gennady M. Koshkin, Vyacheslav A. Vasiliev. Non-parametric State Space Models. Heber, UT 84032, USA. Kendrick Press, Inc., 2012. 501 p.
Вааль Вадим Александрович Томский государственный университет
Векслер Альберт
Университет Баффало (шт. Нью Йорк, США)
Кошкин Геннадий Михайлович Томский государственный университет
E-mail: [email protected]; [email protected]; [email protected]
Поступила в редакцию 2 июля 2012 г.
Vaal Vadim A. (Tomsk State University), Vexler Albert (The State University of New York, University at Buffalo), Koshkin Gennady M. (Tomsk State University). On nonparametric estimation of hazard function and its derivatives.
Keywords: hazard function, nonparametric kernel estimation, conditional mean, asymptotic normality, mean square error.
A class of nonparametric plug-in estimators for an unknown hazard function X(x) = f (x)/s(x) and its derivative is suggested. Here s(x) is a survival function, f (x) = — s' (x) is a probability density, x > 0. Distribution convergences of the proposed estimates Xn(x), X'n (x) and X’n (x) to the unknown hazard function X(x) and its derivatives X'(x) and X"(x) are proved. The piecewise smooth approximations for Xn (x), X 'n (x) and X "n (x) are constructed and the MSEs for this approximations are found.