Научная статья на тему 'МОЩНОСТЬ КРИТЕРИЯ ОДНОРОДНОСТИ КАК ФУНКЦИЯ ПОЛЕЗНОСТИ В ЗАДАЧАХ ПРИНЯТИЯ РЕШЕНИЯ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ'

МОЩНОСТЬ КРИТЕРИЯ ОДНОРОДНОСТИ КАК ФУНКЦИЯ ПОЛЕЗНОСТИ В ЗАДАЧАХ ПРИНЯТИЯ РЕШЕНИЯ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ Текст научной статьи по специальности «Математика»

CC BY
37
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Вестник СибГУТИ
ВАК
Область наук
Ключевые слова
ДАННЫЕ ТИПА ВРЕМЕНИ ЖИЗНИ / КРИТЕРИЙ ВАЛЬДА / МЕТОД МОНТЕ-КАРЛО

Аннотация научной статьи по математике, автор научной работы — Филоненко Петр Александрович, Постовалов Сергей Николаевич

В задачах проверки статистических гипотез существует большое количество статистических методов. Некоторые статистические критерии являются предпочтительными при определенных альтернативных гипотезах. Необходим некоторый надежный способ выбора предпочтительного критерия. Мы формируем типы альтернативных гипотез (с различным количеством точек пересечений функций надежности), для каждого типа строим несколько альтернативных гипотез (с разными законами распределения моментов отказа), а затем в соответствие с теорией принятия решений в условиях риска и неопределенности (критерий Вальда) мы получаем, какой критерий предпочтительнее при определенном типе альтернативной гипотезы, используя результаты компьютерного моделирования мощности критериев.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Филоненко Петр Александрович, Постовалов Сергей Николаевич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

HOMOGENEITY TEST POWER AS UTILITY FUNCTION IN THE THEORY OF DECISION MAKING UNDER RISK AND UNCERTAINTY

There are a lot of statistical tests for hypothesis testing and some statistical tests are preferable than others in a certain alternative hypothesis. It needs some reliable method for selecting the powerful statistical test. To solve the problem, we create types of alternative hypotheses (with different number of intersection points of reliability function). For every type we create some alternative hypotheses (with various distribution of survival function) with similar behavior of survival functions (the behavior of test power is similar too) to simulate the power of statistical tests and then we apply the Wald test to conclude what test is the most preferable in a certain type of alternative hypotheses.

Текст научной работы на тему «МОЩНОСТЬ КРИТЕРИЯ ОДНОРОДНОСТИ КАК ФУНКЦИЯ ПОЛЕЗНОСТИ В ЗАДАЧАХ ПРИНЯТИЯ РЕШЕНИЯ В УСЛОВИЯХ РИСКА И НЕОПРЕДЕЛЕННОСТИ»

УДК 519.23

Мощность критерия однородности как функция полезности в задачах принятия решения в условиях риска и неопределенности1

П. А. Филоненко, С. Н. Постовалов

В задачах проверки статистических гипотез существует большое количество статистических методов. Некоторые статистические критерии являются предпочтительными при определенных альтернативных гипотезах. Необходим некоторый надежный способ выбора предпочтительного критерия. Мы формируем типы альтернативных гипотез (с различным количеством точек пересечений функций надежности), для каждого типа строим несколько альтернативных гипотез (с разными законами распределения моментов отказа), а затем в соответствие с теорией принятия решений в условиях риска и неопределенности (критерий Вальда) мы получаем, какой критерий предпочтительнее при определенном типе альтернативной гипотезы, используя результаты компьютерного моделирования мощности критериев.

Ключевые слова: проверка статистических гипотез, гипотеза однородности распределений, данные типа времени жизни, критерий Вальда, метод Монте-Карло.

1. Введение

Мощность критерия [1] - это важная характеристика статистического критерия, потому что это вероятность отклонить проверяемую статистическую гипотезу, когда верна альтернативная гипотеза. Каждый статистический критерий имеет определенную статистическую мощность на заданной альтернативной гипотезе. Чем выше мощность статистического критерия, тем выше надежность статистических выводов. Наиболее популярным способом исследования мощности критериев является метод имитационного моделирования Монте-Карло [2]. В отличие от других статей [1, 2] мы представляем несколько иной способ исследования мощности статистического критерия: разбиваем множество альтернативных гипотез на определенные типы, при которых функции надежности (следовательно, и мощности критериев) близки. Затем, применяя критерий Вальда [3] для принятия решений в условиях риска и неопределенности [4], мы можем сделать вывод, какой критерий предпочтителен при определенном типе альтернативных гипотез. Критерий Вальда - это критерий выбора оптимальной стратегии в том случае, когда среда находится в наихудшем состоянии (значения мощности критериев минимальны). Это значит, что мощность критерия будет гарантированно наибольшей в ситуации, когда нет априорных предположений о виде альтернативной гипотезы.

1 Данная работа выполнена в рамках проектной части государственного задания Министерства образования и науки Российской Федерации (номер заявки 1.1009.2017/ПЧ) и в рамках реализуемой программы стратегического развития НГТУ по итогам конкурса проектов среди молодых учёных (проект С-15, 2017).

Таким образом, мы определяем типы альтернативных гипотез, затем для каждого типа мы описываем несколько функций надежности, используя различные семейства распределений.

В разделе 2 мы рассмотрим постановку задачи. Кроме того, в разделе 2 мы представим использованные статистические критерии, а также представим модификацию критерия Кра-мера-Уэлча для данных типа времени жизни. В разделе 3 мы представим критерий Вальда и определение функции полезности [4]. Функция полезности - это основная характеристика в теории принятия решений в условиях риска и неопределенности. В разделе 4 - типы альтернативных гипотез, а в разделе 5 - результаты компьютерного моделирования.

2. Статистические критерии

Предположим, что имеются две выборки X1 = {tn,..., tlrh } и X2 = {t21,..., t2n^ } из двух случайных величин & и & соответственно, которым соответствуют функции надежности Sx (t) и S2 (t). Каждый элемент выборки ttj представим в виде ttj = min {Ту, C ), где Т и C - моменты времени отказа и цензурирования j-го объекта в i-ой группе соответственно. Моменты времени Т и C являются независимыми и одинаково распределенными случайными величинами с функциями распределения вероятностей F (t) и FC (t).

Значение функции надежности S (t) - это вероятность события, что не произойдет отказ объекта до момента времени t:

s,(t) = P& >t}-i-F(t).

Таким образом, нулевая гипотеза может быть записана в следующем виде:

Я0: Si(t) = S2(t).

В дальнейшем мы будем предполагать, что элементы выборок упорядочены ttj < t Vi, j . Кроме того, объединим выборки X = X1 ^X2 ,...,tn}, n = n + n2,

tJ < tj+Vj.

Введем в рассмотрение следующие индикаторы:

[0, t е X, tij - отказ, fü, ti - отказ,

1 [l, t е X2 ' 1 Ii, ttj - цензурирований i [1, t - цензурирование

К данному моменту мы ввели все необходимые обозначения и можем рассмотреть статистические критерии для проверки гипотезы однородности. В данной работе мы используем следующие критерии: обобщенные критерии Уилкоксона, логарифмический ранговый критерий, критерий Кокса-Мантела, Q-критерий, критерий максимального значения, взвешенный критерий Каплана-Мейера, обобщенный критерий Крамера-Уэлча и критерии Багдона-вичуса-Никулина.

2.1. Обобщенный Геханом критерий Уилкоксона

Статистики обобщенного Геханом критерия Уилкоксона (в дальнейшем будем называть критерий Гехана) - это классический критерий Уилкоксона [5, 6, 7], обобщенный на случай данных типа времени жизни [2]. Статистика критерия может быть вычислена следующим образом:

п

Ё (1 - V, )Л

£а =

+1,1 > г. & с, = 0&V = 0&V = 1

1 1 ] 1 ]

п

, где к = Ё у Л,Л = <! -1, г < г, & с. = 0&V = 0&V = 1' 1 ¿—I ' 1 } } 1 }

п * ^ 1 V *1

пщ -п,, ,,7 1=1

Ё (1 - V, Л

0, иначе

\ п(п - 1) 1=1

Нулевая гипотеза И0 отклоняется с достигнутым уровнем значимости а, если |£0| > гх_а!2, где гх-а!2 - это (1 - а/2 )-квантиль стандартного нормального распределения.

2.2. Обобщенный Пето критерий Уилкоксона

Статистики обобщенного Пето критерия Уилкоксона (в дальнейшем будем называть критерий Пето) - это классический критерий Уилкоксона [5, 6, 8], обобщенный на случай данных типа времени жизни [2]. Статистика критерия может быть вычислена следующим образом:

п

п(п -1)Ё и(1 - V)

1=1

Р п

щщ Ё и ,2

1 =1

где

п

Г^) + % ) -1, с = 0 п(п - 1)Ёи1(1 - V)

С = 0, и =] 1 _ , ^-^-, к = тах {]\] е{0,..., 1 -1}, С = 0},

№) -1 С =1 п^Ёи2

1=1

п_1

и £(г) = ^ -:— - непараметрическая оценка функции надежности Каплана-Мейера

г.ц <гс =0 п -1 + 1

[9] функции £ (г) по объединенной выборке X .

Нулевая гипотеза Н0 отклоняется с достигнутым уровнем значимости а , если |£р| > 2, где ¿х_а!2 - это (1 -а/2)-квантиль стандартного нормального распределения.

2.3. Логарифмический ранговый критерий

Статистика логарифмического рангового критерия может быть вычислена следующим образом [6, 10]:

п 1 1

Ё(1 - с Ы-^гт

1=1 7=1п -1 +1

п-1 | пп

чЁ (1 С) п -1 +1J п (п -1) Нулевая гипотеза Н0 отклоняется с достигнутым уровнем значимости а, если > гх-а!2, где ¿1-а/2 - это (1 -а/2)-квантиль стандартного нормального распределения.

1 =1

2.4. Критерий Кокса-Мантела

Критерий Кокса-Мантела [11] - это статистический критерий логарифмически рангового типа. Статистика этого критерия может быть вычислена следующим образом:

V _.

£см

г-1(1 - С) А ,)

г=1

V

п

К1 - С ) А (г) (1 - А) )

п 2 п

гда г2 =2 V,(1 - с,.), А(,) =-— ^ V.

г=1 п . ]=1

Нулевая гипотеза Н0 отклоняется с достигнутым уровнем значимости а, если |£см| > 21-а!2, где гх-а!2 - это (1 -а/2)-квантиль стандартного нормального распределения.

2.5. Взвешенный критерий Каплана-Мейера

Взвешенный критерий Каплана-Мейера [12] - это дистанционный статистический критерий. Основная идея заключается в измерении расстояния между оценками функций надежности. В данном критерии в качестве оценок используются оценки Каплана-Мейера [9]. Статистика критерия может быть вычислена следующим способом:

и

£шхм =~Г, где и = \ Ыа \

ПП2 П ^ /А^ А^ , ._(п + П2 ) Е? (-)^2с (I-)

-|*(г)(Д(г)-^2(/))йг, Цг)

П + П2 о 4 7 (г-) + п2 ^2с (г-)

а = -||(т) ^ (т)

п,¥С (г-) + п2 ¥2с (г-) ж (г)

о1 г J (п + п2) Р{ (г-) ¥с2 (г-) £ (г )£ (г-)'

а ^с (г) и £ (г) - оценки Каплана-Мейера соответствующих функций, описанных в разделе 2, а £ (г) - оценка Каплана-Мейера по объединенной выборке X .

Нулевая гипотеза И{) отклоняется с достигнутым уровнем значимости а, если > 21-а/2, где £1-а/2 - это (1 -а/2)-квантиль стандартного нормального распределения.

2.6. ^-критерий

Мартинез и Норанхо предложили предварительную проверку [13], какой критерий предпочтительнее использовать: критерий Уилкоксона или логарифмический ранговый критерий. Мы используем этот критерий в качестве двухэтапного критерия для решения задачи однородности распределений. Статистика ^-критерия может быть вычислена следующим образом:

[X, 0 < 0, - -

^ Ч^ д>() где 0 = ЗДо.б) - £1(^0.6) - £2(^0.2) - ЗДо^Ь Чр = $х(Р\

а (г) - оценка Каплана-Мейера для Si (г) .

Данный критерий имеет двустороннюю критическую область, следовательно, нулевая гипотеза Н0 отклоняется, если >М при больших значениях М .

2.7. Критерий максимального значения

,=1

2

Как и ^-критерий, критерий максимального значения является двухэтапным критерием. Статистика критерия максимального значения может быть вычислена с помощью значений

статистик и Д- . Этот критерий был предложен нами [14, 15]. Статистика критерия может быть вычислена следующим образом:

Дмлх = тах (I До| , Ы),

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где - значение статистики критерия Гехана, Д- - значение статистики логарифмического рангового критерия.

Нулевая гипотеза И0 отклоняется с достигнутым уровнем значимости а, если \$ылх\ > О(8Млх | Н0)1а, где О(8Млх | Н0)1а - это (1 -а )-квантиль распределения статистик критерия при справедливости гипотезы Н0. Данное распределение описывается следующей функцией плотности:

( ( я-7^ ( /ТГ7^ ехР (-)

/(г) = 4^(0 Фо - +Фо а— ,Г > 0, где Фо (/) = ^(х)0* ^-7

1 у!+г I 1 У1г]) 0 о У2ж

-оХ.

1 , " А/1-г -- о V/ ^ ^ — J

В соответствие с [15] функция плотности / (/; г) может применяться в качестве наилучшей оценки предельного распределения статистик критерия максимального значения с параметром г е [0.84; 0.92], например, г = 0.90, если объемы выборок щ, Щ > 50 и а< 0.15. В

противном случае О (| Н0) следует получить с помощью методов компьютерного моделирования, например, метода Монте-Карло.

2.8. Критерий Крамера-Уэлча

Критерий Крамера-Уэлча [16] - это критерий для проверки гипотезы однородности средних. Кроме того, это непараметрический критерий и альтернатива параметрическому критерию Стьюдента [17]. В общем случае проверка гипотезы однородности распределений может осуществляться через проверку однородности характеристик распределений, например, математических ожиданий или дисперсий. Данная модификация критерия может использоваться для данных типа времени жизни. Статистика критерия может быть вычислена следующим образом:

ПЩ (Д -Д)

с = .

^СШ

фп, ст,2 + щ а1

2

где

П / « „ ч nf.nL-- - - ^

А = & (с,(в - Д(/+)) а* = —^ ^ (Д (в - Д (/+))-Д

(ДС-)-ДС +))-Д

а Д , а22 , Д (/) - оценки математического ожидания дисперсии и функции надежности соответственно для данных типа времени жизни.

Нулевая гипотеза Н0 отклоняется с достигнутым уровнем значимости а, если

|ДСШ| > 1х_а!2, где гх-а!2 - это (1 -а/2)-квантиль стандартного нормального распределения.

2.9. Критерий Багдонавичуса-Никулина для однократных пересечений

Данный критерий основан на простой модели с пересечением ^СЕ-модель, [18]), которая предполагает, что функции надежности могут пересекаться один раз. Статистика критерия имеет следующий вид [18]:

Двт К1 &,и2 )т,

где

и1= £ £ УМ

М,=0 у (г,,) Г-02 J=0 У (г2, )

и2 =- £ 1"(1 + Л,))+ £ ^(1 + ,)),

,-су =0 7 у:с2у=0 7 (г2,)

П 2 1

У (г) = Ух(г) + У2(г), У (г) = £у (г), У, (г) = 1(г >г,, Л(г) = £ £ —.

,=1 » ,=1 ,с,-0,г,<г7 (г, )

Элементы матрицы I следующие:

а11 = £ £ , а22 = £ £ 1П2(1 + л(,)),

г=1 , -.с,=0 7 (г,) г=1 , -с,=0 7 (г,)

^ у1(г, Шг,)

О ^ =££ 1п (1 + Л(гу )).

,=1 , -с,=0 У (г, )

Нулевая гипотеза Н0 отклоняется с достигнутым уровнем значимости а, если > а(2), где х1-а(2) - это (1 -а) -квантиль распределения хи-квадрат со степенью свободы 2.

2.10. Критерий Багдонавичуса-Никулина для многократных пересечений

Этот критерий основан на модели множественных пересечений (МСЕ-модель, [19]), которая предполагает, что функции надежности могут иметь одно пересечение или два пересечения. Статистика критерия имеет следующий вид [19]:

2 =^2^3 (и^и ) ,

где

_ У (г,) У (г,,) у (г,) У (г,,)

и1 = £ у2^ - £ , и2 =- £ у2—1—л(гх,) + £ ^^ л(г2,),

,-С1, =0 У (г1, ) ,- С2, =0 У (г2, ) ,-С1, =0 У (г1, ) .,:С2, =0 У (г2, )

из=- £ 7,1.) + £ Л(г,

,Чу = 0 7 (г1 у')» ус21=0 7 (г2у')»

Элементы матрицы I следующие:

^ у1(г, )у2(г,) 2

а11 =£ £ у2 2 , =а21 =£ £ ч Л(г,),

,=1 ,- с,, =0 7 (г,) ,=1 ,-с,=0 7 (г,)

а _а _а _ V V ^ )У2 (г, ) Л2ГМ

а13 =а31 =а22 =£ £ у2,., Л (г, ), ,=1 ,-с, = 0 7 (г, )

а 2 У(г, Щ,) Л3з а _ 2 У(г, ^) Л44

а23 =а32 =£ £ 2(2 л Л 3), а33 =£ £ 2 >> Л 4).

,=1 ,-с,=0 7 (г,) ,=1 ,-с, =0 7 (г,)

Нулевая гипотеза Н0 отклоняется с достигнутым уровнем значимости а, если >а(3), где Х\~а(3) - это (1 -а)-квантиль распределения хи-квадрат со степенью свободы 3.

2.11. Критерий Багдонавичуса-Никулина для постоянного отношения

Данный статистический критерий проверки гипотезы однородности для модели, предполагающей, что отношение соответствующих функций интенсивности [20], является постоянным. Статистика критерия может быть вычислена следующим способом [21]:

'2;

з =(Ц,и2 )1-1 (ци У

где

U (1 - С, ) Y2 (', Ь^ (1 - j ) Kjtj Y (t2 j ),< - 1.2.

Элементы матрицы I следующие:

-X £ (1 - ^) к (ts K (t„)Y f).

Г=1 X=1

Авторами предлагается использовать следующие функции:

2

К() = ехр(-Л(0)Д/П, К2(г) = {ехр(~Л(г))- 1}Д/П, Л(*) = £ £ %/ V 7(° = ^ + ^

п Г1, > *,

^«=|х «, г, «=^0,;<Л

Нулевая гипотеза Н0 отклоняется с достигнутым уровнем значимости а, если Двт >Х\-а(2), где х1-а(2) - это (1 -а)-квантиль распределения хи-квадрат со степенью свободы 2.

В следующем разделе мы рассмотрим критерий Вальда и свойства функции полезности в задачах принятия решений в условиях риска и неопределенности.

3. Критерий Вальда для принятия решений в условиях риска и неопределенности

Пусть r - это стратегия применения статистического критерия со статистикой S при альтернативной гипотезе H. Тогда каждой стратегии r может быть присвоена некоторая полезность, используя функцию полезности U (r | H) [4] (или сокращенно U (r)), для которой будут справедливыми следующие утверждения:

1) стратегия предпочтительнее стратегии rj (обозначим как r^rj), если 1/(/" ) ^' )1

где U(rf).U(r,) - значения полезности стратегий r и r ;

2) если rt >- rj и rj >- rk, тогда С/(гг) > f/^J;

3) если r представима в виде r-(l-а)r + ar2, тогда U(r)-(l-a)U(r)+aU(r2);

4) если U ( r. r ) - это объединенная полезность r1. r2, тогда U (r. r2)- U ( r ) + U ( r2 ).

В данной работе мы используем мощность статистического критерия [1] со статистикой S при альтернативной гипотезе H в качестве функции полезности U(r).

Критерий Вальда - это критерий для принятия решений в условиях риска и неопределенности [4]. Это критерий «осторожного наблюдателя», т.к. критерий оптимизирует полезность (мощность критерия) при выполнении предположения, что для принятия решения среда находится в самом неблагоприятном состоянии, т.е. значения мощности всех критериев минимальны. Правило может быть записано как:

W - maxmin U (r | H ).

i-1. k j-1. m j '

где к - это число рассматриваемых статистических критериев, m - число рассматриваемых альтернативных гипотез.

Фактически наилучший критерий по правилу Вальда - это статистический критерий, чья минимальная мощность среди всех альтернативных гипотез максимальна среди всех критериев.

4. Типы альтернативных гипотез

Мы делим множество близких альтернативных гипотез на 9 типов, как показано в табл. 1 и на рис. 1. Рассмотрим 3 типа альтернатив без пересечений функций надежности Sx(t) и S2(t): с наибольшими отклонениями в ранние (H01 -H03), средние (H04 - H06) и поздние (H07 — H09) моменты времени. Также рассмотрим 3 типа альтернатив с одной точкой пересечений функций надежности S (t) и S2 (t): точка пересечения в ранние (H11 — H13), средние ( H14 — H16) и поздние ( H17 — H19) моменты времени. Кроме того, рассмотрим еще 3 типа альтернатив с двумя точек пересечений функций надежности S (t) и S2 (t): в ранние и средние (H21 — H23), в ранние и поздние (H24 — H26) и в средние и поздние ( H27 — H29) моменты времени.

Для каждого типа альтернатив рассмотрим по 3 альтернативных гипотезы со схожим поведением функций надежности, но на разных семействах распределений. В табл. 1 обозначения Exp, We, LgN и Г обозначают семейства распределений (экспоненциальное, Вейбулла-Гнеденко, лог-нормальное и гамма соответственно), а ^ и at - это математическое ожидание и стандартное отклонение случайной величины с функцией надежности St (t) соответственно. Функции плотности вероятностей для указанных случайных величин приведем ниже:

Вейбулла-Гнеденко, We экспоненциальное, Exp

гамма, Г

fWe (гА,е2,еъ ) = 0 (t—01 f—1exp

t—0

Y5'

, t >0;

fExp (t'AA ) = 01 exp(—01 (t — 02)), t >0;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

fr( t;0102 ) =

0—1

exp

exp

лог-нормальное, LgN fLgN (t; 0,0 ) = -

0Г(0)

— (ln t — 0)

tyj 2%Q2

, t > 0;

, t > 0.

Ранние моменты времени - это область функции надежности £ (V) между квантилями 1.0 и 0.67. Средние моменты времени - это область функции надежности £ (V) между квантилями 0.67 и 0.33. Поздние моменты времени - это область функции надежности £(V) между квантилями 0.33 и 0.0.

Для того чтобы измерить отклонения между функциями надежности £ (V) и £2 (V), мы используем норму Ьр в пространстве Лебега [22] при р = 1. В общем случае норма } для функций надежности £ (V) и £2 (V) может быть вычислена следующим образом:

L (S, S 2) = J (t) — S2 (t)|dt.

012343012345012343

Рис. 1. Типы альтернативных гипотез

В данной работе для каждой альтернативной гипотезы общее отклонение между функциями надежности Д(О и Д2(0 в норме 1} составляет приблизительно 0.10, т.е. }} (Д 2)» 0.10 (приблизительно, потому что параметры распределений были получены из решения нелинейного уравнения, которое имеет некоторую погрешность). Отклонение } (Д1, Д 2)» 0.10 зафиксировано для того, чтобы сравнить, как тип альтернативы влияет на

функцию полезности (мощность критерия). Значения 1} для каждой альтернативной гипотезы представлены в табл. 1.

Таблица 1. Типы альтернативных гипотез

н Тип альтернативы ) ) Пересечения 11 ( £2) ~Иг\ |°1 ~аг\

н 01 Различия в ранние моменты времени Ехр Ехр - 0.099 0.10 0.10

н 02 Шв LgN - 0.096 0.10 0.66

Н 03 LgN Ехр - 0.109 0.18 0.00

Н 04 Различия в средние моменты времени Г Ехр - 0.075 0.07 0.00

Н 05 Ехр Шв - 0.100 0.10 0.08

Н 06 Ехр Шв - 0.162 0.16 0.16

Н 07 Различия в поздние моменты времени Ехр Г - 0.089 0.09 0.03

Н 08 Шв Ехр - 0.116 0.13 0.57

Н 09 Шв LgN - 0.107 0.11 0.41

н„ Точка пересечения в ранние моменты времени Ехр Ехр 0.363 0.100 0.09 0.05

Н12 Г Г 0.763 0.078 0.06 0.35

Н13 Шв Ехр 0.571 0.125 0.12 0.00

Н14 Точка пересечения в средние моменты времени Шв Г 0.611 0.081 0.08 0.01

Н15 Ехр Шв 0.843 0.097 0.04 0.12

Н16 Г Ехр 1.040 0.068 0.04 0.00

Н17 Точка пересечения в поздние моменты времени Шв Ехр 1.346 0.099 0.01 0.00

Н18 Г Г 1.878 0.132 0.03 0.15

Н19 Шв Ехр 3.626 0.097 0.09 0.47

Н 21 Точки пересечения в ранние и средние моменты времени LgN Шв 0.243, 0.655 0.071 0.01 0.04

Н 22 Ехр LgN 0.814, 1.038 0.079 0.08 0.48

Н 23 Шв Ехр 0.577, 1.327 0.105 0.09 0.53

Н 24 Точки пересечения в ранние и поздние моменты времени LgN Г 0.683, 3.074 0.095 0.06 0.13

Н 25 LgN Ехр 0.232, 0.831 0.068 0.01 0.19

Н 26 Шв LgN 1.018, 2.381 0.131 0.06 0.60

Н 27 Точки пересечения в средние и поздние моменты времени Шв LgN 1.254, 3.265 0.099 0.11 0.09

Н 28 Г LgN 0.793, 2.994 0.088 0.07 0.11

Н 29 Ехр LgN 1.321, 3.463 0.104 0.11 0.08

5. Результаты компьютерного моделирования

В нашей работе компьютерное моделирование происходило для одинаковых объемов выборок п = п2 = 200 и равной степени цензурирования в диапазоне 0 % - 50 %. Число повторений метода Монте-Карло составляет 100 000, т.к. по теореме Колмогорова [23] это обеспечивает точность моделирования распределения статистик критерия приблизительно 0.0051. Для вычисления мощности критерия ошибка первого рода а = 0.05. В процессе моделирования использовались 3 семейства распределений моментов цензурирования ¥с (/): Вейбулла-Гнеденко, экспоненциальное и гамма.

Результаты представлены в виде таблиц, содержащих минимальные значения мощности критериев среди всех ¥с (¿) с соответствующим значением критерия Вальда для степеней

цензурирования 0 % и 50 %. Жирным шрифтом выделены значения, близкие (вычисление мощности критериев осуществляется со статистической погрешностью) к значению статистики критерия Вальда Ж.

Выбирая лучшую стратегию по критерию Вальда, исследователь выбирает критерий, который будет иметь наибольшую мощность в заведомо наихудшей ситуации, т.е. при выполнении предположения, что мощности всех критериев минимальны. Однако в общем случае, когда это предположение не выполнено, наилучшая стратегия по Вальду не обязательно соответствует критерию с наибольшей мощностью.

5.1. Функции надежности не пересекаются

Группа альтернатив, не имеющих точек пересечения функций надежности ^ (?) и (?), содержит 3 типа: наибольшие отклонения в ранние ( Н01 — Н03), средние ( Н04 - Н06) и поздние (Н07 — Н09) моменты времени. Результаты представим в табл. 2-4.

Таблица 2. Мощность критериев для типа альтернатив без пересечений и с наибольшим _отклонением в ранние моменты времени_

Статистик а критерия Степень цензу] эирования 0 % Степень цензурирования 50 %

Н 01 Н 02 Н 03 тт Н01 Н 02 Н 03 тт

0.374 0.526 0.307 0.307 0.527 0.739 0.569 0.527

0.376 0.524 0.304 0.304 0.442 0.548 0.431 0.431

с асм 0.162 0.306 0.176 0.162 0.263 0.296 0.204 0.204

0.169 0.305 0.175 0.169 0.263 0.299 0.209 0.209

^ 0.343 0.497 0.258 0.258 0.336 0.525 0.300 0.300

с амлх 0.325 0.476 0.266 0.266 0.481 0.680 0.519 0.481

0.293 0.309 0.155 0.155 0.442 0.433 0.503 0.433

с аБЫ 2 0.276 0.601 0.470 0.276 0.494 0.598 0.662 0.494

3 0.366 0.444 0.247 0.247 0.489 0.536 0.568 0.489

С ашкм 0.374 0.529 0.310 0.310 0.538 0.749 0.565 0.538

0.170 0.621 0.206 0.170 0.115 0.398 0.089 0.089

^=0.310 ^=0.538

Как очевидно из полученных результатов, в случае наибольших отклонений в ранние моменты времени оптимально использовать критерий Гехана и взвешенный критерий Каплана-Мейера . Аналогичный результат получен и в случае наибольших отклонений в средние моменты времени. Однако в случае наибольших отклонений в поздние моменты времени оптимальным выбором является использование критерия Крамера-Уэлча ДСИ7.

Таблица 3. Мощность критериев для типа альтернатив без пересечений и с наибольшим _отклонением в средние моменты времени_

Статистика критерия Степень цензурирования 0 % Степень цензурирования 50 %

Н 04 Н 05 Н 06 тт Н 04 Н 05 Н 06 тт

0.172 0.376 0.671 0.172 0.206 0.338 0.790 0.206

0.175 0.372 0.678 0.175 0.183 0.328 0.712 0.183

¿см 0.094 0.239 0.346 0.094 0.132 0.265 0.505 0.132

0.094 0.240 0.346 0.094 0.139 0.268 0.496 0.139

¿е 0.146 0.341 0.634 0.146 0.153 0.319 0.597 0.153

¿млх 0.148 0.333 0.620 0.148 0.182 0.321 0.747 0.182

с °БЫ1 0.146 0.284 0.576 0.146 0.150 0.257 0.667 0.150

¿БЫ 2 0.121 0.232 0.512 0.121 0.134 0.220 0.679 0.134

¿БЫ 3 0.161 0.298 0.651 0.161 0.158 0.259 0.704 0.158

¿ШКМ 0.173 0.371 0.676 0.173 0.202 0.351 0.799 0.202

С 0.098 0.247 0.363 0.098 0.088 0.156 0.223 0.088

1=0.175 IV =0.206

Таблица 4. Мощность критериев для типа альтернатив без пересечений и с наибольшим _отклонением в поздние моменты времени_

Статистика критерия Степень цензурирования 0 % Степень цензурирования 50 %

Н 07 Н 08 Н 09 тт Н 07 Н 08 Н 09 тт

0.213 0.108 0.100 0.100 0.171 0.065 0.080 0.065

0.219 0.108 0.099 0.099 0.174 0.072 0.071 0.071

с °см 0.197 0.282 0.347 0.197 0.161 0.084 0.076 0.076

¿ь 0.198 0.277 0.334 0.198 0.158 0.084 0.077 0.077

¿е 0.212 0.219 0.251 0.212 0.171 0.075 0.073 0.073

с амлх 0.215 0.228 0.276 0.215 0.169 0.075 0.079 0.075

¿БЫ1 0.161 0.342 0.560 0.161 0.130 0.082 0.067 0.067

с аБЫ 2 0.133 0.285 0.608 0.133 0.118 0.094 0.119 0.094

¿БЫ 3 0.166 0.329 0.482 0.166 0.132 0.081 0.065 0.065

С ашкм 0.215 0.107 0.102 0.102 0.172 0.065 0.079 0.065

0.195 0.283 0.342 0.195 0.113 0.119 0.129 0.113

1=0.215 1=0.113

5.2. Функции надежности с одной точкой пересечения

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Группа альтернатив, имеющих точку пересечения функций надежности ^ (:) и (:), содержит 3 типа: пересечение в ранние (Н11 - Н13), средние (Н14 - Н16) и поздние (Н17 - Н19) моменты времени. Результаты представим в табл. 5-7.

Таблица 5. Мощность критериев для типа альтернатив с одним пересечением

Статистика критерия Степень цензу рирования 0 % Степень цензурирования 50 %

#11 #12 #13 шт #11 #12 #13 шт

0.065 0.057 0.062 0.057 0.053 0.050 0.059 0.050

0.065 0.057 0.062 0.057 0.050 0.049 0.051 0.049

¿см 0.150 0.071 0.210 0.071 0.056 0.055 0.052 0.052

0.151 0.075 0.204 0.075 0.055 0.052 0.051 0.051

0.119 0.065 0.162 0.065 0.053 0.053 0.051 0.051

¿млх 0.125 0.067 0.169 0.067 0.062 0.056 0.064 0.056

с °бы1 0.177 0.069 0.339 0.069 0.133 0.071 0.143 0.071

¿БЫ 2 0.139 0.065 0.257 0.065 0.137 0.077 0.132 0.077

с ¿БЫ 3 0.194 0.073 0.359 0.073 0.146 0.079 0.150 0.079

¿шкм 0.066 0.057 0.061 0.057 0.058 0.052 0.058 0.052

с 0.149 0.068 0.204 0.068 0.077 0.057 0.072 0.057

^=0.075 ^=0.079

Таблица 6. Мощность критериев для типа альтернатив с одним пересечением _в средние моменты времени_

Статистика критерия Степень цензу] ирования 0 % Степень цензурирования 50 %

#14 #15 #16 шт #14 #15 #16 шт

0.051 0.080 0.055 0.051 0.056 0.233 0.090 0.056

0.052 0.078 0.054 0.052 0.051 0.162 0.073 0.051

с °см 0.105 0.071 0.063 0.063 0.049 0.068 0.053 0.049

¿ь 0.105 0.070 0.062 0.062 0.050 0.067 0.053 0.050

¿е 0.093 0.116 0.062 0.062 0.054 0.120 0.061 0.054

с Ямлх 0.089 0.099 0.066 0.066 0.056 0.194 0.081 0.056

ЯБЫ1 0.169 0.323 0.138 0.138 0.076 0.312 0.107 0.076

с ЯБЫ 2 0.131 0.257 0.110 0.110 0.072 0.326 0.099 0.072

¿БЫ 3 0.174 0.391 0.151 0.151 0.076 0.348 0.111 0.076

Яшкм 0.052 0.078 0.054 0.052 0.056 0.233 0.089 0.056

0.111 0.069 0.063 0.063 0.052 0.045 0.052 0.045

^=0.151

^=0.076

Таблица 7. Мощность критериев для типа альтернатив с одним пересечением _в поздние моменты времени_

Статистика критерия Степень цензу рирования 0 % Степень цензурирования 50 %

Н17 Н18 Н19 тт Н17 Н18 Н19 тт

0.201 0.151 0.342 0.151 0.363 0.241 0.330 0.241

0.203 0.149 0.339 0.149 0.276 0.186 0.288 0.186

£см 0.049 0.054 0.142 0.049 0.147 0.113 0.180 0.113

0.047 0.054 0.144 0.047 0.149 0.116 0.175 0.116

% 0.170 0.140 0.283 0.140 0.226 0.170 0.242 0.170

£МАХ 0.173 0.126 0.290 0.126 0.303 0.204 0.274 0.204

С аВЫ1 0.480 0.207 0.302 0.207 0.319 0.197 0.246 0.197

2 0.378 0.167 0.238 0.167 0.268 0.178 0.217 0.178

3 0.518 0.239 0.336 0.239 0.340 0.206 0.264 0.206

£ШКМ 0.197 0.147 0.338 0.147 0.350 0.244 0.323 0.244

С 0.051 0.059 0.154 0.051 0.077 0.057 0.118 0.057

^=0.239 ^=0.244

Это наиболее сложный тип альтернативных гипотез для критериев однородности, имеет точку пересечения в ранние моменты времени, т.к. значение статистики Вальда Ж минимальное. Можно использовать большинство критериев (например, критерии Багдонавичуса-Никулина или критерий максимального значения), но мощность может быть небольшой. В случае наличия пересечения функций надежности в средние или поздние моменты времени оптимальной стратегией является использование критериев Багдонавичуса-Никулина со статистиками 8ВП и 8Ш 3.

5.3. Функции надежности с двумя точками пересечений

Группа альтернатив, имеющих две точки пересечений функций надежности £ (:) и £2 (:), содержит 3 типа: пересечения в ранние и средние (Н21 - Н23), ранние и поздние (Н24 — Н2б) и средние и поздние (Н27 - Н29) моменты времени. Результаты представим в табл. 8-10.

В том случае, если конкурирующие гипотезы имеют два пересечения, то наиболее оптимальной стратегией является использование критерия Багдонавичуса-Никулина со статистикой V 2, т.к. значения мощности были близки к значению статистики Вальда на всех типах альтернатив с двумя пересечениями функций надежности. Кроме того, в случае пересечений в ранние и средние моменты времени может также использоваться критерий Багдонавичуса-Никулина со статистикой .

Таблица 8. Мощность критериев для типа альтернатив с двумя пересечениями в ранние и

Статистика критерия Степень цензу рирования 0 % Степень цензурирования 50 %

Н 21 Н 22 Н 23 шт Н 21 Н 22 Н 23 шт

0.065 0.099 0.050 0.050 0.051 0.109 0.055 0.051

0.065 0.097 0.051 0.051 0.056 0.088 0.053 0.053

¿см 0.052 0.121 0.169 0.052 0.064 0.077 0.050 0.050

0.054 0.120 0.163 0.054 0.063 0.080 0.050 0.050

¿е 0.055 0.120 0.135 0.055 0.059 0.085 0.050 0.050

¿млх 0.061 0.110 0.140 0.061 0.060 0.096 0.060 0.060

с °вм 0.082 0.100 0.393 0.082 0.064 0.071 0.113 0.064

¿БЫ 2 0.147 0.091 0.303 0.091 0.070 0.086 0.099 0.070

с ¿БЫ 3 0.065 0.099 0.389 0.065 0.067 0.078 0.115 0.067

¿шкм 0.064 0.097 0.051 0.051 0.050 0.101 0.055 0.050

с 0.052 0.137 0.162 0.052 0.055 0.086 0.073 0.055

^=0.091 ^=0.070

Таблица 9. Мощность критериев для типа альтернатив с двумя пересечениями в ранние и _поздние моменты времени_

Статистика критерия Степень цензу] ирования 0 % Степень цензурирования 50 %

Н 24 Н 25 Н 26 шт Н 24 Н 25 Н 26 шт

0.051 0.052 0.049 0.049 0.068 0.055 0.090 0.055

0.051 0.052 0.050 0.050 0.053 0.048 0.058 0.048

с °см 0.048 0.056 0.068 0.048 0.050 0.052 0.048 0.048

¿Ь 0.047 0.055 0.066 0.047 0.051 0.052 0.050 0.050

¿е 0.046 0.050 0.057 0.046 0.052 0.051 0.055 0.051

с амлх 0.050 0.053 0.061 0.050 0.073 0.056 0.081 0.056

¿БЫ1 0.085 0.054 0.154 0.054 0.096 0.079 0.053 0.053

с аБЫ 2 0.272 0.140 0.376 0.140 0.207 0.098 0.180 0.098

¿БЫ 3 0.056 0.054 0.098 0.054 0.120 0.086 0.063 0.063

¿шкм 0.051 0.051 0.051 0.051 0.067 0.055 0.091 0.055

0.061 0.053 0.089 0.053 0.043 0.053 0.061 0.043

^=0.140

^=0.098

Таблица 10. Мощность критериев для типа альтернатив с двумя пересечениями в средние и _поздние моменты времени_

Статистика критерия Степень цензу рирования 0 % Степень цензурирования 50 %

H 27 H 28 H 29 min H 27 H 28 H 29 min

Sq 0.239 0.058 0.283 0.058 0.568 0.125 0.627 0.125

Sp 0.238 0.058 0.276 0.058 0.400 0.086 0.456 0.086

SCM 0.093 0.054 0.098 0.054 0.164 0.052 0.190 0.052

SL 0.095 0.054 0.098 0.054 0.162 0.051 0.189 0.051

SQ 0.230 0.059 0.272 0.059 0.293 0.070 0.342 0.070

SMAX 0.197 0.054 0.234 0.054 0.504 0.114 0.585 0.114

С SBN1 0.135 0.055 0.179 0.055 0.535 0.144 0.611 0.144

SBN 2 0.446 0.263 0.488 0.263 0.692 0.272 0.749 0.272

SBN 3 0.258 0.052 0.327 0.052 0.608 0.184 0.686 0.184

SWKM 0.241 0.057 0.284 0.057 0.571 0.131 0.645 0.131

С SCW 0.111 0.066 0.111 0.066 0.070 0.055 0.072 0.055

W=0.263 W=0.272

6. Заключение

В итоге нами было получено, что в случае отсутствия пересечений функций надежности оптимальными стратегиями является использование критериев Гехана, взвешенного критерия Каплана-Мейера, и критерий Крамера-Уэлча. В случае наличия одной точки пересечения в разные моменты времени оптимальной стратегией является использование критериев Багдонавичуса-Никулина со статистиками и з, в случае двух точек пересечений

функций надежности - БШ2. Данные результаты могут использоваться в качестве готовой инструкции по применению критериев на практике.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Литература

1. Philonenko P., Postovalov S. A power comparison of homogeneity tests for randomly censored data / P. Philonenko, S. Postovalov // Applied methods of statistical analysis. Applications in survival analysis, reliability and quality control AMSA2013, Novosibirsk, 25-27 Sept. 2013: proc. of the intern. workshop. Novosibirsk: NSTU publ., 2013. P. 227-237.

2. Philonenko P., Postovalov S. A Comparison of Homogeneity Tests for Different Alternative Hypotheses // Statistical Models and Methods for Reliability and Survival Analysis: monograph. London: Wiley-ISTE, 2013. Chap. 12. P. 177-194.

3. WaldA. Statistical decision functions which minimize the maximum risk. The Annals of Mathematics. 1945. V. 46, № 2. P. 265-280.

4. Johnson E. J., Payne J. W. Effort and accuracy in choice. Management Science. 1985. V. 31, № 4. P. 395-414.

5. Wilcoxon F. Individual comparisons by ranking methods. Biometrics Bulletin. 1945. V. 1, № 6. P. 80-83.

6. Lee E. T., Wang J. W. Statistical Methods for Survival Data Analysis. N. Y: Wiley, 2003.

7. Gehan E. A. A generalized Wilcoxon test for comparing arbitrarily singly-censored samples // Biometrika. 1965. V. 52, № 1/2. P. 203-223.

8. Peto R., Peto J. Asymptotically efficient rank invariant test procedures // J. Royal Statist. Soc. Ser. A (General). 1972. V. 135, № 2. P. 185-207.

9. Kaplan E. L. and Meier P. Nonparametric estimator from incomplete observation // J. Amer. Statist. Assoc. 1958. V. 53. P. 457-481.

10. Savage I. R. Contributions to the Theory of Rank Order Statistics: The Two Sample Case // Annals of Mathematical Statistics. 1956. V. 27. P. 590-615.

11. Mantel N. Evaluation of Survival Data and Two New Rank Order Statistics Arising in Its Consideration // Cancer Chemotherapy Reports. 1966. V. 50. P. 163-170.

12. Pepe M. S., Fleming T. R. Weighted Kaplan-Meier statistics: A class of distance tests for censored survival data // Biometrics. 1989. V. 45. P. 497-507.

13. Ruvie Lou Maria C. Martinez, Joshua D. Naranjo. A pretest for choosing between logrank and wilcoxon tests in the two-sample problem // International Journal of Statistics. 2010. V. LXVIII, № 2, P. 111-125.

14. Philonenko P., Postovalov S. A new two-sample test for choosing between log-rank and Wil-coxon tests with right-censored data // Journal of Statistical Computation and Simulation. 2015. V. 85, № 14. P. 2761-2770.

15. Philonenko P., Postovalov S., Kovalevskii A. The limit test statistic distribution of the maximum value test for right-censored data // Journal of Statistical Computation and Simulation. 2016. V. 86, № 17. P. 3482-3494.

16. Welch B. L. The generalization of Student's problem when several different population variances are involved // Biometrika. 1947. V. 34. P. 29-35.

17. Student. The probable error of a mean. // Biometrika. 1908. V. 6, № 1. P. 1-25.

18. Bagdonavicus V. B., Levuliene R. J., Nikulin M. S. Zdorova-Cheminadeo "Tests for equality of survival distributions against non-location alternatives" // Lifetime Data Analysis. 2004. V. 10, № 4. P. 445-460.

19. Bagdonavicus V. B., Nikulin M. On goodness-of-fit tests for homogeneity and proportional hazards // Applied Stochastic Models in Business and Industry. 2006. V. 22, № 1. P. 607-619.

20. Bagdonavicus V. B., Kruopis J., Nikulin M. S. Nonparametric tests for censored data. John Wiley & Sons, Inc., New York, 2010, 233 p.

21. Bagdonavicus V. B., Kruopis J., Nikulin M. S. Censored and Truncated Data, in Non-parametric Tests for Censored Data. John Wiley & Sons, Inc, Hoboken, NJ, USA. 2013.

22. Titchmarsh E.C. The theory of functions. Oxford University Press, 1976.

23. Kolmogorov A. Some Works of Recent Years in the Field of Limit Theorems in the Theory of Probability // Vestnik Moskov, Univ. Ser. Fiz.-Mat. Estest. Nauk. 1953. V. 8. P. 29-38.

Статья поступила в редакцию 14.09.2016

Филоненко Петр Александрович

аспирант кафедры теоретической и прикладной информатики НГТУ (630073, Новосибирск, пр. Карла Маркса, 20), тел. (383) 346-06-00, e-mail: petr-filonenko@mail.ru.

Постовалов Сергей Николаевич

д.т.н., доцент кафедры теоретической и прикладной информатики НГТУ (630073, Новосибирск, пр. Карла Маркса, 20), тел. (383) 346-06-00, e-mail: postovalov@ngs . ru.

20

n. A. ®H^OHeHKO, C. H. nocTOBanoB

Homogeneity test power as utility function in the theory of decision making under risk and uncertainty

P. Philonenko, S. Postovalov

There are a lot of statistical tests for hypothesis testing and some statistical tests are preferable than others in a certain alternative hypothesis. It needs some reliable method for selecting the powerful statistical test. To solve the problem, we create types of alternative hypotheses (with different number of intersection points of reliability function). For every type we create some alternative hypotheses (with various distribution of survival function) with similar behavior of survival functions (the behavior of test power is similar too) to simulate the power of statistical tests and then we apply the Wald test to conclude what test is the most preferable in a certain type of alternative hypotheses.

Keywords: two-sample problem, lifetime data, Wald test, Monte-Carlo method.

i Надоели баннеры? Вы всегда можете отключить рекламу.