Научная статья на тему 'Квадратичные критерии для проверки гипотез о среднем многомерного нормального распределения'

Квадратичные критерии для проверки гипотез о среднем многомерного нормального распределения Текст научной статьи по специальности «Математика»

CC BY
162
13
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОВЕРКА ГИПОТЕЗ / МНОГОМЕРНОЕ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ / АСИМПТОТИЧЕСКИ НАИБОЛЕЕ МОЩНЫЙ КРИТЕРИЙ / КВАДРАТИЧНЫЙ КРИТЕРИЙ / ЗАДАЧА ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ

Аннотация научной статьи по математике, автор научной работы — Ловенецкая Елена Ивановна

Для наблюдения X = (X1; Xn), имеющего многомерное нормальное распределение с единичной ковариационной матрицей, рассматривается задача проверки гипотезы о среднем против n альтернативы сдвига. Исследуются критерии, основанные на статистиках вида Tn = у X nkf (Xk ), k=1 где коэффициенты удовлетворяют условию равномерной асимптотической малости, а на функцию f накладываются определенные ограничения четности, гладкости и роста. Задача заключается в определении асимптотически (при n да) наиболее мощного критерия. Исследовано предельное поведение математического ожидания и дисперсии статистики Tn при основной и альтернативной гипотезах. Показано, что в случае альтернатив, удовлетворяющих определенному условию асимптотической малости, предельное распределение статистики Tn является нормальным с одной и той же дисперсией при гипотезе и при альтернативе; получено асимптотическое представление для мощности критерия. Задача поиска функции f, определяющей асимптотически наиболее мощный критерий, сводится к задаче вариационного исчисления. Основным результатом статьи является доказательство того, что в описанной постановке задачи наиболее мощным критерием оказывается критерий, определяемый квадратичной функцией f.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Квадратичные критерии для проверки гипотез о среднем многомерного нормального распределения»

ТРУДЫ БГТУ. 2015. № 6. Физико-математические науки и информатика. С. 19-23 19

УДК 519.237.3

Е. И. Ловенецкая

Белорусский государственный технологический университет

КВАДРАТИЧНЫЕ КРИТЕРИИ ДЛЯ ПРОВЕРКИ ГИПОТЕЗ О СРЕДНЕМ МНОГОМЕРНОГО НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Для наблюдения X = (Х1; ...; Xn), имеющего многомерное нормальное распределение с единичной ковариационной матрицей, рассматривается задача проверки гипотезы о среднем против

n

альтернативы сдвига. Исследуются критерии, основанные на статистиках вида Tn = ^ X kf (Xk),

k=1

где коэффициенты удовлетворяют условию равномерной асимптотической малости, а на функцию f накладываются определенные ограничения четности, гладкости и роста. Задача заключается в определении асимптотически (при n ^ да) наиболее мощного критерия.

Исследовано предельное поведение математического ожидания и дисперсии статистики Tn при основной и альтернативной гипотезах. Показано, что в случае альтернатив, удовлетворяющих определенному условию асимптотической малости, предельное распределение статистики Tn является нормальным с одной и той же дисперсией при гипотезе и при альтернативе; получено асимптотическое представление для мощности критерия. Задача поиска функции f, определяющей асимптотически наиболее мощный критерий, сводится к задаче вариационного исчисления. Основным результатом статьи является доказательство того, что в описанной постановке задачи наиболее мощным критерием оказывается критерий, определяемый квадратичной функцией f.

Ключевые слова: проверка гипотез, многомерное нормальное распределение, асимптотически наиболее мощный критерий, квадратичный критерий, задача вариационного исчисления.

E. I. Lovenetskaya

Belarusian State Technological University

QUADRATIC CRITERIA FOR TESTING HYPOTHESIS ON THE MEAN OF THE MULTIDIMENSIONAL NORMAL DISTRIBUTION

For observing X = (X1; .; Xn) having multidimensional normal distribution with unit covariance matrix we investigate the problem of testing hypothesis on the mean against the alternative of the shift.

n

We study the criteria which are based on the statistics in the form of Tn = ^ X nkf (Xk). We assume the

k=1

coefficients of the statistics to satisfy a certain condition of uniform asymptotical negligibility and f to be an even function under some smoothness and growth constraints. The problem is to find the asymptotically (as n ^ да) most powerful test.

The asymptotic behavior of mathematical expectation and variance of the statistics is investigated under null and alternative hypotheses. It is shown in the article that in the case of the alternatives satisfying certain asymptotical littleness condition the limiting distribution of the statistics Tn is normal with the same variance under null and alternative hypotheses. The asymptotic representation of the power function of the test is obtained, too. The problem of finding the functionf for asymptotically most powerful test is reduced to some problem of the calculus of variations. The main result of the paper is the proof of the theorem that the most powerful test in the problem under consideration is a quadratic test.

Key words: hypothesis testing, multidimensional normal distribution, asymptotically most powerful test, quadratic criterion, problem of the calculus of variations.

Введение. Рассмотрим задачу проверки гипотезы о среднем многомерного гауссовско-го распределения. Наблюдение X = (X1; ...; Xn) представляет собой нормальный случайный вектор, имеющий единичную матрицу кова-риаций. Для проверки гипотезы H0 о стандартной нормальности n-мерного вектора X против альтернативы сдвига Hn. EX = Цп = (Цпь Ц™), где Ф 0, применяется критерий с областью отклонения гипотезы Sn = (Xe Rn. Tn(X) > ca}, где константа ca определяется заданием уровня значимости a, т. е. при нулевой гипотезе Po(Sn) = a. Будем рассматривать статистики вида

Тп = Тп (X) = X ^пк/(Хк) (1)

к=1

с некоторыми условиями на коэффициенты Хпк и функцию /. Требуется найти среди таких критериев асимптотически (при п ^ да) наиболее мощный.

Статистики данного вида возникали в работах Ю. И. Ингстера [1, 2] при рассмотрении задачи обнаружения сигнала в гауссовском белом шуме. В этих статьях критерии указанного типа оказываются асимптотически минимаксными для некоторых сложных альтернатив, достаточно удаленных от нуля.

В данной работе исследуются альтернативы, удовлетворяющие некоторому условию асимптотической малости. Это позволяет доказать справедливость ЦПТ для статистики Тп при гипотезе и при альтернативе и получить асимптотическое выражение для мощности. В результате задача поиска функции / соответствующей оптимальному в указанном смысле критерию, сводится к вариационной задаче, решением которой оказывается квадратичная функция.

Отметим, что квадратичные критерии возникают также при байесовском подходе к задаче о среднем многомерного нормального распределения. Замечательное свойство байесовского критерия состоит в том, что он максимизирует среднюю мощность, т. е. является наилучшим против сложной альтернативы. Основной результат статьи заключается в том, что квадратичные критерии в задаче о среднем многомерного нормального распределения являются не только наиболее мощными в среднем для сложных альтернатив, но и доставляют максимум мощности на индивидуальных альтернативах, удовлетворяющих определенному условию асимптотической малости.

Будем обозначать символами: ф - плотность, Ф - функцию распределения одномерной стандартной нормальной величины; Е0£, В0£, - математическое ожидание и дисперсию случайной величины £ при основной гипотезе Н0 и Ец ^ - при альтернативе Нп: ЕХ = цп; квантиль уровня а нормального распределения будем обозначать иа = Ф-1 (1 -а).

Основная часть. Рассмотрим поведение статистики (1) при нулевой гипотезе и при альтернативе. Опишем дополнительные условия на коэффициенты Хпк и функцию/статистики (1).

Относительно функции / предполагаем, что она трижды непрерывно дифференцируема и удовлетворяет следующим условиям:

f (-X) = f ( X),

Eof (X) = 0, E0f''(X) * 0,

(2)

(3)

(4)

для некоторого натурального р существует такая постоянная А > 0, что

|f'''(х)| < A\x\p при всех Xе R.

(5)

Из условия (2) четности функции / следует Е0 /'(X) = 0. Условие (3) не ограничивает общности, поскольку всегда вместо функции / можно рассмотреть / = / - Е0/(Х). Можно показать, что условие (5) обеспечивает функции / свойства, указанные в следующей лемме.

Лемма 1. Пусть / - четная функция класса С3(Я), для которой выполнено условие (5).

Тогда при некоторых постоянных А1, А2, А3 для всякого х е Я справедливы соотношения

|f''(X)| < А( |f'(X)| < A2(| If (x) < A3 (|

XT1 +1

ip+2 , X +1

Xp+3 +11.

Замечание. Очевидным следствием леммы 1 является конечность при гипотезе величин Е0]/Х)Г при всех натуральных г, поскольку они ограничиваются моментами стандартного нормального распределения.

Для изучения распределения статистики (1) при справедливости альтернативной гипотезы полезным будет следующее утверждение.

Лемма 2. Пусть функция к такова, что для некоторого натурального 5 при некотором постоянном а > 0 справедливо |к(х)| < а(|х|5 + 1) для любого х е Я. Тогда при некотором Ь > 0

sup E0 \h(X + v)| <b

+1).

V:

Доказательство следует из свойств математического ожидания и неравенства Минковско-го (см., например, [3, с. 211]).

Относительно коэффициентов \пк статистики (1) предполагаем, что они неотрицательны и удовлетворяют следующим условиям:

max Xnk ^ 0 при n ^ <

1< к < n

Ёх2к ^1 пРи n

(6) (7)

к=1

Условия (6) и (7) влекут условие равномерной асимптотической малости коэффициентов:

max Xпк ^ 0 при n

1<к <n nk

при котором, как следует из [3, 4], верна ЦПТ

n

для Tn = Ё Xnk£к, где £к - независимые оди-

к=1

наково распределенные случайные величины.

Учитывая, что для статистики (1) при основной гипотезе выполняются соотношения

EoTn = 0, Do?; = E„f2(X)£X2nk ^Eof 2(X)

к=1

при n ^ да, получаем следующее утверждение.

Утверждение 1. При выполнении условий (3), (6), (7) и условия Ef 2(X) < да статистика (1) при n ^ да сходится по распределению к нор-

мальному распределению со средним 0 и дисперсией Е/"2^.

Сформулируем условия на альтернативы, для которых применим результат данной работы. Предполагается, что для цп выполняются условия: существует конечный предел

lim £ Xnktik > 0

k=1

£ Xnk k* ^0 пРи n

(8)

(9)

для значения p, определяемого формулой (5), справедливо

£ Xnk |kJP+3 ^0 пРи n

(10)

k=1

Замечание. Условия (4) и (8) играют роль условия асимптотической различимости гипотезы и альтернативы в данной задаче в том смысле, что обеспечивают отличие математического ожидания статистики при альтернативе от математического ожидания при гипотезе.

Рассмотрим числовые характеристики статистики (1) при альтернативе в предположении справедливости условий (2)-(10). Заметим, что

ЕЦ11Тп = X X пк Е„п/X) = X Ь пк Е0 / X +Цпк).

k=1

k=1

Мы можем воспользоваться разложением функции / в ряд Тейлора с остаточным членом в интегральной форме, если ряд

Е»„тп = XЬпк0/,( ) +

k=1

+

£ X nk k3nk ^o j (1 - s)2 f'''(X + s^) ds

k=1

будет сходящимся. Здесь мы приняли во внимание, что Е0/(X) = 0, Е0/'(X) = 0. Учитывая (5) и лемму 2, получим оценку

Eo 2 j(1 - s)2 f'''(X + sknk) ds

<-6 sup E„|f '''(X + v)| <B(( +1)

для некоторой положительной постоянной В. Таким образом,

E,/n=£Xnkk2k 0f..( )+^n,

k=1 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

где остаточный член 0n в силу условий (9), (10) стремится к нулю при n — да.

Следствием леммы 1 является конечность математического ожидания Е0/''(X) поскольку /'' ограничивается степенной функцией. Таким образом, Е^пТп сходится к конечному пределу при п ^ да.

Предельное выражение для дисперсии статистики (1) при альтернативе получается аналогично. Здесь достаточно представить функцию / в виде

/ (Хк + Дпк) = / (Хк) + Дпк | / '(Хк + ^ у*.

0

Тогда, поскольку Е0 / (X) = 0, то

Е,и/(Xk) = Дпк Е< | /'(X + ^к

0

DЦи/(Xk) = Е^/2^,)-(EMя/(Xk) )2 =

= Е< /2 (X) + 2Дпк Е< / (X)} /'(X + ^ № +

0

1

+ ^к ^ / / '(X + *Дпк ) ^

0

Для коэффициента при цпк, применяя дважды неравенство Коши - Буняковского, а затем такие же рассуждения, как выше при оценивании Тп, получим оценку

Eo f (X )j f'(X + sknk) ds

< Eo f 2(X) sup Eo (f '(X + v))2.

v:l vl<M

Аналогично оценим коэффициент при

Do j f'(X + sknk)ds < Eo I j f'(X + sknk)ds

о V о

< sup Eo (f '(X + v))2 <B1 (|nk12(P+2) + i)

при некоторой постоянной Д > 0. Последнее неравенство является очевидным следствием лемм 1 и 2. Используя для оценивания коэффициента при цпк корень из этой величины, получим:

D,/n = £ X nkf (Xk) = £ X lk D^f (Xk) =

k=1 k=1

= Eo f 2( X )£ X2k + en + ei,

k=1

где

|en| < 2^2 B1Eo f 2( X) £ X2nk kJ ((nklp+2

k=1

—> да'

—> да

2

И < Bl ± я ((2('+2)+1

k=l ^

Условия (6)-(8), (10) обеспечивают сходимость к нулю величин еП и еП1, а следовательно, ОрпТ„ ^ Е0/2(X) при п ^ да и статистика (1) при альтернативе имеет дисперсию, асимптотически равную дисперсии при гипотезе.

Утверждение 2. При выполнении условий (2)-(10) и условия Е/2(Х) < да случайная вели-1 п

Чина Тп - - X Япк^гкЕ0/ ''(ХX где статистика Тп

2 к=1

определена соотношением (1), при альтернативе Нп сходится при п ^ да по распределению к нормальному распределению со средним 0 и дисперсией Е/2(Х).

Поскольку при альтернативе Нп статистику (1) можно представить в виде

Тп = X ^к = X Я пк/(Хк +Ц пк ),

i=1

i=1

считая Хк независимыми стандартными нормальными случайными величинами, то для доказательства утверждения проверим справедливость условия Ляпунова:

f П \—3/2 n

|jj D0jj E0 - E& |3 ^ 0 (11)

V i=1 J i=1

при n ^ да. При этом условии справедлива ЦПТ

n

для сумм Tn = j независимых случайных

i=1

величин (см. [3, гл. III, §4]).

n

Поскольку j D0^i = D]lTn, то в силу дока-i=1 n занного выше предельного поведения дисперсии статистики при альтернативе знаменатель в (11) сходится к конечной величине при n ^ да. Можно показать с помощью лемм 1 и 2, что при выполнении условий (6), (7), (10) числитель (11) стремится к нулю при n ^ да.

Таким образом, для статистики (1) при альтернативе Hn имеет место утверждение 2.

Рассмотрим ßn - мощность критерия заданного уровня значимости а с областью отклонения гипотезы Sn = {X е Rn: Tn(X) > са}. Имея в виду асимптотическую ситуацию, при построении критической области будем пользоваться предельными распределениями статистики. Выражая с помощью результатов утверждений 1 и 2 через функцию Ф стандартного нормального распределения вероятности Sn при гипотезе P0(Sn) = а и при альтернативе РцП (Sn) =ßn, получим следующее асимптотическое выражение для мощности ßn критерия уровня значимости а:

ßn =Ф

1 _ E0f''(X)

2 TEf(X)

jхniЦ^ -г

i=1

Таким образом, задача оптимизации мощности сводится к отысканию максимума функцио-

нала (Е0/2(Х)) Е0/''(X), которая вследствие его однородности эквивалентна задаче поиска максимума функционала О(/) = Е0 /''(X)

при фиксированном значении Е0/2(Х) (положим, например, Е0 / 2(Х) = 2).

Итак, имеем следующую оптимизационную задачу:

О(/) = | /''(х)Ф(х)йх ^ ех1г, (12) и

Е„/(Х) = | / (х)ф(х)ёх = 0, (13) и

Ео/2(Х) = | / 2( х)ф( х)йх = 2, (14) и

Ео/'(Х) = | /'(х)ф( х) ёх = 0. (15) и

Интегрируя по частям в (12) и (15) и учитывая, что внеинтегральные члены обращаются в нуль за счет оценок из леммы 1, получаем функцию Лагранжа для данной задачи в виде

L = Х0 j (х2 — 1) f (х)ф(х)йХ + j f (х)ф( x)dx

+

+

Х2 j xf (х)ф( x)dx + Х3 j f 2( х)ф( x)dx.

Приравнивая к нулю вариационную производную: — = 0, находим решение задачи (12)-

(15) в виде /(х) = ах2 + Ьх + с, откуда с учетом условий (13)-(15) получаем:

/ (х) = х2

1.

(16)

Для доказательства того, что на функции (16) достигается максимум в задаче (12)-(15), рассмотрим функцию / + к, четную и удовлетворяющую, как и / условиям (13)-(15), и покажем, что О(к) < 0. Действительно, интегрируя О(к) по частям и учитывая четность функции к, а также (16) и условие (14) для функции / + к, получаем:

О(к) = | (х2 -1)к(х)ф(х)ёх = --1к2 (х)ф(х)ёх < 0,

а следовательно, для всех таких функций h имеет место G(/ + к) = G(/) + G(к) < G(/).

Итак, доказана следующая теорема.

Теорема. Пусть для проверки гипотезы о стандартной нормальности п-мерного вектора X против альтернативы сдвига Нп: ЕХ = цп рассматриваются критерии, основанные на статистиках вида (1) с коэффициентами, удовлетворяющими (6), (7). Если для альтернативы выполнены условия (8)-(10), то в классе критериев, определяемом семейством трижды непрерывно дифференцируемых функций, удовлетворяющих

(2)-(5), асимптотически наиболее мощным является критерий, основанный на функции (16).

Заключение. В статье рассмотрено применение критериев, основанных на статистиках вида (1), в задаче проверки гипотезы о среднем многомерного нормального распределения при альтернативах сдвига, удовлетворяющих определенному условию равномерной асимптотической малости. Показано, что при определенных условиях на компоненты статистики (1) наиболее мощными среди всех таких критериев оказываются квадратичные критерии.

Литература

1. Ингстер Ю. И. О минимаксном непараметрическом обнаружении сигнала в гауссовском белом шуме // Проблемы передачи информации. 1982. Т. 18, вып. 2. С. 61-73.

2. Ingster Yu. I. Asymptotically minimax hypotheses testing for nonparametric alternatives, I-III // Mathematical methods of statistics. 1993. Vol. 2, no. 2, pp. 85-114; no. 3, pp. 171-189; no. 4, pp. 249-268.

3. Ширяев А. Н. Вероятность. М.. Наука, 1980. 576 с.

4. Гаек Я., Шидак З. Теория ранговых критериев. М.. Наука, 1971. 376 с.

References

1. Ingster Ju. I. On the minimax nonparametric detection of signals in white gaussian noise. Problemy peredachi informatsii [Problems of information transmission], 1982, vol. 18, no. 2, pp. 61-73 (In Russian).

2. Ingster Yu. I. Asymptotically minimax hypotheses testing for nonparametric alternatives, I-III. Mathematical methods of statistics, 1993, vol. 2, no. 2, pp. 85-114; no. 3, pp. 171-189; no. 4, pp. 249-268.

3. Shiryaev A. N. Verojatnost' [Probability]. Moscow, Nauka Publ., 1980. 576 p.

4. Hajek J., Sidak Z. Theory of Rank Tests. Prague, Academia, 1967. 297 p. (Rus. Ed.. Gayek Ya., Shidak Z. Teoriya rangovyh kriteriev [Theory of Rank Tests]. Moscow, Nauka Publ., 1971. 376 p.).

Информация об авторе

Ловенецкая Елена Ивановна - кандидат физико-математических наук, доцент, доцент кафедры высшей математики. Белорусский государственный технологический университет (220006, г. Минск, ул. Свердлова, 13а, Республика Беларусь). E-mail. [email protected]

Information about the author

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Lovenetskaya Elena Ivanovna - Ph. D. (Physics and Mathematics), Assistant Professor, Assistant Professor, the Department of Higher Mathematics. Belarusian State Technological University (13a, Sverd-lova str., 220006, Minsk, Republic of Belarus). E-mail. [email protected]

Поступила 15.03.2015

i Надоели баннеры? Вы всегда можете отключить рекламу.