Краткие сообщения
УДК 519.233.3, 519.246.8
ОСТАТОЧНЫЕ ЭМПИРИЧЕСКИЕ ПРОЦЕССЫ И КАЧЕСТВЕННО РОБАСТНЫЕ
GM-ТЕСТЫ В АВТОРЕГРЕССИИ
М. В. Болдин1, Д. М. Есаулов2
В статье исследуется локальная качественная робастность GM-тестов в авторегрессии против выбросов. Рассматривается локальный вариант схемы засорения данных независимыми аддитивными выбросами интенсивности 0(п-1/2), п — объем данных. Качественная робастность формулируется в терминах равностепенной непрерывности мощности. Построены асимптотически оптимальные в максиминном смысле GM-тесты.
Ключевые слова: проверка гипотез, авторегрессия, GM-тесты, робастность, выбросы.
The article deals with the local qualitative robustness of GM-tests against outliers in the autoregression model. We consider a local scheme of data contamination by independent outliers with the intensity O(nT1/'2). The qualitative robustness in terms of power equicontinuity is obtained. The asymptotically optimal in maximin sense GM-tests are constructed.
Key words: hypotheses testing, autoregression, GM-tests, robustness, outliers.
1. Введение и постановка задачи. Для статистического анализа независимых одинаково распределенных данных часто используют M-процедуры оценивания и проверки гипотез. Робастность этих процедур — хорошо изученная тема (см., например, монографию [1]). Для авторегрессионных моделей данных (т.е. для зависимых данных) аналогом M-процедур служат GM-процедуры (см., например, [2]). К сожалению, робастность GM-тестов в авторегрессии, в отличие от оценок, обсуждалась в литературе мало и фрагментарно (см., например, [3]). Между тем актуальность подобных вопросов для приложений и статистической теории временных рядов очевидна.
В этой заметке мы исследуем локальную качественную робастность GM-тестов в авторегрессии против грубых выбросов (засорений) в наблюдениях. Также мы строим асимптотически оптимальные в максиминном смысле тесты.
Итак, будем рассматривать модель AR(1)
ut = (Зщ-1 + £t, t e Z, (1)
где {£t} — н.о.р.с.в. с неизвестными функцией распределения G и лебеговой плотностью g, E£\ = 0, E£l < то; \в\ < 1, в — неизвестный параметр. Наблюдения yo,yi, ...,Уп имеют вид
yt = ut + z]n it, t = 0,1,...,n, (2)
где {ut} — выборка из стационарного решения (1); {z]n } — н.о.р.с.в. с распределением Бернулли Br (jn), jn = min(1,n-1/2y), параметр j ^ 0 неизвестен; {it} — н.о.р.с.в. с неизвестным и произвольным распределением f; последовательности {ut}, {zjn }, {it} независимы между собой.
Последовательность {it} интерпретируется как последовательность грубых выбросов (засорений), Yn — уровень засорения. Схема (2) — локальный вариант общеупотребительной во временных рядах схемы засорения данных независимыми одиночными выбросами (детали см. в [4]).
По наблюдениям {yt} мы будем проверять гипотезу Ho: в = во против, скажем, правосторонней альтернативы H+: в > во. Мощность теста будем исследовать при локальных альтернативах Hin(r): в = вп := во + п-1/2т,т > 0. Удобно дальше полагать т ^ 0, так что Hin(0) есть Ho. Кроме того, будем предполагать, что п ^ пт, где пт есть наименьшее натуральное число, при котором \вn\ < 1 для п ^ пт.
1 Болдин Михаил Васильевич — канд. физ.-мат. наук, доцент каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail: [email protected].
2Есаулов Даниил Михайлович — асп. каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail: [email protected].
Пусть
1п(во) ■= п-1/2^ ф(У—1)Ф(Уь - воУ—) = ф(х)йЧп(х,во), (3)
ь=1
где
Пп(х,во)'-= п ф(у—1)1(уг - воУ—1 ^ х), (4)
г=1
I(•) — индикатор события, х € М1. Процесс ип(х,во) в (4) — остаточный взвешенный эмпирический процесс, функции ф и ф выбираются априорно в соответствии с описанными далее в п. 2 условиями.
В качестве тестовой статистики для Но возьмем
Тп = Тп(во) := 8-11п(во), где п
¿П ■ = пф2(У—)ф2(У* - РоУг-1)
г=1
— оценка параметра а2(во) ■ = Еф2(ио)ф2£), {и0} — стационарное решение (1) при гипотезе Но.
Тест со статистикой Тп называется СМ-тестом (обобщенным М-тестом), так как при гипотезе Но, ф{х) = х, ф(х) = ^^у и 7 = 0 статистика Тп с точностью до множителя есть производная логарифмического правдоподобия наблюдений ио,щ,...,ип.
Соотношения (3), (4) позволяют свести асимптотическое исследование статистики Тп к исследованию эмпирического процесса ип(х,во). Подобный подход использовался в статистике временных рядов очень давно (см., например, [2, 5]), но только в схемах без засорений. Результаты для остаточных эмпирических процессов в схемах с засорениями типа (2) представляют самостоятельный интерес (теорема 1), например, в связи с исследованием робастности ранговых тестов в авторегрессии.
Мощность соответствующего Тп-теста при альтернативе Н1п(т) обозначим Шп(т,^,ц).
Наша первая задача — показать, что при Н1п(т) с любым фиксированным т ^ 0 равномерно по произвольным ц и 0 ^ 7 ^ Г < оо статистика Тп имеет слабый предел при п —^ оо (теорема 2). Отсюда будет следовать, что мощность Шп(т,ч,ц) равномерно сходится к предельной мощности Ш(т,ч,ц), которую мы укажем явно (следствие 2). Вторая задача — установить, что семейство допредельных мощностей {Шп(т,^, ц)} равностепенно непрерывно по 7 в точке 7 = 0 (теорема 3).
Качественно последний факт означает, что мощности Шп(т, ц) в схеме с засорениями и мощности Шп(т, 0, ц) в схеме без засорений равномерно по ц и п близки при малых Это естественно интерпретировать как локальную качественную робастность (LQ-робастность) теста со статистикой Тп. Формальное определение LQ-робастности дано далее в теореме 3, которая снабжена также комментарием. LQ-робастность в схеме (1), (2) была введена в [6], где исследовалась робастность знаковых тестов в АИ(1). В схеме независимых данных определение качественной робастности в нелокальной ситуации впервые дано в [7]. Оно сформулировано в терминах равностепенной непрерывности мощности в метрике Прохорова. Определение из [6] родственно определению из [7], но приспособлено для локальной ситуации и схемы засорений (2).
Наконец, в п. 3 мы строим асимптотически максиминные тесты (теорема 4).
2. Основные результаты. Нам понадобятся следующие условия.
Условие (I). Функция О дважды дифференцируема с производной д, _^^ д(х) = 0,
8ирж \д'(х)\ < ж.
Условие (И). Функция ф(х) п.в. непрерывна, 8ирж \ф(х)\ < ж, Еф(и\) = 0, Е[и°1ф(и°1)] > 0.
Условие (ш). Вариация Уаг [ф] < ж, Еф(£1) = 0, /^ д(х)(1ф(х) > 0.
Обозначим
д(х)йф(х), А2(во,ц) ■ = Еф(и1 + &)ф(£2 - Ш.
-те
Положим
6(т,ч,ц)= 5(во,т,ъц) ■= а-1 (во)[^(во)т + А2(во,цЫ
Пусть
п
■= п-1/2
йп(х,во) ■= п ф(Щ-1 )1(£г ^ х).
г=1
В следующей теореме дается асимптотическое равномерное разложение эмпирического процесса из (4). Ее доказательство использует идеи [5, 6].
Теорема 1. Пусть выполнены условия (i), (ii). Пусть верна альтернатива H\n(r). Тогда при любых 5 > 0 и 0 ^ Г < то
sup Рвп (sup \un(ж, во) - Un(x, во) + g(x)E[u01^(u01 )]т-
x
-E[^(u°1 + 6)№ + воб) - G(x)]}Y\ >5) — 0, n — то.
Соотношение (3) и теорема 1 влекут
Следствие 1. Пусть выполнены условия (i), (ii), Var [ф] < то. Тогда
n
sup Рвп(\1п(во) - n-i/2T p(u?-i)ф(еь) - А1(во)т - А2(во,Ф\ >5) — 0, n —то.
Следующая теорема 2 основана на следствии 1. Она описывает равномерный слабый предел для Tn при Hin(т), Ф(ж) —функция распределения стандартного гауссовского закона, Г —любое неотрицательное конечное число.
Теорема 2. Пусть верна альтернатива Hin(T), т ^ 0. Пусть выполнены условия (i) —(iii). Тогда
sup\Рвп(Tn ^ ж) - Ф(ж - 5(тл,ц))\—0, n —то. (5)
Супремум в (5) берется по ж Е Ri, 0 ^ Y ^ Г и произвольным ц.
В силу теоремы 2 в случае y = 0 при гипотезе Но имеем Tn —о N(0,1), n — то. Отвергать Но будем при Tn > ti-a, ti-a — квантиль Ф(ж) уровня 1 - а. В схеме без засорений такой тест имеет асимптотический уровень а. При произвольном y его мощность на Hin(T) есть Wn(T,Y, ц) := Р@„ (Tn >
ti-a).
Следствие 2. В условиях теоремы 2
Wn(T, y, ц) — W(т, Y, ц) := 1 - $(ti-a - 5(т, y, ц)), n — то,
причем сходимость равномерная по 0 ^ y ^ Г < то и произвольным ц. Очевидно, при ограниченных ф и ф и любом т ^ 0
sup \W(т, y, ц) - W(т, 0,ц)\ — 0, y — 0, м
т.е. семейство предельных мощностей {W(т^,ц)} равностепенно непрерывно по y в точке y = 0. Этот факт позволяет с помощью рассуждений, аналогичных проведенным при доказательстве теоремы 3.3 в работе [6], установить следующую теорему.
Теорема 3. Пусть выполнены условия теоремы 2. Тогда
sup ^п(тп,ц) - Wn (т, 0,ц)\—0, y — 0. (6)
Супремум в (6) берется по n ^ nT и произвольным ц.
В силу (6) семейство допредельных мощностей {Wn(т,Y, ц)} равностепенно непрерывно по y в точке Y = 0. Мы интерпретируем (6) как LQ-робастность GM-теста, соотношение (6) служит определением такой робастности. LQ-робастность означает, что при гипотезе для малых y при всех n ^ 1 и произвольных ц в схемах с засорениями и без засорений даже допредельные уровни значимости GM-теста близки. То же верно для локальных мощностей при n ^ nT.
Отметим, что тест наименьших квадратов, получаемый при ф(ж) = ф(ж) = ж, условию LQ-робастности не удовлетворяет. Легко проверить, что при во =0 асимптотический уровень значимости теста наименьших квадратов при сколь угодно малом y > 0 может быть сколь угодно близок к единице для распределений ц с тяжелыми хвостами. Это патологическая ситуация, когда тесту наименьших квадратов следует предпочесть GM-тест с ограниченными ф и ф, для которого выполнено (6).
3. Асимптотически оптимальные тесты. Для b > 0 пусть
1, x > b; Vb(x) := ^ x/b, \x\ ^ b;
-1, x < -b.
Пусть ^o(x) : = signx. Положим ev(b) := 1/[Еф2(u°i)]l/2, b ^ 0. Тогда ev(b) — строго возрастающая непрерывная функция с минимальным значением 1 в нуле, e^(b) ~ b/[E(uU1)2]1/2.
Также для с ^ 0 положим фс(х) := фс[ — j(x)) и еф(с) := 1/[Еф2(е\)]1/2. Тогда вф(0) = 1, е^(с) ~ c/i(g), с ^ с, i(g) — информация Фишера плотности g относительно сдвига. Введем два класса функций:
^ /ТЛ i /л ЛЛ sup^ \^(x)\ } := <ф: выполнены условия (ij, (л) и ---- ^ е<До) >,
I [Еф2(и°°)] ' )
V t \ f I /.\ Л..ч sup^ \ф(x)\ }
:= < ф: выполнены условия l , ш и --—- ^ e^(c) >.
^ l [Еф 2(ei)]1/2 J
Напомним, сдвиг, определяемый альтернативой H\n(r), равен
а-\130)А1Шт = EU°MU%2 Sgd\/2r.
[Еф2{ь°)]1/2[Еф2{е О]1/2
Следующая лемма показывает, что этот сдвиг достигает максимума по ф £ (b), ф £ Кф(с) на паре фь, Фс. Ее доказательство проводится тем же методом, что и известная теорема Хампеля (см. [1, разд. 2.4]).
Лемма. 1) Пусть фь £ Kv(b) для некоторого b ^ 0. Тогда фь является решением задачи --^ -и/2 —^
. Любое другое решение п.в. совпадает с кфь при некотором k > 0.
2) Пусть фс £ Кф(с) для некоторого с ^ 0. Пусть i(g) < с. Тогда ф является решением задачи
—1/2 —тахгфе^ (с). Любое другое решение п.в. совпадает, с кфс при некотором к > 0.
[Еф (si)]
Обозначим мощность W(т, Y, f) через W(т, Y, ¡л\ф, ф). В этих обозначениях sup^ W(0, Y, ¡л\ф, ф) — наибольший асимптотический объем теста, а inf^ W(t,y, f \ф,ф) — его наименьшая асимптотическая локальная мощность на паре ф, ф.
Теорема 4. Пусть фь £ (b), фс £ Кф (с) для некоторых b ^ 0, с ^ 0. Пусть i(g) < с. Тогда для любых ф £ K.v{b), ф £ Кф(с) имеем
1) sup^ W(0,Y,f \ф,ф) < $(ta + ev(b)e^(ф);
2) inf^ W(т, y, f \фь, фс) ^ infц W(т, y, f \ф, ф) для т > 0 и 0 ^ y < ъ(ф, ф).
В силу теоремы 4 GM-тест с фь, фс обладает асимптотически максиминным свойством. При b = с = 0 функции фо(x) = фо(x) = sign(x), если только signg'(x) = — signx. Это непараметрический медианный тест, так как тестовая статистика есть Tn = Y^n=i sign(yt/yt-i — во), а уравнение Yn=i sign(yt/yt-i — 0) = 0 определяет медиану массива {yt/yt-i}. Подобные медианные оценки в авторегрессии были введены в [8]. При b = с = 0 верхняя граница для наибольшего объема в п. 1 теоремы 4 минимальна по всем Ь,с и равна Ф(Ьа + y).
СПИСОК ЛИТЕРАТУРЫ
1. Hampel F.R., Ronchetti E.M., Rousseeuw J., Stahel W.A. Robust statistics. The approach based on influence functions. N.Y.: Wiley, 1985.
2. Koul H.L. Weighted empiricals and linear models // IMS Lect. Notes. Monogr. Series. Vol. 21. Hayward, CA. 1992.
3. Есаулов Д.М. Робастность GM-тестов в авторегрессии против выбросов // Вестн. Моск. ун-та. Матем. Механ. 2012. № 2. 47-50.
4. Martin R.D., Yohai V.J. Influence functionals for time series // Ann. Statist. 1986. 14. 781-818.
5. Boldin M.V. On empirical processes in heteroscedastic time series and their use for hypothesis testing and estimation // Math. Methods Statist. 2000. 9. 65-89.
6. Boldin M.V. Local robustness of sign tests in AR(1) against outliers // Math. Methods Statist. 2011. 20. 1-13.
7. Reider H. Qualitative robustness of rank tests // Ann. Statist. 1982. 10. 205-211.
8. Boldin M.V. On median estimates and tests in autoregressive models // Math. Methods Statist. 1994. 3. 114-129.
Поступила в редакцию 06.02.2012
УДК 512.628.2 + 512.552.12
ПЕРВИЧНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ НИЛЬ-АЛГЕБРЫ СУЩЕСТВУЮТ
Г. А. Погудин1
Строится гомоморфизм из дифференциальной алгебры k{x} / [xm] в алгебру Грассма-на, снабженную структурой дифференциальной алгебры. С его помощью доказывается первичность k{x}/[xm] и ее алгебры дифференциальных многочленов, решается связанная с этой алгеброй одна из задач Ритта и дается альтернативное доказательство инте-гральности идеала [xm].
Ключевые слова: дифференциальная алгебра, алгебра дифференциальных многочленов, задача Ритта, первичный радикал.
We construct a monomorphism from differential algebra k{x}/ [xm] to Grassmann algebra endowed with the structure of differential algebra. Using this monomorphism, we prove the primality of the k{x}/[xm] and its algebra of differential polynomials, solve the so-called Ritt problem and give a new proof of integrality of the ideal [xm].
Key words: differential algebra, algebra of differential polynomials, Ritt problem, prime radical.
Всюду в статье предполагается, что характеристика основного поля k равна нулю.
1. Основная конструкция. Изучение идеала [xm] в свободной дифференциальной алгебре k{x} началось с работы Г. Леви [1]. Там сформулировано достаточное условие принадлежности монома идеалу, выраженное в терминах веса и степени. В монографии Дж. Ритта [2] была сформулирована задача: в какую наименьшую степень следует возвести x¿, чтобы попасть в [xm]? В работе [3] эта задача решена для i = 1, 2. Насколько нам известно, решение для остальных случаев ранее получено не было. Однако была высказана гипотеза, которую мы и докажем в теореме 3.
В кандидатской диссертации А. И. Зобнина [4] было отмечено, что процесс редукции, который использовал Г. Леви в своей работе, является просто процессом редукции относительно дифференциального базиса Грёбнера, состоящего из одного элемента xm. Там же была сформулирована гипотеза об интеграль-ности идеала (теорема 4; ранее это утверждение было доказано М.В.Кондратьевой). Более подробно о базисе Грёбнера идеала [xm] написано в работе [5].
Введем свободную дифференциальную алгебру от одной образующей. Будем обозначать образующую через x, а ее i-ю производную через x¿. Тогда свободной дифференциальной алгеброй от x будем называть k+{x} = k+[x,xi,x2, • • •], т.е. свободную коммутативную алгебру от x и ее производных. Плюс в нижнем индексе обозначает, что берутся мономы только положительной степени. В частности, определенная алгебра не содержит единицы.
Введем основную конструкцию данной статьи. Для изучения идеала [xm] рассмотрим векторное пространство Vm с m — 1 парой счетных серий базисных векторов и tfl (k = 0, — ,m — 2, i £ N U {0}). Внешнюю алгебру этого пространства будем обозначать через A(Vm), а ее четную и нечетную компоненты — через Ac(Vm) и Ki(Vm) соответственно. Отметим, что мы не предполагаем наличия в A(Vm) единицы. Введем на A(Vm) дифференцирование, которое на образующих будет действовать увеличением на единицу нижнего индекса, т.е. )' = £k+i и (nk)' = П+i. Заметим, что Ao(Vm) является дифференциальной подалгеброй.
1 Погудин Глеб Александрович — асп. каф. высшей алгебры мех.-мат. ф-та МГУ, e-mail: [email protected].