Краткие сообщения
УДК 519.24
РОБАСТНОСТЬ ЗНАКОВЫХ ТЕСТОВ В АВТОРЕГРЕССИИ
М. В. Болдин1
Исследуется робастность знаковых тестов в авторегрессии против выбросов. Рассматривается локальная схема засорения данных аддитивными одиночными выбросами интенсивности O(nT1/'2), n — объем данных.
Ключевые слова: проверка гипотез, авторегрессия, знаковые тесты, выбросы, робаст-ность.
Robustness of sign tests in autoregression against outliers is studied. The local scheme of observations contamination by additive isolated outliers with the intensity O(n-i/2), n is the size of observations, is considered.
Key words: hypotheses testing, autoregression, sign tests, outliers, robustness.
1. Введение. Ранговые, знаково-ранговые и знаковые процедуры проверки гипотез в линейных и нелинейных конечно-параметрических моделях временных рядов составляют обширную, технически кропотливую и довольно хорошо исследованную область статистики. Эта область активно развивается как альтернатива классическим процедурам наименьших квадратов.
Настоящая работа посвящена изучению робастности (устойчивости) знаковых тестов в AR^-модели против выбросов. Непараметрические локально наиболее мощные знаковые тесты в АЛ(1)-модели были предложены в [1], распространены на АЯ(р)-модель в [2], на ARM A(p,q)-модель — в [3]. Эти тесты родственны линейным и квадратическим ранговым и знаково-ранговым тестам из [4-7]. К сожалению, фундаментальное свойство робастности против выбросов знаковых и ранговых тестов из [1-7] изучено лишь фрагментарно. В частности, в [8] рассматривались AR^-модель и наблюдения, содержащие независимые аддитивные выбросы. Интенсивность выбросов O(n-i/2), n — объем данных. Это локальный вариант хорошо известных для временных рядов схем засорения данных из [9]. В [8] установлена локальная качественная робастность знаковых тестов.
Для независимых данных различные варианты робастности ранговых тестов обсуждались очень давно. В частности, в [10] было введено определение качественной робастности тестов в нелокальной ситуации и исследованы ранговые тесты. Определение из [10] родственно известному определению качественной робастности оценок из [11]. Иная (инфинитезимальная) характеризация робастности знаковых и ранговых тестов с помощью функций влияния представлена в [12], там же можно найти библиографию.
В настоящей работе в схеме засорения данных из [8] установлена локальная качественная робастность знаковых тестов в AR(p). Это обобщение результатов [8]. Стоит отметить, что общеупотребительные тесты наименьших квадратов локальной качественной робастностью не обладают.
2. Описание модели и постановка задачи. В этой работе будем рассматривать AR^-модель
ut = fîlUt-i + ... + врUt-p + £t,t G Z, (1)
где в = (в1,..., вР)Т — неизвестный вектор; порядок p известен; {et} — н.о.р.с.в. с неизвестной ф.р. G(x), удовлетворяющей следующим условиям.
Условие (i). P (si < 0) = P (si > 0) = 1/2.
Условие (ii). Es1 = 0.
Условие (iii). Существует плотность g(x) = G'(x), g(0) > 0, g(x) непрерывна в нуле, sup^g(x) < œ.
Без дополнительных упоминаний далее предполагается, что корни характеристического уравнения по модулю меньше единицы. Обозначим через {ôt(в) = ôt} соответствующую (1) переходную функцию, тогда
St = fîiSt-i + ... + врк-р, t = 1, 2,... ; ôt = 0 для t < 0; ô0 = 1.
Если наблюдения Ui-p, ...,un суть выборка из строго стационарного решения (1), то по этим наблюдениям можно построить следующий непараметрический знаковый тест для гипотезы Ho : в = во, где вектор во = (вю,..., вРо)Т полностью известен. Пусть
1 Болдин Михаил Васильевич — канд. физ.-мат. наук, доцент каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail:
boldin [email protected].
Зк (во) = sign(ufc - вю пк-1 - ... - вроПк-р), к = 1,...,п;
п
Ты(во) = (п - *)-1 Бк-г(во)Зк (во),* = 1,...,п - 1; к=г+1
п-з-1
1зп(во) = 5г(во)(п - г - 3)Гг+],п (во), 3 = 1,...,р; г=1
1п (во) = (11 (во),...,1р(во))Т. Введем матрицу К (в) = (к^ (в))г^=1...,р, кц (в) : = Е ^0 \ (в). Матрица К (в) > 0 и пропор-
циональна знаковой информации Фишера о параметре в (см. [3]). Знаковая статистика для Но имеет вид
Ьп(во) := п-11Т(во)К-1 (во)1п(во).
Будем рассматривать локальные для Но альтернативы Н1п(т) : в = во + п-1/2т, т € Яр, тогда Но есть Н1п(0). Введем обозначения: х2(р) — распределение хи-квадрат с р степенями свободы, Х2(Р, X2) — нецентральное распределение хи-квадрат с параметром нецентральности X2, х1-а — квантиль Х2(р) уровня 1 - а, Ер(х, X2) — функция распределения Х2(Р, X2). Пусть |.| — евклидова норма.
Следующая теорема 1 — частный случай следствия 3.2 из [3].
Теорема 1. Пусть выполнены условия ^)-(ш). Тогда при Н1п(т) по распределению Ьп(во) ^ Х2(р,Х2(т)), п ^ж, где Х2(т) = \2д(0Ще1 К 1/2(во)тI2.
Гипотеза Но отвергается при Ьп(во) > х1-а- Мощность такого теста при Н1п(т) обозначим через Шп(т) := Ррп(Ьп(во) > х1-а), асимптотическая при п ^ж мощность есть Ш(т) = 1 - Ер(хР_а,Х2(т)), асимптотический уровень значимости есть а.
Далее будем предполагать, что наблюдаемые величины у1-р, ...,уп имеют вид
yt = щ + г]"г = 1 - р,...,п,п ^ р + 1. (2)
Здесь {у^} — выборка из строго стационарного решения авторегрессии (1); {¿¡"} — н.о.р.с.в., г"-[" имеет распределение Бернулли с параметром тп = шш(п-1/2^, 1), 7 ^ 0,7 неизвестно; — н.о.р.с.в. с неизвестным и произвольным распределением ¡; последовательности {у^}, {¿¡" }, независимы.
Последовательность {^} интерпретируется как последовательность грубых выбросов или засорений в данных, тп есть уровень засорения. Схема типа (2) с постоянным (не зависящим от п) уровнем засорения давно используется во временных рядах (см. [9]). Мы рассматриваем ее локальный вариант.
В схеме (2) будем изучать тестовую статистику Ьп(во), построенную по {у^ так, как Ьп(во) строится по {щ}. Пусть ШЩ(т,7,л) := Ррп(Ьп(во) > х1-а) — соответствующая мощность при Н1п(т).
Наша цель — исследовать асимптотические при п ^ж и при конечных п свойства Ьп (во) и ШЩ (т, ¡¡).
3. Формулировка результатов. Введем вектор
т
A(ß,ß) = (Ai(ß,ß),...,Ap(ß,ß))
с компонентами
p-j p-t-j
Aj (ß,ß) = ^ 5t (ß) E[1 - 2G(ßk 6)][1 - 2G(ßt+j+k 6)], ß = (ßi, . . .,ßp )T, ßo = -1,3 = 1,... ,Р. t=o k=0
Вектор A(ß, ß) будет характеризовать асимптотическое влияние засорений на знаковые тестовые статистики. Он уже появлялся в знаковом анализе авторегрессии в связи с вычислением функционала влияния знаковой оценки (см. [2, § 7.6]).
Через QT,r будем обозначать множество троек (т,Y,ß) с \т\ ^ T < со, Y ^ Г < со и произвольным ß. Теорема 2. Пусть выполнены условия (i)-(iii). Пусть верна гипотеза Hin(T). Тогда при любых 0 ^ T < с, 0 ^ Г < с 'равномерно по (т,Y,ß) Е QT,r по распределению
Lyn(ßo) ^ Х2(Р, %(т, y, ß)), n ^с,
где Х2(т, y, ß) = \2g(0)E\si\K1/2^)т + K-i/2(ßo)A(ßo,ß)Y\2.
Положим
Wy(т:= 1 - Fp(x\-a, \2у(т(3)
Теорема 2 влечет
sup \Wy(т- Wy(т
(т ,Y,^)eQT,T
т.е. Wy(тесть асимптотическая мощность знакового теста в схеме (2). Можно проверить, что
\Fp(x,X2y) - Fp(x, \У)\ < 2sup^(x)\Ai - Ау\, (4)
x
ф — стандартная гауссовская плотность. Кроме того,
sup|A,(T,7,/X)-A(T)K|K-1/2(/3o)||A(/3o)|7) (5)
т
где вектор Д(/30) = (Ai(/30),..., Ар((30))т имеет компоненты
p-j
A (ßo) = Е ¡St №q)¡(p - t - j + 1),j = 1,...,p,
t=Q
для которых sup^ \Aj(ß0, ß)\ ^ Aj(ß0). В силу (3)—(5) получаем соотношение
suplir,7,/л) -W(t)\ < v/2Ä|K-l/2{ß0)\\E{ßo)b, т
которое дает равномерные границы для асимптотических уровня и мощности знакового теста в схеме (2). При малых y эти характеристики равномерно по т, ß близки характеристикам в схеме без засорений.
В следующей теореме 3 речь идет о свойствах знакового теста при конечных n. При гипотезе Hq знаковая тестовая статистика определена для любого n ^ p + 1. При альтернативе H^(т) с ¡т¡ ^ T < с она определена при n ^ Пт := max(p + 1,nт), где Пт — такое число, что для n ^ Пт корни характеристического уравнения по модулю меньше единицы.
Теорема 3. Пусть выполнены условия (i)-(iii). Тогда:
1) при гипотезе Hq для любого e > 0 существует Yo = Yo(e) > 0, такое, что при Y < YQ для всех n ^ p +1 и произвольных ß выполнено неравенство
¡Wy(0, y, ß) - Wn(0)¡ < e;
2) при альтернативе Hin(т) с ¡т¡ ^ T < с для любого e > 0 существует Yo = Yo(e,T) > 0, такое, что при Y < YQ для всех n ^ Пт, ¡т¡ ^ T и произвольных ß выполнено неравенство
¡Wy(т,Y,ß) - Wn^)¡ < e.
В силу теоремы 3 семейство функций {Wfí(т, y, ß)} равностепенно непрерывно по y в точке y = 0, что означает локальную качественную робастность знакового теста в схеме (2) при гипотезе (т.е. робастность уровня значимости) и на локальных альтернативах.
СПИСОК ЛИТЕРАТУРЫ
1. Boldin M.V., Tyurin Yu.N. On nonparametric sign procedures in autoregression models ^ Math. Methods Statist. 1994. 3. 279-305.
2. Boldin M.V., Simonova G.I., Tyurin Yu.N. Sign-based methods in linear statistical models. Providence: Amer. Math. Soc., 1997.
3. Болдин М.В., Штуте В. О знаковых тестах в ARMA-модели с возможно бесконечной дисперсией ошибок У У Теор. вероятн. и ее примен. 2004. 49. 436-460.
4. Hallin M., Ingenbleek J.-Fr., Puri M.L. Linear and quadratic rank tests for randomness against serial dependence У У J. Time Ser. Anal. 1987. S. 409-424.
5. Hallin M., Puri M.L. Optimal rank-based procedures for time series analysis: testing an ARMA model against other ARMA models // Ann. Statist. 1988. 16. 402-432.
6. Hallin M, Puri M.L. Time series analysis via rank order theory: signed-rank tests for ARMA models //J. Multiv. Anal. 1991. 39. 1-29.
7. Hallin M, Puri M.L. Aligned rank test for linear models with autocorrelated error terms //J. Multiv. Anal. 1994. 50. 175-237.
8. Boldin M.V. Local robustness of sign tests in AR(1) against outliers // Math. Methods Statist. 2011. 20. 1-14.
9. Martin R.D., Yohai V.J. Influence functionals for time series // Ann. Statist. 1986. 14. 781-818.
10. Rieder H. Qualitative robustness of rank tests // Ann. Statist. 1982. 10. 205-211.
11. Hampel F.R. A general qualitative definition of robustness // Ann. Math. Statist. 1971. 42. 1887-1896.
12. Hampel F.R., Ronchetti E.M., Rousseeuw P.J., Stahel W.A. Robust statistics. The approach based on influence functions. N.Y.: Wiley, 1985.
Поступила в редакцию 19.05.2010
УДК 514
МЕТРИЧЕСКИЕ СВОЙСТВА ЛОМАНЫХ ПОНСЕЛЕ
Е. А. Авксентьев1
В работе получено обобщение теоремы Радича-Калимана о метрических соотношениях в ломаных Понселе, из которого выводится общий принцип нахождения условия замыкания ломаной Понселе для двух окружностей. В частности, получены явные формулы для вписано-описанных n-угольников при n = 5, 6, 8 и алгоритм отыскания таких формул для любого n.
Ключевые слова: теорема Понселе, вписано-описанный многоугольник, пучок окружностей, теоремы о замыкании, условия замыкания.
A generalization of the Radic-Kaliman theorem on metric relations in Poncelet polygonal curves is obtained in the papaer. A general principle for determination of condition for a closure of a Poncelet polygonal curve for two circles is derived from this result. In particular, explicit formulas for the inscribed-circumscribed n-gon for n = 5, 6, 8 and an algorithm for finding such formulas for all n are obtained.
Key words: Poncelet theorem, inscribed-circumscribed n-gon, pencil of circles, closure theorems, closure conditions.
1. Введение. Теорема, открытая Ж.-В. Понселе в 1814 г. [1], представляет собой альтернативу, согласно которой вписано-описанная ломаная двух коник либо замыкается для любой, либо не замыкается ни для какой начальной точки, причем в случае замыкания число звеньев всегда одинаковое. Если некоторым проективным преобразованием можно перевести эти коники в концентрические окружности, то утверждение теоремы становится очевидным, однако такого преобразования в общем случае не существует. Например, две неконцентрические окружности нельзя перевести в концентрические, ибо все окружности в однородных координатах проходят через точки (1, ±i, 0) бесконечно удаленной комплексной прямой (см. [2, гл. XXII, § 2]), а концентрические окружности, и только они, касаются в этих точках друг друга. Есть множество обобщений и следствий этой замечательной теоремы, которые нашли применения в классической геометрии, теории алгебраических кривых, дифференциальных уравнениях и т.д. (см. работы [3-5] и библиографию в них). Еще одна задача, которую называют поризмом Понселе, звучит так: каким должно быть соотношение между параметрами, характеризующими две коники, чтобы для них существовала вписано-описанная n-звенная ломаная? А. Кэли нашел явное условие на уравнения двух коник c таким свойством [6, 7]. Однако попытки применить его формулы в простейшем случае для двух окружностей приводят к очень громоздким вычислениям уже для n = 4.
1 Авксентьев Евгений Александрович — студ. каф. общих проблем управления мех.-мат. ф-та. МГУ, e-mail: [email protected].