Научная статья на тему 'Робастность знаковых тестов в авторегрессии'

Робастность знаковых тестов в авторегрессии Текст научной статьи по специальности «Математика»

CC BY
93
15
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОВЕРКА ГИПОТЕЗ / HYPOTHESES TESTING / АВТОРЕГРЕССИЯ / AUTOREGRESSION / ЗНАКОВЫЕ ТЕСТЫ / SIGN TESTS / ВЫБРОСЫ / РОБАСТНОСТЬ / ROBUSTNESS / OUTLIERS

Аннотация научной статьи по математике, автор научной работы — Болдин Михаил Васильевич

Исследуется робастность знаковых тестов в авторегрессии против выбросов. Рассматривается локальная схема засорения данных аддитивными одиночными выбросами интенсивности $O(n^-1/2)$, $n$ объем данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Робастность знаковых тестов в авторегрессии»

Краткие сообщения

УДК 519.24

РОБАСТНОСТЬ ЗНАКОВЫХ ТЕСТОВ В АВТОРЕГРЕССИИ

М. В. Болдин1

Исследуется робастность знаковых тестов в авторегрессии против выбросов. Рассматривается локальная схема засорения данных аддитивными одиночными выбросами интенсивности O(nT1/'2), n — объем данных.

Ключевые слова: проверка гипотез, авторегрессия, знаковые тесты, выбросы, робаст-ность.

Robustness of sign tests in autoregression against outliers is studied. The local scheme of observations contamination by additive isolated outliers with the intensity O(n-i/2), n is the size of observations, is considered.

Key words: hypotheses testing, autoregression, sign tests, outliers, robustness.

1. Введение. Ранговые, знаково-ранговые и знаковые процедуры проверки гипотез в линейных и нелинейных конечно-параметрических моделях временных рядов составляют обширную, технически кропотливую и довольно хорошо исследованную область статистики. Эта область активно развивается как альтернатива классическим процедурам наименьших квадратов.

Настоящая работа посвящена изучению робастности (устойчивости) знаковых тестов в AR^-модели против выбросов. Непараметрические локально наиболее мощные знаковые тесты в АЛ(1)-модели были предложены в [1], распространены на АЯ(р)-модель в [2], на ARM A(p,q)-модель — в [3]. Эти тесты родственны линейным и квадратическим ранговым и знаково-ранговым тестам из [4-7]. К сожалению, фундаментальное свойство робастности против выбросов знаковых и ранговых тестов из [1-7] изучено лишь фрагментарно. В частности, в [8] рассматривались AR^-модель и наблюдения, содержащие независимые аддитивные выбросы. Интенсивность выбросов O(n-i/2), n — объем данных. Это локальный вариант хорошо известных для временных рядов схем засорения данных из [9]. В [8] установлена локальная качественная робастность знаковых тестов.

Для независимых данных различные варианты робастности ранговых тестов обсуждались очень давно. В частности, в [10] было введено определение качественной робастности тестов в нелокальной ситуации и исследованы ранговые тесты. Определение из [10] родственно известному определению качественной робастности оценок из [11]. Иная (инфинитезимальная) характеризация робастности знаковых и ранговых тестов с помощью функций влияния представлена в [12], там же можно найти библиографию.

В настоящей работе в схеме засорения данных из [8] установлена локальная качественная робастность знаковых тестов в AR(p). Это обобщение результатов [8]. Стоит отметить, что общеупотребительные тесты наименьших квадратов локальной качественной робастностью не обладают.

2. Описание модели и постановка задачи. В этой работе будем рассматривать AR^-модель

ut = fîlUt-i + ... + врUt-p + £t,t G Z, (1)

где в = (в1,..., вР)Т — неизвестный вектор; порядок p известен; {et} — н.о.р.с.в. с неизвестной ф.р. G(x), удовлетворяющей следующим условиям.

Условие (i). P (si < 0) = P (si > 0) = 1/2.

Условие (ii). Es1 = 0.

Условие (iii). Существует плотность g(x) = G'(x), g(0) > 0, g(x) непрерывна в нуле, sup^g(x) < œ.

Без дополнительных упоминаний далее предполагается, что корни характеристического уравнения по модулю меньше единицы. Обозначим через {ôt(в) = ôt} соответствующую (1) переходную функцию, тогда

St = fîiSt-i + ... + врк-р, t = 1, 2,... ; ôt = 0 для t < 0; ô0 = 1.

Если наблюдения Ui-p, ...,un суть выборка из строго стационарного решения (1), то по этим наблюдениям можно построить следующий непараметрический знаковый тест для гипотезы Ho : в = во, где вектор во = (вю,..., вРо)Т полностью известен. Пусть

1 Болдин Михаил Васильевич — канд. физ.-мат. наук, доцент каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail:

boldin m@hotmail.com.

Зк (во) = sign(ufc - вю пк-1 - ... - вроПк-р), к = 1,...,п;

п

Ты(во) = (п - *)-1 Бк-г(во)Зк (во),* = 1,...,п - 1; к=г+1

п-з-1

1зп(во) = 5г(во)(п - г - 3)Гг+],п (во), 3 = 1,...,р; г=1

1п (во) = (11 (во),...,1р(во))Т. Введем матрицу К (в) = (к^ (в))г^=1...,р, кц (в) : = Е ^0 \ (в). Матрица К (в) > 0 и пропор-

циональна знаковой информации Фишера о параметре в (см. [3]). Знаковая статистика для Но имеет вид

Ьп(во) := п-11Т(во)К-1 (во)1п(во).

Будем рассматривать локальные для Но альтернативы Н1п(т) : в = во + п-1/2т, т € Яр, тогда Но есть Н1п(0). Введем обозначения: х2(р) — распределение хи-квадрат с р степенями свободы, Х2(Р, X2) — нецентральное распределение хи-квадрат с параметром нецентральности X2, х1-а — квантиль Х2(р) уровня 1 - а, Ер(х, X2) — функция распределения Х2(Р, X2). Пусть |.| — евклидова норма.

Следующая теорема 1 — частный случай следствия 3.2 из [3].

Теорема 1. Пусть выполнены условия ^)-(ш). Тогда при Н1п(т) по распределению Ьп(во) ^ Х2(р,Х2(т)), п ^ж, где Х2(т) = \2д(0Ще1 К 1/2(во)тI2.

Гипотеза Но отвергается при Ьп(во) > х1-а- Мощность такого теста при Н1п(т) обозначим через Шп(т) := Ррп(Ьп(во) > х1-а), асимптотическая при п ^ж мощность есть Ш(т) = 1 - Ер(хР_а,Х2(т)), асимптотический уровень значимости есть а.

Далее будем предполагать, что наблюдаемые величины у1-р, ...,уп имеют вид

yt = щ + г]"г = 1 - р,...,п,п ^ р + 1. (2)

Здесь {у^} — выборка из строго стационарного решения авторегрессии (1); {¿¡"} — н.о.р.с.в., г"-[" имеет распределение Бернулли с параметром тп = шш(п-1/2^, 1), 7 ^ 0,7 неизвестно; — н.о.р.с.в. с неизвестным и произвольным распределением ¡; последовательности {у^}, {¿¡" }, независимы.

Последовательность {^} интерпретируется как последовательность грубых выбросов или засорений в данных, тп есть уровень засорения. Схема типа (2) с постоянным (не зависящим от п) уровнем засорения давно используется во временных рядах (см. [9]). Мы рассматриваем ее локальный вариант.

В схеме (2) будем изучать тестовую статистику Ьп(во), построенную по {у^ так, как Ьп(во) строится по {щ}. Пусть ШЩ(т,7,л) := Ррп(Ьп(во) > х1-а) — соответствующая мощность при Н1п(т).

Наша цель — исследовать асимптотические при п ^ж и при конечных п свойства Ьп (во) и ШЩ (т, ¡¡).

3. Формулировка результатов. Введем вектор

т

A(ß,ß) = (Ai(ß,ß),...,Ap(ß,ß))

с компонентами

p-j p-t-j

Aj (ß,ß) = ^ 5t (ß) E[1 - 2G(ßk 6)][1 - 2G(ßt+j+k 6)], ß = (ßi, . . .,ßp )T, ßo = -1,3 = 1,... ,Р. t=o k=0

Вектор A(ß, ß) будет характеризовать асимптотическое влияние засорений на знаковые тестовые статистики. Он уже появлялся в знаковом анализе авторегрессии в связи с вычислением функционала влияния знаковой оценки (см. [2, § 7.6]).

Через QT,r будем обозначать множество троек (т,Y,ß) с \т\ ^ T < со, Y ^ Г < со и произвольным ß. Теорема 2. Пусть выполнены условия (i)-(iii). Пусть верна гипотеза Hin(T). Тогда при любых 0 ^ T < с, 0 ^ Г < с 'равномерно по (т,Y,ß) Е QT,r по распределению

Lyn(ßo) ^ Х2(Р, %(т, y, ß)), n ^с,

где Х2(т, y, ß) = \2g(0)E\si\K1/2^)т + K-i/2(ßo)A(ßo,ß)Y\2.

Положим

Wy(т:= 1 - Fp(x\-a, \2у(т(3)

Теорема 2 влечет

sup \Wy(т- Wy(т

(т ,Y,^)eQT,T

т.е. Wy(тесть асимптотическая мощность знакового теста в схеме (2). Можно проверить, что

\Fp(x,X2y) - Fp(x, \У)\ < 2sup^(x)\Ai - Ау\, (4)

x

ф — стандартная гауссовская плотность. Кроме того,

sup|A,(T,7,/X)-A(T)K|K-1/2(/3o)||A(/3o)|7) (5)

т

где вектор Д(/30) = (Ai(/30),..., Ар((30))т имеет компоненты

p-j

A (ßo) = Е ¡St №q)¡(p - t - j + 1),j = 1,...,p,

t=Q

для которых sup^ \Aj(ß0, ß)\ ^ Aj(ß0). В силу (3)—(5) получаем соотношение

suplir,7,/л) -W(t)\ < v/2Ä|K-l/2{ß0)\\E{ßo)b, т

которое дает равномерные границы для асимптотических уровня и мощности знакового теста в схеме (2). При малых y эти характеристики равномерно по т, ß близки характеристикам в схеме без засорений.

В следующей теореме 3 речь идет о свойствах знакового теста при конечных n. При гипотезе Hq знаковая тестовая статистика определена для любого n ^ p + 1. При альтернативе H^(т) с ¡т¡ ^ T < с она определена при n ^ Пт := max(p + 1,nт), где Пт — такое число, что для n ^ Пт корни характеристического уравнения по модулю меньше единицы.

Теорема 3. Пусть выполнены условия (i)-(iii). Тогда:

1) при гипотезе Hq для любого e > 0 существует Yo = Yo(e) > 0, такое, что при Y < YQ для всех n ^ p +1 и произвольных ß выполнено неравенство

¡Wy(0, y, ß) - Wn(0)¡ < e;

2) при альтернативе Hin(т) с ¡т¡ ^ T < с для любого e > 0 существует Yo = Yo(e,T) > 0, такое, что при Y < YQ для всех n ^ Пт, ¡т¡ ^ T и произвольных ß выполнено неравенство

¡Wy(т,Y,ß) - Wn^)¡ < e.

В силу теоремы 3 семейство функций {Wfí(т, y, ß)} равностепенно непрерывно по y в точке y = 0, что означает локальную качественную робастность знакового теста в схеме (2) при гипотезе (т.е. робастность уровня значимости) и на локальных альтернативах.

СПИСОК ЛИТЕРАТУРЫ

1. Boldin M.V., Tyurin Yu.N. On nonparametric sign procedures in autoregression models ^ Math. Methods Statist. 1994. 3. 279-305.

2. Boldin M.V., Simonova G.I., Tyurin Yu.N. Sign-based methods in linear statistical models. Providence: Amer. Math. Soc., 1997.

3. Болдин М.В., Штуте В. О знаковых тестах в ARMA-модели с возможно бесконечной дисперсией ошибок У У Теор. вероятн. и ее примен. 2004. 49. 436-460.

4. Hallin M., Ingenbleek J.-Fr., Puri M.L. Linear and quadratic rank tests for randomness against serial dependence У У J. Time Ser. Anal. 1987. S. 409-424.

5. Hallin M., Puri M.L. Optimal rank-based procedures for time series analysis: testing an ARMA model against other ARMA models // Ann. Statist. 1988. 16. 402-432.

6. Hallin M, Puri M.L. Time series analysis via rank order theory: signed-rank tests for ARMA models //J. Multiv. Anal. 1991. 39. 1-29.

7. Hallin M, Puri M.L. Aligned rank test for linear models with autocorrelated error terms //J. Multiv. Anal. 1994. 50. 175-237.

8. Boldin M.V. Local robustness of sign tests in AR(1) against outliers // Math. Methods Statist. 2011. 20. 1-14.

9. Martin R.D., Yohai V.J. Influence functionals for time series // Ann. Statist. 1986. 14. 781-818.

10. Rieder H. Qualitative robustness of rank tests // Ann. Statist. 1982. 10. 205-211.

11. Hampel F.R. A general qualitative definition of robustness // Ann. Math. Statist. 1971. 42. 1887-1896.

12. Hampel F.R., Ronchetti E.M., Rousseeuw P.J., Stahel W.A. Robust statistics. The approach based on influence functions. N.Y.: Wiley, 1985.

Поступила в редакцию 19.05.2010

УДК 514

МЕТРИЧЕСКИЕ СВОЙСТВА ЛОМАНЫХ ПОНСЕЛЕ

Е. А. Авксентьев1

В работе получено обобщение теоремы Радича-Калимана о метрических соотношениях в ломаных Понселе, из которого выводится общий принцип нахождения условия замыкания ломаной Понселе для двух окружностей. В частности, получены явные формулы для вписано-описанных n-угольников при n = 5, 6, 8 и алгоритм отыскания таких формул для любого n.

Ключевые слова: теорема Понселе, вписано-описанный многоугольник, пучок окружностей, теоремы о замыкании, условия замыкания.

A generalization of the Radic-Kaliman theorem on metric relations in Poncelet polygonal curves is obtained in the papaer. A general principle for determination of condition for a closure of a Poncelet polygonal curve for two circles is derived from this result. In particular, explicit formulas for the inscribed-circumscribed n-gon for n = 5, 6, 8 and an algorithm for finding such formulas for all n are obtained.

Key words: Poncelet theorem, inscribed-circumscribed n-gon, pencil of circles, closure theorems, closure conditions.

1. Введение. Теорема, открытая Ж.-В. Понселе в 1814 г. [1], представляет собой альтернативу, согласно которой вписано-описанная ломаная двух коник либо замыкается для любой, либо не замыкается ни для какой начальной точки, причем в случае замыкания число звеньев всегда одинаковое. Если некоторым проективным преобразованием можно перевести эти коники в концентрические окружности, то утверждение теоремы становится очевидным, однако такого преобразования в общем случае не существует. Например, две неконцентрические окружности нельзя перевести в концентрические, ибо все окружности в однородных координатах проходят через точки (1, ±i, 0) бесконечно удаленной комплексной прямой (см. [2, гл. XXII, § 2]), а концентрические окружности, и только они, касаются в этих точках друг друга. Есть множество обобщений и следствий этой замечательной теоремы, которые нашли применения в классической геометрии, теории алгебраических кривых, дифференциальных уравнениях и т.д. (см. работы [3-5] и библиографию в них). Еще одна задача, которую называют поризмом Понселе, звучит так: каким должно быть соотношение между параметрами, характеризующими две коники, чтобы для них существовала вписано-описанная n-звенная ломаная? А. Кэли нашел явное условие на уравнения двух коник c таким свойством [6, 7]. Однако попытки применить его формулы в простейшем случае для двух окружностей приводят к очень громоздким вычислениям уже для n = 4.

1 Авксентьев Евгений Александрович — студ. каф. общих проблем управления мех.-мат. ф-та. МГУ, e-mail: avksentjev@mail.ru.

i Надоели баннеры? Вы всегда можете отключить рекламу.