Научная статья на тему 'Робастность GM-тестов в авторегресии против выбросов'

Робастность GM-тестов в авторегресии против выбросов Текст научной статьи по специальности «Математика»

CC BY
58
11
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РОБАСТНОСТЬ / ROBUSTNESS / ПРОВЕРКА ГИПОТЕЗ / АВТОРЕГРЕССИЯ / AUTOREGRESSION / GM-ОЦЕНКИ / GM-ТЕСТЫ / CONJECTURE CHECKING / GM-ESTIMATORS / GM-TESTS

Аннотация научной статьи по математике, автор научной работы — Есаулов Даниил Михайлович

В статье рассматриваются свойства GM-оценок и GM-тестов для проверки линейных гипотез в AR(p)-модели в случае, когда наблюдения содержат грубые ошибки (выбросы). В частности, найдено предельное распределение тестовых статистик, что позволяет установить робастность GM-тестов. Рассматривается схема с аддитивными одиночными выбросами интенсивности O(n^{-1/2}), n объем данных.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Текст научной работы на тему «Робастность GM-тестов в авторегресии против выбросов»

Краткие сообщения

УДК 519.233.3, 519.246.8

РОБАСТНОСТЬ GM-ТЕСТОВ В АВТОРЕГРЕССИИ ПРОТИВ ВЫБРОСОВ

Д. М. Есаулов1

В статье рассматриваются свойства GM-оценок и GM-тестов для проверки линейных гипотез в ЛИ^)-модели в случае, когда наблюдения содержат грубые ошибки (выбросы). В частности, найдено предельное распределение тестовых статистик, что позволяет установить робастность GM-тестов. Рассматривается схема с аддитивными одиночными выбросами интенсивности O(n-1/2), n — объем данных.

Ключевые слова: робастность, проверка гипотез, авторегрессия, GM-оценки, GM-тесты.

The article deals with properties of GM-estimators and GM-tests for linear hypotheses in AR(p)-processes when the observations contain outliers. In particular, we obtain the marginal distribution of test statistics, which allows us to prove the robustness of these GM-tests. The scheme of data contamination by additive single outliers with the intensity O(n-1/2), where n is the data level, is considered.

Key words: robustness, conjecture checking, autoregression, GM-estimators, GM-tests.

1. Введение. В статье рассматривается проверка линейных гипотез в авторегрессии в случае, когда наблюдения содержат грубые ошибки (выбросы). Выбросы предполагаются независимыми, аддитивными, с интенсивностью 7n = min(1, n-l/27), 7 ^ 0, параметр 7 неизвестен. Это локальный вариант известной схемы засорения данных из [1]. Тесты строятся на основе GM-оценок параметров модели. В стандартной ситуации (т.е. при отсутствии засорений) подобные оценки детально изучены в [2].

Робастность тестов будет характеризоваться равностепенной непрерывностью семейства предельных мощностей по переменной 7. Равностепенная непрерывность — ключевой момент в определении робастности статистических оценок и статистических тестов. Качественная робастность оценок для случая независимых данных была определена в [3], затем это понятие было распространено на временные ряды [4]. Качественная робастность тестов для независимых данных была исследована в [5]. В отличие от упомянутых работ мы рассматриваем задачу в локальной схеме засорения данных. Наша постановка задачи родственна исследованию робастности тестов для случая независимых данных с помощью функций влияния (см. [6, гл. 2]).

2. Предварительные сведения и постановка задачи. Рассмотрим модель авторегрессии

Ut = Ut-I + ... + PpUt-p + £t, t e Z . (1)

Здесь {£t, t e Z} — н.о.р. случайные величины E£i = 0, e4 < ж. Обозначим в = (в1,...,вр)T. Будем предполагать, что неслучайные коэффициенты в\, ...,вр таковы, что корни характеристического уравнения

xp = вгхр-1 + ... + вр

по модулю меньше единицы.

Тогда (см. [7, гл. 2]) существует п.н. единственное, строго стационарное решение уравнения (1). По выборке U\-p,U2-p, ...,un из этого решения можно построить GM-оценки параметра в. А именно пусть для заранее выбранных функций ф и ф

n

Lnj (в) := n-1/2J2 <fi(Ut-j )Ф(п - OiUt-i - ... - врЩ-р) t=i

1(1/), ..., Lnp(V)^T

векторного уравнения

и вектор Ln(e) := (Lni(e),..., Lnp(e))T. Тогда последовательность GM-оценок определяется как решение

Ьп(в) = 0 (2)

(детали см. в [2, гл. 7]).

1 Есаулов Даниил Михайлович — асп. каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail: daniel.yesaulov@gmail.com.

Важным свойством GM-оценок является их асимптотическая гауссовость (см. [2, гл. 7]). А именно пусть (Зп — у^-состоятельное решение (2). Пусть ..., — выборка из строго стационарного решения уравнения (1) при в = во. Обозначим

( Е<?(п_) ... Е^Мп—) \ (В (<р(Щ> Щ) ... Е(<рЩ )п°1-р)\

К := Еф2(ег)

Еф^МЩ,) ...Е<р(п0_1 Мп\_р)

С := Еф1 (ег)

\Е^(п\-р)^(п0) ... Е^(п0-р) ) \Е(<р(Щ-р)п_) ...Е(<р(Щ-р)п\-р

Е(ф0-1)и0) ...Е(ф\ )и_-р) \Е(^(п01-р)п0_) ...Е(^(п°1-р)п°1-р);

М^ := С-*К(С"1 )т. (3)

Тогда

п1/2(@п — вп) ^ N(0, М^), п ^ж.

На основе этих GM-оценок можно построить тест для проверки линейных гипотез относительно вектора в. Если представить вТ = (в(1 , в(2 ), где векторы в(г), Ъ = 1, 2, имеют размерности т и р — т соответственно (1 ^ т < р), то линейная гипотеза имеет вид Н_ : в(2 = . Здесь — известный вектор, а в(1 — неизвестный (мешающий) параметр. Введем локальные альтернативы Н1П(т) : в = вп = в0 + п-1/2т, где вТ = (в(1^Т, ), тт = (т(1)Т, т(2)Т) е Мр — постоянный вектор с подвекторами размерности т и р — т соответственно. Таким образом, мы допускаем, что неизвестный параметр в« при альтернативах Н1п(т) меняется на величину порядка 0(п—1/2).

В работе рассматривается ситуация, когда наблюдения в (1) содержат выбросы, так что в результате имеем вектор наблюдений Yn = (у1-р,..., уп) с

Уь = щ + ¿¡" (ь, t = 1 — р,...,п. (4)

Здесь [г]" } — н.о.р. случайные величины, ¿1" ~ В\(1,^п), уровень засорения 7п = шт(1,п—1/2 7), 7 ^ 0, параметр 7 неизвестен; {(ь} — н.о.р. случайные величины с неизвестным распределением ц из класса М.2 распределений с конечным вторым моментом; последовательности {еь}, {г1" }, {(ь} предполагаются независимыми между собой. Это локальный вариант схемы засорения из [1].

Для схемы (4) GM-оценка вектора в и соответствующий GM-тест строятся по Yn. При этом GM-оценка является решением векторного уравнения

¿П (в) = 0, (5)

где ¿П строится по У1-р, ...,уп так же, как Ьп строится по П1-р,..., пп.

Цель работы — изучить свойства GM-оценок и тестов в схеме (4). Мы найдем асимптотическое при п ^ ж распределение оценок при гипотезе и локальных альтернативах, а также асимптотические мощности соответствующих тестов. Семейство этих предельных мощностей окажется равностепенно непрерывным по 7.

3. Формулировка результатов. Пусть ц — произвольная случайная величина, а ст-алгебра определяется следующим образом:

•Ь—1 := ст{(1—р,(2—р,...,(Ь; г1—р,г2—р,...,г1; ; е1—р, е2—р, . .., еЬ—1}.

Введем функцию фь(п) := Е(ф(еь + ). Обозначим

р

ь3 := Еф0— + (2—3 )ф2 (—Р_з (2—3 ) + Еф°2Ч )Еф(е1 + Ы+ X] Еф^ )Еф(е2 — в_г (2—г),

г=1, г=3

и := (и1 ,...,ир)Т.

Обозначим также := 1 ■ и.

Теорема 1. Пусть верна альтернатива Н1п(т). Пусть выполнены следующие условия:

функции ф и ф ограничены, ф непрерывно дифференцируема с ограниченной производной ф', а ф дважды непрерывно дифференцируема с ограниченными производными; (Ь) Еф(ег) = 0, Еф'(е 1) ф О, ЕЦ < оо7 С ф 0.

Тогда с вероятностью, стремящейся к 1, система уравнений (5) имеет у/п-состоятелъное решение Зп,у, для которого

п1/2фп,у - вп) ^ N(а^ф, М^), п ^ж. Матрица М^ определена в (3).

Представим (Зпу в виде (Зпу = (ЗПУ , ЗпУ ), где ЗПУ ^ = 1 2, имеют размерности т и р — т соответственно. Пусть Т^ — такая матрица размерности (р — т) х (р — т), что

__I

'■= I вт т

а а(2) — вектор размерности р — т, такой, что = (а(1^Т, а(2^Т).

Следствие 1. Пусть выполнены условия теоремы 1. Тогда

n1/2(&& - в™) - N(a(2), J^), n ^ж.

Теперь перейдем к тестам, построенным на основе GM-оценок. Пусть J^ — произвольная состоятельная оценка ковариационной матрицы . В качестве последовательности тестовых статистик возьмем

TY := n • (^ - в02))Т^)-1(J& - в02)).

Обозначим нецентральное распределение хи-квадрат с p-m степенями свободы и параметром нецентральности Л2 через Х2(Р - m, X2), а соответствующую функцию распределения — через Fp-m(x, X2). Следствие 2. Пусть выполнены условия теоремы 1. Тогда

mY d 2/ \2\

Tn ^ Х (p - m,X ), n ^ж,

где параметр нецентральности X2 = \т(2) + a(2^>\2.

Мощность теста, основанного на TY, при альтернативе Hin(т) есть Wn(т,7,ц) = Ppn(TY > xP—m), где XP—m — (1 - а)-квантиль распределения центрального x2 (p - m). В силу следствия 2

lim Wn(T,7,V) = W(т,7,v) = 1 - Fp-m(xP-m,X2),

n—

и тест имеет асимптотический уровень значимости а. Пусть Wn(т) — мощность статистического теста в схеме (1) без засорений. Тогда в силу следствия 2 существует limn—TO Wn(т) = W(т) := W(т, 0,ц). Пусть | — евклидова норма матрицы или вектора. Теорема 2. Пусть выполнены условия теоремы 1. Тогда

sup \W(т, 7, ц) - W(т)\ < (2/п)1/2 |C-1| \и\7.

В силу теоремы 2 при фиксированном т семейство предельных мощностей {W(т,7,Ц)}^еШ2 равностепенно непрерывно по 7 в точке 7 = 0. Полученное свойство равностепенной непрерывности, во-первых, характеризует асимптотическую робастность GM-тестов, а во-вторых, является важным шагом в доказательстве локальной качественной робастности GM-тестов. Локальная качественная робастность тестов в схеме (4) характеризуется равностепенной непрерывностью по 7 семейства мощностей {Wn(т,7,ц)} в точке 7 = 0. Определение локальной качественной робастности см. в [8].

СПИСОК ЛИТЕРАТУРЫ

1. Martin R.D., Yohai V.J. Influence functionals for time series // Ann. Statist. 1986. 14. 781-818.

2. Koul H.L. Weighted empiricals and linear models // IMS Lect. Notes. Monograph Series. Vol. 21. Hayward, CA, 1992.

3. Hampel F.R. A general qualitive definition of robustness // Ann. Statist. 1971. 42. 1887-1896.

4. Boente G., Fraiman R., Yohai V.J. Qualitive robustness for stochastic processes // Ann. Statist. 1987. 15. 1293-1312.

5. Reider H. Qualitive robustness of rank tests // Ann. Statist. 1982. 10. 205-211.

6. Hampel F.R., Ronchetti E.M., Rousseeuw J., Stahel W.A. Robust statistics. The approach based on influence functions. N.Y.: Wiley, 1985.

7. Brockwell P.J., Davis R.A. Time series analysis: Theory and methods. N.Y.: Springer-Verlag, 1991.

8. Boldin M.V. Local robustness of sign tests in AR(1) against outliers // Math. Methods Statist. 2011. 20. 2-22.

Поступила в редакцию 15.12.2010

УДК 519.21

РАВНОМЕРНАЯ ОЦЕНКА ЭКСТРЕМАЛЬНОГО ИНДЕКСА СТОХАСТИЧЕСКИХ РЕКУРРЕНТНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ

А. А. Голдаева1

В работе найдена равномерная оценка сверху экстремального индекса некоторых стохастических рекуррентных последовательностей. Для этого был использован новый подход, который состоит в рассмотрении последовательностей наблюдений (в детерминированные или случайные моменты времени) процесса с непрерывным временем, заданного стохастическим дифференциальным уравнением.

Ключевые слова: экстремальный индекс, индекс хвоста, стохастические разностные уравнения, стохастические дифференциальные уравнения.

A uniform upper bound of the extremal index of some stochastic recurrent sequences is obtained in the paper. We used a new approach consisting in the consideration of sequences of observations (in deterministic or random moments of time) of a continuous time process given by a stochastic differential equation.

Key words: extremal index, tail index, stochastic difference equations, stochastic differential equations.

1. Bведение. Рассмотрим процесс Yn, n ^ 1, удовлетворяющий стохастическому разностному уравнению

Yn = An Yn-1 + Bn, n ^ 1, Yo ^ 0, (1)

где (An,Bn), n ^ 1, — независимые, одинаково распределенные пары неотрицательных случайных величин.

Известно, что стационарные процессы вида (1) при довольно общих условиях обладают двумя важными свойствами, относящимися к поведению их экстремумов: стационарное распределение имеет степенной хвост, а максимум M;^ = max[Y\,..., Yn} при n ^ж растет асимптотически, как максимум [вч\ независимых случайных величин с тем же распределением, где в есть экстремальный индекс процесса Yn.

Напомним [1], что стационарная случайная последовательность Yn с маргинальной функцией распределения G(x) имеет экстремальный индекс в, если для любого т > 0 существует такая последовательность Пп(т), что:

1) nG(un(T)) ^ т при n ^ж;

2) P(MY < Un(T)) ^ ехр(—вт), n ^ж.

Процессы (1) изучаются начиная с работы [2]. В работе [3], которая посвящена исследованию двух числовых характеристик — индекса хвоста к и экстремального индекса в, найдены общие формулы для них, но они не дают ответа в явном виде и результат может быть получен только численно. Так, в [3] доказана

Теорема A [3]. Пусть процесс Yn, n ^ 1, удовлетворяет уравнению (1), пусть

1) существует такое число к > 0, что E Af = 1, E Af ln+ A\ < ж, 0 < E BK < ж;

2) распределение B\/(1 — A\) невырожденное, а распределение ln A\ при условии, что A\ = 0, не решетчатое.

1 Голдаева Анна Алексеевна — ассист. каф. теории вероятностей мех.-мат. ф-та МГУ, e-mail: gold_ann@list.ru.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.