НАУЧНОЕ ИЗДАНИЕ МГТУ ИМ. Н. Э. БАУМАНА
НАУКА и ОБРАЗОВАНИЕ
Эл № ФС77 - 48211. Государственная регистрация №0421200025. ISSN 1994-0408
электронный научно-технический журнал
Робастность оценки коэффициентов уравнения
пространственной авторегрессии,
основанной на знаковых критериях
# 04, апрель 2013
DOI: 10.7463/0413.0569036
Горяинов В. Б., Горяинова Е. Р.
УДК 519.12
Россия, МГТУ им. Н.Э. Баумана Россия, НИУ ВШЭ vb-goryainov@mail.ru el-goryainova@mail.ru
1. Введение
Рассмотрим модель пространственной авторегрессии — стационарное поле Xij на прямоугольной целочисленной плоской решетке, описываемое рекуррентным соотношением
Xij = aioXj-ij + aoiXi,j-i + anXi-1,— + e^, i, j = 0, ±1, ±2, ... (1)
Модель пространственной авторегрессии широко используется в цифровой обработке изображений для устранения дефектов при редактировании изображений. С математической точки зрения проблема заключается в разработке таких методов оценивания вектора коэффициентов a = (a10, a01, a11) по наблюдениям Xij, точность которых, в отличие от метода наименьших квадратов, слабо зависит от предположений о вероятностном распределении поля eij.
Одним из таких методов является знаковый метод [1]. В работе [2] предложена оценка параметра a, основанная на знаках остатков
eij (a) = Xij — a10Xi-1,j — a01 Xi,j-1 — a11Xi-1,j-1.
Там же при помощи компьютерного моделирования показано ее преимущество над оценкой наименьших квадратов при измерении поля Xij с аномально большими ошибками, имитирующими сбой измерительной аппаратуры.
В данной работе получено аналитическое выражение для функционала влияния знаковой оценки, который является теоретической характеристикой устойчивости (робастно-сти) оценки к ошибкам наблюдений поля Xij. Функционал влияния показывает, насколько сильно изменится оценка при добавлении к выборке достаточно большого объема еще од-
ного наблюдения. Если это изменение в принципе не может быть сколь угодно большим, то оценка называется робастной. Анализ функционала влияния показал преимущество знаковой оценки над оценкой наименьших квадратов при измерении Ху с аномально большими ошибками.
Функционал влияния впервые появился в работе [3] для описания робастных свойств оценок параметров авторегрессионных временных рядов. Функционал влияния является обобщением на временные ряды таких понятий, как кривая чувствительности и функция влияния, которые описывают робастные свойства оценок параметров в одно- и двувыбороч-ных моделях сдвига и масштаба [4, 5].
2. Постановка задачи
Рассмотрим поле (1), где еу — независимые одинаково распределенные случайные величины с нулевым математическим ожиданием Ееу = 0 и неизвестной функцией распределения ^, а = (а10, а01, Яц) — неизвестный вектор параметров. Достаточные условия стационарности поля (1) приведены в [6, 7].
Пусть Ху, г = 0, ..., т, ] = 0, ..., п, — наблюдаемая реализация поля (1). Обозначим
. , , /-1, х < 0;
8ЩП(Ж) = <
[ 1, х > 0. Перейдем от наблюдений Ху к знакам остатков
Бу (а) = sigп(еij (а)), г = 1, ..., т, ] = 1, ..., п.
Пусть а0 = (а10, а°°1, а11) — некоторый известный вектор.
В [2] на основе знаков остатков Бу (а) построены локально наиболее мощные критерии проверки гипотезы
Н0 : а = а0
против односторонних альтернатив Н+ и Н-, (р, д) е! = {(1, 0), (0,1), (1,1)}, вида
Н+ : ап > а°д, аы = а£г для любых (к,1) = (р,д), Н_ : ард < а°д, аы = а£г для любых (к,1) = (р,д),
которые выглядят следующим образом.
Определим множество {8у(а)} рекуррентным соотношением
8у (а) = аю^г_1,у- (а) + а01^_1 (а) + аи^_1у_1(а), г, ] = 1, 2, ..., (2)
с граничными условиями
800(а) = 1, 8Ы(а) = (аю)й, к > 0, 801 (а) = (а01)1, I > 0,
8у (а) = 0, г < 0 или ^ < 0. (3)
Обозначим
m n
Zj (a) = X y^ Sfci(a)Sfc-i,i-j (a), i = 0, 1, ..., m, j = 0, 1, ...,n;
m— i—p n— i—q
Wq(a) = X X] (a)Zi+p,j+q(a), (p,q) Gl; i=0 j=0
W(a) = (Wio(a), Woi(a), Wn(a)). Теорема 1. Пусть
1 - a%zi - a0iZ2 - a0iziz2 = 0, |zi| < 1, |z21 < 1, (4)
а функция распределения F(x) и плотность распределения вероятности f (x) случайных величин удовлетворяют условиям
F (0) = 1, (5)
f (0) > 0, (6)
E(eii) = 0, (7)
E[|f (tfuXn) - f (0)||Xn|] ^ 0 при u ^ 0 для любого tf G (0,1). (8)
Тогда локально наиболее мощный знаковый критерий отклоняет Н0 в пользу Н+, если
Wpq(a0) >C+, (p,q) GI, (9)
и принимает в противном случае. Постоянная C+ определяется уровнем значимости а критерия.
Теорема 2. В условиях теоремы 1 локально наиболее мощный знаковый критерий отклоняет Н0 в пользу Н—, если
Wpq(a0) <C" , (p,q) GI, (10)
и принимает в противном случае. Постоянная C— определяется уровнем значимости а критерия.
Доказательство теорем 1 и 2 приведено в [2].
Теоремы 1 и 2 показывают, что небольшие значения |Wpq (a0)| свидетельствуют в пользу Н0, а большие — в пользу Н+ или Н—. Это позволяет определить знаковую оценку параметра a как решение системы уравнений
Wpq(a) = 0, (p,q) GI.
Точное решение этого уравнения ввиду разрывности функций Wpq(a), вообще говоря, не существует, поэтому знаковой оценкой a естественно считать точку минимума функции | W (a) |.
Предположим теперь, что вместо авторегрессионного поля Xij наблюдается поле Yj вида
Yij = Xij + vij (ij, (11)
где Zj — независимые одинаково распределенные случайные величины, а vij — независимые бернуллиевские случайные величины, принимающие значения 1 и 0 с вероятностями ö и 1 — ö соответственно, 0 < ö < 1. Предположим, что поля eij, vij и Zj не зависят друг от друга. Модель (11) описывает загрязнение поля Xij небольшой долей ö (обычно на практике 0 < ö < 0,2) ошибочных наблюдений Zj, имитирующих сбой с вероятностью ö измерительной аппаратуры.
В этом случае знаковая оценка определяется как решение системы
Wpq(ö, a) = 0, (p,q) G I,
где
m—i—pn—1-q
Wpq(ö,a)= Y^ öij(a)Zi+p,j+q(ö,a), i=0 j=0 mn
Zij(ö, a) = ^ ^ Sij(ö,a)Si—Pj—q(ö,a), k=i+i i=j+i
Sij (ö,a) = sign (Yij — aioYi—i,j — aoi Yi,j—i — anYi—ij—i). При ö > 0 знаковая оценка amn параметра a0 не обязана быть состоятельной, т.е. предел
lim ämn = a(ö),
если он существует, не обязан совпадать с a0. Перестает быть состоятельной и оценка наименьших квадратов [8]. Тем не менее, если разность a(ö) — a0 для знаковой оценки меньше, чем для оценки наименьших квадратов, то разумно пользоваться именно знаковой оценкой. Возникает задача исследования поведения a(ö)—a0 в зависимости от распределения поля Zj.
3. Функционал влияния
Для оценивания величины a(ö) — a0 определим функционал влияния IF(a(ö), FZ) оценки ämn по формуле
d
IF (a(ö),F )= döa(ö) .
dö ¿=0
IF(a(ö), Fz) характеризует величину главного линейного члена в разложении асимптотического смещения
a(ö) — a0 = IF(a(ö), Fc)ö + o(ö), ö ^ 0 и зависит от a(ö) и от распределения случайных величин Zij.
Лучше других противостоять засорениям вида (11) наблюдений Xj будут оценки с ограниченным IF(a(i), FZ). Обозначим через F множество возможный функций распределения случайный величин Zj. Назовем величину
GES(F,a(£)) = sup |IF(a(£),Fc)|
Fc
коэффициентом чувствительности оценки amn к большой ошибке. Оценку amn будем называть робастной на семействе распределений F, если GES(F, a(#)) < то.
Теорема 3 дает явное выражение для функционала влияния знаковой оценки. Обозначим через l = (/10, /01, lii) вектор с координатами
+ +
lpq =( ii-P>-q (a0)E [(l-2F (-Zii))(l-2F (a°,Zii)) + (l-2F (a0iZio))(l-2F (aOiZio))" + i-p,i-q(a0)E [(1 - 2F(—Zii))(l - 2F(aOiZii)) + (l - 2F(aOoZoi))(l - 2F(a°iZoi))"
+ ii-p,i-q(a0)E[(l - 2F(-Zii))(l - 2F(a0iZii))]). (12)
Определим матрицу
fC
f K(l, 0, l, 0) K(l, 0,0, l) K(l, 0, l, l)^
K(l, 0,0, l) K(0, l, 0, l) K(0, l, l, l) \K(l, 0, l, l) K(0, l, l, l) K(l, l, l, l)/
с элементами
те те
0
г=0 .7=0
Теорема 3. Пусты функция распределения Е(ж) и плотносты распределения вероятности / (ж) случайный величин удовлетворяют условиям (5)-(7) и
Б[е?1] < то. (13)
Тогда функционал влияния знаковой оценки равен
Жад )= (4/(0)Б[е-1]К)-1 I. (14)
Доказательство. Обозначим
те те
Lpq (^,a) = XX (a)E[Si+P+ij+q+i(£,a)Sii(£,a)]. i=0 j=0
Сначала докажем, что
-Wpq(a) ^ Lpq(#, a) при m, n ^ то, (p, q) G I,
mn
равномерно по a Е B. Имеем
— Wpq (а) - Lpq (#, а) mn
< Si + S2,
где
Si =
-WPq (а) - E
mn
1 1 - Lpq (¿, a)
mnWpq (a) S to E mnWpq (a)
mn mn
Известно [6], что при выполнении (4) решение Х^ уравнения (1) представимо в виде
X
fc,l=0
(15)
причем [7] существуют постоянные а € (0,1) и С, что
(а)| < Сак+
Из стационарности полей Х^, ^, (у и следует, что
Е^Д^а)^—¿—р,г—.,•—д (¿,а)] = Е[5г+р+1,^+9+1(^,а)5и(^,а)]. Отсюда и из (16) вытекает,что
т— 1—р 1—д т п
(16)
E
1
-Wpq (a)
mn
1
mn
—i—p,l—j—q (i, a)]
i=0 j=0
fc=i+p+1 l=j+q+1
m— 1— p j — 1 — q
Y Y ^ij (a4 1 - mm ) ( 1 - П ) E[Si+p+1j+q+1(i,a)S11(£,a)] ^ Lpq (^,a). i=0 j=0
Поэтому S2 ^ 0, причем в силу (16) и ограниченности Sij (#, a) эта сходимость будет равномерной в B.
Докажем, что S1 ^ 0. Из (15)-(16) следует, что существует т Е (0,1), такое, что
|cov(Xij,ХЫ)| < Ст|i—fc|+|j—1|,
где С > 0 — некоторая постоянная. Поэтому поле Xij удовлетворяет условию сильного перемешивания с экспоненциально убывающим коэффициентом сильного перемешивания [9, § 5.2]. Отсюда и из независимости vij, Zij [10, lemma 2.1] поле
0ы = Sfci(¿, a)Sfc—i—p,i—j—q(¿, a), (k, l) Е Z2,
также будет удовлетворять условию сильного перемешивания с тем же самым (в данном случае экспоненциально убывающим) коэффициентом сильного перемешивания. Так как Zfcz удовлетворяют условию сильного перемешивания и ограничены, то [11, теорема 17.2.1]
|cov(Zij,Сы)| < С1Т|i—k|+|j—1|,
где С1 > 0 — некоторая постоянная. Таким образом,
1
т— 1—р .—1—д
т п
Е«2 ^ £ £ ¿2. («) £ £ ВД +
¿=0 .=0 й=г+р+1 1=.+д+1
т— 1—р .— 1—д
+
т2п2
X X ^(а^.1(а)| X X |соу(^г>Ск:
хгх )1 <
¿,¿1=0 .,.1=0
й,к1=г+р+1 М1=.+д+1
<
т— 1—р.—1—д , ' \ /
_ _ (а)2 1 - -) 1 - П) +
тп —' —' ^ \ т / \ п
¿=0 .=0 4 7 4
- £ £ .
т— 1— р .— 1— д
+
т2п2
Е Е^ (а) ¿¿1.1 (а)1 Е £ 11 <
¿,¿1=0 .,.1=0
fc,fcl=¿+p+11,11=.+д+1 т— 1— р .— 1— д
— — — —
< — + Е Е (а)¿¿1.1 (а)1< - 0 ¿,¿1=0 .,.1=0
тп т2п2
равномерно по а € В.
Теперь найдем явный вид функционала влияния знаковой оценки. По теореме о неявной функции
'^¿^ ) = Ш
/дОДа) г=0 V да
— I
г=0
1
а)
г=0
Найдем
а)
5а
и
а)
г=0
а=а0
г=0
а=а0
Обозначим = 1,., ь 1,.—1). Заметим, что если вместо X. наблюдаются
, то
е.(а) = - а =
= (а) — ^¿Т(а — а0) + с.— а?0 1,. c¿—1,.— ^^г,.—^¿л—1— аи^г—1,.—1,.—1
и что
£ы(а) = sign(еfcг(a)) = 1 — 21 (еы(а) < 0),
где
1 (еы(а) < 0) =
1, еы (а) < 0;
.0, еы(а) > 0.
Обозначим через а-алгебру, порожденную случайными величинами
{е., ^) < (М)} и {^¿.,С®., ) < (М)}
1
1
а=а
Тогда, используя свойство условного математического ожидания, получаем
Е[1 Ыа) < 0)] = Е(Е[/(еы(а) < 0)|АЫ]) =
Е
^ (^ы (а — а ) — + 1,1 Ск—1,1 + а01^к:,1—1 Ск,1—1 + а11 ^й—1,1—1С&—1,г—1
Определим полную группу событий
Н.рд = = ¿, ^ы—1,г = ^,1—1 = р, 1 = д}, г, р, д = 0, 1.
Так как
Р(.) = 5г+7+р+д(1 - 5)
4—¿—р—д
то по формуле полного математического ожидания
Е[1 Ыа) < 0)] = Е Е[/(еы(а) < 0)|Я.рд]5*+7+р+д(1 - 5)
4—¿—7—р—д
¿,7,р,д=0
Следовательно, с учетом ^(0) = 1/2,
в
^Е[1 Ыа) < 0)]
г=о
-2 + Е[^ (-(«)] + Е[^ (а0 оСы—1,1)] + Е[^ (а01)] + Е[^ (а0 1^—1,1—1)],
д
даЕ[/(£и(а> <
г=0
/ (0)Е[Хы] = 0.
Далее, в силу измеримости 1(е11(а) < 0) относительно Ак1
Е[1 Ыа) < 0) 1Ыа) < 0)] = Е(/(еи(а) < 0) Е[/(еы(а) < 0)|ЯЫ])
а — а0) — ^11^11 + а00^и^ц + а01^,10^10 + а^^ю^ц) х
Е
Х М^Ы(а - а0) - + а00^к— 1,1Ск—1,1 + а01^ы,1—1Сы,1—1 + а11 ^к—1,1—1 Ск—1,1—1
Пусть (к,/) таковы, что (к,/) не совпадает ни с одним из индексов (1,1), (2,1), (1, 2). Определим полную группу событий
Нгхг2...гв = = ¿Ъ ^к—1,1 = г2> ^,1—1 = ¿З, ^к—1,1—1 = ^
= ¿5, V;—1,1 = ¿6, ^,1—1 = ¿7, ^к—1,1—1 = ¿8, }, ¿1, ¿2, . . . , ¿8 = 0, 1.
По формуле полного математического ожидания
Е[1 (£и(а) < 0)1 (£11 (а) <
Е
8 8 Е ъ 8—^2 ъ
Е[1 (еы (а) < 0)1 Ыа) < 0)|ЯМ2...*Ъ (1 - 5)
¿1,г2,...,г8=0
а=а
и
а=а
Следовательно,
в
— Е[1 (еы(а) < 0)1 (еп(а) < 0)] ао
Е Е[1 (еы(а) < 0)1 (еи(а) < 0)^.^=0]
¿1 ,¿2 ,...,¿8=0 ¿1+¿2+...+¿8=1
— 8Е[1 (еы(а) < 0)1 (еп(а) < 0)1^00000000]
= Е[1 (еп < 0)Е(—<ы)] + Е[1 (ей < 0)Е(а00Ск—1,1)] + + Е[1 (еп < 0)Е(а01<к,г—1)] + Е[1 (еи < 0)Е(а?1Ск—1,1—1)] + + Е[1 (еи < —СИ)Е(0)] + Е[1 (еп(а) < а^^(0)] + + Е[1 (ей < а21<ю(0)] + Е[1 (еи(а) < а01С00)Е(0)] — 8Е[1 (еп < 0)Е(0)]
Е
Е (—Си) + Е (а?0(01) + Е (а&Ы + Е (а?^)
2.
Обозначим = (¿к—1,1, ¿&,г—1, ¿к—1,1—1 )Т. Тогда
5
5
Т („ „0\ 77( КТ/ „0
даЕ[1 (еы(а) <0) 1 (еп(а) <0)] ¿=0 = — Е[/(еп <ХТ1(а — а0)Е(ХКТ1(а — а'
да Е
¿=0о да
^(а — а0)т (Е ¿рд(а0)ед—р,1—д + 1,1—1(а0)^ ] /(*) в*
р,д
(а — а0 )т( Е Крд (а0)е^—р,1—д + 4—1,1—1(а0)Хи(а — а0))) / (Хп (а — а0)) +
р,д
ГХК«—«0) / _ _ ч
+ У /у (а — аТ(Е Крд(а0)е^—р,1—д + 4—1,1—1 (а0)Г
х (Е Крд(а0)ек—р,1—д
+ 4—1,1—1(а0)* /(*) а*
р,д
(0)/(0) + [ /(0/Е Крд(а0)ед—р,1—д + 1,1—1 (а0)Л /(*) в* =
^ р,д '
Г0 _
= /(0) / Кк—1,1—1(а0)*/(*) а* = /(0)Е[е—1]Кк—1,1—1(а0),
^ —те
где суммирование ^ ведется по всем р, д от 0 до то, так что к — р = 1,1 — д = 1.
р,д
Так как
Яы(а)5л(а) = (1 — 21 (еы (а) < 0))(1 — 21 (еп(а) < 0)) =
= 1 — 21 (еы(а) < 0) — 21 (еп(а) < 0) + 41 (еы(а) < 0)1 (еи(а) < 0),
а=а
0
а=а
0
а=а
0
а=а.
0
а=а.
то с учетом одинаковой распределенности Zk1
d
- E[(Sfci (a)Sii(a))]
¿=0
0-2
E[F (-Zii)] + E[F (a?oCoi)] + E[F (a^Zio)] + E[F (aOiZoo)]
2
E[F (-Zii)] + E[F (aOo Coi)] + E[F (a^o)] + E[F (aOiZoo)]
+
+ 4
E[F (-Zii)] + E[F (a?oCoi)] + E[F (a^o)] + E[F ^Zoo)]
d
— E[(Sfcz(a)Sii(a))] da
¿=o
a=a0
f (0)E[e-i]4_i;i_i(a°).
(17)
Отдельно рассмотрим случаи (k, /) G {(2,1), (1, 2), (2, 2)}. Если (k, /) = (2,1), то
E[1 (£2i(a) < 0)1 (eii(a) < 0)] = e(/(en(a) < 0)E[1 (e2i(a) < 0)|ЗД) =
Цвц < УЩ(a - ao) - viiZii + a?oVoiZoi + ao^ioZio + a?iVooZoo) x
x FiY^i ( a — ao) — V2iZ2i + aioVii Zii + aoiV2oZ2o + aiiVioZio
Определим полную группу событий
Hw..i6 = {vii = ¿i, Voi = ¿2, Vio = ¿3, Voo = ¿4, V2i = ¿5, V2o = ¿e}, ¿i, ¿2, . . . , ¿6 = 0, 1. По формуле полного математического ожидания
E[1 (e2i (a) < 0) 1 (eii(a) < 0)] =
i 6 6
E ij 6-J2 ij
= J] E[1 (e2i(a) < 0)1 (eii(a) < 0)|ЯМ2..^]<j=l (1 - 5) j=l . il,i2,...,i6=o
Следовательно,
d
— E[1 (efci(a) < 0)1 (eii(a) < 0)] d
¿=o
E E[1 (eM(a) < 0)1 (eii(a) < 0)|Hiii2...i8=o]
il,i2,...,i8=o il+i2+...+i8=i
- 8E[1 (eM(a) < 0)1 (en(a) < 0)|Hoooooooo] = E[1 (eii(a) < 0)F(-Z«)] + E[1 (en(a) < 0)F(a?oZfc-M)] + + E[1 (eii(a) < 0)F«Z^-i)] + E[1 (en(a) < 0)F(a?1Zfc-i,i-i)] + + E[1 (eii(a) < -Zii)F(0)] + E[1 (en(a) < a?oZoi)F(0)] + + E[1 (eii(a) < aoiZio)F(0)] + E[1 (en(a) < aoiZoo)F(0)] - 8E[1 (en(a) < 0)F(0)]
E
F (-Zii) + F (a?oZoi) + F (aoiZio) + F (a^Zoo)
2.
0
a=a
0
__0
Поэтому
а
— Е[1 (е21(а) < 0)1 (еп(а) < ад
¿=0
Е[1 (еи < —Си)Е(а00Си)] +
+ Е[1 (еи < а^^(0)] + Е[1 (еп < а01С10)Е(а^Сю)] +
6
+ Е[1 (еп < а?1С00)Е(0)] + Е[1 (еп < 0)Е(—(21)] + Е[1 (еп < 0)Е(а^)] — 4
Е
Р(—Си) Р(а00(и) + Е(а01 (ю) Е^(ю) +
+ - ( Е^00(01) + Е(а°1С00) + Е(а^Ы + Е(—С:
21
Следовательно, с учетом одинаковой распределенности
а
- Е[(Я21(а)Яи(а))]
¿=0
(1 — 2Е (—Си ))(1 — 2Е (а?0Сп)) + (1 — 2Е (а&Ы)^ — 2Е (а^ю))
Аналогично
а
- Е[(Я12(а)Яи(а))]
¿=0
(1 — 2Е (—Сп))(1 — 2Е (а01(ц)) + (1 — 2Е (а% <01))(1 — 2Е (а?^))
а
- Е[(Я22(а)Яи(а))]
¿=0
°=°0
(1 — 2Е (—Си))(1 — 2Е (а^и))
Во всех трех частных случаях (к, /) € {(2,1), (1, 2), (2, 2)} формула (17) не меняется. Таким образом,
аЬрд (¿, а)
а
X X ¿¿.(а) E[S¿+p+l,.+д+l(¿, ^п^ а)]
¿=0
°=°0
, , ......... _., а)Яц (¿, а
°=°0 ¿=0 .=0
а а
¿1—р,—д(а0) — Е[(Я21(а)Яи(а))] ¿=0 + ¿—р,1—д(а0) —Е[(Я12(а)Яп(а))]
¿=0
°=°0
а
d¿
¿=0
+
+ ¿1—р,1—д(а ) — Е[(Я22(а)Яц(а))]
¿=0
= ¿1—р,—д (а0)Е [(1 — 2Е (—Сп))(1 — 2Е ^Си)) + (1 — 2Е (а&Ы)^ — 2Е (а?^)) + ¿—р,1—д (а0 )Е[(1 — 2Е (—Сп))(1 — 2Е (а&Сп)) + (1 — 2Е КЫ)^ — 2Е (а?^)) + ¿1—р,1—д (а0)Е [(1 — 2Е (—Си))(1 — 2Е (а°х Си))
+
+
дЬрд (¿, а)
да
д
а ) да ^^+1,^+1 ^ ^^п^ а)]
°=°0 ¿=0 .=0
¿=0
°=°0
оо оо
XX 4/(0)Е[е—^^р^д (а0) = 4/(0)Е[е—^К, ¿=0 .=0
откуда следует утверждение теоремы 3.
0
°=°
6
4
0
°=°
Е
0
°=°
Е
0
°=°
0
°=°
Вид формул (12), (14) показывает, что функционал влияния знаковой оценки будет ограничен, поскольку координаты |/и | вектора I в (12) ограничены величиной тах |ард По-
(р,д)ех
этому коэффициент чувствительности к большой ошибке будет конечным, а знаковая оценка робастной.
Для сравнения, функционал влияния оценки наименьших квадратов имеет вид (см. [8])
(а(5),Ес) = Е[&]В-1(а0°1),а(1°о),а00о))Т, (18)
где В — ковариационная матрица вектора (Х01, Х10, Х°°). Из формулы (18) следует, что с ростом Е[((2°] будет расти и /Е^(а(5), ^). Поэтому максимум /Е^(а(5), ^) будет бесконечным на (достаточно узком) множестве всех вероятностных распределений случайной величины с конечной дисперсией. Следовательно, коэффициент чувствительности к большой ошибке оценки наименьших квадратов в этом случае будет бесконечным, а оценка наименьших квадратов, в отличие от знаковой оценки, не будет робастной.
тбл.1
4. Пример
Сравним при помощи компьютерного моделирования знаковую оценку и оценку наименьших квадратов при загрязнении наблюдений Ху аномально большими ошибками вида (11).
В эксперименте моделировались 1000 реализаций поля Уу, г, ] = 1, ..., 10, вида (11), где ву имели стандартное нормальное распределение, а (у — распределение Коши с плотностью распределения вероятности
1
пт 1 + —
Истинные значения параметров а10, а01, а11 были -0,6, 0,4 и 0,8 соответственно. Точность каждого метода оценивалась выборочным средним и выборочной дисперсией соответствующих оценок по 1000 реализациям. Результаты экспериментов для различных значений 7 и 5 приведены в табл. 1. В каждой ячейке таблицы верхнее число означает выборочное среднее (по 1000 реализациям) соответствующей оценки соответствующего параметра, а нижнее число (в скобках) — соответствующее выборочное среднеквадратическое отклонение.
Из таблицы видно, что если достаточно умеренным искажениям подвергается только каждое сотое наблюдение, то знаковая оценка уже точнее оценки наименьших квадратов. Следовательно, для оценивания авторегрессионных коэффициентов а при отсутствии выбросов предпочтительнее использовать метод наименьших квадратов, а при обработке загрязненных наблюдений преимущество имеет знаковый метод.
Таблица 1
Результаты экспериментов
Значения Y и т Знаковая оценка Оценка наименьших квадратов
aw aoi aii aio aoi aii
Y = 0 -0,5748 (0,0922) 0,3879 (0,0999) 0,7552 (0,1126) -0,5857 (0,0738) 0,3957 (0,0841) 0,7744 (0,0862)
Y = 0,01, т = 9 -0,5874 (0,0712) 0,4021 (0,0589) 0,7823 (0,0839) -0,58671 (0,0809) 0,3911 (0,0856) 0,7682 (0,0754)
Y = 0,1, т = 9 -0,5803 (0,0706) 0,3893 (0,0543) 0,7623 (0,0845) -0,4292 (0,2376) 0,2536 (0,1961) 0,5375 (0,3205)
5. Заключение
В работе получено явное выражение для функционала влияния знаковой оценки коэффициентов уравнения авторегрессионного поля. Показано, что знаковая оценка является робастной, в то время как оценка наименьших квадратов не является робастной в достаточно типичной ситуации, когда ошибочные наблюдения авторегрессионного поля могут иметь сколь угодно большую дисперсию. Знаковая оценка может быть рекомендована в качестве альтернативы оценке наименьших квадратов при наблюдении авторегрессионного поля с аномально большими ошибками.
Список литературы
1. Болдин М.В., Симонова Г.И., Тюрин Ю.Н. Знаковый статистический анализ линейных моделей. М.: Наука. Физматлит, 1997. 288 с.
2. Горяинов В.Б., Горяинова Е.Р. Непараметрическая идентификация пространственной модели авторегрессии в условиях априорной стохастической неопределенности // Автоматика и телемеханика. 2010. № 2. С. 31-41.
3. Martin R.D., Yohai V.J. Influence functionals for time series. With discussion // Ann. Statist. 1986. Vol. 14, no. 3. P. 781-818.
4. Хьюбер П.Дж. Робастность в статистике. М.: Мир, 1984. 304 с.
5. Хампель Ф., Рончетти Э., Рауссеу П., Штаэль В. Робастность в статистике. Подход на основе функций влияния. М.: Мир, 1989. 512 с.
6. Tjostheim D. Statistical Spatial Series Modelling // Advances in Applied Probability. 1978. Vol. 10, no. 1.P. 130-154.
7. Basu S., Reinsel G.C. Properties of the Spatial Unilateral First-Order ARMA Model // Advances in Applied Probability. 1993. Vol. 25. no. 3. P. 631-648.
8. Горяинов В.Б. Функционалы влияния робастных оценок параметров авторегрессионных полей//ВестникМГТУ им. Н.Э. Баумана. Сер. «Естественныенауки». 2012. №4, С. 3-12.
9. Bulinski A., Shashkin A. Limit theorems for associated random fields and related systems. Singapore: World Scientific, 2007. 447 p. (Advanced Series on Statistical Science & Applied Probability; vol. 10)
10. White H., Domowitz I. Nonlinear regression with dependent observations // Econometrica. 1984. Vol. 52. P. 143-162.
11. Ибрагимов И.А., Линник Ю.В. Независимые и стационарно связанные величины. М.: Физматлит, 1965. 525 с.
SCIENTIFIC PERIODICAL OF THE BAUMAN MSTU
SCIENCE and EDUCATION
EL № FS77 - 48211. №0421200025. ISSN 1994-0408
electronic scientific and technical journal
Robustness of estimates
of spatial autoregression's coefficients
based on sign tests
# 04, April 2013
DOI: 10.7463/0413.0569036
Goryainov V. B., Goryainova E. R.
Bauman Moscow State Technical University, 105005, Moscow, Russian Federation Higher School of Economics, 101000, Moscow, Russian Federation
vb-goryainov@mail.ru el-goryainova@mail.ru
In this article the process of two-dimensional autoregression of order (1,1) is considered. Distribution of the innovation field of the autoregressive model was assumed to be unknown. Definitions of the influence functional and the gross error sensitivity coefficient for autoregressive field parameter estimation were given. An explicit expression for the influence functional of sign estimation of the equation coefficients of the autoregressive field was obtained. It was shown that the sign estimation was robust. Sign estimation could be recommended as an alternative to least squares estimation with anomalously large errors when observing an autoregressive field.
References
1. Boldin M.V., Simonova G.I., Tyurin Yu.N. Znakovi statisticheski analiz linejnih modelej [Sign statistical analysis of linear models]. Moscow: Fizmatlit, 1997. 288 p.
2. Goryainov V.B., Goryainova E.R. Neparametricheskaya identifikacia prostranstvennoi modeli avtoregressii v uslovijah apriornoj stohasticheskoj neopredelennosti [Nonparametric identification of the spatial autoregression model under a priori stochastic uncertainty]. Avtomatika I telemehanika, 2010, no. 2, pp. 31-41. (Trans. version: Automation and Remote Control, 2010, vol. 72, no. 2, pp. 198-208. DOI: 10.1134/S0005117910020049).
3. Martin R.D., Yohai V.J. Influence functionals for time series. With discussion. Ann. Statist, 1986, vol. 14, no. 3, pp. 781-818.
4. HuberP.J. Robust Statistics. John Wiley & Sons, 1981. 320p. (Russ. ed.: Huber P.J. Robastnost v statistice. Moscow, Mir, 1984. 304 p.)
5. Hampel F.R., Ronchetti E.M., Rausseu P.J., Stahel W.A. Robust statistics: The approach based on influence functions. Wiley, New York, 1986. 536 p. (Wiley Series in Probability and Statistics). (Russ. ed.: Khampel' F., Ronchetti E., Rausseu P., Shtael' V. Robastnostv statistike. Podhodna osnove funkcii vlujanija. Moscow, Mir, 1989. 512 p.).
6. Tjostheim D. Statistical Spatial Series Modelling. Advances in Applied Probability, 1978, vol. 10, no. 1, pp. 130-154.
7. Basu S., Reinsel G.C. Properties of the Spatial Unilateral First-Order ARMA Model. Advances in Applied Probability, 1993, vol. 25, no. 3, pp. 631-648.
8. Goryainov V.B. Funkcionali vlijanija robastnih ocenok parametrov avtoregressionnih polej [Influence functionals of robust estimations of parameters of autoregressive fields]. Vestnik MGTU im. N.E. Baumana. Ser. Estestvennie nauki [Herald of the Bauman MSTU. Ser. Natural science], 2012, no. 4, pp. 3-12.
9. Bulinski A., Shashkin A. Limit theorems for associated random fields and related systems. Singapore, World Scientific, 2007. 447 p. (Advanced Series on Statistical Science & Applied Probability; vol. 10)
10. White H., Domowitz I. Nonlinear regression with dependent observations. Econometrica, 1984, vol. 52, pp. 143-162.
11. Ibragimov I.A., Linnik Iu.V. Nezavisimye i statsionarno sviazannye velichiny [Independent and stationary connected values]. Moscow, Fizmatlit, 1965. 525 p.