Научная статья на тему 'Устойчивое оценивание одновременного тренда среднего и дисперсии случайного сигнала'

Устойчивое оценивание одновременного тренда среднего и дисперсии случайного сигнала Текст научной статьи по специальности «Математика»

CC BY
203
40
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РОБАСТНОЕ ОЦЕНИВАНИЕ / ВРЕМЕННЫЕ РЯДЫ / ТРЕНДЫ СРЕДНЕГО И ДИСПЕРСИИ / СХОДИМОСТЬ ПОЧТИ НАВЕРНОЕ / АСИМПТОТИЧЕСКАЯ НОРМАЛЬНОСТЬ

Аннотация научной статьи по математике, автор научной работы — Китаева А. В.

Рассматриваются параметрические робастные оценки одновременного тренда среднего и дисперсии случайного процесса, построенные по дискретным независимым наблюдениям, аналогичные по структуре оценкам квартилей распределений. Квартили распределения шумов предполагаются фиксированными. Показана сильная состоятельность и асимптотическая нормальность предложенных оценок.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STABLE ESTIMATION OF SIMULTANEOUS TREND OF A RANDOM SIGNAL AVERAGE AND DISPERSION

Parametric robust estimations of simultaneous trend of average and dispersion of random process constructed by discrete independent observations similar to distribution quartile estimations by structure have been considered. Quartiles of noise distribution are supposed to be fixed. Strong consistency and asymptotic normality of proposed estimations are shown.

Текст научной работы на тему «Устойчивое оценивание одновременного тренда среднего и дисперсии случайного сигнала»

Управление, вычислительная техника и информатика

УДК 519.2

УСТОЙЧИВОЕ ОЦЕНИВАНИЕ ОДНОВРЕМЕННОГО ТРЕНДА СРЕДНЕГО И ДИСПЕРСИИ СЛУЧАЙНОГО СИГНАЛА

А.В. Китаева

Томский политехнический университет E-mail: [email protected]

Рассматриваются параметрические робастные оценки одновременного тренда среднего и дисперсии случайного процесса, построенные по дискретным независимым наблюдениям, аналогичные по структуре оценкам квартилей распределений. Квартили распределения шумов предполагаются фиксированными. Показана сильная состоятельность и асимптотическая нормальность предложенных оценок

Ключевые слова:

Робастное оценивание, временные ряды, тренды среднего и дисперсии, сходимость почти наверное, асимптотическая нормальность.

Введение

Классические статистические процедуры дают хорошие результаты, как правило, в случае нормального распределения шумов. Если же распределение помех наблюдений имеет «тяжелые хвосты», например, F(x)~e—м, или представляет собой смесь распределений, к примеру, гауссовских, F(x)=(ls)N(0,al2)+sN(0,a22), s<<1, cjl2<<a22, где второе распределение вносит «аномальные» помехи, то их эффективность может быть очень низка. Устойчивые (или робастные) статистические методы сохраняют работоспособность для достаточно широкого класса распределений и менее подвержены влиянию «аномальных» ошибок наблюдений. Основы современной теории робастности были заложены в 60-х годах прошлого века [1]. В настоящее время робаст-ные методы находят широкое применение в самых разнообразных областях не только техники, где их применение стало обыденным, но и экономики, например, - макроэкономике [2], маркетинге [3, 4], финансовом анализе [5, 6]. Следует отметить также устойчивый интерес к применению робастных статистических методов (в частности, М-оценок) в машинном зрении (computer vision) [7, 8].

Метод наименьших модулей, предложенный и использованный Р.Дж. Босковичем (R.J. Boscovich) в 1757 г. является, по-видимому, исторически пер-

вой робастной процедурой, появившейся, кстати, на 50 лет раньше метода наименьших квадратов (МНК) - самого популярного, хотя и неустойчивого, метода оценивания. В экономике и финансах метод наименьших модулей является старейшей и наиболее распространенной робастной альтернативой МНК - В. Шарп (М 8Иагре) применял его для анализа рынка ценных бумаг еще в 1971 г. [9]. Процедуры оценивания, основанные на норме Ц, обладают хорошими робастными свойствами [10], но сложны для исследования и вычисления по сравнению с МНК. В данной работе предлагается использовать знаковую функцию в качестве меточной, что характерно для оптимизационных критериев по норме Ц.

Параметры масштаба случайного сигнала приходится оценивать наряду с параметрами сдвига при применении М-оценок параметров положения. Эта проблема возникает, например, при обработке сигнала в большинстве процедур машинного зрения [11]. В данной работе предполагается, что среднее и дисперсия меняются с течением времени и искомые функции допускают разложение по некоторым заданным ортогональным системам функций, так что задача сводится к оцениванию параметров этого разложения, что является обычной постановкой в параметрическом анализе временных рядов [12].

1. Постановка задачи

Будем рассматривать следующую модель наблюдений

в т _

X = X (' / N) + п< ехР[Ха Фк (' / N)], ' = 1 N

к=0 к=0

где ц - независимые одинаково распределенные случайные величины с плотностью {%(•), к=0,д} и {фк(.), к=0,т} - системы ортонормирован-ных на [0,1] полиномов порядка от нуля дотсоответственно, причем полиномы {%(•), к=0,д} орто-

т

нормированны с весом ехр-2[ХакФк(х)], аки ак -

к =0

параметры, подлежащие оцениванию. Экспоненциальное представление тренда дисперсии вызвано удобством последующих вычислений.

Оценки параметров трендов среднего и дисперсии соответственно ak, к=0,д и ак, к=0,т предлагается искать из следующей системы уравнений

х sign

n=Ew-(i 1N )exp-1

s

xi -Ea Wk(i 1N)

_ k =0

n.=E фj s-i(i / n ) х

i=1

s

xi "E a Wk (i 1 N) "

k =0

m ^

"exP[Ea^k(i 1 N)]

E ^ (i i n )

= 0, j = 0,s;

(1)

sign

+ 1I2

преобразования у(-) не вырожден в этой точке. Тогда последовательность {хп} такая, что уп(хп)=0, сходится к х0.

Доказательство. Заметим, что ||у (х0)—у„ (хи)|| —>0, поскольку у„(хв)—у(х»)=0, и у„(х„)=0.

Рассмотрим окрестность У точки х0, в которой функция у непрерывна - т. к. у(х) имеет единственный нуль в £ и ёйР(х0)^0, то существует некоторая окрестность УсУ, в которой функция у строго монотонна.

Для любых точек ^ ^еУ для Уе>035>0:||у(^1)-у(52)||<5=о||51-^2||<е'; с другой стороны, в силу сходимости последовательности функций для Уе>03N:n>N:\\yя(sl)-y(sl)||<ел|\yя(s2)-yis2)||<е• Заметим, что для Уп>И

Цх*) - У С^Ц ^ I к^) - У М! +1 \Уп С^) - У (в 2^1 +

41 Уп СО - Уп С^Ц < 2е +||Уп («1) - Уп С^Ц-

Возьмем е<5/4, тогда из условия ||уп(^1)-уп(^2)||<5/2 будет следовать Ц^-^Ке' Таким образом, для любых ^ ^еУ и для любого е0 существует 50 такое, что из условия ||уп(^1)-уп(^2)||<50 при достаточно больших номерах п следует ||51-52||<е0.

Итак, из сходимости ||у(х0)-уп(хп)||—0 будет следовать сходимость ||х0-хп||—0. Лемма доказана.

Введем векторные обозначения

(a > (~ > ас ( a ^ 0 (" > a0

a = a j = \am J , a = a \ s J , a = va s J W (•) =

= 0, у = в +1, в + т +1,

-1, х < 0;

где знаковая функция sign(х) = <! 0, х = 0; . Исполь-

1, х > 0.

зование знаковой функции в силу ее ограниченности обеспечивает устойчивость оценок к «загрязнению» наблюдений, но, с другой стороны, затрудняет исследование их свойств, вследствие ее не диф-ференцируемости в нуле.

Исследуем асимптотические свойства оценок при неограниченном возрастании числа наблюдений, пользуясь методикой, примененной в работе [13].

2. Сходимость оценок почти наверное

Прежде всего, покажем сходимость оценок к истинным значениям параметров. Докажем вспомогательный результат.

Лемма. Пусть {уп} - последовательность функций Вк—Вк, которая поточечно сходится к функции у, причем существует единственная точка х0:

у(х0)=0, и якобиан аег до = аег т(•);У = 1, к

Теорема 1. Пусть плотность распределения вероятностей p(-) симметрична относительно 0 и

i

Jp(x)dx = 1/4, причемp(0)^0,p(1)^0, иp(.) непре-0 6 6 рывна в точках х=0 и х=1. Тогда оценки а и а сильно состоятельны.

Доказательство. Рассмотрим систему (1). Найдем Gi (а, а) = lim M (п)/ N =

j N ^да j

1 m ui(x) _

= -2jtyj(х)ехр-1[Еа*Фк(x)] J p(t)dtdx, j =0,5;

Gi (a, a) = lim M (n. )I N =

1

=i<

0

где

u2 (x)

"s"1(x)[-2 J p(t)dt + 1I2]dx, j = s +1, s + m +1,

Ui( x) = XAaWk (x) exp-1

u2(x) =

EAakWk(x)+exp

k=0

m

;exp-1 EaA(x)

Еаф(x)

_k=0 _

m

Ea4k(x)

k=0 _

Aak = a k - a.

Сходимость почти наверное ц/Ж к Ц при следует непосредственно из усиленного закона больших чисел.

Покажем, что система

G (а, a) = 0, j = 0,5

(2)

Gj (а, a) = 0, j = s + 1,5 + m +1

(3)

da k

a=a ,a=a

-2p(°)¡Wk (x)Wj (x) exp-2[ Xa^k (x)]dx -0 k =0

= -2 p(0)8jk, j, k = Ö~s;

= 0, j = Ö~s, k = 0m;

dGj (a, a)

dak

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

dGj (a, a)

a=a ,a=a

da k

1

-2 P(1)¡ Wk(x^j - s-1(x) exp-1

1*кФк(x)

dx,

j = s +1, s + m +1, k = 0, s; dGj (a, a)

dak

= -2 P(1)<5

j-s-1k'

где sß =

0, k Ф j,

1, k = j.

имеет единственное решение а =а при любых значениях а и а.

х

Действительно, функция g(x)=\p(t)dt обращается в нуль только в точке х=0, поскольку она монотонна в силу неотрицательности плотности и строго монотонна в некоторой окрестности точки х=0 в силу непрерывности плотности в этой точке, и р(0)^0. Согласно системе (2) функция ¡(и1(х)) должна быть ортогональна с положительным весом ехр-1[|;акфк(х)] системе полиномов {%(.), к=0,д}, следовательно, она должна иметь не менее я+1-го нуля на [0,1] [14]. С другой стороны, уравнение и1(х)=0 имеет не более д корней, т. к. $Дакщ(х) является полиномом не более чем д-го порядка и ехр-1[Ёакфк(х)]>0. Отсюда следует, что для удовлетворения системы (2) необходимо потребовать ¿Дакук(х)=0, т. е. Дак=0, к=0,д.

Аналогично показывается, что система

также имеет единственное решение та=а при а =а. В этом случае и2(х)=ехр[Ё Дакфк(х)], Дак=ак-ак, и функция f(x)=-2¡p(t)dt+f/2 обращается в нуль только в точке х=1. 0

Найдем матрицу производных преобразования, задаваемого системами (2) и (3):

дО/ (а, а)

Привлекая лемму, получаем требуемый результат.

3. Асимптотическая нормальность оценок

На6йде6м асимптотическое распределение оценок а и а.

Теорема 2. В—словиях теоремы 1 случайные векторы NДа и жДа имеют при Ж^ж нормальное распределение с нулевым средним и ковариационными матрицами соответственно Т/(4р2(0)) и

3/41 + p(1)/p(0)BBT(p(1)/ p(0) -1)

где I - еди-

4 p (1)

ничная матрица соответствующей размерности, матрица

B = ,bjk = ¡Ф -s-1( x)Wk (x)exp-1 \ Yak ф (x) f^

j = s +1, s + m +1, k = 0, s

Доказательство. Рассмотрим случайные величины

N m

j (С) = N-1/2 YwWj (i / N) exp-1[ Y^k (i / N)] X

i=1 k= 0 s m

X sign[«i - XN~ll2CkWk (i/N)exp-1[X^k (x)]],

k=0 k=0

j = M,

где с=(c0,...,cs)T - некоторый вектор параметров. Заметим, что цр^Еа )=N-1/2nj(o° ,а). Обозначим

v(i / N) = N-т Су/(i / N) exp-1[ X акфк(i / N)].

k =0

Найдем

lim M(n(N'(c)) = -2 lim Nx

N^tt J N^tt

N m v / N )

xXWj(i/N)expЛТчМ/N)]N1/2 ¡ p(x)dx =

i=1 k=0 0

s 1 [ m I

= -2p(0)Xck¡Wj(x)Wk(x)exp-21 Xakф (x) Idx =

j = s +1, s + m +1, k = 0, m,

k=0 0 \k=0 = -2 p(0)Cj,

lim cov(n(N)(c),n(N )(С)) =

N^tt j k

= ¡Wj(x)Wk(x)exp-2 [X^(x) Idx = 8jk.

0 \ k=0 )

Таким образом, ) сходится в среднеква-дратическом при N^tt к случайной величине ПЛ с )=-2p(0)Cj+gp где M(?i)=0, cov(^,q)=8ip причем распределение вектора q=(g0,...,gs)T совпадает с аоиоптотическим распределением вектора

Г(° )=(п0(Л,(° ),...,пГ(о ))T.

k=0

_( Найдем предельное распределение вектора

ц{М(0). Для любого действительного вектора 7=(/0,...,/5)т сумма

/ ^ (0) =

N s т

= N-т(I/N)ехр-'[X«кФк0/N]э!^)

.=1 к=0 к = 0

по центральной предельной теореме имеет при И—ж нормальное распределение, следовательно [15], вектор д распределен нормально.

Если последовательность векторов сИ удовлетворяет П(И)(сИ)=0, то нетрудно показать, аналогично лемме, что || сИ-С||—>0 по вероятности, где с удовлетворяет П( с)=0. Таким образом, асимптотическое распределение вектора си=лИд« совпадает с распределением вектора д/(2р(0)). Аналогично рассмотрим

П )(с, й) = N-1/2 ХФ; - s Л / N) X

I=1

s ( т

^ - N -1/2 X Ск¥к 0 / N )ехр-1|Х

к=0

т

ехр N-1/2 X ^Фк (I / N)

х-^ sign

(x) -

+1/2 U

= 0, j = s +1, s + m +1,

где d =(d6,...,dm)T - некоторьш^вектор параметров, ,#/2Да)=И-у2щ(аa). Раскрывая неопределенность, имеем

lim M (n( N '(с, d)) =

= -2 p (1)\ф] -i( x)

X cWk(x) exp-1 |X аф (x) |+

k=0

m

+X акфк(x)

dx,

как и вектор

-ШАа, т. е.

2 p(1)

имеет гаус-

совское распределение с нулевым средним. Найдем ковариационную матрицу этого распределения, учитывая, что

М [э1яп(п,. ^п( п,)] = ,

М[ф§п(п1 -1) + 1/2)^п(п; -1) +1/2)] = 3/48,

М [^п( п1 -1) +1/2)э1мп( п;)] =1/28;.

Получаем

lim M

N

n(N)(0,0) Bn(N)(0)

2 p(1)

2 p(0)

Ншсоу(п(" )(с, й),ц(" )(с, й)) =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

N—ж J к

1

= |Ф;-s-1(х)фк-s-1(ХУ^Х = 8;к ■

0

Аналогично предыдущему, получаем, что в асимптотике вектор лиДа распределен также,

(0,0) - П (0) 2 р(1) 2р(0)

= 3/41 + р(1)/ р(0)ВВт (р(1)/ р(0) -1)

= 4^ '

что и требовалось показать. Теорема 2 доказана.

Замечание. Требование симметричности распределения шумов, вообще говоря, не является обязательным, необходимо только фиксировать квартили распределения &=-1, б2=0, 03=1.

Выбор весовых функций перед 81§п(.) в системе (1) вызван стремлением повысить асимптотическую точность оценивания. Покажем это для оценок параметров тренда среднего. Рассмотрим следующую систему, определяющую оценки а(Ь)=(а(Ь), к=0,я): N s Л(4)

П = X Ь; (. / ^^[х,.-X а к Щ (. / N)] = 0,

1=1 к= 0

;=м,

причем весовые функции Ь(.) таковы, что решение системы

1 и (х)

I bj (х) | р(/)сНсХ = 0, ; = 0, s,

0 0

s т

и1(х)=XKЩk (х)ехр-1[X«kфk(х)]

к=0 к=0

относительно ащ единственно в условиях теоремы 1 - это обеспечивает сходимость почти наверное рассматриваемых оценок к а. Ковариационная матрица асимптотического распределения оценок а щ

будет иметь вид А РА—, где матрицы 4 р 2(0)

A =

a]k = j b] (x)]Vk (x) exP-11 X ак Фк (x)

], к = 0,5

D = {djk =jbj (x)bk (x)dx, j, k = 0, s}.

0

Решая задачу минимизации Sp(A-1DA-1T) по вектору b (x)=(b0(x),...,bs(x))T, получаем

_ ___I

b(x) =^(x)exp-11 Хакфк(x)

но, т. к. истинные значения параметров тренда дисперсии а неизвестны, а оценки а сильно состоятельны, то следует положить

b(x) =^(x)exp 11 XакФк(x)

V к =0

что и сделано в системе (1).

Разрывность меточной функции в нуле создает проблемы при применении стандартных методов решения системы (1). К настоящему времени разработано много специальных алгоритмов для численного оценивания по норме Ь1 [16]. В системе (1) все оцениваемые параметры присутствуют во всех уравнениях системы, что создает дополнительные трудности в ее решении. Можно упростить систему и оценивать параметры тренда среднего независимо от параметров тренда дисперсии, если исключить из весовых^функций первых (я+1)-го уравнения а, положив Ь(х)=у(х).

Заметим, что тогда оценки а(Ь) удовлетворяют следующему критерию наименьших модулей:

I

xi -Ia t Wk (i1N )

■ min.

- (b) a k

В этом случае будут потери в эффективности оценивания 6. Как показывают результаты расчетов, сделанные для линейных трендов среднего и дисперсии при гауссовском распределении шумов, т. е. у/0(х)=ф0(х)=1, у/1(х)=ф(х)=^2(х-1/2), р(.)=Л(0,о2), эти потери могут достигать 30 % в диапазоне значения а/а от -2,5 до 2,5.

СПИСОК ЛИТЕРАТУРЫ

1. Huber P.J. Robustness: Where are we now? // Student. - 1995. -V. 1. - № 2. - P. 75-86.

2. Atkinson A.C., Koopman S.J., Shephard N. Detecting shocks: outliers and breaks in time series // Journal of Econometrics. - 1997. -V. 80. - P. 387-422.

3. Franses P.H., Kloek T., Lucas A. Outlier robust analysis of longrun marketing effects for weekly scanning data // Journal of Econometrics. - 1999. - V. 89. - P. 293-315.

4. Seung-Hoon Yoo. A robust estimation of hedonic price models: least absolute deviations estimation // Applied Economics Letters. -2001. - V. 8. - P. 55-58.

5. Franses P.H., Van Dijk D., Lucas A. Short patches of outliers, ARCH and volatility modeling // Applied Financial Economics. -2004. - V. 14. - P. 221-231.

6. Martin R.D., Simin T. Outlier-Resistant Estimates of Beta // Financial Analysts Journal. - 2003. - V. 59. - № 5 - P. 56-69.

7. Stewart C.V. Robust Parameter Estimation in Computer Vision // SIAM Review. - 1999. - V. 41. - № 3. - P. 513-537.

8. Robust Statistical Techniques in Image Understanding. Special Issue of Comput. Vision Image Understand. - 2000. - V. 78. - 156 p.

9. Sharpe W.F. Mean-Absolute-Deviation Characteristic Lines for Securities and Portfolios // Management Science. - 1971. - V. 18. -№ 2. - P. B1-B13.

10. Shevlyakov G.L., Vilchevski N.O. Robustness in Data Analysis: Criteria and Methods. (Modern Probability and Statistics Series). - Boston: Vsp International Science Publishers, 2002. - 310 p.

11. Dahyot R., Wilson S. Robust Scale Estimation for the Generalized Gaussian Probability Density Function // Metodoloski zvezki. -2006. - V. 3. - № 1. - P. 21-37.

12. Андерсон Т. Статистический анализ временных рядов. - М.: Мир, 1976. - 758 с.

13. Китаева А.В. Медианные оценки параметров квадратичного тренда временного ряда // Автометрия. - 1990. - № 1. - С. 87-89.

14. Сеге Г. Ортогональные многочлены. - М.: Физматгиз, 1962. -500 с.

15. Андерсен Т. Введение в многомерный статистический анализ. - М.: Физматгиз, 1963. - 500 с.

16. Koenker R. L1 computation: An interior monologue. In: L1-Stati-stical Procedures and Related Topics. (IMS Lecture Notes Monograph Series. V. 31). - Hayward, California, 1997. - P. 15-32.

Поступила 10.10.2008 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.