ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА
2012 Управление, вычислительная техника и информатика № 3(20)
УДК 519.25
Г.М. Кошкин, И.Ю. Глухова
НЕПАРАМЕТРИЧЕСКАЯ ИДЕНТИФИКАЦИЯ НЕЛИНЕЙНЫХ ЛЯХ-ПРОЦЕССОВ
Рассматриваются ядерные оценки условного среднего и функции чувствительности нелинейных АКХ-процессов. Находятся главные части среднеквадратических ошибок оценок базовых функционалов и их производных.
Ключевые слова: ядерные оценки, условное среднее, функция чувствительности, нелинейный ЛКК-процесс.
Рассматривается скалярная последовательность (У(){= _101 , генерируемая нелинейным АКХ(т,р,ё)-процессом:
Yt = Т (^_ч,..., ^ , XI л,..., XI ]г,..., X_ к,.., X_ ]к) + ^ = П^,т, X,*) + ^, (1)
где ^,т = (^_Ч,...,^_т )> Xt * = ^ ]1,..., ,..., ^ А,..., Xtp_ ]к ) - экзогенные пере-
менные, ё=тах(г,...,к), 1<г1 <...< 1т <<п, 0<]1 <...<]г <<п,...,0<]1 <...<]к <<п -известные подпоследовательности натурального ряда чисел, * = г+...+к, ^ - последовательность независимых одинаково распределенных (с положительной на Я1 плотностью распределения) случайных величин с нулевым математическим ожиданием, единичной дисперсией, нулевым третьим и конечным четвёртым моментами, х¥(У(т, Xts) - неизвестная непериодическая ограниченная функция.
В данной работе предполагается, что выполняются условия, при которых процесс (У{)(= _101 удовлетворяет условию сильного перемешивания (с.п.) с коэффициентом с.п. [1,2]
а(т) и е-5т,5>0,. (2)
Модели типа (1) находят широкое применение при анализе экономических систем и финансовых временных рядов.
1. Постановка задачи
Пусть Y1,Y2,...Yn - наблюдения, порожденные процессом (1), Ь = тах(т,ё). В качестве модели структуры Т в (1) возьмем условное математическое ожидание
Я(у, х) = Е(^ | Yt т = У,X,* = х) = Е^ 1у, х), (у, х) е Ят+*.
Пусть а(у, х) = | д/(д, у, х)ёд - базовый функционал, где /(д,у,х) - неизвестная плотность распределения случайного вектора (У(, Ytm, XI,,) в стационарном режиме.
В связи с тем, что | /(д, у, х)ёд = р(у, х), где р(у,х) - плотность распределения вектора ^ т, Xt *), условное математическое ожидание можно представить в виде
Ь(y, х) = =Г^(^ 1 y, х)ё^ , ()
р( у, х)
В качестве непараметрической оценки функционала а(у, х) в точке (у, х) возьмём статистику
у _ ^т ^ 1 К* I, (4)
ап (У, х) = —Кт (■
„ - ^г=Ь+1 Ли У
пи к нУ }Пні-ЛнР] 5У *
1=1 1=1 1=1
где нУ = (к,И2,...кт), нх = (ИХ,Кх,..н;), нх = (кп,...н1г),...,н; = (нр1,...,нрк) -
соответствующие параметры размытости, положительные числа, а Кт и Кх -
т-мерное и 5-мерное ядра.
Таким образом, ядерная оценка подстановки условного функционала Ь(у,х) в точке (у,х), а следовательно, и функции Т в (1) задаются отношением вида
У - ¥,,т Ї 1 „ Г Х - X
]Т Уі -т^ Кт I —К------------------------Ч-— К5
П'
1=1 1=1 1=1
ьп (у, х) = Т„ г (у, х) =-----—^^-----------------------— . (5)
, Кт Г У^1------К-К, Г Х - ^
-Ь"пи 4 И йк,
1=1 1=1 1=1
На практике часто необходимо исследовать влияние каждого из факторов модели на выходную переменную. Для этого можно использовать функции чувствительности [3]. Введем обозначения (у,х) = х,
1, = Ътт, X,) = (^ ^т^ ^ , Xt_l^,..., X_ 1); (6)
И = (}11 , И2,...Ит , Ни,...к1г ,..^ Ир1,...Ирк ) = И2,..кт , Ип,..Я1г ,..^ Йр1,...Йрк ). (7)
Функция чувствительности по ,-му входу имеет вид
дЬ(х) = д а(х) дх, дх1 р(х)
и, следовательно, нам необходимо оценить частные производные
а( 1 \у, х) = а( 1 \х) = да (х),, = 1, т + * :
дх1
а 1)п (у, х) = а 1 ^ (х) = Пл 1п1-^+Г- Кт+*(1) (х-1) . (9)
п _Ьi=м И
к=1
Т1 (*) =^ = ~------------------------7Г, (
Оценки функции чувствительности и условного функционала принимают вид
E YK (j> \* Zi 1 E YK \ * Z I E K (j> (
гГ 1 m+S I h J Г 1 m+s t hn ji_2T+l m+s I h
i=L+1
z - Zi
ZZ-Zi
h > I i=EKm*' I h
2
;(io>
ш=%1K^I (11
2. Асимптотические свойства оценок функционалов и их производных
Пусть
аг (*> = Цy’\f (у> *>dy , a+i(\+%),tk(s> = JR2|u V | /кит) (u *, q, s>dudq , (12>
где f1(i+T-)- 2(т+5+1>-мерная плотность распределения выборочных величин (Z1, Z1+T>, т> 1. Тот факт, что (Zj > удовлетворяет условию с.п. с коэффициентом с.п. а(т>, обозначим через (Z ■ > е S(а>.
Определение 1. Функция K(u> принадлежит классу одномерных нормированных ядер A(r\ r = 0,1, если Ц K(r >(u> |du <o, JK(u>du = 1. Функция K(■> е AV>,
если K(■> е A(r\ и K(u> удовлетворяет условиям J |uvK(u>| du <o,
Tj = JujK(u>du = 0, j = 1,...,v- 1,TV Ф 0, K(u> = K(-u>.
Определение 2. Функция H(■>: Rm+s ^ R1 принадлежит классу Nv m+s (z> (H(■> е Nvm+s (z>>, если она и все ее частные производные (до v -го порядка включительно> непрерывны в точке z. Функция H (■> е Nv m+s (R>, если указанные
свойства H(■> выполняются для всех z е Rm+s.
В дальнейшем для всех факторов будем использовать один и тот же параметр размытости hn , а в качестве многомерных ядер возьмем произведение одномерных ядер соответствующей размерности.
Лемма 1 (асимптотическая несмещённость an (z> >. Если функция a(z> непрерывна в точке z, supа+ (z> = sup J\y\f (y,z>dy <o, K(u> е A , последовательность
чисел (hn > X 0, то
lim Ean (z> = 0 .
n^o
Лемма 2 (асимптотическая несмещённость a(]>n (z> >. Если функция a(]>n (z> абсолютно непрерывна по zj, j = 1, m + s , на R1, sup a + (z> = sup J |y| f (y, z>dy < o,
X X
sup a(j>(z>\ <o, K(u> е A(r\r = 0,1, lim K(u> = 0, последовательность чисел
x 1 1 \u h°
(hn > X (0,
то
lim Ea( 1 \ (z > = 0.
Лемма 3 (ковариация оценок а(Г\х) и а^^х)). Пусть 9 принимает значения , и к, у принимает значения г и д и выполняются следующие условия:
1) процесс ()(= _101 удовлетворяет условию с.п. с коэффициентом с.п.
а(т>, J [а(т>] dт < о для некоторого X;
2> a+2Q (z> е N0 (z>, ae (■> е N0 (R>, at+k (■> е N0 (R>;
1-X
3> sup a +2e (z> <o, sup a+ (■> < о , sup a++ k (■> < о ;
z 1-X z z
4> K(■>еА(Y>, sup|K(Y>(u>| <o, sup|K(u>\ <o;
uеRl uеR1
5> для монотонно невозрастающей последовательности (hn > имеет место
\ 1 1
X 0. (13>
hn +
1
К nhn
(m+ s >(X+1>+ r+q
Тогда
\cOY(an )(z> ak‘q \z>>| :
24
(
1-X
nh
(m+s>(X+1>+r+q
1-X
2 12
Y
a 2t_ (z>a 2k_ (z>
К 1-X 1-X J \
1
(nh
(m+s >(X+1>+r+q
j lKm+s (u>1-x du j iKm+>s (u>1-x du jKT>fdт
KRm+s Rm+s J 0
Если при этом 6> I < 112;
7> sup a+i+T>,tk (z, s> < C , a+2e (■> е N0(x>, a+e (z> <o , то при n
. (14>
1-X 1-X
COV(an>(z > a<kf( z>> - ^J+Tr+q J K ( Г >(u > K (q)(u >du (J K 2(u >du)m+S 1
~ =
nh m+s+r+q
\nnn J
При t = k имеем частный случай: at+p(z>
Da(r)(z> - nh m+ s+2r a2t(z> j (k (r >(u>>2 du (j k ((u>du)"
(15>
Теорема 1 (СКО оптимальных оценок функционалов a(n['>(z>, r = 0,1>. Если выполнены условия леммы 1, леммы 2, условия 1> - 4> и 6>, 7> леммы 3 при у = r, 0 = t = p и дополнительно ra(V> (z> Ф 0, то при n
НП1 = ащ тіпи2 (а(1 (г)):
1
(т + 5 + 2г )а2п (г) 2v(n-L) г)]2
\ т+ 5-1
т+5+2(У+Г )
и 2(а((ПГ')(г) \К1=Нг„(п)
а2п(г)
2v(n - Ь)
||^К(г)(и)] ёи (К2(и)ёи^
||^К(Г)(и)] ёи(К2(и)ёи)
0) = и 2(а((ГГ')0 (г)) и (т + 5 + 2v + 2г) у №( г)] 2
(16)
т+5 + 2г
2v
т+5+ 2(v+ г )
т + 5 + 2г
т+2(v+г)
= о
2v \
т+5+ 2(v+ г )
(И)
Доказательства лемм и теоремы данного раздела используют ряд моментов книги [4] и ввиду громоздкости не приводятся. Асимптотические свойства ядерных оценок условного среднего и функции чувствительности нелинейных АКХ-процессов будут изучены в следующей статье.
3. Моделирование
Для исследования зависимости индекса промышленного производства РФ (У) от инвестиций в основной капитал (X1), курса доллара (X2) и экспорта (X3) воспользуемся (1) с р = 3, т = 1, г = 1:
Уп =Т(Уп_1, X1n_1, X!,, X2, X3) + ^ . (18)
Моделирование проводилось по реальным данным за период с сентября 1994 по март 2004 г., доступным на официальном сайте Госкомстата РФ www.gks.ru.
В соответствии с (5) имеем следующую оценку для Уп :
Уп = £ УК
і=2
X К5
і=2
где 2п = (Уп-!, XI-!, XI, X2, XI), Н = (Нх, Н2,...Н5), К (и ) =
ур2ж
Параметр
размытости для каждой переменной вычисляется отдельно по формуле
И = С0 стіп
-И9
і = 1,5.
С = ащ тіп
0<С <ш
о г
п-1 (у - 7
Уп-1 -X У,К5 '
і=2
н
'£ К5Г г - 2і
і=2
н
(19)
где стг- - выборочная дисперсия і-го фактора.
При решении задачи идентификации получили, что параметр размытости
И = Ост^179, і = 1,5 .
2
Непараметрический алгоритм идентификации сравнивался с параметрическим МНК-алгоритмом с помощью относительной и среднегодовой ошибок:
An =
1 n-1
—X
n -1 h.
Y - Yi
A(t)=12 X
12 i=1
12
Y - Y,
t = 1994,...,2004.
где Y - истинные значения, а Y, - их оценки.
Рис. 1. Среднегодовая ошибка идентификации А(/)
Ошибку 1998 года можно объяснить дефолтом экономики РФ, который произошёл в августе 1998 г. При решении задачи прогнозирования ИПП РФ на 1 месяц воспользуемся модификацией (1) вида
г„+1 = *(Г„, *1,„-1, X,,и, Х2'„, Хз,„ ) + %п ,
Как и при решении задачи идентификации, использовались гауссовские ядра. В этом случае параметр размытости равен
^ = 0,9агп_1/9, I = 1,5 .
Относительные ошибки прогнозирования и идентификации
Вид задачи Параметрический подход Непараметрический подход
Идентификация 0,0414 0,0448
Прогнозирование 0,045 0,05
Заключение
Работоспособность предложенных алгоритмов проверена на экспериментальных данных. Показано, что непараметрические алгоритмы идентификации и прогноза практически не проигрывают алгоритмам оценивания по МНК. При этом непараметрический подход обладает адаптивными свойствами и позволяет идентифицировать сложные нелинейные структуры.
ЛИТЕРАТУРА
1. Masry E., Tjostheim D. Nonparametric estimation and identification of nonlinear ARCH time series // Econometric Theory. 1995. V. 11. No. 2. С. 258-289.
2. Китаева А.В., Кошкин Г.М. Полурекуррентная непараметрическая идентификация в широком смысле нелинейной гетероскедастической авторегрессии // Автоматика и телемеханика. 2010. № 2. С. 92-111.
3. Пащенко Ф.Ф. Функция чувствительности и ее применение при выборе оптимальной модели // Системы управления. М.: Наука, 1973. С.72-78.
4. Кошкин Г.М., Пивен И.Г. Непараметрическая идентификация стохастических систем. Хабаровск: РАН. Дальневосточное отделение, 2009. 336 с.
Кошкин Геннадий Михайлович
Глухова Ирина Юрьевна
Томский государственный университет
E-mail: [email protected]; [email protected] Поступила в редакцию 14 июня 2012 г.
Koshkin Gennady M., Glukhova Irina Yu. (Tomsk State University). Nonparametric identification of nonlinear ARX - processes.
Keywords: kernel estimation, conditional mean, sensitivity function, nonlinear ARX-processes.
Kernel estimates of conditional mean and sensitivity function for a nonlinear ARX-processes are considered. The principal parts of mean square errors for the estimators of the basic functionals and their derivatives are found.