Локальные полиномиальные оценки условных функционалов и их производных по независимым наблюдениям

Китаева Анна Владимировна

Управление, вычислительная техника и информатика

УДК 519.2

ЛОКАЛЬНЫЕ ПОЛИНОМИАЛЬНЫЕ ОЦЕНКИ УСЛОВНЫХ ФУНКЦИОНАЛОВ И ИХ ПРОИЗВОДНЫХ ПО НЕЗАВИСИМЫМ НАБЛЮДЕНИЯМ

А.В. Китаева

Томский политехнический университет E-mail: [email protected]

Предложены оценки подстановки функций функционалов от условных распределений (условных функционалов) и их производных. В качестве элементов подстановки взяты локальные линейные оценки, построенные по независимым наблюдениям. Рассмотрены их асимптотические свойства: найдены условные смещения и дисперсии. Определен также порядок скорости сходимости в среднеквадратическом четвертых условных моментов отклонений оценок

Ключевые слова:

Функционалы от условного распределения, линейная локальная аппроксимация, условные асимптотические моменты.

1. Введение. Постановка задачи

В условиях недостаточности априорной информации об объекте, что, как правило, и имеет место на практике при моделировании сложных систем, можно воспользоваться непараметрическими методами. В этом случае для всестороннего исследования объекта проводится идентификация в широком смысле [1, 2], т. е., например, определяется степень связи между входными и выходными переменными, что можно сделать с помощью функций чувствительности в регрессионной модели, находится остаточная дисперсия и т. д.

Данная работа посвящена развитию идеи единого подхода к идентификации в широком смысле стохастических систем в условиях априорной неопределенности [3]. В качестве модели берется функция регрессии, минимизирующая среднеквадратическое отклонение истинных выходов объекта и модели. Регрессионный анализ является одним из самых распространенных методов изучения зависимостей, к примеру, практически вся эконометрика основана на исследовании регрессии [4].

В [5] отмечена важная роль условных функционалов в практических приложениях, более того, все примеры, приведенные в статье (функция регрессии, функция чувствительности, условная дисперсия, куртическая и скедастическая кривые), либо прямо являются условными функционалами и их производ-

ными, либо представляют собой функции от них. Поэтому с содержательной точки зрения вместо оценок базовых функционалов а[х)=Щу)Лу,х)йу, г=1,5+1, &+^1 и их производных, введенных в [5], представляется целесообразным сразу же рассматривать оценки условных функционалов

ь (х) = а (х)/ р( х) = ц (х) / а +1 (х) =

= j gi (У) f (УI x)dy, i = 1,5

(1)

и их производных, которые в [5] рассматривались как характеризационные.

Здесь применяются без дополнительных пояснений обозначения, введенные в [5].

Таким образом, взяв за основу условные функционалы, в дальнейшем будем рассматривать функции

J (х) = а({Ь(х)}, {Ь^(х)}, / = 1~), (2)

где Ьу( х) =

dbt (х) dx

Заметим, что отказ от рассмотрения оценок функции регрессии и функций чувствительности, как оценок подстановки в рамках идеологии работ [3,5], позволяет получить более естественные оценки, обладающие лучшими асимптотическими свойствами в среднеквадратическом смысле.

Приведем еще два важных примера применения выражений вида (1) и (2): при gi(y)=I(Y<y), где ДО - функция-индикатор, соответствующий условный функционал представляет собой условную функцию распределения; отношение

| У~‘/(У I х)СУ

минимизирует среднеквадратиче-

| У ~2 / (У1 х)СУ ское относительное отклонение [6].

Будем рассматривать одномерный случай (т=1).

Классические ядерные оценки типа Надарая-Ватсона функционалов (1) (оценки подстановки базовых функционалов, рекуррентный аналог которых использован в [5], формула (7) при к;к=к„) имеют вид

£ я,- (X,) к

Ьп (х) =-

£ к

( х - X} к

а п(х) Рп (х) ’

для оценивания Ь(1)(х) в [5] предлагается брать оценку подстановки производной Ь;(х).

Оценки Ь;н(х) можно рассматривать как частный случай оценок аНн (при а¡1)=...=осi(p)=0), удовлетворяющих условию

(

£

к)

-£аа

V к = 1

(X, - х)к

К

( х - X Л

Ш1П .

—(к)

(а а а ] )

(4)

' я1 (У1)Л

Г’ 3 = } , Л =

V Яа ( Уп ) )

(

Введем обозначения 1 Х1 - х 1 Х2 - х

1 X, - х

(X1 - х)

(X 2 - х)Р

(X, - х)Р

,р Л

Заметим, что если ядро К(.) задано на компакте, что и будем предполагать, то матрица D не вырождена с вероятностью, стремящейся к единице при нкн^ж. Теоретически проблема может быть решена и для ядра, заданного на Я, например, гауссовского, однако с практической точки зрения выбор финитного ядра оправдан [13].

Из (4) следует

а,

= е^Б-ЛтКО,,

а,) = ет(к) Б- ЛтКО],

к = 1, р.

(5)

Рассмотрим случай р=1 (линейная локальная аппроксимация). Тогда из (5) следует

У(2) - 5(1)(X, - х)

1

пк

£ к

к

Я,(У, )-

У (0) - (у (I))2

(6)

,= 1, у, (3) где у

(,)

=— £ к

пк “1

(X,- х) .

Заметим, чтобы оценить Ь(1)(х), ]=1^ следует взять коэффициент при (Х—х), полученный по критерию (4), - аН(1), и, вообще, чтобы оценить производную к-го порядка (к<р)Цк)(х) следует взять а^к!. Таким образом, мы получаем единый естественный подход к оцениванию условных функционалов и их производных любого порядка.

Оценки функции регрессии (^(х)=х) вида (4) впервые были рассмотрены в [7], (до этого они использовались в анализе временных рядов) и изучались в [8-10]. Обсуждение достоинств этих оценок можно найти также, например, в [11, 12].

2. Асимптотические свойства оценок условных функционалов и их производных

Воспользуемся методологией, предложенной в [9], и найдем условные смещение и дисперсию оценок ан (при условии Х1=х1,...,Хн=хн), т. к. при усреднении по переменной X возникают проблемы, связанные с возможностью обращения в нуль знаменателя в (6), которые можно решать различными способами, в частности, при помощи кусочногладкой аппроксимации [14] или, просто добавляя к знаменателю слагаемое н~2 [15].

Введем определение. Пусть (4) и (пн) - последовательности случайных величин, определенных на вероятностном пространстве (0,ДР).

Определение. Будем говорить, что последовательность (4) бесконечно мала по сравнению с по-

ние: 4=о„(п„)), если для V е > 0 Р

( 4 л

>е

V Пп )

^ 0

при н^да; последовательность (4) ограничена по сравнению с последовательностью (пн) по вероятно-

сти (4=0 (г1н)), если Vе > 0 Зу,N: Р

>7

<е

для Vн>N.

В леммах 1-5 будем считать, что весовая функция К(.) - ограниченное ядро-плотность, заданное на компакте, причем все его начальные моменты нечетного порядка (нам будет достаточно моментов первого и третьего порядков) обращаются в нуль. Заметим, что для выполнения последнего условия достаточно взять симметричное ядро, что является вполне естественным для задач ядерного оценивания. Существование всех моментов ядра (как и ин-

е(Щ - вектор размерности (р+1)х1, состоящий из тегралов } К 2(х)Сх и } х2К2(х)с1х, рассматривае-

нулей, кроме к+1-ой компоненты, равной 1,

кпК = сНая

К ^

V V к,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

D=ATKA.

мых далее) следует из ограниченности ядра, заданного на компактном носителе.

,=1

Лемма 1. Пусть функция Ь(х) дважды непрерывно дифференцируема, функция плотности распределения р(х) непрерывно дифференцируема в точке х, р(х)^0, последовательность (кн)—0. Тогда при н—ж

Ьшя, = Е(а п(х)X = х!,...,Xп = хп)-Ь (х) =

1 ж

= 2ь,(х)К I х2К(х)Сх + Ор (кп2). (7)

-ж

Доказательство. Из (6) следует

Е (ап (х)| X1 = хр..., Xп = хп) =

1

пк

£ к

( х - х Л

(х, -х)Ь,(х,)

У(2) - 5(1)

Разложим функцию Ь() в ряд:

Ь,(х,) = Ь,(х) + (х, -х)Ь](х) + 2(х - х)2й/(х) +... Тогда

Ыая, =

= е^Б-1 ЛТК

' Ь, (х)

Ь'Ах) .

V 14 V

((х1 - х)2 л

(хп - х)2

Ь 1(х) + ...

-Ь,( х) = 2 Ь,( х)е(о)ТБ-1 ЛТК

(хп - х)2

+.... (8)

При р=1

-Б = п

( с(0) о« Л

„(1) „(2)

)

-ЛТК

п

((х1 - х)2 л

(хп - х)2

( „(2) Л

5(3)

Для у=0,1,2,3

кп | х1 К(х)Схр(х) + орк) при 1 = 0,2;

„(1) =^

К11 х+'К(х)СхР(х)+ор(кп+1) пРи1= 1,3. (9)

Отсюда, при р(х)^0, следует пБ-1 =

( 1 р'(х)

рм -Ор(1)

+ Ор(1)

р (х)

2( ) 'Ор (1) р (х)

1

к^р(х) | х2К(х)Сх

■ Ор (К2)

(10)

Обозначим

Р,к (х) = ЕЯ (7) Як (У)\Xl = х1,..., X, = х,) --Ь1( х)Ьк(х)

Ф,к = С,аЯРк (х1Х-^к (хп )).

Найдем условные ковариации

еоу(а,п(х), аы(х)|Xl = х^..., Xп = хп), к,1= 1,

Лемма 2. Пусть функция рк(х) непрерывна в точке х, р(х) непрерывно дифференцируема в точке

х, р(х)^0, 11ш(Кп +1/(пкп)) = 0. Тогда при н—ж

п——ж

С0У(а,п (х),акп ( х)\X1 = х1,-> ^ = хп ) =

ж

I К2(х)сжр,к(х)

-+ О„

( 1 Л

V пкп )

пкпр (х)

Доказательство. Из (5) следует

С0У(ащ (х),а*п (х)|X1 = х1,..., X = хп )

= е(0)ТБ-1 ЛТ К Ф ¡кКЛБ~ 1е(0).

Рассмотрим

(11)

(12)

—ЛТ К Ф ,кК4 = п

=йк!т(Л

=р( х)р,к(х) *

К1 I К2(х)Сх + Ор (к-1) I хК2(х)Сх + 0р (кп )

| хК2(х)Сх + 0р(кп) кп | х2К2(х)Сх + 0р (п-1)

(13)

Подставив (10) и (13) в (12), получаем при (кн+1/(нкн))—0 то, что и требовалось доказать.

Рассмотрим свойства оценки а-н1)(х) производной Ь'(х) в линейной локальной аппроксимации.

Лемма 3. Пусть функция Ь(х) имеет непрерывную третью производную, функция плотности распределения р(х) непрерывно дифференцируема в точке х, последовательность ( кн)—0. Тогда

Ь,а1 = Е(<(х)| Xl = х1 >..., X = хп) - Ь(х) =

ж

ь"'(х) Iх"к(х)Сх

-ж

Подставляя полученные результаты в (8), получаем то, что и требовалось доказать.

Обратим внимание на то, что смещение оценки ан„(х) в отличие от Ьн(х) [14] не зависит от Ь'(х), в частности, если функция Ь() линейна (ЬДх)=0), то скорость сходимости смещения увеличивается.

I х2К(х)Сх

Ь" р’ (х)

2 р( х)

I х4К(х)сСх

-ж

ж

I х2К(х)Сх

к2 +

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+Ор (к„).

(14)

Доказательство. Из (5) следует (р=1, к=1)

Е(а1 (х)|X1 = хр..., Xn = хп) = е(Т)Б-1ЛТЩ , (15)

( Ь. (х1) Л

где В. =

Ь (х )

V .Л п/)

. Разложим Ь/х) в ряд

1

Ь,(х,) = Ь (х) + (х, -х)Ь'(х) + -(х -х) Ь’’(х) +

1

+б(х, - х) Ь,(х) +...

(16)

Подставляя (16) в (15), учитывая (10), получим

= е(1)ТБ-1 ЛТК

(Ь,(х)Л 1

+

2

3 Л

((х1 - х)2 Л

Ь' (х)

V 1 4 -V

(хп - х)2

Ь 1 (х) +

1

+

6

(х1 - х)

Ь 'X х) +...

= е(1)ТБ-1 ЛТК

(хп - х)3, -Ь1( х) = ((х - х)2 Л

Ь1(х)+

1

+

6

(хп - х)2

((х1- х)3 Л

(хп - х)3

=е(1) х

( “Г)+ Ор(1) р(х) р

р'(х)

+ Ор (1)

р'(х) р( х)2

+ Ор (1)

к2р(х) I х2К(х)Сх

+ Ор (К1)

пК, I I х2К(х)Сх

Доказательство аналогично доказательству леммы 2. Найдем

соу(а® (х), аы (х) | Xl = хр..., Xn = х,)

(будем считать выполненными условия леммы 2 и дополнительно 11ш1/(пк2) = 0 ):

п—ж

п С0V(а1n) (х), акп ( х)| X1 = х1,..., X = хп) =

= пе(1)ТБ- ЛТК Ф 1кКЛБ-1е(0) =

Р (х) р( х)2

■ Ор (1)

к^р(х) I х2К(х)Сх х р( х)Р1к(х) х

( -ж ж Л

К11к2(х)Сх+Ор(к;1) ]"хК2(х)Сх +0, (кп)

I хК2 (х)Сх + 0р (кп) кп I х2К2 (х)Сх + 0р (п-1)

( 1

р( х) р'( х)

Ор (1)

+ Ор (1)

К р( х)

р (х)

I хК2(х)Сх I х2К(х)Сх

+ Ор (кп_2)-

( „(2 „(3) Л

----Ь 1 (х) +---Ь1( х) +...

2 6 1

„(3) „(4)

----Ь 1 (х) +---Ь "(х) +...

V 2 1 6 1 у

Принимая во внимание (9), получаем при (кн)—0 то, что и требовалось доказать.

Лемма 4. Пусть функция рк(х) непрерывна в точке х, р(х) непрерывно дифференцируема в

точке х, р(х)^0, 11ш(кп + 1/(пкп3)) = 0. Тогда

п—ж

С°У(«1п)( х); акШ( х)\X1 = х1>-> Xn = хп ) =

1 I х К2(х)Сх рк(х)+ Ор 1-0. (17)

ж р(х) I пк„)

Заметим, что если К(.) - симметричная функция, то

соу(а(п)(x), акп(х)|X1 = xl,..., Xn = хп) = Ор(п

Рассмотрим поведение условных четвертых моментов статистик анп(х)=а^0’(х) и а^х), что надо для исследования свойств оценок подстановки функций (2). Обозначим

Sln = аЦ(х) -Е(О)(х)|X1 = х1,...,Xn = хп), 0(() = = КЛБ-1е(1)е(,;Б-1ЛТК = (^,,,] = Щ),

/ = 0,1, (3 - В])(0] - В1)Т = с =

= (Ск = (Я1(У,) -ЬСУ))(Я/Ук) -Ь1(УкЛ ^ к =1 п). Лемма 5. Пусть

Е((яД) -Ь/х))4|X1 = хр...,Xn = х,) <ж,

р(х) непрерывно дифференцируема в точке х, р(х)^0, 11ш(кп + 1/(пкп'+1)) = 0. Тогда при н—ж

п—ж

Е(Б^\X1 = х1,...,Xn = х,) = 0р (п-\2*+\ Доказательство. Из (5) следует

Е^(,)4|X1 = х1;...,X = х ) =

^1^ 1 15 5 п п '

= Е(е(1)ТБ-ЛТКС<2(СКЛБг\) X1 = хр...,Xn = х ).

Пусть t=0. Учитывая (10), получаем

( (х хЛ (х хЛЛ

K

n2Q <0> =

1

K

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

V hn у

( хп - х Л

(х1 - х) K

(Xn - х) K

V V П у

V hn у

( Xn - х Л

v hn у у

( 1

, + Op (1) (1)

p’(х) pW p>(х) p' '

£!£.+Op (1) (£Mi+Op (1)

V^ (х) p (х) у

p (х)

K i ^ хЛ

V К у

(х ,л

p (х)

K

( хп - х Л

v hn у

(х1 - х) K

V hn у

(хп - х )K

( хп - х Л

V hn уу

Итак,

ATKE (CQ(0)C|X1 = х1,Xn = хп )KA = 1

п hn

I

p ,y,k ,m=1

pykm

I (лу - х)д

p,y ,k ,m=1

pykm

I (х, - х)арг1<т I (х,- х)(хp - х)аиЫ

Vp,y,k,m=1 py ,k,m=1

х - х Л ( х - х

a^,km = K | -p-----------IK

pykm

XE(Cpm9kmCky |X1 = х1,--- = Xn = хп )-

(18)

Если среди индексов ц у, к, т есть хотя бы один отличный от остальных, то Е(сыдктск)Х1=х1,...,Хн=^н)=0 в силу независимости выборочных значений, и главные члены в матрице (18) дают попарные совпадения индексов, при этом все суммы превращаются в двойные. Выделяя главные части, аналогично (9), получим при н—ж

к, ЛТКЕ (С0 (0CX1 = х1,..., Xn = х, )КЛ =

= 'с + Ор (1) 0р (К,) ^

О (к ) О (к 2) ,

V р 4 п' р ^ п ' )

где с^0. Учитывая (10), получаем

Е^п|X1 = х1,...,X, = х,)4 = Ор (п-2к;2).

Случай = рассматривается аналогично. Доказательство леммы 5 закончено.

Порядок сходимости условных четвертых моментов отклонений, равный

0(п-2 к-2(1+» + к,4),

показывается аналогично доказательству леммы 7 [16].

Интересно отметить, что степень полинома р оказывает такое же влияние на скорость сходимости смещения оценки ан функции регрессии ^(у)=у), как и параметр V в [5], показывающий минимальный порядок момента ядра, отличного от нуля: Маз^О^к^1) для нечетных р и Ыаз=0р(к„р+2) для четных р [11]. Этот результат может быть распространен и на условные функционалы общего вида (1).

n

X

СПИСОК ЛИТЕРАТУРЫ

1. Райбман Н.С. Что такое идентификация. - М.: Наука, 1970. -119 с.

2. Эйкхофф П. Основы идентификации систем управления. Оценивание параметров и состояния. - М.: Мир, 1975. - 683 с.

3. Китаева А.В., Кошкин Г.М., Пивен И.Г Непараметрическая идентификация в экономических системах // Обозрение прикладной и промышленной математики. - 2008. - Т. 15. -Вып. 4. - С. 588-612.

4. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Исследование зависимостей. - М.: Финансы и статистика, 1985. - 487 с.

5. Китаева А.В., Кошкин ГМ. Полурекуррентные ядерные оценки базовых функционалов по независимым наблюдениям // Известия Томского политехнического университета. - 2008. -Т 312. - № 2. - С. 8-12.

6. Jones M.C., Heungsun Park, Key-Il Shin, Vines S.K., Seok-Oh Je-ong. Relative error prediction via kernel regression smoothers // J. Statist. Planning and Inference. - 2008. - V. 138. - № 10. -P. 2887-2898.

7. Stone C.J. Consistent nonparametric regression // Ann. Statist. -1977. - V. 5. - № 4. - P. 595-645.

8. Cleveland W.S. Robust locally weighted regression and smoothing scatterplots // J. Amer. Statist. Assoc. - 1979. - V. 74. - № 368. -P. 829-836.

9. Fan J. Design-adaptive nonparametric regression // J. Amer. Statist. Assoc. - 1992. - V. 87. - № 420. - P. 998-1004.

10. Ruppert D., Wand M. P. Multivariate Locally Weighted Least Squares Regression // Ann. Statist. - 1994. - V. 22. - № 3. -P. 1346-1370.

11. Fan J., Gasser T, Gijbels I., Brockmann M. Engel J. Local polynomial regression: optimal kernels and asymptotic minimax efficiency // Ann. Inst. Statist. Math. - 1997. - V. 49. - № 1. - P. 79-99.

12. Fan J., Gijbels I. Local Polynomial Modeling and Its Applications. - London: Chapmen and Hall, 1996. - 341 p.

13. Seifert B., Gasser T Finite sample variance of local polynomials: analysis and solutions // J. Amer. Statist. Assoc. - 1996. - V. 91. -№ 433. - P. 267-275.

14. Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание сигналов. - М.: Наука, Физматлит, 1997. - 336 с.

15. Fan J. Local linear regression smoothers and their minimax efficiency // Ann. Statist. - 1993. - V. 21. - № 1. - P. 196-216.

16. Китаева А.В., Кошкин ГМ. Ядерные оценки базовых функционалов по зависимым наблюдениям // Известия Томского политехнического университета. - 2009. - Т. 314. - № 2. -С. 26-31.

Поступила 24.03.2009г.

Локальные полиномиальные оценки условных функционалов и их производных по независимым наблюдениям Текст научной статьи по специальности «Математика»

Аннотация научной статьи по математике, автор научной работы — Китаева Анна Владимировна

Похожие темы научных работ по математике , автор научной работы — Китаева Анна Владимировна

Текст научной работы на тему «Локальные полиномиальные оценки условных функционалов и их производных по независимым наблюдениям»