Научная статья на тему 'Смещение ядерных оценок функционалов от условных распределений: знакопеременные ядра и полиномиальная аппроксимация'

Смещение ядерных оценок функционалов от условных распределений: знакопеременные ядра и полиномиальная аппроксимация Текст научной статьи по специальности «Математика»

CC BY
179
36
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ФУНКЦИОНАЛЫ ОТ УСЛОВНЫХ РАСПРЕДЕЛЕНИЙ / ЯДЕРНОЕ ОЦЕНИВАНИЕ / АСИМПТОТИЧЕСКОЕ СМЕЩЕНИЕ / CONDITIONAL DENSITY FUNCTIONALS / KERNEL ESTIMATION / ASYMPTOTIC BIAS

Аннотация научной статьи по математике, автор научной работы — Китаева Анна Владимировна, Субботина Валентина Игоревна

Проводится сравнительный анализ асимптотического смещения оценок функционалов от условных распределений, аналогичных оценкам регрессии Надарая Ватсона, построенных на знакопеременных ядрах, и оценок, полученных методом полиномиальной аппроксимации. Показано, что скорость сходимости смещения оценок полиномиальной аппроксимации ведет себя по отношению к степени аппроксимирующего полинома так же, как главная часть смещения оценки типа Надарая Ватсона по отношению к порядку ядра, причем множитель в главной части смещения, зависящий от ядра, допускает интерпретацию через знакопеременные ядра.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Bias of conditional density functional's estimators: signchanging kernels and polynomial approximatio

Comparative analysis of asymptotic biases of two types of conditional density functional's kernel estimators: analogous to Nadaraya Watson regression estimators with sign-changing kernels and polynomial approximation estimators are considered. The range of convergence of the polynomial approximation estimators' behavior depending of the polynomial degree is similar to the one of Nadaraya Watson type estimators depending of the kernel's order. The bias' main part can be interpreted by sign-changing kernels. The results are the same as for simple regression estimators.

Текст научной работы на тему «Смещение ядерных оценок функционалов от условных распределений: знакопеременные ядра и полиномиальная аппроксимация»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2012

Управление, вычислительная техника и информатика

№ 4(21)

УДК 519.2

А.В. Китаева, В.И. Субботина

СМЕЩЕНИЕ ЯДЕРНЫХ ОЦЕНОК ФУНКЦИОНАЛОВ ОТ УСЛОВНЫХ РАСПРЕДЕЛЕНИЙ: ЗНАКОПЕРЕМЕННЫЕ ЯДРА И ПОЛИНОМИАЛЬНАЯ АППРОКСИМАЦИЯ

Проводится сравнительный анализ асимптотического смещения оценок функционалов от условных распределений, аналогичных оценкам регрессии Надарая - Ватсона, построенных на знакопеременных ядрах, и оценок, полученных методом полиномиальной аппроксимации. Показано, что скорость сходимости смещения оценок полиномиальной аппроксимации ведет себя по отношению к степени аппроксимирующего полинома так же, как главная часть смещения оценки типа Надарая - Ватсона по отношению к порядку ядра, причем множитель в главной части смещения, зависящий от ядра, допускает интерпретацию через знакопеременные ядра.

Ключевые слова: функционалы от условных распределений, ядерное оценивание, асимптотическое смещение.

Рассматриваются оценки кривой в точке, представимые в виде

где (х) - некоторые веса, которые, вообще говоря, могут зависеть от всего на-

Естественным подходом к выбору весов в (1) является описание последовательности весов с помощью некоторой функции плотности вероятностей К (•), в которой параметр масштаба играет роль сглаживающего параметра. Такие оценки называют оценками ядерного типа, а функцию К(•) - ядром. Если мы возьмем веса в виде

- ядерная оценка плотности вероятностей Розенблатта - Парзена [1, 2], то полу-

П

(1)

бора регрессоров {, /' = 1, п} . Веса, которые, как правило, зависят от некоторого

параметра сглаживания, регулируют степень влияния наблюдений {, { = 1, п} .

П

При выполнении условия нормировки (х)/ п = 1, оценка У(х) является ре-

і=і

шением оптимизационной задачи взвешенного МНК

где

чим классическую оценку функции регрессии - оценку Надарая - Ватсона [3, 4]

X - Х

NWn (x) = 1=

(1 V h

I = 1 V )

Оценку NWn (х) можно рассматривать как локальную аппроксимацию константой, поскольку она получается из критерия

П2 ( X - X. Л

- 1')К^ Т (

Класс ядерных оценок был введен Розенблаттом М. [1] и изучался Парзеном Э. [2] и Надарая Э.А. [3,5 - 7], хотя основные принципы ядерного оценивания были независимо предложены Фиксом И. и Ходжесом Дж. [8] еще в 1951 г. и Акаки Х. [9] в 1954 г.

Оценки полиномиальной аппроксимации функции регрессии а0 (х) являются естественным обобщением оценки NWn (х), следующим из представления (2):

i =1

( p k Y (x - x

Yi-<ao-Xak(x-x) к\-h^ (3)

V k=i ) V "n

Метод локальной полиномиальной аппроксимации функции регрессии систематически изучался сначала в работах Stone C.J. [10] и Cleveland W.S. [11], затем Fan J. [12,13], Fan J. и Gijbels I. [14], Ruppert D. и Wand M.P. [15].

Заметим, что аП)k! служит оценкой производной k-го порядка (k < p) функции регрессии.

1. Оценки типа Надарая - Ватсона функционалов от условных распределений

Аналогичный подход можно применить к оцениванию функционалов от условных распределений (условных функционалов) и их производных, рассматриваемых в работах Кошкина Г.М. [16, 17].

Все примеры практических приложений, приведенные в [16, 17], либо прямо являются условными функционалами и их производными, либо представляют собой функции от них. Поэтому с содержательной точки зрения вместо оценок «базовых» функционалов at (x) = J gi (y) f (y, x) dy, i = 1,5 +1, gs+1 = 1, и их производ-

R

ных, вводимых в [16], можно сразу же рассматривать оценки условных функционалов Ьг (x) = a (x)/p(x) = a (x)/a^+1 (x) = | gt (y)f(y | x)dy, i = 1, s . Здесь g1,..., gs

R

- известные функции, p(-) - плотность распределения входной переменной X, f (• | x) = f (x, •) / p(x) - условная плотность распределения зависимой переменной Y.

Рассмотрим среднеквадратическую ошибку (СКО) оценок типа Надарая - Ватсона условных функционалов в случае н.о.р. (независимых одинаково распределенных) наблюдений (X; ,Yi):

¿aY )K | * - Xl b1n (х) = —----^, ()

1n v / nf„Y^

¿kI ^

1=1 l hn

пользуясь методикой, предложенной Кошкиным Г.М.

Согласно этому, вначале находим СКО и ковариации оценок базовых функ-

1 n I х - X, I

ционалов ain (х) =-> gi (Yl)KI--------I, а затем, применяя теоремы сходимости

nhnl=1 l hn )

(следствия 1.9.1 и 1.9.3 в [18]), находим асимптотическое смещение и дисперсию

L

оценки b1n (х). В нашем случае функция H(t) = —, t1 = a1n (х), t2 = a2n (х), 5 = 2.

t2

Будем считать, что K(•) - ограниченное симметричное ядро-плотность, g1(-) и р() - ограниченные функции, lim ( +1/ (nhn I) = 0, плотность р() и функция

n——да ' ' ''

a^) дважды непрерывно дифференцируемы, а функция J g12(>’)f (•, y)dy непре-

R

рывна в точке х, р(х) Ф 0 . Тогда при n — да

J х2 K (х^х

E(b1n(х))= Ь1(х) + hn2 R 1 1

2 b{'( х) р( х) + Ь1 (х) р (х)

+ о

(h2

р( х)

J g12(y)f (y I х)Ф - b12(х) I .

Var (b1n (х)) = R---------- ——-------J K2(u)du + о I I.

nhnP( х) R l nhn)

При исследовании асимптотического смещения оценок базовых функционалов (см., например, [17, с. 41]) нетрудно видеть, что, отказавшись от условия неотрицательности ядра, можно повысить скорость сходимости смещения оценок. Пусть ядро K (•) дополнительно удовлетворяет условиям

J|хvK(х)|dх < да, Tj = Jх1 K(х^х = 0 , j = 1,...,v-1, Tv Ф 0 ,

R R

где v - произвольное четное число, которое обычно называется порядком ядра. Тогда при условии непрерывной дифференцируемости до v -го порядка включительно функций р() и a1 (•)

J х'' K (х^х

E (An (х) ) = ^( х) + h

v R

2 a1(v)(х) - b^ х) р(v)(х)

р( х)v!

Асимптотическое поведение дисперсии при этом не меняется.

+ о

(;)•

Очевидно, что при V > 2 ядро принимает отрицательные значения. Знакопеременные ядра можно строить различными методами [17, с. 95] или, например, используя рекуррентную формулу, позволяющую получать ядра порядка v + 2, зная ядра v-го порядка при условии их дифференцируемости:

К^(х) = 3К, (х) +1 хк; (X),

где К; - ядро порядка ; .

Использование знакопеременного ядра позволяет повысить скорость сходимости смещения оценок (4), однако, с другой стороны, приводит к трудностям интерпретации результатов (например, получается, что оценка плотности не обладает свойствами плотности) и может выглядеть искусственным приемом.

2. Оценки полиномиальной аппроксимации функционалов от условных распределений

Оценки полиномиальной аппроксимации условных функционалов строятся с использованием ядер-плотностей и также дают улучшенную скорость сходимости смещения. Для простоты обозначений далее будем опускать индекс у функций g (•) и Ь (•).

Введем обозначения

О =

8(у У

8 (Уп у

А =

1 X1 - х 1 Х2 - х

1 X„ - х

(X - х У (X2 - хУ

(Хп - хУ

Кк = )....к [х - Х

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

[ 1) [а ) а 0п

0 а1п Vарп у

е= V 0 у - вектор размерности (р +1) х 1, а п =

Если н.о.р. наблюдения = (Х1, ), I = 1, п , и ядро таковы, что существует обратная матрица В- = ( КА) , то из критерия

п ( р А2

X 8 № )-<І0 -Е“к (Хг - хУ

і=1 V к=1 У

к

х - X.

И

Ш1П

следует, что а0п = ет Б 1 Ат КО. (5)

Рассмотрим асимптотические характеристики а0п как оценки условного функционала Ь( х) = | я (у) / (у | х)ёу.

Пусть ядро К(•) определено на замкнутом ограниченном множестве, тогда матрица Б не вырождена с вероятностью, стремящейся к единице при пИп — да [19]. Пусть также ядро ограничено, тогда оно будет иметь все моменты. Кроме того, будем предполагать, что К (•) - ядро-плотность (из чего будет следовать, что

| х2К(х)Сх Ф 0). Все наложенные на ядро ограничения вполне естественны для

к

ядерного оценивания.

Введем определение. Пусть |п и пп - последовательности случайных величин, определенных на вероятностном пространстве (О, ^, Р).

Определение. Будем говорить, что последовательность |п бесконечно мала по сравнению с последовательностью пп по вероятности (обозначение

> є I —> 0 при п — (

^п = 0р (пп)), если для Ув> 0 Р

Обозначим ф(х) = |я2(у)/(у/х)Су-Ь2(х), Ф = ^(ф^),...,ф(хп)),

М =

1 | хК (х)Сх

к

| хК (х)Сх | х2 К (х)Сх

к к

| хрК (х)Сх | хр+1 К (х)Сх

к

1 | хК (х)с1х •••

к

и | х2 К (х)Сх •••

и =

— | хр К (х)Сх

к

••• | хр+1 К (х)Сх к

••• | х2 рК (х)Сх

к

| хрК (х)Сх

к

| хр+1К (х)Сх

ир | хр+1 К (х)Сх — | х2 рК (х)Сх

Найдем асимптотические условные (при условии Х1 = х1,...,Хп = хп) смещение и дисперсию оценки а0п. При усреднении по X возникают проблемы, связанные с возможностью обращения в нуль знаменателя в (5), которые можно решать различными способами, например, при помощи кусочно-гладкой аппроксимации оценок [17] или добавлением к знаменателю слагаемого п~2 [20].

Теорема. Пусть функция Ь(х) имеет непрерывные производные до р + 2-го порядка включительно; функция ф(-) непрерывна точке х, р() непрерывно дифференцируема в точке х, р(х) Ф 0; ядро К(•) дополнительно удовлетворяет усло-

вию

| x2k 1K(x)dx = 0, k = 0, p (это условие

выполняется, например, для четного

ядра); lim (hn +1/(nhn )) = 0 . Тогда при n ^-да условное смещение ' ' '' для четных p (p(x) Ф 0 )

E (a0nlX1 = x1,..., Xn = Xn )-b( x) =

fup + 2K(u)U(u)|du r

f ^ \ hp +2 + o, (+2);

M (p +1)!

для нечетных p

p( x)

E (a0«lX1 = X1,..., Xn = xn )-b(x) =

f up+1K (u) U (u )| du

—b(p+1)(x)hpn+l + op ++1);

(p +1)! M

условная дисперсия (p(x) Ф 0)

Var (1X! = xi,..., Xn = xn) = ^D- ATK^KAD-le{y, =

nhn M

f K(u) U(u)|2 du + o

lj.fl2 j p(x)

V nhn

Доказательство. Рассмотрим смещение оценки a0n (x)

bn = E (0 n\Xl = ^..^ Xn = xn )-b(x) =

eTD - ATK b( p+1)( x) ' (x1 - x)( p+1) ^ b( p+2)(x) ' (x1 - x)(p+ 2) ^ + ...

(p +1)! V(xn - x)(p+1) У (p + 2)! V(xn - x)(p+ 2) ,

Обозначим

M =

h = dmg ( hn,..., Щ), f xK (x)dx f x2 K (x)dx ••• f xp+lK (x)dx

RR R

f x2 K (x)dx f x3 K (x)dx ••• f xp+2 K (x)dx

R R R

f xp+! K (x)dx f xp+2 K (x)dx ••• f x2 p+1K (x)dx

V R

Тогда при n ^ да

D

-h[p(x)M + hnp’(x)M]h ,

p(x) p (x)

h-.

(6)

(7)

(8)

(9)

(10)

n

Рассмотрим поведение величин .Г1 =

Применяя закон больших чисел и делая преобразования (замену переменной в интеграле), как в лемме 2.3.1 [17, с. 30], получим для к = 0, р

5(]) =

^ |х} К(х)Схр(х) + ор (к}п ) при ] = 2к,

к

К+1 X х1+1К(х)йхр'(х) + Ор ( +1) при ] = 2к +1.

(11)

Учитывая (11), получаем

И~1ЛТК

X хп - х)

= Кр( х)

X хкК(х)Сх

к

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

+ Ькп +1 р'( х)

X хр+кК (х)Сх

\ к

+ о (+1) . (12)

| хк+1К (х)Сх

к

| хр+к+1к (х)с1х

\К )

Обозначим через (М- ).=|х'-1К(х)Сх,' = 1,р +1, элементы первой строки

к

матрицы М-.

Подставляя (10) и (12) в (9), получаем

Ьп = У (м-1) [ х'+1+рК(х)СхЬ(р )(х) Нр+1 + У (м-) [ X+2+рК(х)СхЬ^ )(+ + п ¿Л Ы (р + !)| п /и к ' (к2)!

'=1

Г \ X хр+1К (х)Сх

р+1 У(м-1 ) х'+2+ рК (х)Сх - еТМ~ХММ -'=1 к к р'( х)Ь( р+1)( х)

р(х) (р +1)!

X х2 р+1К (х)Сх \к У

йр+2. (13)

Упростим выражение (13), учитывая, что при к нечетном X хкК(х)Сх = 0; при

к

' + ] нечетном (м-) = 0, а при ' + ] четном ММ, = 0. Заметив, что матрица М

получена из матрицы м сдвигом влево на одну позицию, получим, что при четном р первый член в (13) обращается в нуль, и еТ М ~1М = 0 .

Таким образом, справедлива формула (7). При нечетном р первый член в (13) является главным и справедлива формула (6).

п

Докажем (8). Обозначим

Т =

1 X хК 2( х)Сх

к

X хК 2 (х)Сх X х2 К 2 (х)Сх

X хрК 2( х)Сх

к

X хр+1К 2( х)Сх

X хрК 2( х)Сх X хр+1 К 2( х)Сх ••• X х 2 рК 2( х)Сх

V к

Тогда

Л1 К ФКЛ р( х)ф( х) п К

ИТИ при п . Учитывая (10), имеем ф( х)

пИпВ(Х = х^...,Хп = хп)=^е М ТМЛ + Ор(1),

р(х)

что, нетрудно видеть, совпадает с (8).

Из формул (6) и (7) видно, что скорости сходимости смещения оценки а0п по отношению к степени полинома р и оценки Ьп (х) по отношению к параметру V ведут себя одинаково.

Заключение

Заметим, что главная часть смещения, зависящая от ядра, допускает интерпре-

~ К (и)\и (и)| и

тацию через ядра из класса К; : функция К (и) =--------р:—— удовлетворяет ус-

1М1

ловию

XК(и)и*Си = 0, 5 = 1, р, XК(и)ир+1 Си Ф 0,

к к

если р нечетное;

X К (и) и6'Си = 0, 5 = 1, р +1, X К (и) ир + 2 Си Ф 0,

к к

если р четное, т. е К (и) можно рассматривать как ядро из класса Кр+1 (Кр+2), если р нечетное (четное) (параметр ; принимает только четные значения, поскольку для оценок условных функционалов типа Надарая - Ватсона рассматривались четные ядра).

Например, пусть р = 2 или р = 3 . Тогда

X х4К(х)Сх - и2 X х2К(х)Сх

К (и) =-

-К (и)

(14)

X х4К(х)Сх -1 X х2К(х)Сх к V к У

принадлежит классу К4 . При помощи формулы (14) можно получать ядра из класса К4 из ядер из класса К2 (К(•) е К2 в формуле (14)).

Таким образом, оценки полиномиальной аппроксимации, используя ядра-плотности, дают естественный подход к ядерному оцениванию условных функционалов, обеспечивая улучшенную скорость сходимости смещения, причем константы сходимости в части, зависящей от ядра, при определенном выборе знакопеременного ядра совпадают для двух типов рассматриваемых оценок.

ЛИТЕРАТУРА

1. Rosenblatt M. Remarks on some nonparametric estimates of a density function // Ann. Math. Statist. 1956. V. 27. No. 3. P. 832-837.

2. Parzen E. On estimation of a probability density function and mode // Ann. Math. Statist. 1962. V. 33. No. 3. P. 1065-1076.

3. Надарая Э.А. Об оценке регрессии // Теория вероятностей и ее применения. 1964. Т. 19. Вып. 1. С. 147-149.

4. Watson G.S. Smooth regression analysis // Sankhya. Indian J. Statist. 1964. V. A26. P. 359— 372.

5. Надарая Э.А. Непараметрические оценки кривой регрессии // Тр. ВЦ АН ГССР. Тбилиси: Мецниереба. 1965. № 5:1. С. 56-68.

6. Надарая Э.А. Об интегральной среднеквадратической ошибке некоторых непараметрических оценок плотности вероятностей // Теория вероятностей и ее применения. 1974. Т. 19. Вып. 1. С. 131-139.

7. Надарая Э. А. Непараметрическое оценивание плотности вероятностей и кривой регрессии. Тбилиси: Изд-во Тбил. ун-та, 1983. 194 с.

8. Fix E., Hodges J.L. Discriminatory analysis - non-parametric discrimination: consistency properties // Report No. 4. Project no. 21-29-004. USAF School of Aviation Medicine, Randolph Field, Texas. 1951.

9. Akaike H. An approximation to the density function // Ann. Inst. Statist. Math. 1954. V. 6. P. 127-32.

10. Stone C.J. Consistent nonparametric regression // Ann. Statist. 1977. V. 5. P. 595-645.

11. Cleveland W.S. Robust locally weighted regression and smoothing scatterplots // J. Amer. Statist. Assoc. 1979. V. 74. P. 829-836.

12. Fan J. Design-adaptive nonparametric regression // J. Amer. Statist. Assoc. 1992. V. 87. №420. P. 998-1004.

13. Fan J. Local linear regression smoothers and their minimax effciency // Ann. Statist. 1993. V. 21. P. 196-216.

14. Fan J., Gijbels I. Variable bandwidth and local linear regression smoothers // Ann. Statist. 1992. V. 20 P. 2008-2036.

15. RuppertD., WandM.P. Multivariate locally weighted least squares regression // Ann. Statist. 1994. V. 22. №3. P. 1346-1370.

16. Кошкин Г.М. Об одном подходе к исследованию функционалов о условных распределений при статистической неопределенности // Автоматика и телемеханика. 1978. № 8. С. 53-65.

17. Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание сигналов. М.: Наука, Физматлит, 1997. 336 с.

18. Васильев В.А. Добровидов А.В., Кошкин Г.М. Непараметрическое оценивание функционалов от распределений стационарных последовательностей. М.: Наука, 2004. 512 с.

19. WandM.P., JonesM.C. Kernel Smoothing. London: Chapman & Hall, 1995. 210 p.

20. Fan J. Local linear regression smoothers and their minimax effciency // Ann. Statist. 1993. V. 21. P. 196-216.

Китаева Анна Владимировна Томский политехнический университет,

Субботина Валентина Игоревна Томский государственный университет,

E-mail: kit1157@yandex.ru; valsubbotina@mail.ru Поступила в редакцию 7 сентября 2012 г.

Kitaeva Anna V. (Tomsk Polytechnic University), Subbotina Valentina I. (Tomsk State University). Bias of conditional density functional’s estimators: sign-changing kernels and polynomial approximation.

Keywords: conditional density functionals, kernel estimation, asymptotic bias.

Comparative analysis of asymptotic biases of two types of conditional density functional’s kernel estimators: analogous to Nadaraya - Watson regression estimators with sign-changing kernels and polynomial approximation estimators are considered.

The range of convergence of the polynomial approximation estimators’ behavior depending of the polynomial degree is similar to the one of Nadaraya - Watson type estimators depending of the kernel’s order. The bias’ main part can be interpreted by sign-changing kernels. The results are the same as for simple regression estimators.

i Надоели баннеры? Вы всегда можете отключить рекламу.