УДК 519.8
Оценивание функционалов терминального типа по стационарным выборкам
Валерий И. Рюмкин*
Томский государственный университет, Ленина, 36, Томск, 634050, Россия
Получена 18.06.2010, окончательный вариант 25.08.2010, принята к печати 10.09.2010 В 'работе предложена процедура получения сходящихся в среднеквадратичном оценок функционалов терминального типа по стационарным выборкам слабозависимых случайных величин на основе непараметрических ядерных оценок плотности и операции усечения аномально больших значений используемых статистик.
Ключевые слова: функционалы терминального типа, стационарные выборки, непараметрическое оценивание, сходимость в среднеквадратичном.
Введение
Решение многих задач прикладной статистики требует оценивания функционалов терминального типа, представимых в виде [1,2]
H(F(0)(x),F(rl)(x),...,F(rs)(x)),x е Rm, (1)
dfa ]f (x)
где H : Rs+1 ^ R1 — известная функция, F(rj)(x) = —j p--—— — производная
dx/ dx2j ... dx„j—
порядка [rj] = (rji + ... + Vjm) функции распределения (ф.р.) F(x) в точке x е Rm. Естественный и наиболее распространенный метод оценивания состоит в подстановке вместо производных F(rj )(ж) их состоятельных оценок tj = F(rj )(x), j = 0, s, однако прямое использование этого метода не гарантирует получения оценок нужного качества, если функция F(zo, zi,..., zs) имеет некоторые особенности (неограниченность, недифференцируемость и др.). В результате некорректной подстановки можно получит оценку, не имеющую дисперсии или даже математического ожидания.
В данной работе предложена универсальная процедура получения сходящихся в среднеквадратичном оценок функционалов (1) на основе использования непараметрических оценок плотности и ее производных ядерного типа, а также операции усечения больших значений статистик F(to,ti,...,ts) .
1. Обозначения и определения
Пусть {x(j) е Rm} — стационарная в узком смысле последовательность случайных величин, заданных на пространстве {X,BX, Px}; F(x) = Px(x(j) < x) — функция распределения (ф.р.) элементов последовательности {x(j)}. Будем говорить, что {x(j)} удовлетворяет
* [email protected] © Siberian Federal University. All rights reserved
условию равномерно сильного перемешивания (РСП), если для ее коэффициента перемешивания ^х(т) [3] справедливо
Vx(r) = sup { Px(AB) pIpA()A)Px(B) : A G B G Э>т, Px(A) = 0} ------► 0. (2)
A,B I Px(A) J T^TO
Здесь Э<к, 3>k — алгебры, порожденные семействами {х(т) : т < к}, {х(т) : т > к} .
В качестве оценок ф.р. и ее производных рассмотрим оценки ядерного типа
FP4Z) = ^т! Е Kfp) (X—Xj) , (3)
nhH Р \ hp ) ’ V '
__(r* ) (x — x(j)\ m тАг ) (Xi — Xi(j)\
где Kp I -------- ) = П Kpi I ------------- I есть произведение производных одномерных
V hp ) i=i V hp )
ядерных функций Kpi(u) . Оценки строятся на основе выборки Xn = (X(1),..., X(n)) объема
n из генеральной совокупности всех последовательностей {X(j)}. В (3) и везде далее: p = 0, s; h = h(n) = (ho, hi,..., hs) — параметр размытости.
Определение 1. Последовательность h = h(n) положительных вещественных чисел h G Hk, h G Hke, если она удовлетворяет соответственно условиям
lim (h +-------------тт,-ттт I =0, lim (h +-----------------:-—-ттт I =0.
n^TO у nh2k-Sgn(k) J n^TO у n1—£ h2k — sgn{k) J
Определение 2. Функция f G N$(X), если f (X) абсолютно непрерывна на Rm и имеет непрерывную производную
д [sf (X)
f (s)(x)
dxl1 dx22 ... dxm
порядка s в точке X;
f G N+ (X), если f G Ng(X) и sup |f (v)(X)| < to, 0 < V < s.
x
Записи f G Ng(Rr n) и f G N+(Rm l) означают, что f (X) удовлетворяет соответствен-
но условиям f G Ns(X) и f G N+ (X) при любых X G Rm .
Определение 3. Ядро K(u) G L1, если оно измеримо по Борелю, причем f |K(u)|du < то; K(u) G L+, если K(u) G L1 и, кроме того, sup |K(u)| < то.
K(u) G Li, если Ki(ui) G Li, i = 0, m; K(u) G L+, если Ki(ui) G L+, i = 0, m.
Определение 4. K(u) G Zs,v, если
О, если j = О, s — l, j = v;
K(u)u3du = ^ ( —l)vv!, если j = v, (4)
us,v = О, если j = s.
К(и) Є если Кі(иі) Є ^аі^і, і = 0, т .
Определение 5. Ядро К (и) Є К, если К (и) абсолютно непрерывно на Я1 и, кроме того, К (и) = К (—и), ^ К (и)с!и = 1, К (и) Є Ьі;
К(и) Є К, если Кі(иі) Є К, і = 1, т; К+ = Кр| Ьі; К+ = К р|Ьі.
Определение 6. Последовательность РСП с.в. |ж(і)} Є Бедр,р > 0 , если
П
^(1 - т/п)(^х(т))1/р = 0(1).
Т =1
Рассмотрим последовательность с.в.
«<•'• > . К<-> () - БК<-> (^-^) , (5)
порождаемую выборкой Хп. Введем неограниченно возрастающую числовую последовательность {Яп} с помощью равенства
Я. ~ Е ( ) ’ (6)
=0
где sgn(fi) = sgn(rii)sgn(ri2) .. . sgn(rim). В соответствии с (5) и (6) положим
П— 1
в'. = TTsgnroDIZj’I = „4m{E(«Iм)'+2X> -T/n)E(«1”' ’«1'-
a,
= Jim .2,.d-—Sn„(r-) Ръ. (7)
n^rsdSgn(rs)' Ts
Обозначим
= / (u)a—.
J (a — 1)!
2. Усеченные оценки функций от эмпирических распределений
Рассмотрим функционал H(т(Х)) , где т(Х) = (F(0)(X), F(ri)(X),..., F(rs)(X)). Положим
t„(x) = (t0n(x) ... 7 Wx)) ^in (x) = Fn (x) , Tn(x) = Etn(x); Tin(x) = EFn (x).
m m
Без ограничения общности везде далее: rsj > Y1 rij, если i = s.
j=. j=1
В некоторых случаях использование прямого метода подстановки при оценивании H(т(Х)) дает неудовлетворительный результат, так как наличие особенностей функции H(*) приводит к "выбросам" и несостоятельности получаемых таким способом оценок H(tn) . Для избежания нежелательных эффектов такого сорта введем операцию усечения больших значений H (tn) :
G(t) = J H(4), если |H(4)1 < Cdn (8)
n \ Csgn(H(tn))dn, если |H(4)\ > Cdn.
Здесь C, y — положительные константы, а dn задано соотношением (6).
Определенная таким образом процедура усечения (8) задает класс Pc,Y (H) зависящих от n функционалов, которые сходятся в среднеквадратичном к H(т(X)) при n ^ то. Следующая теорема дает условия, при которых усеченная оценка G(tn) G PC}1 (H) сходится в среднеквадратичном к H(т(Х)) при n ^ то.
Теорема 1. Пусть элементы выборки Xn взяты из последовательности слабозависимых случайных величин {X(j)} G Seqp,p > 0, причем F G N'(Rm), ak ^ rik +1, i = 0, s; k = 1, m. Пусть, кроме того,
1\ h G U ; h G U X = 2[a]([a] — 1) — Wj (2ws — 1) + ws ; ^ 1
-// -0 G H0; hj G H[rj ],d, xj 0,-г^1П I 1s! ’ j ^ 1,
2([d] — 1)([d]+ Wj — 1)
n
2) lim Kpi(u) = 0, lim (uai Tpi+jKj)(m^ =0, j = 1,rpi — 1, p = 1, s, i = 1,m;
n— — ^> |u| —►^o V /
Kpf)(u) G K; Kp1) (u) G Za—rl>,0, p = M;
3) H(T) = H(z0,z.,..., zs) — вещественная функция, которая в некоторой окрестности Oe(T) точки т непрерывна и имеет непрерывные первые и вторые производные по аргументам zj G R1;
4) G(tn ) G Pc,9(H), где
C = max (sup \KjT)(u)\l ; в =27^-------------“T.
j=0,s [ u J J 2(N — Ws)
Тогда усеченная оценка G(tn) G Pc,e(H) сходится к Hs(T) при n ^ то в среднеквадратичном. При этом асимптотически минимальная среднеквадратическая ошибка WG(tn) равна
wg(4) = e(g(4) — h(т))2 «
2([3]-Ws) 22 i
f(x^ (aTs)(2a]a] —"1 (®s) 2a-1)Hs2(t) (f(a)(x^2w-1, (9)
2[a] — 1
где
\2([®] — ) / \ 2([а] — ц8) /
— не зависящая от ядерных функций, константа, = /(м)а-1К^>(г()Ям, а определя-
ется формулой (7).
Оптимальные значения параметров размытости при этом равны
6-ш^
1 ^ 6(26-1)
чП
6 + ш3 ~ 1
,* = ^ (2ц — 1)6!а|,(Х) Л 26-1 ((2ц; — 1)(6 — ц — 1)!На(т)жа) 6+шз'-1 . =1
3 ^2(6 — ц8)ж2(Р(Й>(Х))2 пу \(2ц — 1)(6 — Ц — 1)!Н;(т)ж3/ ’ ^ , в
т т
В (9) 6 = [а] = ^ а», Ц = I] г^.
г=1 г=1
Теорема 1 является конструктивной и дает способ построения оценок С(4п) € Рс,е (Н) функционала Н(т), сходящихся в среднеквадратичном к его истинному значению. Как следует из (9), асимптотическая среднеквадратическая ошибка №6(4.) таких оценок мажорируется степенной функцией, которая при увеличении параметра гладкости 6 ф.р. Р(Х) неограниченно сближается с функцией 1/п :
_» 2(6-шП / 1 \
№С(4п) ^ Тд^ (п) 26—^ = оМ, 6 ^то.
Константа Т при этом не зависит от а и в .
Следующая теорема устанавливает асимптотическую нормальность оценок усеченного типа.
Теорема 2. В условиях теоремы 1
чД~п (с(РП3>(Х),..., РТ>(Х)) — С(Р(0>(Х),..., Р«(Х))) ^ ^1(шп; Р),
где
= Us (T) ^dn f (U)a—Ts KSf) (U)duF (a)(_X.)| (-: )5—Ws ; p = Hs2 (T)aTs (X).
7 (a — rs)!
Известно, что скорость сходимости СКО « 1/n имеет место в параметрической постановке задачи оценивания [4, 5]. Тот факт, что скорость сходимости СКО предлагаемых усеченных непараметрических оценок при соблюдении некоторых условий регулярности (условия
2 и 3 теоремы 1) неограниченно сближается с нижней границей сходимости СКО в параметрической постановке, говорит о перспективности процедуры усечения (8). Построенная процедура реализует двухшаговую схему оценивания. На первом шаге с помощью введенной специальным образом операции усечения (8) исходному функционалу (1) однозначным образом ставится в соответствие функционал G(F(0)(X), F(r')(X),..., F(rs)(X)) из класса "усеченных" функционалов G(tn) G Pc,Y(U) ; на втором производится подстановка статистики
tn = (Fn0)(X),..., Fnr)(X)) на место аргумента функционала G(T) . Наиболее важной характеристикой предложенной процедуры оценивания является ее универсальность, поскольку она не зависит от конкретного вида отображения H : Rs+1 ^ R1 и распределения исходной выборки.
Список литературы
[1] В.А.Васильев, А.В.Добровидов, Г.М.Кошкин, Непараметрическое оценивание функционалов от распределений случайных последовательностей, М., Наука, 2004.
[2] В.И.Рюмкин, Непараметрическое оценивание одного класса функционалов, Обозрение прикл. и промышл. матем., 10(2003), №3, 735.
[3] И.А.Ибрагимов, Ю.В.Линник, Независимые и стационарно связанные величины, М., Наука, 1965.
[4] А.А.Боровков, Математическая статистика, М., Наука, 1984.
[5] Э.А.Надарая, О непараметрических оценках плотности вероятностей и регрессии, Теория вероятн. и ее примен., 10(1965), №1, 199-203.
Estimation of Terminal Type Functionals under Stationary Samples
Valery I. Ryumkin
m
n
The nonparametric estimation of terminal type functionals under stationary samples is considered. It is proved that suggested nonparametric estimates have mean-square convergence.
Keywords: terminal type functionals, stationary samples, nonparametric estimation, mean-square convergence