Научная статья на тему 'Предельные теоремы для ядерных оценок плотности в пространствах произвольной природы'

Предельные теоремы для ядерных оценок плотности в пространствах произвольной природы Текст научной статьи по специальности «Математика»

CC BY
184
44
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СТАТИСТИЧЕСКИЕ МЕТОДЫ / МАТЕМАТИЧЕСКАЯ СТАТИСТИКА / НЕПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА / НЕЧИСЛОВАЯ СТАТИСТИКА / ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ / ПРОСТРАНСТВА ПРОИЗВОЛЬНОЙ ПРИРОДЫ / ЛИНЕЙНЫЕ ОЦЕНКИ ПЛОТНОСТИ / ЯДЕРНЫЕ ОЦЕНКИ ПЛОТНОСТИ / ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ / СОСТОЯТЕЛЬНЫЕ ОЦЕНКИ / АСИМПОТИЧЕСКАЯ НОРМАЛЬНОСТЬ / РАВНОМЕРНАЯ СХОДИМОСТЬ / STATISTICAL METHODS / MATHEMATICAL STATISTICS / NONPARAMETRIC STATISTICS / NON-NUMERIC STATISTICS / PROBABILITY DENSITY FUNCTION / SPACE OF AN ARBITRARY NATURE / LINEAR DENSITY ESTIMATORS / KERNEL DENSITY ESTIMATORS / LIMIT THEOREMS / CONSISTENT ESTIMATORS / ASYMPTOTIC NORMALITY / UNIFORM CONVERGENCE

Аннотация научной статьи по математике, автор научной работы — Орлов Александр Иванович

Оценки плотности распределения вероятностей в пространствах произвольной природы используют для решения различных задач нечисловой статистики. Систематическое изложение теории таких оценок начато в нашей статье [2], непосредственным продолжением которой является настоящая статья. Регулярно используются ссылки на условия и утверждения из статьи [2], в которой введено несколько видов непараметрических оценок плотности вероятности по выборке. Подробнее изучены линейные оценки. В настоящей статье рассмотрим их частные случаи ядерные оценки плотности в пространствах произвольной природы. При оценивании плотности числовой случайной величины ядерные оценки переходят в оценки Парзена-Розенблатта. Асимптотическому поведению ядерных оценок плотности в общем случае пространствах произвольной природы посвящены теоремы 1 8. При различных условиях доказана состоятельность и асимптотическая нормальность ядерных оценок плотности. Изучена равномерная сходимость. Введено понятие "предпочтительный показатель различия" и изучены ядерные оценки плотности на его основе. Введены и изучены естественные меры близости, используемые при анализе асимптотического поведения ядерных оценок плотности. Найдена асимптотика дисперсий ядерных оценок плотности. Рассмотрены примеры, в том числе в конечномерных пространствах и в пространстве интегрируемых с квадратом функций

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

LIMIT THEOREMS FOR KERNEL DENSITY ESTIMATORS IN SPACES OF ARBITRARY NATURE

Some estimators of the probability density function in spaces of arbitrary nature are used for various tasks in statistics of non-numerical data. Systematic exposition of the theory of such estimators had a start in our work [2]. This article is a direct continuation of the article [2]. We will regularly use references to conditions and theorems of the article [2], in which we introduced several types of nonparametric estimators of the probability density. We studied more linear estimators. In this article we consider particular cases kernel density estimates in spaces of arbitrary nature. When estimating the density of the one-dimensional random variable, kernel estimators become the Parzen-Rosenblatt estimators. Asymptotic behavior of kernel density estimators in the general case of an arbitrary nature spaces are devoted to Theorem 1 8. Under different conditions we prove the consistency and asymptotic normality of kernel density estimators. We have studied uniform convergence. We have introduced the concept of "preferred rate differences" and studied nuclear density estimators based on it. We have also introduced and studied natural affinity measures which are used in the analysis of the asymptotic behavior of kernel density estimators. We have found the asymptotic behavior of dispersions of kernel density estimators and considered the examples including kernel density estimators in finite-dimensional spaces and in the space of square-integrable functions

Текст научной работы на тему «Предельные теоремы для ядерных оценок плотности в пространствах произвольной природы»

Научный журнал КубГАУ, №108(04), 2015 года

1

УДК 519.2

01.00.00 Физико-математические науки

ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ ДЛЯ ЯДЕРНЫХ ОЦЕНОК ПЛОТНОСТИ В ПРОСТРАНСТВАХ ПРОИЗВОЛЬНОЙ ПРИРОДЫ

Орлов Александр Иванович д.э.н., д.т.н., к.ф.-м.н., профессор РИНЦ SPIN-код: 4342-4994 Московский государственный технический университет им. Н.Э. Баумана, Россия, 105005, Москва, 2-я Бауманская ул., 5, prof-orlov@mail. ru Московский физико-технический институт, 141700, Моск. обл., г. Долгопрудный, Институтский пер., 9

Оценки плотности распределения вероятностей в пространствах произвольной природы используют для решения различных задач нечисловой статистики. Систематическое изложение теории таких оценок начато в нашей статье [2], непосредственным продолжением которой является настоящая статья. Регулярно используются ссылки на условия и утверждения из статьи [2], в которой введено несколько видов непараметрических оценок плотности вероятности по выборке. Подробнее изучены линейные оценки. В настоящей статье рассмотрим их частные случаи - ядерные оценки плотности в пространствах произвольной природы. При оценивании плотности числовой случайной величины ядерные оценки переходят в оценки Парзена-Розенблатта. Асимптотическому поведению ядерных оценок плотности в общем случае пространствах произвольной природы посвящены теоремы 1 - 8. При различных условиях доказана состоятельность и асимптотическая нормальность ядерных оценок плотности. Изучена равномерная сходимость. Введено понятие "предпочтительный показатель различия" и изучены ядерные оценки плотности на его основе. Введены и изучены естественные меры близости, используемые при анализе асимптотического поведения ядерных оценок плотности. Найдена асимптотика дисперсий ядерных оценок плотности. Рассмотрены примеры, в том числе в конечномерных пространствах и в пространстве интегрируемых с квадратом функций

Ключевые слова: СТАТИСТИЧЕСКИЕ МЕТОДЫ, МАТЕМАТИЧЕСКАЯ СТАТИСТИКА, НЕПАРАМЕТРИЧЕСКАЯ СТАТИСТИКА, НЕЧИСЛОВАЯ СТАТИСТИКА, ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ, ПРОСТРАНСТВА ПРОИЗВОЛЬНОЙ ПРИРОДЫ, ЛИНЕЙНЫЕ ОЦЕНКИ ПЛОТНОСТИ, ЯДЕРНЫЕ ОЦЕНКИ ПЛОТНОСТИ, ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ, СОСТОЯТЕЛЬНЫЕ ОЦЕНКИ, АСИМПОТИЧЕСКАЯ НОРМАЛЬНОСТЬ, РАВНОМЕРНАЯ СХОДИМОСТЬ

UDC 519.2

Physics and mathematical sciences

LIMIT THEOREMS FOR KERNEL DENSITY ESTIMATORS IN SPACES OF ARBITRARY NATURE

Orlov Alexander Ivanovich

Dr.Sci.Econ., Dr.Sci.Tech., Cand.Phys-Math.Sci.,

professor

Bauman Moscow State Technical University, Moscow, Russia

Moscow Physics-Technical Institute; Moscow region, Dolgoprudny, Russia

Some estimators of the probability density function in spaces of arbitrary nature are used for various tasks in statistics of non-numerical data. Systematic exposition of the theory of such estimators had a start in our work [2]. This article is a direct continuation of the article [2]. We will regularly use references to conditions and theorems of the article [2], in which we introduced several types of nonparametric estimators of the probability density. We studied more linear estimators. In this article we consider particular cases - kernel density estimates in spaces of arbitrary nature. When estimating the density of the one-dimensional random variable, kernel estimators become the Parzen-Rosenblatt estimators. Asymptotic behavior of kernel density estimators in the general case of an arbitrary nature spaces are devoted to Theorem 1 - 8. Under different conditions we prove the consistency and asymptotic normality of kernel density estimators. We have studied uniform convergence. We have introduced the concept of "preferred rate differences" and studied nuclear density estimators based on it. We have also introduced and studied natural affinity measures which are used in the analysis of the asymptotic behavior of kernel density estimators. We have found the asymptotic behavior of dispersions of kernel density estimators and considered the examples including kernel density estimators in finite-dimensional spaces and in the space of square-integrable functions

Keywords: STATISTICAL METHODS, MATHEMATICAL STATISTICS, NONPARAMETRIC STATISTICS, NONNUMERIC STATISTICS, PROBABILITY DENSITY FUNCTION, SPACE OF AN ARBITRARY NATURE, LINEAR DENSITY ESTIMATORS, KERNEL DENSITY ESTIMATORS, LIMIT THEOREMS, CONSISTENT ESTIMATORS, ASYMPTOTIC NORMALITY, UNIFORM CONVERGENCE

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

2

1. Введение

Оценки плотности распределения вероятностей в пространствах произвольной природы используют для решения различных задач нечисловой статистики [1], называемой также статистикой объектов нечисловой природы или статистикой нечисловых данных. Систематическое изложение теории таких оценок начато в статье [2], непосредственным продолжением которой является настоящая статья. Регулярно используются ссылки на условия и утверждения из статьи [2].

Пусть (Z, A) - измеримое пространство, p и q - сигма-конечные меры на (Z, A), причем p абсолютно непрерывна относительно q, т.е. из q(B) = 0 следует p(B) = 0 для любого множества B из сигма-алгебры A. В этом случае на (Z, A) существует неотрицательная измеримая функция fx) такая, что

q(C) = j f(x )dp (1)

с

для любого множества C из сигма-алгебры измеримых множеств A. Функция f(x) называется производной Радона - Никодима меры q по мере p, а в случае, когда q - вероятностная мера, также плотностью вероятности q по отношению к мереp [3, с.460].

Пусть X1, X2 ,..., Xn - независимые одинаково распределенные случайные элементы (величины), распределение которых задается вероятностной мерой q. В статье [2] введено несколько видов непараметрических оценок плотности вероятности q по выборке X1, X2 ,..., Xn. Подробнее изучены линейные оценки. В настоящей статье рассмотрим их частные случаи - ядерные оценки плотности в пространствах произвольной природы.

2. Ядерные оценки плотности

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

3

В предположении непрерывности неизвестной плотности f(x) представляется целесообразным «размазать» каждый атом эмпирической меры, т.е. рассмотреть линейные оценки, введенные в нашей первой работе по нечисловой статистике [4, с.24]:

f (x)=1 £gn(x, X,), g„ Z1 ® R\ (2)

n 1<i<n

в которых действительнозначные функции gn удовлетворяют некоторым условиям регулярности, обсуждаемым ниже. Ядерные оценки плотности -это линейные оценки (2), в которых слагаемые имеют специальный вид.

Пусть d - показатель различия (синоним - мера близости) на Z [1] (в наиболее важных частных случаях - метрика на Z). В докладе [5] нами введены ядерные оценки плотности - оценки вида (2) с

gn(У X,) =

1

b(hn, х)

K

d ( х, X,) ^

h

K :[0,+¥) ® R1,

(3)

n J

где K = K(u) - ядро (ядерная функция), hn - последовательность положительных чисел (показателей размытости), b(hn, x) - нормировочный множитель. В статье [6] линейные оценки (2) с функциями gn из (3) названы «обобщенными оценками типа Парзена - Розенблатта», т.к. в частном случае Z = R1, d(x, X,) = | х - X |, b(hn, х) = hn они переходят в известные оценки, введенные Розенблаттом [7] и Парзеном [8]. Поскольку Парзен и Розенблатт никогда не рассматривали оценки вида (2) для пространств произвольной природы, далее будем называть эти оценки ядерными.

Согласно [2] линейные оценки (2) удовлетворяют условию нормировки:

j gn(У У) p(dy) =1. (4)

Z

Из условия нормировки следует, что b(hn, x) - нормировочный множитель b(hn, x) имеет вид

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

4

КК, х) = J K

d ( х, у)

h

p(dy).

(5)

n J

Введем шар радиуса t с центром в точке х:

Lt(x) = {у: d(x, у) < t} (6)

(в соответствии с замечанием после условия (IV) статьи [2] шар Lt(x) -измеримое множество, т.е. Lt(х)е A). Зависимость меры шара от радиуса обозначим

Fx (t) = P(Lt (х)).

(7)

Справедливо полезное для дальнейших рассуждений равенство

f d (х, у) ^

J K AV p(dy'> = J K lir dFx (I).

Lt (x) V hn J 0 V hn

(8)

Для ядерных оценок (3) рассмотрим условия (I) - (VII), введенные в статье [2] для линейных оценок.

С учетом (8) условие (I) переходит в следующее:

—J

b(hn, х)0

K \-

U

п J

dFx (t) <¥ .

(9)

При рассмотрении условия (VI) естественно принять, что для любой окрестности U(x) точки х найдется положительный радиус t > 0 такой, что шар Lt(x) содержится в U(x), т.е. топология в Z порождена системой шаров Lt(x), хе Z, t > 0. Тогда вместо (VI) получаем условие:

lim-n®¥ b(hn, х)

—J

к lg

h

n J

dFx (g) = 0

(10)

для любого t > 0.

Замечание. Симметричность меры близости d, т.е. свойство d(x, у) = d(y, х), в настоящей статье не используется. Примером несимметричного показателя различия d: R2 ® [0,+¥ является

у -1

х

d ( х, у)

Имеем взамен условия (VII)

(11)

Z

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

5

1 7 ( g)

—Jr-lgkte) <¥. (12)

dn = dn (x) = — n Л) b (hn,x)o

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Формулировки условий (II), (IV), (V) нет оснований.

Из теорем 1 и 2 статьи [2] вытекает следующее утверждение.

Теорема 1. Пусть выполнены соотношения (5), (9), (10), а также условия (II), (IV), (V) статьи [2]. Тогдаядерная оценка плотности (2) - (3) является состоятельной, причем

lim Mfn(x) = f(x). (13)

П®¥

Если, кроме того, выполнено (12) и условия

DK

( d (x, X1) ^

V

h

n J

Ф 0, limdn = 0, (14)

n®¥ n

то fn(x) - состоятельная и асимптотически нормальная оценка

плотности f в точке x.

Для доказательства достаточно сослаться на результаты статьи [2] о линейных оценках и доказать соотношение (18) этой статьи, т.е.

Hm - Dgn(x, X1) = °. (15)

n®¥ п

Имеем с учетом условия (II) статьи [2]

“ Dgn (x, X1) £ ^2dn, (16)

n n

откуда в соответствии с (14) следует (15). Теорема 1 доказана.

Если ядерная функция K(u) является финитной, т.е. K(u) = 0 при u > u0, то значение оценки плотности fn(x) определяется только по элементам выборки X/, для которых d(x, X) < u0hn. Поскольку предполагаем, что hn ® 0 при n ® ¥ , то fn(x) определяется по сужающейся окрестности, а верхние пределы интегрирования в формулах (8) - (10), (12) можно заменить на u0hn. Поскольку u0hn ® 0 при n , то соотношение (10) выполнено автоматически. Если K(u) - ограниченная функция, то (9) и (12) также выполнены. Вместо условия (II) статьи [2] достаточно

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

6

ограниченности f в некоторой окрестности x, а это вытекает из непрерывностиf. Согласно сказанному получаем следующую теорему.

Теорема 2. Пусть K - ограниченная финитная функция, hn ® 0 при n , справедливы условия (IV), (V) статьи [2] и следствие условия нормировки (5). Тогда выполнено (13). Если, кроме того, справедливы условия (14), то fn(x) - состоятельная и асимптотически нормальная оценка плотности f в точке х.

3. Предпочтительный показатель различия

Чтобы продвинуться дальше, введем более сильное ограничение: (VIII) Функция Fx(t) - непрерывная функция по t.

Это ограничение сильное, поскольку исключает распределения, имеющие атомы, в частности, все конечные пространства Z. (В дальнейших исследованиях мы рассмотрим последовательность конечных Z и заменим условие (VIII) на некоторую аппроксимацию.)

Поскольку статистик может сам выбирать меру близости d, введем новый показатель (назовем его "предпочтительный показатель различия")

di(x, y) = Fx(d(x, y)). (17)

Тогда

Fl(t) = P(L\(х)) = Р{У : di(XУ) <t} = p{y : Fx(d(XУ)) <t}. (18)

Поскольку Fx(t) - непрерывная по t функция, то определена обратная функция

Fx~l(a) = minb: Fa(fr = a}. (19)

она возрастает по a, т.к. функция Fx(t) не убывает по t. Поэтому неравенство Fx(d(x, y)) < t эквивалентно неравенству Fx~\Fx (d ( x, y)) < Fx~\t). Тогда

F;'( Fx (d( x, y)) = min>b:Fx (b) = F, (d (x, y)) (20)

http://ej kubagro.ru/2015/04/pdf/21 .pdf

Научный журнал КубГАУ, №108(04), 2015 года

7

по определению обратной функции. Чтобы не усложнять излишне изложение, несколько усилим условие (VIII).

(VIII1) Fx(t) - строго возрастающая непрерывная по t функция, причем Fx(0) = 0.

Если выполнено условие (VIII1), то F~\a) - тоже строго возрастающая функция, непрерывная на области своего определения, и

F~\Fx(t)) = t,Fx (F~l(a)) = a. Если t входит в область определения функции

F-, то

Fl(t) = p{y: Fx(d(x,y)) < t} = p{y: d(x,y) < F-\t)} = Fx(F-\t)) = t. (21)

Если p(Z) = ¥, то цепочка равенств (21) верна при любом t. Если же p(Z) < ¥, то Flx(t) = p(Z) при t > p(Z). Итак,

F1(t) =

t, 0 < t < p(Z), p(ZX t > p(Z).

(22)

Пример 1. Пусть Z = Rk, d - евклидово расстояние, p - мера Лебега. Тогда Fx(t) не зависит от x и Fx(t) = F(t) = p{y: d(x, y) < t} = ck tk, где ck -

объем шара единичного радиуса в Rk, естественный показатель различия имеет вид d1(x, y) = ck dk(x, y), поскольку

p{y : ckdk (x, y) < t} = p\ y : d(x, y) <

V ck J

f 1 V

t

1 = c,

V ck J

=t.

(23)

Пример 2. При непараметрическом оценивании плотности в Rk часто

используют ядра вида

K

f x1~ X1 (i) x2~ X2 (i) xk - Xk (i) ^

(24)

К к к

v n n n у

причем добавляют различные требования симметричности. В виде ядерных функций (3) такие ядра, как правило, представить нельзя, т.к. в (3) K: [0,+¥) ® R1 - функция одного числового аргумента. Если

I < \k

t

http://ej .kuhagro.ml2015l04lpdfl21 .pdf

Научный журнал КубГАУ, №108(04), 2015 года

8

d(x, y) = max | xj - yi |, то функция K = K(d) постоянна на поверхности куба

j j j

max | xj - yj |= const. Тогда

j j j

F(t) = p{y: d(x, y) < t} = 2k tk, di(x, y) = 2k d k(x, y). (25)

Поскольку любое расстояние в R, полученное с помощью некоторой нормы в R, функция F(t) имеет порядок tk, то всегда d1 = Cd k, где С -константа. В Rk в качестве p обычно используют меру Лебега, хотя можно рассматривать, например, меру, порожденную нормально распределенным случайным вектором. При изучении скорости сходимости ядерных оценок можно увидеть некоторые преимущества меры Лебега [9].

4. Ядерные оценки плотности на основе предпочтительного показателя различия

Далее будем использовать предпочтительный показатель различия. Пусть Fx(t) имеет вид (22). Рассмотрим сначала случай p(Z) = ¥. С помощью замены переменных u = t/hn из (5) и (8) получаем, что

b(hn, x) = jK^dt = hn jK(u)du . (26)

n J

0

0

Поскольку согласно (3) можно одновременно умножить ядерную функцию K и нормировочный множитель b на одну и ту же константу и b(hn, x) ф 0, то можно положить

J K (u)du = 1. 0 (27)

Тогда b(hn, x) = hn (28)

и g„(x,X) = j Kfd(hX)]. hn V hn J (29)

Если же p(Z) < ¥, то при справедливости (27) вместо (29) имеем

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

9

b(hn, х) = hri

| K (u)du

(30)

Если ядерная функция K(u) финитна, то в силу hn ® 0 при достаточно большом n справедливы равенства (28) и (29).

Соотношение (9) переходит в условие

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

—| KI — dt = J| K (u )| du

hn 0 v hn) 0

< ¥

(31)

Если неравенство (31 выполнено, то для любого t > 0 при n ® ¥

—| KI — dg = J|K(u)|du ® 0 ,

hn t V hn) i/„

(32)

поскольку hn ® 0. Следовательно, соотношение (10) выполнено. Справедливость условия (V) вытекает из (31). Далее, имеем

dn = dn(х) = -j jK2 — dg = - JK2(u)du , (33)

hn 0 V hn )

и (12) выполнено, если

n0

1

JK2 (uu)du <¥ . (34)

0

Если при этом nhn ®¥ при n ®¥, то выполнены условия (14). Подведем итоги проведенных рассуждений в виде теорем.

Теорема 3. Пусть выполнены условия (VIII'), (27), (31), (34), условия

(II) и (IV) статьи [2], причем hn ® 0 и nhn ®¥ при n ®¥. Тогда справедливы заключения теорем 1 и 2.

Определение 1. Пусть X и Y - пространства с мерами близости рх и Г соответственно. Функция f: X ® Y называется равномерно непрерывной в X в смысле мер близости рх и р2, если для любого e > 0 найдется е> 0 такое, что для любых х, X таких, что р( х, х') <d, имеем Р2 (f (х), f (х')) < e .

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

10

Теорема 4. Пусть выполнены условия теоремы 3 и, кроме того, плотность f равномерно непрерывна в Z в смысле меры близости d и евклидова расстояния в R1 (см. определение 1). Тогда

lim sup | Mfn (x) - f (x)|= 0. (35)

n®¥ xeZ

Все условия теоремы 3 выполнены равномерно по Z, за исключением условия (IV) статьи [2]. Это условие используется при выборе окрестности точки x в доказательстве теоремы 1 той же статьи (см. формулу (10) статьи

[2]). Равномерная непрерывность позволяет использовать окрестность одного и того же радиуса для всех x е Z, а это обеспечивает равномерность всех оценок, т.е. (35).

5. Естественные меры близости

Из всех мер близости (показателей различия) в пространствах произвольной природы выделим т.н. "естественные меры близости".

Определение 2. Мера близости р в пространстве X называется естественной, если из р( xn, x) ® 0 и p(yn, x) ® 0 вытекает, что р( xn, yn) ® 0, а из р(xn, x) ® 0 и р(xn, yn) ® 0 вытекает, что p(yn, x) ® 0 при n для любых x, xn,Уп е X,n = 1,2,...

Лемма 1. Пусть X счетно-компактно [10], топология в X порождена естественной мерой близости р, в пространстве Y задана естественная мера близости р2, функция f: X ® Y непрерывна. Тогда функция f равномерно непрерывна.

Доказательство. Предположим, что отображение f не является равномерно непрерывным. Это означает, что для некоторого е> 0 и каждого натурального n найдутся в Х такие точки x1n и x2n, что

Р( x1n , x2n ) < -, p2(f (x1n ), f (x2n )) ^£. (36)

n

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

11

Бесконечное подмножество {x1n, n = 1,2,...} имеет хотя бы одну предельную точку. Значит, существуют точка x0 е А и последовательность n(k), k = 1, 2, ...., такие, что x1n(k) ® х0 при к ®¥ . Тогда в силу первого неравенства в (36) и определения естественной меры близости имеем x2n(k) ® х0. Из определения непрерывности f следует, что при к ®¥

P2(f(x1n( к)Х f (x0)) ® 0, P2(f (x2n(k)), f (x0)) ® 0, (37)

а это в силу определения естественной меры близости несовместимо со вторым неравенством в (36). Лемма 1 доказана.

Теорема 5. Пусть выполнены условия теоремы 3, пространство Z счетно-компактно, мера близости d является естественной (определение

2). Тогда справедливо соотношение (35).

Для доказательства достаточно сослаться на теорему 4 и лемму 1.

Замечание. В теоремах 4 и 5 условие (VIII1) предполагается выполненным при всех x е Z. Требовать, чтобы nhn ®¥ и было справедливо (34), - нет необходимости.

6. Асимптотическое поведение дисперсий ядерных оценок плотности

Теорема 6. Пусть выполнены условия теоремы 3. Тогда

lim nhnDfn (x) = f (x) j K2 (u )du .

n®¥ J

0

(38)

Доказательство проводится по той же схеме, что и доказательство теоремы 1 в статье [2]. Согласно формуле (17) статьи [2] и (28) имеем

Dfn (x) =

1

nh

jK

d ( x, y)

h

f (y)p(dy) -

n J

j K

d(x, y)

h

f (y) p(dy)

nJ

> .

(39)

-i 2

Z

Z

Возьмем e > 0. По условию (IV) статьи [2] найдется d > 0 такое, что

| f (x) - f (y) |< e (40)

для всех y е Z таких, что d(x, y) < d. Имеем для i = 1, 2

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

12

MK

d ( x, X ) h

V "n J Le( x)

J k

d ( x, y)

V hn J

f (y) p(dy) + J К

Z \ Ls( x)

d ( x, y)

V hn J

f (y) p(dy). (41)

Второе слагаемое в (41) не превосходит в силу условий (II) статьи [2] и (VIII')

f t \

v hn J

J К — dt =c2hn J|К (t)|dt.

(42)

SI hn

Рассмотрим первое слагаемое в формуле (41). В силу (40)

J К

Ls( x )

<e J

d ( x, y)

V hn J

f(y)p(dy) - f(x) J К

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

LS(x)

К

d ( x, y )

V hn J

LS(x)

f t \

d ( x, y)

V hn J

p(dy)

<

p(dy) <eJ К — dt = ehn J|К (и)|du.

V hn J

(43)

Кроме того,

d ( x, y) h

LS(x) V n J

J K

S f X\

ri

h

0 V"n

SI hn

VI, ~ ' "n

p(dy) = J К — dt =hn J К (и U)du =hn J К (и )du - J К (и )d

h 0 V 0

(44)

SI hn

Из (43) и (44) вытекает, что

J К f(y)p(dy)-f(x)hnJK(u)du

h

LS(x) V n J

<ehn J| К (и )du +hnf(x) J|K (u )du (45)

SI hn

Из (41), (42) и (45) следует, что для i = 1, 2 справедливы оценки

MK

d ( x, X )

V hn J

- hnf (x)JК (и)du < hn\ eJ|К (и) du + (c2 + f (x)) J|К (и) du > = hnfr . (46)

SI h

(Заметим, что из неравенства (46) вытекает существование

рассматриваемых математических ожиданий.) С помощью (39) и (46) получаем, что

1

Dfn ( x):

nh

hnf (x)J K 2(u)du + K№ - hnf (x)J K (u)du + hnb(1)

fx)' nh

fr-(„)d„+b(2)-fi(x)+2b(i>f(x)+b-(i>, b(i)|<b, i = 1,2 * nh n

(47)

c

2

S

0

0

0

0

0

0

0

0

http:IIej.kubagro.ruI2015I04IpdfI21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

13

(с учетом (27)). Выбирая е> 0 достаточно малым, а затем n достаточно большим, можно в силу (46), (27), (31) и (34) сделать Д и Д2 сколь угодно малыми, откуда и следует (38). Теорема 6 доказана.

Теорема 7. Пусть выполнены условия теоремы 6 и, кроме того, плотность f равномерно непрерывна. Тогда

liml nhn sup

xeZ

Dfn (x) - f(X) f K2 (u )d

nh J

nh

u )du

0.

0

(48)

Следствие. В условиях теоремы 7

lim sup Dfn (x) = 0. (49)

n®¥ xeZ

Теорема 8. Пусть выполнены условия теоремы 6, пространство Z счетно-компактно, мера близости d является естественной. Тогда справедливы соотношения (48) и (49).

Доказательства теорем 7 и 8 аналогичны доказательствам теорем 4 и 5. Условие (VIIIr) предполагается выполненным при всех xe Z .

7. Ядерные оценки плотности в пространстве интегрируемых с квадратом функций

Пример 3. Пусть пространство Z - пространство интегрируемых с квадратом функций g :[0,1] ®R1 таких, что g(0) = g(1) = 0. Пусть мера p порождается броуновским мостом - гауссовским процессом £(t) на [0, 1] таким, что

MX(t) = 0, MX(t)X(s) = min(s, t) - st, (5 0)

а мера q порождается процессом £(t) + a(t), где a(t) - детерминированная функция,

a(t) = 2 alj (t). (51)

\<i<m

В (51) jk (t) - собственные функции ядра min(s, t) - st, т.е. функции (см. [11, с.248])

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

14

jk(t) = 42sm(kpt), k = 1,2,... (52)

соответствующие собственным числам

1 =т4г, k = 1,2,... (53)

k Р

Согласно теореме 2 на с.115 монографии [12] плотность ^ по p существует и имеет вид

f(x) = (x) = exp А~Уг x) - 2 b)| (5 4)

где А - корреляционный оператор процесса X(t), b = А~1/гa, т.е.

b = Z akj(t Ьт==Z akkppk(t). (55)

1£k £m -yj A'k 1£k £m

Далее,

(b, А"к x) = Z (x,jk )akk 1£k £m (56)

где 1 (x, jk ) = | x(t)V2 sin(kp t)dt. 0 (57)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Значит, 1 (b, A~yx) = | x(t)j(t)dt, 0 (58)

где j(t) = Z akkVV2sin(kp t) . 1£k £m (59)

Поскольку (b, b) = Z a2kk V = 2C 1£k £m (60)

при некотором C, то согласно (54), (58) и (60)

f (x) = exp jj x(t)j(t)dt - C|. (61)

Рассмотрим ядерные оценки плотности. Для плотности fx), заданной формулой (61), условие (II) статьи [2] не выполнено - плотность не

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

15

является ограниченной. Поэтому рассмотрим финитные ядра K(u) (см. теорему 2). В качестве меры близости рассмотрим

r (У У ) = sup I x(t) - y(t) |. (62)

0<t<1

Ясно, что в топологии, порожденной р2, плотность fx) непрерывна. Имеем:

Fx (q)=P \ sup1 x(t) - x(t) |< q

l0<t<1

(63)

В частности, при x = x(t) ° 0

Fx(q) = Fm(q) = 2(~1)‘e'2‘V - (64)

-¥<k <¥

- функция распределения Колмогорова. Значит, можно сделать преобразование (17), перейдя к предпочтительному показателю различия.

Если в качестве меры близости взять

1

Л(У У) = j(x(t) -У(t))2dt, (65)

0

то в топологии, порожденной р3, плотность fx) непрерывна (в силу неравенства Коши - Буняковского - Шварца). Тогда

F, (q) = P\j (X(t) - x(t))2 dt < q

0

(66)

При x = x(t) = 0 имеем согласно [13, 14]

Fx (q) = F(2)(q) =1+

2_

p

2kp

2 (-1)k j

k=1 (2k-1)p

-l2q/

e '2

dl,

-lsin l

(67)

т.е. Fx (q) есть функция распределения, асимптотическая для функции распределения статистики Крамера - Мизеса - Смирнова а?.

В обоих случаях справедливы приведенные выше теоремы об асимптотическом поведении непараметрических оценок плотности. Естественно, что разные способы оценивания приводят к одному и тому же результату - значению плотности в рассматриваемой точке.

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

16

Рассмотрим подробнее оценивание плотности в точке x = x(t) ° 0. Тогда для предпочтительного показателя различия (см. (17)), построенного исходя из р2 (см. (62)):

а для предпочтительного показателя различия (см. (17)), построенного исходя из r (см. (65)):

где X1(t), X2(t), ..., Xn(t) - независимые реализации процесса £(t) + a(t). Если ядро K удовлетворяет условиям (27), (31), (34) и финитно, hn ® 0 и nhn ®¥ при n ® ¥, то согласно теореме 3

при n ®¥, где C определено в (60).

Некоторые результаты по рассматриваемой тематике приведены в статье [15].

Пример 3 показывает, что развиваемая в настоящей статье теория применима, в частности, к функциональным пространствам Z и позволяет получать отдельные новые результаты для случайных процессов. Однако эта теория развита для нужд статистики объектов нечисловой природы (статистики нечисловых данных, нечисловой статистике), в которой основной интерес представляют конечные пространства Z. Для них приведенные выше результаты нельзя применять непосредственно, поскольку не выполнено условие (VIII1), функция Fx(t) - функция дискретного распределения (а не непрерывного), а потому "не проходят"

(68)

(69)

fn (0) ® exp(-C), f2n (0) ® exp(-C)

(70)

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

17

доказательства теорем 3 - 8. Нами развита теория, охватывающая случай конечных пространств Z. Она будет изложена в дальнейших публикациях.

Литература

1. Орлов А.И. Организационно-экономическое моделирование: учебник : в 3

ч. Часть 1: Нечисловая статистика. - М.: Изд-во МГТУ им. Н.Э. Баумана. 2009. - 541 с.

2. Орлов А.И. Оценки плотности распределения вероятностей в

пространствах произвольной природы / А.И. Орлов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. - Краснодар: КубГАУ, 2014. -№05(099). С. 33 - 49. - IDA [article ID]: 0991405003. - Режим доступа: http://ei.kubagro.ru/2014/05/pdf/03.pdf

3. Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю.В. Прохоров. - М.: Большая Российская Энциклопедия, 1999. - 910 с.

4. Орлов А.И. Статистика объектов нечисловой природы и экспертные оценки // Экспертные оценки / Вопросы кибернетики. Вып.58. - М.: Научный Совет АН СССР по комплексной проблеме «Кибернетика», 1979. - С. 17-33.

5. Орлов А. И. Статистика объектов нечисловой природы // Теория вероятностей и ее применения. - 1980. - Т.ХХУ. - №3. - С.655-656.

6. Орлов А.И. Непараметрические оценки плотности в топологических пространствах // Прикладная статистика. Ученые записки по статистике, т.45. - М.: Наука, 1983. - С. 12-40.

7. Rosenblatt M. Remarks on some nonparametric estimates of a density function // Ann. Math. Statist. - 1956. - У.27. - N 5. - P. 832 - 837.

8. Parzen E. On estimation of a probability density function and mode // Ann. Math. Statist. - 1962. - У.33. - N 6. - P. 1065-1076.

9. Орлов А.И. Ядерные оценки плотности в пространствах произвольной природы // Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. / Перм. гос. нац. иссл. ун-т. - Пермь, 1996. - Вып. 11. - С.68-75.

10. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. - М.: Наука, 1972. - 496 с.

11. Гихман И.И., Скороход А.В. Введение в теорию случайных процессов. -М.Наука, 1965. - 656 с.

12. Скороход А.В. Интегрирование в гильбертовом пространстве. - М.: Наука, 1975. - 232 с.

2

13. Смирнов Н.В. О распределении w - критерия Мизеса // Математический сборник. - 1937. - Т.2. - Вып.1. - С. 973 - 993.

14. Орлов А.И. Скорость сходимости распределения статистики Мизеса -Смирнова // Теория вероятностей и ее применения. - 1974. - Т.19. - Вып.4. - С. 766 - 786.

15. Орлов А. И. Оценки плотности в пространствах произвольной природы // Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр. / Перм. гос. нац. иссл. ун-т. - Пермь, 2013. - Вып. 25. - С.21-33.

References

1. Orlov A.I. Organizacionno-jekonomicheskoe modelirovanie: uchebnik : v 3 ch. Chast' 1: Nechislovaja statistika. - M.: Izd-vo MGTU im. N.Je. Baumana. 2009. - 541 s.

http://ej.kubagro.ru/2015/04/pdf/21.pdf

Научный журнал КубГАУ, №108(04), 2015 года

18

2. Orlov A.I. Ocenki plotnosti raspredelenija verojatnostej v prostranstvah proizvol'noj prirody / A.I. Orlov // Politematicheskij setevoj jelektronnyj nauchnyj zhurnal Kubanskogo gosudarstvennogo agrarnogo universiteta (Nauchnyj zhurnal KubGAU) [Jelektronnyj resurs]. - Krasnodar: KubGAU, 2014. - №05(099). S. 33 - 49. - IDA [article ID]: 0991405003. - Rezhim dostupa: http://ej.kubagro.ru/2014/05/pdf/03.pdf

3. Verojatnost' i matematicheskaja statistika: Jenciklopedija / Gl. red. Ju.V. Prohorov. - M.: Bol'shaja Rossijskaja Jenciklopedija, 1999. - 910 s.

4. Orlov A.I. Statistika ob#ektov nechislovoj prirody i jekspertnye ocenki // Jekspertnye ocenki / Voprosy kibernetiki. Vyp.58. - M.: Nauchnyj Sovet AN SSSR po kompleksnoj probleme «Kibernetika», 1979. - S.17-33.

5. Orlov A.I. Statistika ob#ektov nechislovoj prirody // Teorija verojatnostej i ee primenenija. - 1980. - T.XXV. - №3. - S.655-656.

6. Orlov A.I. Neparametricheskie ocenki plotnosti v topologicheskih prostranstvah // Prikladnaja statistika. Uchenye zapiski po statistike, t.45. - M.: Nauka, 1983.

- S. 12-40.

7. Rosenblatt M. Remarks on some nonparametric estimates of a density function // Ann. Math. Statist. - 1956. - V.27. - N 5. - P. 832 - 837.

8. Parzen E. On estimation of a probability density function and mode // Ann. Math. Statist. - 1962. - V.33. - N 6. - P. 1065-1076.

9. Orlov A.I. Jadernye ocenki plotnosti v prostranstvah proizvol'noj prirody // Statisticheskie metody ocenivanija i proverki gipotez: mezhvuz. sb. nauch. tr. / Perm. gos. nac. issl. un-t. - Perm', 1996. - Vyp. 11. - S.68-75.

10. Kolmogorov A.N., Fomin S.V. Jelementy teorii funkcij i funkcional'nogo analiza. - M.: Nauka, 1972. - 496 s.

11. Gihman I.I., Skorohod A.V. Vvedenie v teoriju sluchajnyh processov. -M.Nauka, 1965. - 656 s.

12. Skorohod A.V. Integrirovanie v gil'bertovom prostranstve. - M.: Nauka, 1975.

- 232 s.

13. Smirnov N.V. O raspredelenii - kriterija Mizesa // Matematicheskij sbornik. -1937. - T.2. - Vyp.1. - S. 973 - 993.

14. Orlov A.I. Skorost' shodimosti raspredelenija statistiki Mizesa - Smirnova // Teorija verojatnostej i ee primenenija. - 1974. - T.19. - Vyp.4. - S. 766 - 786.

15. Orlov A.I. Ocenki plotnosti v prostranstvah proizvol'noj prirody // Statisticheskie metody ocenivanija i proverki gipotez: mezhvuz. sb. nauch. tr. / Perm. gos. nac. issl. un-t. - Perm', 2013. - Vyp. 25. - S.21-33.

http://ej.kubagro.ru/2015/04/pdf/21.pdf

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.