Научная статья на тему 'Оценивание функции среднего для зашумленного случайного процесса при наличии разреженных данных'

Оценивание функции среднего для зашумленного случайного процесса при наличии разреженных данных Текст научной статьи по специальности «Математика»

CC BY
4
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Журнал
Чебышевский сборник
Scopus
ВАК
RSCI
Область наук
Ключевые слова
непараметрическая регрессия ◆ оценивание функции среднего ◆ разреженные данные ◆ ядерные оценки ◆ равномерная состоятельность / nonparametric regression ◆ mean function estimation ◆ sparse functional data ◆ kernel estimation ◆ uniform consistency

Аннотация научной статьи по математике, автор научной работы — Линке Ю. Ю.

Рассматривается регрессионная постановка задачи оценивания функции математического ожидания некоторого почти наверное непрерывного случайного процесса, когда зашумленные значения независимых копий случайного процесса наблюдаются в некоторых известных наборах точек (вообще говоря, случайных), при этом количество наблюдений для каждой из копий случайно и совокупность этих величин по всем сериям не обязательно состоит из независимых и одинаково распределенных компонент. Данная постановка включает в себя два наиболее популярных в научной литературе варианта разреженных данных, когда либо количества наблюдений в сериях представляют собой независимые одинаково распределенные случайные величины, либо количества наблюдений в каждой серии неслучайны и равномерно ограничены по всем сериям.В работе предложены новые оценки ядерного типа для функции математического ожидания случайного процесса. Доказана равномерная состоятельность новых ядерных оценок при весьма слабых и универсальных ограничениях касательно стохастической природы временных точек наблюдений: требуется лишь, чтобы вся совокупность этих точек с высокой вероятностью образовывала бы измельчающееся разбиение области определения исходного случайного процесса.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по математике , автор научной работы — Линке Ю. Ю.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Mean function estimation for a noisy random process under a sparse data condition

We consider a regression statement of the problem of estimating the mean function of some almost sure continuous random process, when noisy values of independent copies of this random process are observed in some known sets of time points (generally speaking, random). Moreover, the size of observations for each of the copies is random, and the total collection of the time points for all series does not necessarily consist of independent and identically distributed random variables. This setting includes two of the most popular sparse data variants in the scientific literature, in which ever the sizes of observations in the series are independent identically distributed random variables, or the sizes of observations in each series are nonrandom and uniformly bounded over all series.The paper proposes new kernel-type estimators for the mean function of a random process. The uniform consistency of the new kernel estimators is proved under very weak and universal restrictions regarding the stochastic nature of observed time points: it is only required that the entire set of these points with a high probability would form a refining partition of the original random process domain.

Текст научной работы на тему «Оценивание функции среднего для зашумленного случайного процесса при наличии разреженных данных»

ЧЕБЫШЕВСКИЙ СБОРНИК

Том 24. Выпуск 5.

УДК 519.234 DOI 10.22405/2226-8383-2023-24-5-112-125

Оценивание функции среднего для зашумленного случайного процесса при наличии разреженных данных 1

Ю. Ю. Линке

Линке Юлиана Юрьевна — кандидат физико-математических наук, Институт математики им. С. Л. Соболева Сибирского отделения Российской академии наук (г. Новосибирск). e-mail: linke@math.nsc.ru

Аннотация

Рассматривается регрессионная постановка задачи оценивания функции математического ожидания некоторого почти наверное непрерывного случайного процесса, когда за-шумленные значения независимых копий случайного процесса наблюдаются в некоторых известных наборах точек (вообще говоря, случайных), при этом количество наблюдений для каждой из копий случайно и совокупность этих величин по всем сериям не обязательно состоит из независимых и одинаково распределенных компонент. Данная постановка включает в себя два наиболее популярных в научной литературе варианта разреженных данных, когда либо количества наблюдений в сериях представляют собой независимые одинаково распределенные случайные величины, либо количества наблюдений в каждой серии неслучайны и равномерно ограничены по всем сериям.

В работе предложены новые оценки ядерного типа для функции математического ожидания случайного процесса. Доказана равномерная состоятельность новых ядерных оценок при весьма слабых и универсальных ограничениях касательно стохастической природы временных точек наблюдений: требуется лишь, чтобы вся совокупность этих точек с высокой вероятностью образовывала бы измельчающееся разбиение области определения исходного случайного процесса.

Ключевые слова: непараметрическая регрессия, оценивание функции среднего, разреженные данные, ядерные оценки, равномерная состоятельность.

Библиография: 30 названий. Для цитирования:

Ю. Ю. Линке. Оценивание функции среднего для зашумленного случайного процесса при наличии разреженных данных // Чебышевский сборник, 2023, т. 24, вып. 5, с. 112-125.

CHEBYSHEVSKII SBORNIK Vol. 24. No. 5.

UDC 519.234 DOI 10.22405/2226-8383-2023-24-5-112-125

Mean function estimation for a noisy random process under a

sparse data condition

Yu. Yu. Linke

1 Исследование выполнено в рамках государственного задания ИМ СО РАН (проект FWNF-2024-0001).

Linke Yuliana Yurievna — candidate of physical and mathematical sciences, Sobolev Institute of Mathematics, Siberian Branch of the Russian Academy of Sciences (Novosibirsk). e-mail: linke@math.nsc.ru

Abstract

We consider a regression statement of the problem of estimating the mean function of some almost sure continuous random process, when noisy values of independent copies of this random process are observed in some known sets of time points (generally speaking, random). Moreover, the size of observations for each of the copies is random, and the total collection of the time points for all series does not necessarily consist of independent and identically distributed random variables. This setting includes two of the most popular SpS.rSG dcltcl variants in the scientific literature, in which ever the sizes of observations in the series are independent identically-distributed random variables, or the sizes of observations in each series are nonrandom and uniformly bounded over all series.

The paper proposes new kernel-type estimators for the mean function of a random process. The uniform consistency of the new kernel estimators is proved under very weak and universal restrictions regarding the stochastic nature of observed time points: it is only required that the entire set of these points with a high probability would form a refining partition of the original random process domain.

Keywords: nonparametric regression, mean function estimation, sparse functional data, kernel estimation, uniform consistency.

Bibliography: 30 titles. For citation:

Yu. Yu. Linke, 2023, "Mean function estimation for a noisy random process under a sparse data condition", Chebyshevskii sbornik, vol. 24, no. 5, pp. 112-125.

1. Введение

Пусть даны наблюдения {Xij, г = 1,.. .п, j = 1,... ,m,i}, которые представимы в виде

Xij = fi(Zij)+ £ij, i = 1,...,n, j = 1,...,mi, (1)

где fi(t),...,fn(t) — независимые ненаблюдаемые копии некоторого почти наверное непрерывного случайного процесса f (t), определенного на конечном интервале Т (без ограничения общности будем считать, что Т = [0,случайные вели чины {eij} — ненаблюдаемые погрешности, величины {Zij} известны и могут быть как детерминированными, так и случайными. Таким образом, в каждой серии г = 1,... ,п мы наблюдаем зашумленные значения {Xij ,j = 1,... ,m,i} случайной функции fi(t) в наборе ее аргументов {Zij ,j = 1,... ,mi}, которые нередко называют временными точками. Задача состоит в том, чтобы по парам наблюдений {(Zij,Xij), г = 1,.. .п, j = 1,..., mi} оценить функцию среднего ^(t) = Ef (t).

Оценивание функции среднего (наряду с функцией ковариации) случайного процесса по выборочным данным со структурой (1) является одной из важнейших задач в так называемом функциональном анализе данных (см., например, [3], [6], [8], [17]) и многие недавние работы были посвящены решению этой задачи. Неполный список таких работ, связанных с методами ядерного сглаживания, включает [2], [5]-[10], [18], [20], [21]-[27]. Оценки для функции среднего могут представлять как самостоятельный интерес, так и играть важную вспомогательную роль в том или ином последующем анализе (см., например, [4], [6], [8], [9], [17], [19], [25]). В задаче оценивания функции среднего чаще всего исследуется один из трех вариантов асимптотических свойств оценок: равномерная состоятельность ([6], [9], [22], [25], [27]), .^-состоятельность ([5], [25]), асимптотическая нормальность ([7], [21], [23], [25]). Вопросы

интервального оценивания рассматриваются, например, в [7], [18], [26]. Исключительная важность свойства равномерной состоятельности оценок (в контексте рассматриваемой задачи) отмечается, например, в [9] и [22].

Данные в модели (1) нередко подразделяют на те или иные типы в зависимости от количества наблюдений для той иной реализации случайного процесса. Так, данные могут быть в некотором смысле плотными, или разреженными (в английской терминологии — dense и sparse, соответственно), или смешанными. Хотя не существует строгого разделения типов функциональных данных (см., например, [19], [25]), тем не менее, данные принято относить к разреженным (неплотным) в одном из двух случаях: либо когда неслучайное количество наблюдений в каждой серии равномерно ограничено, т.е. maxi<j<ra mi < с и константа с не зависит от п ([5], [9], [27]), либо когда mi случайны и являются независимыми копиями некоторой целочисленной случайной величины ([21], [22], [26]). К плотным данным относят ситуацию, когда mini<i<rami > т(п) ^ го при п ^ го ([9], [18], [23], [27]). Стоит отметить, что в литературе основное внимание уделяется именно этим двум указанным типам данных. Иные данные, в том числе смешанного типа, когда для одних реализаций процесса данные могут быть плотными, а для других — разреженными, рассматривались, например, в [9] и [25].

Подходы к оцениванию, используемые в случае плотных или разреженных данных, как правило, различны (см., например, [17], [19]). В случае плотных данных для построения оценки функции среднего естественно предварительно оценить каждую случайную функцию по наблюдениям соответствующей серии, а затем провести усреднение по всем сериям (см., например, [1], [5], [11], [23]). Для разреженных данных такой способ построения оценки не будет работать в силу недостаточности информации, относящейся к каждой реализации случайного процесса, и зачастую наблюдения предварительно каким-либо образом объединяют для заимствования информации друг у друга (см., например, [5], [22], [25]). Имеется точка зрения (см., например, [19]), что оценивание для разреженных данных нередко требует больших усилий, нежели для плотных. Некоторые унифицированные подходы, которые годятся как для плотных, так и для разреженных функциональных данных, предложены в [9] и [25].

Как и в классических задачах регрессии, модели (1) со случайными или детерминированными временными точками {Zij} принято рассматривать отдельно. В первом случае, как правило, предполагается, что случайные величины {Zij } являются независимыми и одинаково распределенными (см., например, [2], [5], [7], [9], [21]—[27]). Некоторые авторы подчеркивают (см., например, [5]), что их результаты можно перенести и на слабо зависимые величины.

В данной работе при близких к минимальным условиях на временные точки построены равномерно состоятельные оценки ядерного типа для функции среднего в условиях разреженных данных. Относительно количества данных mi, г = 1,... ,п, в сериях наблюдений мы будем предполагать, что это положительные целочисленные случайные величины, не зависящие от п, не обязательно независимые или одинаково распределенные. Так что указанное условие включает оба вышеупомянутые предположения, используемых в литературе в случае разреженных данных: либо {mi} случайны и являются независимыми копиями целочисленной случайной величины, либо неслучайны и равномерно ограничены. Отметим, что во всех известных нам работах указанные два случая разреженных данных рассматриваются отдельно. В отличие от известных ранее результатов, новые оценки универсальны в смысле их нечувствительности к стохастической природе временных точек, которые могут быть как фиксированными, так и случайными, и при этом не обязательно состоящими из независимых или слабо зависимых случайных величин. В наших условиях зависимость временных точек может быть существенно более сильной (в сравнении с известными ранее условиями), когда не выполнены те или иные предельные теоремы или моментные неравенства, с использованием которых обычно исследуются ядерные оценки в непараметрической регрессии. Относительно временных точек требуется лишь, чтобы вся их совокупность (по всем сериям) с высокой вероятностью образовывала бы измельчающееся разбиение области определения случайного

процесса. Подчеркнем, что предлагаемые условия равномерной состоятельности оценок одновременно включают в себя как ситуацию фиксированных, так и случайных временных точек.

Ранее подобная идея об общих универсальных относительно стохастической природы и близких к минимальными условиях на регрессоры была реализована в [1] и [11] в классической постановке задачи непараметрической регрессии. В частности, для оценивания (восстановления) регрессионной функции в этих работах относительно набора регрессоров требуется лишь, чтобы этот набор с высокой вероятностью образовывал измельчающееся разбиение области определения регрессионной функции. Указанное условие по сути является необходимым для восстановления регрессионной функции с той или иной точностью. Полезно заметить, что равномерную состоятельность новых оценок, предложенных в [1] и [11] (и относящихся к локально-постоянным и локально-линейным ядерным оценкам), удалось доказать лишь при указанном минимальном ограничении на регрессоры во многом благодаря специальной структуре этих оценок, содержащей конструкции интегральных сумм Римана (это обстоятельство позволяет асимптотические свойства оценок исследовать за счет близости интегральных сумм и соответствующих интегралов, а не предельных теорем). В данной работе мы используем идеи и результаты из [11]. Отметим также, что близкие условия на регрессоры использовались в [12] и [28] в задачах непараметрической регрессии, а в [29], [30], [13]-[16] — в нелинейной регрессии.

2. Основные результаты

Прежде чем перейти к построению оценки для функции среднего ^(Ь), приведем ряд условий на параметры модели (1), которые мы будем использовать в тех или иных сочетаниях, а также условия на ядро сглаживания К, участвующее в оценивании.

(А1) Пары наблюдений )} представимы в виде (1), где {!(■), ..., /п(■) — неиз-

вестные независимые одинаково распределенные с вероятностью 1 непрерывные случайные процессы, заданные на, [0,1^; временные точки {Zij; г = 1,... ,п, ] = 1,..., тг} представляют, собой набор наблюдаемых случайных величин со значениям,и в [0,1], имеющих, вообще говоря, неизвестные распределения, не обязательно независимых или, одинаково распределенных; положительные целочисленные случайные величины {тг,г = 1,...,п} не обязательно независимые или одинаково распределенные. Случайные величины {Zij} могут зависеть от п.

(А 2) Случайные вели чины {тг} не зависят от {¡г(^} и ^^ }, а также не зависят, от, п.

(А2) При некотором, а > 3 выполнено

тахЕт" < \а < ж,

г<п

где константа \а может быть неизвестна и не зависит от, п.

(A2) Выполнено равенство т1 = ... = тп и при некотором а > 0 имеет место ограничение Emf < ж.

(A2") Величины, {mi} неслучайны и равномерно ограничены:

max mi < с < ж,

i<n

где константа с не зависит от, п.

(A3) Ненаблюдаемые случайные погрешности {sij; г = 1,...,п, j = 1,...,mi} при всех i,j, а т,а,кже (il,jl) = (i2, j2), с вероятностью 1 удовлетворяют условиям

Ep£ij = 0, maxEpe2j ^ a22, Epeilj1 ei2j2 = 0,

где константа a2 > 0 может быть неизвестной и не зависящей от п, символ Ep обозначает условное математическое ожидание при фиксации а-алгебры F, порожденной случайным,и величинам,и {Zij; г = 1,... ,п, j = 1,..., mi} и {mi, г = 1,..., п}.

(A4) Случайные функции {fi(t)} не зависят, от, {Zij}, при этом

sup Dfi(t) <jj < го. te[0,i]

(A5) Ядерная функция К(t), t £ R является плотностью симметричного распределения с носителем на [—1,1], т.е. К(t) ^ 0 К(t) = К(—t) при всех t £ [—1,1] и /_11К(t)dt = 1. Предполагается, что функция, К(t) определена на, R удовлетворяет условию Липшица, с константой 1 < L < го и К(±1) = 0.

В дальнейшем нам понадобится обозначение = Н-1К(h-11). Понятно, что К^(^)

— плотность распределения на [—h,h]. Считаем, что всюду в дальнейшем пределы, если не оговорено иное, берутся при п ^ го. Через Ор(г]п) будем обозначать некоторую случайную величину такую, что для каждого положительного х выполнено

limsupP(|(nl/Vn >х) < р(х),

где {Vn} ~ положительные (возможно, случайные) величины, а функция @(х) не зависит от п и Р(х) = 0. Введем также обозначение для модуля непрерывности (§) функции

»(t) = Efi(t):

ш„(5)= sup 1ц(х) — р(у)1

х,у: |ж-

Перейдем к построению оценки для функции ^(i). Положим N = mi + ... + тп и по выборке {Zij; г = 1,...,п, j = 1,...,mi} образуем вариационный ряд, элементы которого обозначим через Zn:1 < ... < Zn:n. Положим Zn:0 = 0 Zn:n+1 = 1. Пусть N = lr + s, где I, г и s — целые, г неслучайно, а случайные величины I и s таковы, что 1 < s < г почти наверное (т.е. s — это остаток от деления N на I). Считаем, что г = г(п) ^ го и г = о(п), так что I = 1(п) ^ п/г — 1 также должно неограниченно возрастать с ростом п. Определим следующие величины:

A ZNl = ZN :N+1 — ZN :r(l-1), AZNk = ZN :rk — ZN :r{k-1), к = 1,...,l — 1. (2)

Таким образом, отрезок [0,1] мы разбили на I попарно несовместных отрезков с длинами A Zn 1,..., A Zni, каждый из которых (за исключением последнего отрезка) содержит по г точек, а последний отрезок длины A Z^i содержит г + s < 2г точек. Нам также потребуются следующие обозначения:

Н1 = {(i, j) ■ Zij £ [ZN:0, ZN:r]},

Hk = {(i, j) ■ Zij £ ^N^^-1),, ZN::rk\},, к = 2,...,l.

Отметим, что множества Hk, к = 1,... ,1 — 1, содержат ровно по г пар индексов, а множество Hi содержит г + s < 2г пар индексов. При к = 1,... ,1 — 1 положим

X fc = Г-1 £ Xij, fk = г-1 Y. fi(Zij), ёк = Г-1 Y. £И (3)

(iJ)evk (i,j)eHk (i,j)eHk

и определим величины

Xi = (r + s)-1 Y Xi3, fi = (r + s)-1 Y fi(Zij), * = (r + s)-1 Y £H. W

(i,j)eHl (i,j)em (i,j)eHl

Далее, преобразуем уравнение (1) следующим образом:

Xк = 1к + ^к, к = 1,... ,1.

В силу условий (А1), (А4), определения множеств Нк, закона больших чисел, а также условия (А2) шш (N2), можно ожидать, что при любом к = 1,..., I выполнено ~ Ц-(Ъ), где £ € [ZN:г(к-1), -.гк]■ Положим для определенности £ = ZN-.гк- Иными словами,

Хк ~ ^{ЯN:гк) + ёк, к = 1,...,1.

Мы предлагаем оценить функцию среднего ^(Ь) в такой модели непараметрической регрессии с помощью метода ядерного сглаживания из [1]. В итоге оценку для ^(Ь) определим равенством

Е, XkKh(t — Zn:rk)^ZNk k=l_

El

, л Kh(t — ZN:Гk)AZNk k=l

m = 1 ......—-—. (5)

Основное предположение на временные точки, гарантирующее существование равномерно состоятельной оценки для функции среднего в классе введенных оценок, состоит в следующем.

(Аб) Имеет место предельное соотношение

Р

5i = max AZNk ^ 0 при п ^ ж. l<k^l

Замечание 3. Другими словам,и, условие (Аб) означает,, что набор точек {Zij} с высокой вероятностью образует измельчающееся разбиение отрезка [0,1]. Если {Z^} независимы и одинаково распределены, а, отрезок [0,1] является носителем, распределения, то условие (Аб) выполнено. В частности, в случае существования отделенной от, нуля, на, [0,1] плотности распределения Zll и неслучайном I, с вероятноетью 1 справедливо соотношение 5i = О (log l/l). Если последовательность бесконечномерных векторов {mi, Zn, Zi2,...}, г = 1, 2,..., удовлетворяет условию а-перемешивания, причем для любого фиксированного г все конечномерные распределения последовательности {Zij; j ^ 1} имеют строго положительные плотности, а сам,а, эта последовательность не зависит, от, mi, то условие (Аб) также будет выполнено. Но выполнение условия (Аб) вполне возможно и для других типов зависим,ост,и, которая может быть более сильной, нежели классические условия слабой зависим,ост,и, (например, когда не выполнены, предельные теоремы типа законов больших чисел). Соответствующие примеры и обсуждения такого рода, условий можно найти, в [1],

т im»т

Основной результат работы состоит в следующем.

Теорема 1. Пусть выполнены, условия Тогда, для, любого фиксированного

h <Е (0,1/2) с вероятностью 1

sup lfi(t) - v(t)l ^ U^(h) + u^(5i) + (i,r,h + rn,r (6)

te[o,l]

и случайные величины (i,r,h и щ>г таковы, что

P(Ci,r,h >y,Si < h/(8L)) < C^L2y-2h-2r-lE5l, P(Vir>y) < 2afM3nr-2y-2 + P( max mi > м),

' J \i=l,...,n )

где С — абсолютная положительная постоянная, а М — произвольная положительная константа. Если дополнительно при некотором а > 0 и всех г < п выполнено Em" < ж, то

о а "¡т-3— а 2а . .

P(vi,r >у) < 2(2a2f) 3+а п3+а (гу)-3+а , где Ха,п = E( max т").

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

J i<n

Замечание 4. Отметим, что 81 ^ 1, а пот,ом,у при выполнении условия (Аб) имеет место предельное соотношение Е5[ ^ 0. Кроме того, справедливо соотношение

(1,Ф = Ор (й-1(г-1Ей))1/2) + О(к-1Е5г). (7)

Далее, если выполнено (А'2), то в силу очевидной оценки тахг=1,./пт'^ получаем,,

Что Ха,п < п\а, а, потому

о а 2а

Р(т,г > у) < 2(2(72) 3+"Л«+а п(гу)-. Если выполнено (А'2) или (А'2'), то соответственно

о а / \ 3 а 2а по о о

Р(> у) < 2(2(2) 3+а (Ет") 3+апз+а (гу) 3+а , р(> у) ^ 2а}с3пг-2у-2.

Таким, образом, если выполнено (А'2), то щ>г = Ор (п(3+а">/ (2а"> г-1), а, если справедливо одно из двух условий (А'2) или ( А2','), то щуГ = Ор (у/и/г).

Из теоремы 1 и замечания 4 получаем следующие утверждения.

Следствие 1. Пусть выполнены, условия (А1 )-(Аб), (А2) и

к ^ 0, к-2г-1Е5г ^ 0, Р(5г > к/(8Ь)) ^ 0, п(3+а)/(2а)г-1 ^ 0. (8)

Тогда,

вир Ц1(г) 0. (9)

¿е[0Д]

Следствие 2. Пусть выполнены, условия (А1)-( Аб) и (А'2); а, также справедливы, первые три соотношения в (8) и у/п/г ^ 0. Тогда имеет место сходимость (9).

Следствие 3. Пусть выполнены, условия (А1); (Аз)-(Аб); (А'), справедливы первые три соотношения в (8) и у/п/г ^ 0. Тогда, имеет место сходимость (9).

Замечание 5. Б условиях следствия 1 количество точек г = г(п) ^ го нужно выбирать таким образом, чтобы (среди прочих) выполнялось соотношение п(3+а^/г-1 ^ 0. Отметим, что в рамках следствия 1 мы имеем (3 + а)/(2а) < 1 при а > 3. В условиях следствий 2 или 3 количество точек г = г(п) ^ го нужно выбирать так, чтобы у/п/г ^ 0. По-

= ( п)

I = 1(п) ^ М/г — 1 ^ п/г — 1 также должно неограниченно возрастать при п ^ го.

Пример 5. Пусть г = п1/2+е при некотором е > 0 и Е§1 = О(г/п). Последнее условие выполнено, например, если вся совокупность временных точек образует равномерную решетку на [0,1], или если набор ^^} состоит из независимых и одинаково распределенных случайных величин с отделенной от нуля плотностью на [0,1]. Предположим, что функция ^(Ь) удовлетворяет условию Гёльдера, т.е. ш^(к) < С к1 при вс ех к > 0 и некоторых фиксиро ванных 7 £ (0,1]

" 1

и С > 0. В этом случае величина к = п 2(т+1) уравнивает по к порядок малости слагаемого

(к) и первой компоненты слагаемого (см. формулу (7)) в правой части соотношения (6),

' ' / 7-2^(1+7) \

зависящих от размера окна к. В сделанных предположениях ЕЬ\/к = О1п 2(7+1) I, так что

третье условие в (8) выполнено при 0 < е < 7/(2 + 27). При этом для выполнения четвертого

а > 3/(2 )

3. Доказательства

Для вывода утверждения теоремы 1 нам потребуются следующие обозначения:

Vi,r,h(t) = Kh(t - ZN

:г к )AZNk) ^ Kh{t — Zn:rк)AZNk£к, к=1 к=1

Vl,h(t) = Kh(t - ZN:rк)AZNk Y, {v(Zn:rк) - Kt)) Kh(t - Zn:rк)AZNk, (10)

\k=l J к=1

( l \-1 l -Tl,h(t) = ^ Kh (t — Zn :r к )AZnк - ^(ZN :r к )) Kh(t — Zn :r к )AZNk.

\k=l J к=1

Подчеркнем, что ввиду свойств плотности Kh(-) область суммирования во введенных величинах совпадает с множеством {k : |i — Z^:гкI ^ h, 1 ^ к ^ I}, что является принципиальным моментом для дальнейшего анализа. Имеем

în(t) = /j,(t) + <pl<h(t) + Tlth(t) + Ut,r,h(t). (11)

Лемма 1. Для любых у > Ou h < 1/2 на подмножестве элементарных событий, определяемых соотношением ôi < h/(8L), имеет место следующая оценка,:

sup Wi,r,h(t)l > У

V^M )

Pf ( sup IPi,r,h(t)l > y\ < Ca2£L2r-1ôih-2y-2 te[o,i]

где С — абсолютная положительная константа.

Доказательство. Для любых k < I и u,v < I, и = v, с вероятноетью 1 выполнено

Ер£к = 0, sup^ r-1aEp£uev = 0. к<1

Здесь мы учли, что 1/(r + s) < 1/г. Таким образом, доказательство этого утверждения с очевидными изменениями повторяет вывод леммы 6 из [1]. □

Лемма 2. В условиях теоремы 1 имеют место оценки,

sup \<pi,h(i)| ^ u^(h), sup \ri,h(t)\ ^ u^(5i) + щ,г, te[o,i] ie[Q,i]

где Р(щ>г > y) ^ 2afnM3r-2y-2 + p( max mi > м)

Доказательство. Первое утверждение леммы очевидно. Для вывода второго соотношения заметим прежде всего, что ввиду (10) выполнено

вир ЬД^ < тах \]к - :гк)|. *е[о,1] 1<к<1

Пусть символы Вр, Соур и Рр обозначают соответственно условную дисперсию, условную ковариацию и условную вероятность при фиксации ст-алгебры порожденной случайными величинами из наборов г = 1,... ,п, ] = 1,..., т{} и {тг; г = 1,..., п}. В силу определений (3), (4) и равенства Ер= имеем

7 к - К%М:гк )= Р1к + Р2к, к = 1,...,1,

где

Р1к = г-1 ^ {/г(ггз) -е^д(ггз)), р2к = г-1 ^ р.(ггз) - р.(гм:гк), к<1-1, (г,з)енк (г,з)енк

ри = (г + 8)-1 £ (/(ггз) - е^¡1{ггз)), р21 = (г + 8)-1 £ ^ггз) - :г1).

(г,з)ещ (ьЛещ

С учетом определения множеств Нк, к = 1,... ,1, и условия (Аб) получаем, что

тах 1р2кI < тах шЛАгМк) < (81), к = 1,...,1. 1<к<1 1<к<1

Введем событие Ап = Р| ™—1{т1 < М} при некото ром М > 0. Имеем

Р (Ап) = Р ^ Ц{тг > М} ^ = Р ^ тах тг > М^ . Далее, поскольку ^™—1 = г1 + в, то на множестве Ап выполнено I < пМ/г

Р ( тах 1р1к I > у, Ап) < Р ( тах 1р1к | > у, Ап) <

\1<к<Г ' ) \1<к<пМ/г )

<пМг-1 тах ЕР^- (\р1к\ > у) <пМу-2г-1 тах ЕВТр1к,

1<к<пМ/г 1 1 1<к<пМ/г

где р1к = р1к 1(Ап) и 1(-) — индикатор события. Далее, справедливо представление

г2ВТр1к = 1(Ап) £ В^¡1(г13)+1(Ап) £ Соиг {№гз), /п (гпп)} . (12)

(г,з)еНк (г,з)=(ч,31)еНк

С учетом условия (А4) для любых ], Д ^ т1 имеем

в^/1(ггз) < а), СоуТ {/г(ггз), /г1 (гг1П)} < а22. = 1

Если же г = г 1, то количество пар индексов (г, ]) и (г, Ц) в двойной сумме в (12) при выполнении события Ап будет меньше, чем т2 ^ М2. Если же произойдет дополнительное событие Ап, то все члены в (12) обратятся в ноль. Следовательно, с вероятностью 1

г2ВТр1к < га22 + гМ2а}, ВТр1к < 2г-1М2а].

Аналогично, для к = I ^ [пМ/г] при выполнении события Ап имеем

(Г+ 8)2вТрц = ^ в^/1(ггз)+ ^ £оьТ{/г(ггз), /г1 (гг131)},

(г,з)ещ (г,з)=(ч,31)ен1

(г + в)2ВТр1к < 2(г + в)а2 + (г + 8)М2а2, В^р1к < 2г-1М2а}. Таким образом,

Р ( тах 1р1кI >у, Ап) < 2а2пМ3г-2у-2, \1<к<1 ) 1

а потому

Р ( тах 1р1 кI > у ) < 2а2пМ3г-2у-2 + р[ тах тг > м\

\ 1 < ^ < ^ у V %— 1 ,...,ТХ /

Для завершения доказательства леммы 2 остается положить r = max Ipik □

1< к<

Завершим доказательство теоремы 1. Положим Q,r,h = suptе[0д] lvi,r,h(t)l и заметим, что P{Q,r,h >y,5t < h/(8L)) = EI(5t < h/(8L))PT> у).

Первое утверждение теоремы следует теперь из тождества (11) и лемм 1,2.

В силу оценки mf < maxi<п mf < ^П mf предположение о том, что при некотором а и всех г < п выполнено Em" < ж, эквивалентно соотношению Ха,п = E( max^<п mf) < те. Поэтому с учетом неравенства Маркова

P (т,г > у) < 2а}пМ3г-2у-2 + Кп м-f.

Приравнивая теперь оба слагаемых в правой части этого соотношения, находим оптимальный уровень «срезки», равный М = (г2у2\а,п/(2а2п))1/(г+а\ В итоге

о а "¡г-3— а 2а

P (Vl,r > у) < 2(2а}) 3+а Xf+па п 3+а (гу)-3+а .

Теорема 1 доказана.

4. Заключение

В работе предложены новые оценки ядерного типа для функции математического ожидания непрерывного случайного процесса в случае разреженных данных. Доказана равномерная состоятельность оценок при более слабых ограничениях относительно корреляции временных точек, чем были известны ранее. В отличие от известных ранее результатов, не предполагается, что набор временных точек состоит из независимых или слабо зависимых случайных величин. Относительно временных точек требуется лишь, чтобы совокупность этих точек из всех серий с высокой вероятностью образовывала измельчающееся разбиение области определения случайного процесса. Предлагаемые ограничения на временные точки универсальны относительно стохастической природы этих точек, поскольку наши ограничения включают и случай детерминированных временных точек наблюдения.

В работе используются также достаточно общие ограничения на количество временных точек в каждой серии. В отличие от известных ранее результатов, предлагаемые условия равномерной состоятельности оценок универсальны и относительно стохастической природы количества наблюдений в каждой серии и включают в себя в качестве частных случаев как ситуацию независимых и одинаково распределенных целочисленных величин, так и случай детерминированных равномерно ограниченных величин — два наиболее популярных варианта в исследованиях предшественников.

СПИСОК ЦИТИРОВАННОЙ ЛИТЕРАТУРЫ

1. Borisov I. S., Linke Yu. Yu., Ruzankin P. S. Universal weighted kernel-type estimators for some class of regression models // Metrika. 2021. Vol. 84, № 2. P. 141-166. https://link.springer.com/ article/10.1007/s00184-020-00768-0

2. Bunea F., Ivanescu A. E., Wegkamp M. H. Adaptive inference for the mean of a Gaussian process in functional data // J. R. Stat. Soc. Ser. В Stat. Methodol. 2011. Vol. 73, № 4. P. 531-558. https://rss.onlinelibrary.wiley.eom/doi/abs/10.llll/j.1467-9868.2010.00768.x

3. Cuevas A. A partial overview of the theory of statistics with functional data //J. Stat. Plan. Inference. 2014. Vol. 147, № 4. P. 1-23. https://www.sciencedirect.com/science/article/abs/ pii/S0378375813000748

4. James G. M., Hastie T. J. Functional linear discriminant analysis for irregularly sampled curves // J. R. Stat. Soc. Ser. B Stat. Methodol. 2001. Vol. 63, № 3. P. 533-550.

https://www.jstor.org/stable/2680587

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

5. Hall P., Miiller H.-G., Wang J.-L. Properties of principal component methods for functional and longitudinal data analysis // Ann. Statist. 2006. Vol. 34, № 3. P. 1493-1517.

https://www.jstor.org/stable/25463465

6. Hsing T., Eubank R. Theoretical foundations of functional data analysis, with an introduction to linear operators. Wiley, 2015. https://onlinelibrary.wiley.com/doi/book/10.1002/ 9781118762547

7. Kim S., Zhao Z. Unified inference for sparse and dense longitudinal models // Biometrika. 2013. Vol. 100, № 1. P. 203-212. https://www.jstor.org/stable/43304546

8. Kokoszka P., Reimherr M. Introduction to functional data analysis. Chapman and Hall/CRC, 2017. https://www.routledge.com/Introduction-to-Functional-Data-Analvsis/Kokoszka-Reimherr/p/book/9781032096599

9. Li Y., Hsing T. Uniform convergence rates for nonparametric regression and principal component analysis in functional/longitudinal data // Ann. Statist. 2010. Vol. 38, № 6. P. 3321-3351. https://www.jstor.org/stable/29765266

10. Lin Z. Wang J.-L. Mean and covariance estimation for functional snippets //J. Amer. Statist. Assoc. 2022. Vol. 117, № 537. P. 348-360. https://www.tandfonline.com/doi/abs/10.1080/ 01621459.2020.1777138

11. Linke Y., Borisov I., Ruzankin P., Kutsenko V., Yarovava E., Shalnova S. Universal local linear kernel estimators in nonparametric regression // Mathematics. 2022. Vol.10, № 15. P. 2693. https://www.mdpi.com/2227-7390/10/15/2693

12. Linke Yu.Yu., Borisov I. S. Insensitivitv of Nadarava-Watson estimators to design correlation // Commun. Stat. Theory Methods. 2022. Vol. 51, № 19. P. 6909-6918. https://www.tandfonline.com/doi/abs/10.1080/03610926.2021.1876884

13. Linke Yu.Yu. Asymptotic properties of one-step M-estimators // Commun. Stat. Theory Methods. 2019. Vol.48, № 16. P. 4096-4118. https://www.tandfonline.com/doi/abs/10.1080/ * 03610926.2018.1487982?journalCode=lsta20

14. Linke Yu.Yu., Borisov I. S. Constructing initial estimators in one-step estimation procedures of nonlinear regression // Statist. Probab. Lett. 2017. Vol. 120, № 1. P. 87-94.

https://www.sciencedirect.com/science/article/abs/pii/S0167715216301857

15. Linke Yu.Yu. Asymptotic normality of one-step M-estimators based on non-identicallv distributed observations // Statist. Probab. Lett. 2017. Vol.129, № 10. P. 216-221.

https://www.sciencedirect.com/science/article/abs/pii/S0167715217302031

16. Linke, Yu. Yu. k, Borisov I. S. 2023, "An approach to constructing explicit estimators in nonlinear regression", Siberian Adv. Math., vol. 33, no. 4, pp. 338-346. https://link.springer.com/ article/10.1134/S1055134423040065

17. Muller H.-G. Functional modelling and classification of longitudinal data // Scand. J. Statist. 2005. Vol. 32, № 2. P. 223-246. https://onlinelibrary.wiley.com/doi/abs/10.llll/

j. 1467-9469.2005.00429.x

18. Song Q., Liu R., Shao Q., Yang L. A simultaneous confidence band for dense longitudinal regression // Commun. Stat. Theory Methods. 2014. Vol. 43, № 24. R 5195-5210. https://www.tandfonline.com/doi/abs/10.1080/03610926.2012.729643

19. Wang J.-L., Chiou J.-M., Muller H.-G. Review of functional data analysis // Annu. Rev. Statist. 2016. Vol. 3. P. 257-295.

20. Wu H., Zhang J.-T. Nonparametric regression methods for longitudinal data analysis: mixed-effects modeling approaches. John WTilev and Sons, 2006. https://www.annualreviews.org/ doi/abs/10.1146/annurev-statistics-041715-033624

21. Yao F. Asymptotic distributions of nonparametric regression estimators for longitudinal or functional data //J. Multivariate Anal. 2007. Vol. 98, № 1. P. 40-56.

22. Yao F., Muller H.-G., Wang J.-L. Functional data analysis for sparse longitudinal data //J. Amer. Statist. Assoc. 2005. Vol.100, № 470. P. 577-590. https://www.tandfonline.com/ doi/abs/10.1198/016214504000001745

23. Zhang J.-T., Chen J. Statistical inferences for functional data // Ann. Statist. 2007. Vol. 35, № 3. P. 1052-1079. https://www.jstor.org/stable/25463592

24. Zhang X., Wang J.-L. Optimal weighting schemes for longitudinal and functional data // Stat. Prob. Lett. 2018. Vol. 138, № 7. P. 165-170. https://www.sciencedirect.com/science/ article/abs/pii/S0167715218301214

25. Zhang X., Wang J.-L. From sparse to dense functional data and beyond // Ann. Statist. 2016. Vol. 44, № 5. P. 2281-2321. https://www.jstor.org/stable/43974716

26. Zheng S., Yang L., Hardle W. A smooth simultaneous confidence corridor for the mean of sparse functional data //J. Amer. Statist. Assoc. 2014. Vol. 109, № 506. P. 661-673. https://www.tandfonline.com/doi/abs/10.1080/01621459.2013.866899

27. Zhou L., Lin H., Liang H. Efficient estimation of the nonparametric mean and covariance functions for longitudinal and sparse functional data //J. Amer. Statist. Assoc. 2018. Vol. 113, № 524. P. 1550-1564. https://www.tandfonline.com/doi/abs/10.1080/01621459.2017.1356317

28. Липке Ю. Ю. К вопросу о нечувствительности оценок Надарая-Ватсона относительно корреляции элементов дизайна // Теория вероятн. и ее примен. 2023. Т. 68, № 2. С. 236-252.

29. Липке Ю.Ю. Асимптотические свойства одношаговых взвешенных М-оценок с приложениями к задачам регрессии // Теория вероятн. и ее примен. 2017. Т. 62, № 3. С. 468-498.

30. Липке Ю.Ю., Борисов И. С. Построение явных оценок в задачах нелинейной регрессии // Теория вероятн. и ее примен. 2018. Т. 63, № 1. С. 29-56.

REFERENCES

1. Borisov, I. S., Linke, Yu. Yu. k, Ruzankin, P. S. 2021, " Universal weighted kernel-type estimators for some class of regression models", Metrika, vol. 84, no. 2, pp. 141-166.

2. Bunea, F., Ivanescu, A. E. k, Wegkamp, M.H. 2011, "Adaptive inference for the mean of a Gaussian process in functional data", J. R. Stat. Soc. Ser. В Stat. Methodol, vol. 73, no. 4, pp. 531-558.

3. Cuevas A. 2014, "A partial overview of the theory of statistics with functional data", J. Stat. Plan. Inference., vol. 147, no. 4, pp. 1-23.

4. James, G.M. k Hastie, T.J. 2001, "Functional linear discriminant analysis for irregularly sampled curves", J. R. Stat. Soc. Ser. B Stat. Methodol, vol. 63, no. 3, pp. 533-550.

5. Hall, P., Miiller, H.-G. k Wang, J.-L. 2006, "Properties of principal component methods for functional and longitudinal data analysis", Ann. Statist., vol. 34, no. 3, pp. 1493-1517.

6. Hsing, T. k Eubank, R. Theoretical foundations of functional data analysis, with an introduction to linear operators. Wiley, 2015.

7. Kim, S. k Zhao, Z. 2013, "Unified inference for sparse and dense longitudinal models", Biometrika, vol. 100, no. 1, pp. 203-212.

8. Kokoszka, P. k Reimherr, M. Introduction to functional data analysis. Chapman and Hall/CRC, 2017.

9. Li, Y. k Hsing, T. 2010, "Uniform convergence rates for nonparametric regression and principal component analysis in functional/longitudinal data", Ann. Statist., vol. 38, no. 6, pp. 3321-3351.

10. Lin, Z. k Wang, J.-L. 2022, "Mean and covariance estimation for functional snippets", J. Amer. Statist. Assoc., vol. 117, no. 537, pp. 348-360.

11. Linke, Y., Borisov, I., Ruzankin, P., Kutsenko, V., Yarovava, E. k Shalnova, S. 2022, "Universal local linear kernel estimators in nonparametric regression", Mathematics, vol.10, no. 15, pp. 2693.

12. Linke, Yu.Yu. k Borisov, I.S. 2022, "Insensitivitv of Nadarava-Watson estimators to design correlation", Commun. Stat. Theory Methods., vol. 51, no. 19, pp. 6909-6918.

13. Linke, Yu.Yu. 2019, "Asymptotic properties of one-step M-estimators", Commun. Stat. Theory Methods, vol.48, no. 16, pp. 4096-4118.

14. Linke, Yu.Yu. k Borisov, I.S. 2017, "Constructing initial estimators in one-step estimation procedures of nonlinear regression", Statist. Probab. Lett., vol. 120, no. 1, pp. 87-94.

15. Linke, Yu.Yu. 2017, "Asymptotic normality of one-step M-estimators based on non-identicallv distributed observations", Statist. Probab. Lett., vol.129, no. 10, pp. 216-221.

16. Linke, Yu. Yu. k Borisov I. S. 2023, "An approach to constructing explicit estimators in nonlinear regression", Siberian Adv. Math., vol. 33, no. 4, pp. 338-346.

17. Muller, H.-G. 2005, "Functional modelling and classification of longitudinal data", Scand. J. Statist., vol. 32, no. 2. pp. 223-246.

18. Song, Q., Liu, R., Shao, Q. k Yang, L. 2014, "A simultaneous confidence band for dense longitudinal regression", Commun. Stat. Theory Methods, vol. 43, no. 24, pp. 5195-5210.

19. Wang, J.-L., Chiou, J.-M. k Muller, H.-G. 2016, "Review of functional data analysis", Annu. Rev. Statist., vol. 3. pp. 257-295.

20. Wu, H. k Zhang, J.-T. Nonparametric regression methods for longitudinal data analysis: mixed-effects modeling approaches. John WTilev and Sons, 2006.

21. Yao, F. 2007, "Asymptotic distributions of nonparametric regression estimators for longitudinal or functional data", J. Multivariate Anal, vol. 98, no. 1, pp. 40-56.

22. Yao, F., Muller, H.-G. к Wang, J.-L. 2005, "Functional data analysis for sparse longitudinal data", J. Amer. Statist. Assoc., vol.100, no. 470, pp. 577-590.

23. Zhang, J.-T. к Chen, J. 2007, "Statistical inferences for functional data", Ann. Statist., vol. 35, no. 3, pp. 1052-1079.

24. Zhang, X. к Wang, J.-L. 2018, "Optimal weighting schemes for longitudinal and functional data", Stat. Prob. Lett., vol. 138, no. 7, pp. 165-170.

25. Zhang, X. к Wang, J.-L. 2016, "From sparse to dense functional data and beyond", Ann. Statist., vol. 44, no. 5, pp. 2281-2321.

26. Zheng, S., Yang, L. к Hardie, W. 2014, "A smooth simultaneous confidence corridor for the mean of sparse functional data", J. Amer. Statist. Assoc., vol. 109, no. 506, pp. 661-673.

27. Zhou, L., Lin, H. к Liang, H. 2018, "Efficient estimation of the nonparametric mean and covariance functions for longitudinal and sparse functional data", J. Amer. Statist. Assoc., vol. 113, no. 524, pp. 1550-1564.

28. Linke, Yu.Yu. 2023, "Towards insensitivitv of Nadarava-Watson estimators with respect to design correlation", Theory Probab. Appl, vol. 68, no. 2, pp. 236-252. fin Russian]

29. Linke, Yu. Yu. 2017, "Asymptotic properties of one-step weighted M-estimators with application to some regression problems", Theory Probab. Appl, vol. 62, no. 3, pp. 373-398.

30. Linke, Yu.Yu. к Borisov I.S. 2018, "Constructing explicit estimators in nonlinear regression models", Theory Probab. Appl, vol. 63, no. 1, pp. 22-44.

Получено: 26.05.2023 Принято в печать: 21.12.2023

i Надоели баннеры? Вы всегда можете отключить рекламу.