Научная статья на тему 'ОТРИЦАТЕЛЬНАЯ БИНОМИАЛЬНАЯ РЕГРЕССИЯ В ЗАВИСИМОСТИ ДОЗА-ЭФФЕКТ'

ОТРИЦАТЕЛЬНАЯ БИНОМИАЛЬНАЯ РЕГРЕССИЯ В ЗАВИСИМОСТИ ДОЗА-ЭФФЕКТ Текст научной статьи по специальности «Математика»

CC BY
80
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
МОДЕЛЬ ОТРИЦАТЕЛЬНОГО БИНОМИАЛЬНОГО ОТКЛИКА / ЭФФЕКТИВНАЯ ДОЗА / НЕПАРАМЕТРИЧЕСКАЯ ОЦЕНКА

Аннотация научной статьи по математике, автор научной работы — Тихов Михаил Семенович

Эта статья посвящена проблеме оценки функции распределения и ее квантилей в зависимости доза-эффект с непараметрической отрицательной биномиальной регрессией. Большая часть математических исследований зависимости дозаэффект касалась моделей с биномиальной регрессией, в частности моделей с бинарными данными. Здесь предложены ядерные оценки функции распределения, ядро которых взвешивается отрицательной биномиальной случайной величиной при каждой ковариате. Эти ковариаты являются квазислучайными ван дер Корпута и Холтона последовательностями с медленным расхождением. Наши оценки состоятельны, т.е. сходятся к своим оптимальным значениям когда число наблюдений возрастает до бесконечности. Предлагаемые оценки сравниваются с помощью их среднеквадратичных отклонений. Показано, что наши оценки имеют меньшую асимптотическую дисперсию по сравнению, в частности, с оценками типа Надарая-Ватсона и других оценок. Представлены непараметрические оценки квантилей, полученные путем инвертирования ядерной оценки функции распределения. Асимптотическая нормальность этих оценок с поправкой на смещение сохраняется при некоторых условиях регулярности. Мы даем также многомерное обобщение полученных результатов.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

NEGATIVE BINOMIAL REGRESSION IN DOSE-EFFECT RELATIONSHIPS

This paper is devoted to problem on estimating the distribution function and its quantiles in the dose-effect relationships with nonparametric negative binomial regression. Most of the mathematical researches on dose-response relationships concerned models with binomial regression, in particular, models with binary data. Here we propose a kernel-based estimates for the distribution function, the kernels of which are weighted by a negative binomial random variable at each covariate. These covariates are quasirandom van der Corput and Halton low-discrepancy sequences. Our estimates are consistent, that is, they converge to their optimal values in probability as the number of observations grows to infinity. The proposed estimats are compared by their mean-square errors. We show that our estimates have a smaller asymptotic variance in comparison, in particular, with estimates of the Nadaraya-Watson type and other estimates. We present nonparametric estimates for the quantiles obtained by inverting a kernel estimate of the distribution function. We show that the asymptotic normality of these bias-adjusted estimates is preserved under some regularity conditions. We also provide a multidimensional generalization of the obtained results.

Текст научной работы на тему «ОТРИЦАТЕЛЬНАЯ БИНОМИАЛЬНАЯ РЕГРЕССИЯ В ЗАВИСИМОСТИ ДОЗА-ЭФФЕКТ»

ISSN 2074-1871 Уфимский математический журнал. Том 14. № 4 (2022). С. 100-116.

УДК 519.2

ОТРИЦАТЕЛЬНАЯ БИНОМИАЛЬНАЯ РЕГРЕССИЯ В ЗАВИСИМОСТИ ДОЗА-ЭФФЕКТ

м.с. тихов

Аннотация. Эта статья посвящена проблеме оценки функции распределения и ее квантилей в зависимости доза-эффект с непараметрической отрицательной биномиальной регрессией. Большая часть математических исследований зависимости доза-эффект касалась моделей с биномиальной регрессией, в частности моделей с бинарными данными. Здесь предложены ядерные оценки функции распределения, ядро которых взвешивается отрицательной биномиальной случайной величиной при каждой ковариате. Эти ковариаты являются квазислучайными ван дер Корпута и Холтона последовательностями с медленным расхождением. Наши оценки состоятельны, т.е. сходятся к своим оптимальным значениям когда число наблюдений п возрастает до бесконечности. Предлагаемые оценки сравниваются с помощью их среднеквадратичных отклонений. Показано, что наши оценки имеют меньшую асимптотическую дисперсию по сравнению, в частности, с оценками типа Надарая-Ватсона и других оценок. Представлены непараметрические оценки квантилей, полученные путем инвертирования ядерной оценки функции распределения. Асимптотическая нормальность этих оценок с поправкой на смещение сохраняется при некоторых условиях регулярности. Мы даем также многомерное обобщение полученных результатов.

Ключевые слова: модель отрицательного биномиального отклика, эффективная доза, непараметрическая оценка.

Mathematics Subject Classification: 62G05, 62Е20, 62Р10

1 15 И К. (К1III к

Задача оценивания неизвестного распределения является важнейшей задачей математической статистики как для полных, так и для неполных выборок. В настоящей статье рассматривается проблема построения эффективных оценок функции распределения (ф. р.) Р(х) и квантиль-ной функции Р-1(А) = х\, 0 < А < 1 в зависимости доза-эффект для модели отрицательной биномиальной регрессии, а также изучается асимптотическое поведение предложенных оценок. Цель нашего сообщения состоит в том, чтобы дать пригодные для использования на практике оптимальные оценки кривых доза-эффект. Такие задачи возникают в биологии [1], токсикологии [2], в оценке эффективных доз лекарственных препаратов [3]. Отметим также, что «зависимость доза-эффект» — это условное название. Рассматриваемая нами модель может быть применена, например, для оценки доверительных временных границ стадий развития ребенка в педиатрии (см. [1], [4]-[6]). Наиболее остро эта проблема возникает при оценивании квантилей либо малых, либо относительно высоких уровней.

Существует два основных подхода к оценке Р(х) и ее квантилей: параметрический подход с использованием известных распределений, в частности, пробит- и логит-модели, и непараметрический подход. Биологические механизмы действия и токсичности лекарств часто настолько сложны, что форма кривой Р(х) в значительной степени неизвестна и подгонка неправильной

M.S. Tikhov, Negative binomial regression in dose-effect relationships. © Тихов М.С. 2022. Поступила 18 ноября 2021 г.

модели может привести к большим и непредсказуемым отклонениям с недопустимыми доверительными границами. В таком случае для зависимости доза-эффект становится разумным использовать непараметрический подход, который состоит в следующем. Имеется модель бинарных откликов, которая носит условное название зависимость доза-эффект [3], [7]. Именно, пусть {(Хг, Щ), 1 ^ г ^ п} — потенциальная повторная выборка из неизвестного распределения

^(х)С(х), ^(х)=¥(Хг <х), в(х)=Р(Щ <х),

вместо которой наблюдается выборка

и(п) = {(Пг ,Шг), 1 < г < п},

где Шг = I(Хг < Щ) есть индикатор события (Х^ < и.Задача — оценить неизвестную ф.р. Р(х) по выборке Ы(п\ Здесь рассматриваются как дозы, а — как эффект от воздействия дозы Пг- Пусть

/X Г X

/(£) (М, О(х) = / д(Ь) (М, причем /(х) > 0, д(х) > 0.

-те ■)—те

Такую ситуацию будем называть случайным планом эксперимента. Тогда условное математическое ожидание будет равно

Е(W= х)=Р(Х < и 1и = х)=Р(Х < хр = х)=Р(Х <х) = Р(х),

т.е. неизвестная функция распределения Р(х) является регрессией и для оценки Р(х) по выборке Ы(п) = {( Иг, 1 ^ г ^ п} можно использовать ядерные оценки регрессии.

Наряду со случайным планом будем рассматривать фиксированные планы эксперимента [8]. Именно, будем полагать вводимую дозу и неслучайной и положим и^ = щ, г = 0,1,...,п + 1, где 0 = ио < и\ < ... < ип < ип+\ = 1. В статье мы будем изучать поведение ядерных оценок по фиксированным планам.

Для зависимости доза-эффект со случайными планами эксперимента и бинарными откликами [3], [7] в качестве оценки функции распределения Р (х) обычно берется статистика

Рп(х) = , Зы(х) = - ± Кн(х - иг), 32п(х) = - ± ШгКн(х - иг),

г=1 г=1

если 81П(х) = 0, где К^(х) = К(х/К)/к, К(х) — финитная симметричная плотность распределения (ядро), к = Н(п) ^ 0 пк ^ го при п ^ го. Если 31П(х) = 0, то Рп(х) полагается равным нулю. Так, в качестве ядерной функции К(х) часто используют ядро Епанечникова

К1(х) = (3/4)(1 -х2)1(1х | < 1),

а также квартическое ядро

К2(х) = (15/16)(1 - х2)21(1 х | < 1),

в качестве к(п) берут п-1/5.

При некоторых условиях регулярности (см. [7]), оказывается, что при п ^ го величина п2/5(Рп(х) — Е(Рп(х))) асимптотически нормальна N(0,а2(х)), где

/те

К2(х) (1х.

-те

Для фиксированных планов эксперимента предельная дисперсия оценки Рп(х) равна

а2(х)=Р(х)(1 -Р(х))\\К У2.

Зависимость доза-эффект в модели с биномиальной регрессией (см., например, [9], [10]), можно описать следующим образом. Предположим, что ответ равен 1, если он дает интересующую реакцию, или = 0, если реакции нет, которая наблюдается на каждой фиксированной кова-риате и^.

Таким образом, W^ есть j-й ответ m субъектов, когда ковариата равна щ, i = 1,2,...,п, и ответы Wij являются взаимно независимыми. Взаимосвязь определяется вероятностью того, что Wij = 1 при условии U,f.

F (Ui) =V(Wi3 = 1)=P(Xi3 < щ),

m

где Wi = E Wij имеет биномиальное распр еделение B(m, pi) с параметр ом pi = F (щ), а хорошо

3 = 1

известно, что максимальное правдоподобие для pi дается отношением Wi = Wi/т для каждого г. Данные (u,i,Wi), г = 1, 2, ...,п, позволяют построить оценку ф. р. вида

n

Е Wi^i(x)

3 = 1

Fn(x) = —-, где щ(х) = Kh(x — Ui).

Е ni(x)

3 = 1

Для т = 1 мы имеем регрессионную модель Бернулли. В [11] показано, что при фиксированном х, разность Vnh(Fn(x) — Е(Fn(x))) асимптотически нормальна N(0,а2(х)/т) при п ^ те. При этом в каждом слое мы рассматриваем повторную выборку, в которой параметр pi = F(ui) биномиального распределения, неслучаен. Для бесповторной выборки можно считать, что сам параметр биномиального распределения случаен, например, имеет бета распределение Л(а,/3). В этом случае мы получим бета-биномиальное распределение, тогда вместо параметра pi мы будем иметь параметр сц/(щ + /%) и в качестве его оценки будем брать т\i/Wi как МП-оценку «средней» вероятности и «средней» функции распределения.

В представленном здесь сообщении, тезисы которого опубликованы в [12], рассматривается отрицательная биномиальная регрессионная модель (NBR-модель). Точнее, для заданного т рассматривается отрицательное биномиальное распределение величин Zi при заданной ковариате Ui:

p(zi = к) = nk(k+ +)rt)pm(1—pi)k-m, k = m,m+1,..., r(k+1) =kl.

Мы используем выборку Z = {(zi, ui), i = 1, 2,..., n } для определения оценки F(x) вида

n

E mVi(x)

Tn (x) = 3~n-. (1.1)

E ZiT]i (x)

3 = 1

Для так называемых квази-случайных последовательностей {щ},г = 1, 2,...,п с медленным расхождением (low-discrepancy sequences), где щ — неслучайны, мы докажем состоятельность и асимптотическую нормальность построенных оценок при п ^ те. Мы показываем, что предельная дисперсия оценок при нормировке Vnh равна

а22 (x)=F 2(х)(1 — F (х))\\К \\2/т,

которая меньше предельной дисперсии

а2(х) = F(ж)(1 — F(ж))\\ К \\2/т

оценок функции распределения F(х) типа Надарая-Ватсона в биномиальной регрессии. На основе статистики (1.1) строятся оценки квантилей и доказывается их асимптотическая нормальность. На базе несмещенной оценки ^параметра р, а также оценки максимального правдоподобия отрицательного биномиального распределения мы предлагаем оценку неизвестной функции распределения.

Отрицательное биномиальное распределение возникает естественным путем при малых значениях параметров биномиального распределения pi и больших т, которое можно аппроксимировать распределением Пуассона. Известно, что смесь пуассоновского и Гамма-распределения (см. [13, с. 184]) приводит к отрицательому биномиальному распределению. Можно рассматривать также урновую схему Пойа и показать, что отрицательное биномиальное распределение можно получить предельным переходом из урновой схемы Пойа (см. [14, с. 495]).

В прикладных задачах, каковой является данная задача, приходится учитывать помимо теоретических аспектов вопросы привязки к конкретным ситуациям, в частности, выбор ковариат щ. Их можно выбирать детерминированно с равномерным шагом, можно построить чисто случайные конструкции, можно, используя квази-метод Монте-Карло, отбирать их из заданного множества случайным образом. При удачном выборе множества удается получить почти оптимальные результаты. Здесь мы предлагаем рассматривать почти равномерные последовательности ковариат.

2. Основные условия

Пусть {Xi, г = 1,... ,п} — последовательность независимых одинаково распределенных с X на отрезке [0,1] случайных величин с функцией распределения F(х), а

Р = {и0,и1, ..., ип, ип+1} — разбиение отрезка [0,1},и0 = 0 < и1 < ... <ип < 1 = ип+1.

Будем предполагать, что выполнены следующие условия.

Условие 1. При п ^ го ширина, окна, h = п-1/5.

Условие (1) будем записывать, как условие (Н).

Условие 2. К(х) ^ 0, причем К(х) = 0,х £ [-1,1]. 1

Условие 3. f К(х) dx = 1.

-1

Условие 4. К(х) = К(-х),х е R.

К( х)

[-1, 1]

Условие 6. || К = sup | К(х) | = kj < го . Положим

||К ||2 = J1 К2(x)dx

и определим вариацию функции f = f(х), a ^ х ^ b (см. [15, с. 234]).

Пусть д : [a, b] ^ R. Вариацией функции д = д(и) на отрезке [ a, b] называется следующая величина:

b т

V^ = V(9) = suP Y119(ик+1) - д(ик) 1,

a Р к=0

Р [ a, ]

К( х) ( К) < го

Заметим, что если К(х) — гладкая функция, то \/о(К) = /0 | К'(х) | с1х. В дальнейшем условия (2-7) будем записывать, как условие (К).

Условие 8. Существует третья непрерывная ограниченная производная, плотности распределения f(х) = F'(х), причем

f(х) > 0.

Условие (8) будем записывать, как условие (F).

В работе будем предполагать, что выполнены условия (Н), (К), (F), которые будем называть условиями регулярности.

3. Вспомогательные результаты

В этом параграфе представлены вспомогательные результаты, необходимые для изучения асимптотики введенных оценок.

Приведем неравенство Коквта-Шадука (см. [16, с. 18]), которое позволяет оценить скорость сходимости интегральных сумм к соответствующему интегралу.

Пусть # — лебегова ст-алгебра н а Р, где I = [0,1], и — лебегова мер а на В, а Р множество точек 111, и2, ..., и^ € Р- Определим счетчик

Ап(В;Р ) = 1в (щ)

i=1

и отклонение

Dn(B;P) = sup вев

Ап(В;Р)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п

-ра(В)

где 1в(х) — индикатор множества В. Положим DП(Р) = Dn(J*;P), где J* есть семейство по-

динтервалов па Is вида П [0, иг]. Здесь ps I П[0,иг] ) = u1 u2...us. Величину DП(Р) называют

i=1 \i=1 дискрепансом (discrepancy) последовательности.

Определение 3.1. Говорят,, что последовательность Р = {u1,u2,...} действительных чисел равномерно распределена (p.p.), если для любой пары, действительных чисел 0 ^ а < Ъ ^ 1, имеем

Ап([а, Ь),Р)

lim

= а.

п

Мы будем иметь дело с p.p. последовательностями.

Теорема 3.1 ([16]). (Неравенство Коквта-Шатка). Если функция, f (и) (0 ^ и ^ 1) есть непрерывная функция и имеет ограниченную вариацию \/(^ на [0,1], то для любых и1,и2, ...,ип € [0,1], м,ы, имеем,

п „

f(Ui) - f(u) du

=1

<

V( f )D*n (u1,...,un).

Для многомерного единичного куба Р = [0,1)5, Р = [0,1]5 и вариации в смысле Харди и Краузе (см. [16, с. 19]) имеет место следующий результат.

Теорема 3.2. [16, с. 20] Если функция f(и) (0 ^ и ^ 1) имеет огщниченную вариацию ) на р в смысле Харди и Краузе, то для любых щ, и2,..., Ип € Р, мы имеем,

п

£/(Ui) - f (U)dU =1

<

У( f)D*n (и 1,..,ип).

В [16] показано, что И**(щ,..., ип) есть непрерывная функция переменных (и1, ...,ип) и что ес-

п 1

ли щ = —, то И*(и,1, ...,ип) = —. Аналогично можно показать, что для равномерного разбиения п п

5-мерного единичного куба Р дискрепапс конечного числа точек есть И* ^ — (см. [17]). При коп

Замечание 3.1. В одномерном случае если и0 = 0 < и1 < и2 < ... < ип < ип+1 = 1, то

Ап([0,и)-,Р)

Dn (Р) = max sup

а это есть статистика Колмогорова.

— U

п

max sup

k^n Uk <u4,Uk + 1

k

--U

п

= max max

0< k<n

k k

--Xk , --Xk+1

п п

Таким образом, если и < и2 < ... < ип рассматривать как вариационный ряд выборки и в качестве нулевой гипотезы взять равномерное распределение, то дискрепанс является максимальным уклонением выборочной функции распределения от равномерной. Большие значения D* говорят

Р

Этот результат обобщается и на многомерный случай [19]. В этом случае справедлив закон повторного логарифма, доказанный Кифером [20]: почти всюду

Tim" D*n(Р)/V2 lulnn = 1.

п^те

Чтобы расширить возможные применения приводимых в п.4 результатов, рассмотрим последовательности с низким расхождением (low-discrepancy sequences) [16, Гл. 3] — Ван дер Корпута и Холтона последовательности [21]. Пусть

те

n = £a3 (n) V (3.1)

3=0

— представление целого числа n ^ 0 по натуральному основ анию b ^ 2, где a,j(п) е Zb = {0,1,..., b — 1} для каждого j ^ 0 и a,j(п) = 0 для всех достаточно больших j.

Определение 3.2. Для b ^ 2, радикально-обратная, функция фь по основанию b определяется следующим образом,:

те

фь(п) = (п)Ь-^-1 для любого целого п ^ 0, (3-2)

з=о

где aj (п) берутся из представления (3.1) с тем же Ь.

Определение 3.3. Для любого натурального b ^ 2, последовательность Ван дер Корпута по основанию b есть последовательность {и0,и1, ...,ип,...} с ига = фь(п) для любого п ^ 0.

Пусть дана последовательность S = {и0,и1,...}. Мы будем писать Dn(S) = Dn(v,0,v,1, ...,ип+1) для расхождения первых п членов S и аналогично будем писать D**(S) = D**(ио,Щ, ...,ип). В [16] показано, что если Sb есть последовательность Ван дер Корпута по основанию Ь, то

InN

D*n(Sb) < , Для всех N ^ 2,

где константа С1 зависит только от Ь.

Определение 3.4. Пусть s — произвольная размерность, a b1, Ь2,..., bs ^ 2, — взаимно простые натуральные числа,. Определим, последовательность Холтона, полагая

и(п) = (фьх(п),фь2(п), ...,фъа(п)) е Is для любого п ^ 0.

При s = 1 это определение сводится к определению последовательности Ван дер Корпута.

S

С2 и Сз, зависящие только от, b1, Ь2,..., bs такие, что для всех N ^ 1,

С М- < DN S) (,nN)s

N ' " 2 N

В [17, с. 166] замечено, что при = 1 наилучшими являются равномерные сетки, но с увеличе-

лучше. В двумерном случае также известна явная квадратурная формула Фибоначчи [22, с. 92]:

(Jk,{_ IT^k^) , Ь1 = Ь2 = 1, Ьп = Ьп-1 + Ьп-2, (п ^ 3),

где {а} — дробная часть числа а. Кроме того, в [23, с. 92], приведена оценка сверху для следующих квадратурных формул:

вир

1,2 ^^=ф (А {И)

^ с

1 + ЫА

Аг ,

где г > 1, А и Ь (1 < Ь < А) — взаимно простые целые, а функция /(х,,х2) принадлежит классу Я2, если в единичном кубе I3 она имеет непрерывные производные вида

дк

дхХ1 ...дхк

(0 < к < г0 < г).

Нам нужна будет также теорема об асимптотическом поведении функций от оценок. Теорема 3.4. [24, с. 86] (Дельта-метод). Если <р(п) — го при п — го, и

<р(п)(Тп - 9) --——N(0, т2)

то

<Р(п)(д(Тп) - д(в)) --— N(0, т2(д'(в))2)

при условии, что существует непрерывная не равная нулю производная, д'(9), функции д(9).

}

4. Основные результаты

4.1. NВН.-оцопки. Асимптотическое поведение. Пусть дана выборка 2,(п) = {(гг,щ), г = 1,2,...,п}, где ^ имеет отрицательное биномиальное распределение №В(т,Р (щ)), а последовательн ость щ, г = 1, 2,...,п есть последовательность Ван дер Корпута. Определим статистику

п

Е тЯг(х)

Тп(х) = г-=-, где щ(х) = Кн(щ - х).

Е ^гц(х)

г=1

1 п

Поскольку — Е Лг(х) — 1 при п —У го, то мы рассмотрим оценку

п г=1

^ т

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Рп(х) = -. (4.1)

- Е г^г(х) п г=1

Обозначим

1 п Г

& = - Е ггГ]г(х), Ч(К) = ПК(I) (И,э е N.

п

г=1 -1

Теорема 4.1. Пусть Рп(х) — оценка функции распределения, Р(х), определенная формулой (4-.1), {щ,г = 1,2,...,п} — последовательность Ван дер Корпута, выполнены, условия регулярности. Тогда,

^пй(Рп(х) - е(Рп(х)) -— N (0, (1 -Р(х»Р2(х) у к Ц2) .

п^те у т )

Доказательство. Из [25, леммы 3.4] следует, что \/( Кн) = О (к 1), поэтому при п ^ <х> мы имеем:

п / ч\ п / \ п / \

1 ^ ^ I иг — х\\ 1 ^^ ( иг 1 ^ I щ —х\ т

=-г- > К

Е( *> = Е и= Пъчг, = Пк±К(Щ-Х)

\ г=1 / г=1 г=1

пк ^ V к ) / пк ' V к ) пк ' V к ) Г(иг)

„—1 ^ I г=1 г=1

1 [~ 1 (и -х\ (-пп

-к 1. т'Л—)11''+4 -ш

=т • к и ГыК(ЩТХ)'1и +О(ж)

=т [ '^«М* + О (1

!-х/н Г (х + ы)

Ш

гоо

К и) ^{-пп\

--т , . М + О —-

У—. г(х + М) V пк )

-т Г. (т + КЦ) - 1 У)* + О Г^*

1—.\Г(х) ()\Г (х + м) Г (х)У/ V пк /

т Г~Г(х) -Г(х + М-пп\

- +т/ , ,^к(¿М

Г(х) У—. Г(х)Г(х + М) и \ пк

Теперь

/". Г(х + М) - Г(х) _ . , У—. Г (х)Г (х + М) ()

= [. ты+(1/2) г(х)-Н2 + (1/6) f"(х)-Н3 + (1/24)г" (Р-Н4 к

= .1-. г (х)Г (х + М) К ^

1

к4 ( /ГЯ , \ к4^К(1)М

У Г(х)Г(х + М)

1

< к4щ(К) sup ^ (Ц)

-1<4<1

Г (х)Г (х + М)

то

2Сф4

^ Г (х)(Г (х) - е) для п

-V Г f(x)М + (1/2) Г(х)-Н2 К(,ш + 0(-4)

1п = Г2(х) ]-. (1 + и(х)/Г(х))Ы) + О(к2))К (т + О(к )

=^ /I (f (х)м+\пх)-Н2 - ГХкН2 - \Щг кН3)К т+О(к3)

1 г. / 1 ¿2/

Г (^Х)Ы + 1 ¡'(х)-Н2 - ОХ к2^ К (№ + о (к2 У—. V 2 Г (х) )

Г2(Х)]—. V 2"

Ш) - Ш) -2нк )+о(1Л

(к2)

поэтому

Е<*> = -т(1ГЩ - Ш) -2(К) = £ ЩИ.

Рассмотрим теперь дисперсию статистики Б1. Имеем:

В( 5.) = „ ( ±*К {щ-х)) = ^ ± К2 (*-£) В (2.)

\г=1 / г=1

_ 1 ^К-х\ш(1 -Р(щ))

п2Ь2 ^ \Ь Р2(щ)

г=1 4 7

1-р (щ)к 2( щ-^) ли

пЬ2 У-те Р2(и) = т [те 1 - Р(х + Ы) К2 = пь]-те Р2(х + Ы) К { )а

т(1 -Р (х))11 К| 12 ~ пЬР2(х) уК 11 .

Чтобы доказать асимптотическую нормальность статистик 51 проверим условие Ляпунова,

а > 1

| х + у \а < 2а-1( | х\а + \у\а), (4.2)

которое есть следствие того, что функция | х \а выпукла при а > 1, значит

х + у

< \ х \а + \у\а

Пусть

Тогда 51 = Е Сг Используя неравенство (4.2) при а = 4, имеем

3 = 1

\ & -Е (е,) \4 < 8(\ & \4 + \Е (е,) \4).

Беря от обеих частей математическое ожидание, получаем

Е((6 - Е&))4) < 8(Е(ф + (Е&))4 < 16Е(ф .

п

Рассмотрим Ага = Е Е(£4). Имеем:

3 = 1

Ага = £ Е(24)К4(^)

га п4Ь4

3 = 1

Заметим, что если с.в. 2 имеет отрицательное биномиальное распределение с параметрами т и р = 1 - д, то ее характеристическая функция равна

( р ■ ехр^У V ^ =\1 -Я- ехр(и))

1 - д- ехр(И) / '

дисперсия равна 2) = тд/р2, а четвертый начальный момент равен

4 3 2

Е( 24 ) = Ъ4^ + Ьз% + Ь2% + Ь р4 р3 р2 р

где

Ь4 = т(т3 + 6т2 + 11т + 6), Ь3 = 6т(т2 + 3т + 2), Ь2 = 7т(т + 1), Ь1 = т.

т Гте

2

2

С учетом этого замечания выводим, что

А 1 V (Ь (1 - Г (и, ))4 + , , 1 -Г (и,) \ 4 [и,-Х\

Ап - Ш^Х Г4(и,) + Ьз Г3(и,) + 1,2 Г2(и,) + ^-пит)К I—)

1 / (1 -Г (Х))\ А (1 -Г (х))3 А (1 -Г (Х))2 1 А 1 -Г (Х) \ Г ~ С1

( (1 -г(х))4 (1 -г(х))3 , (1 -г(х))2 , 1 -г(х)\ г™ к4 i ь4^чхг+ г3(х) + ,2 г2(х) + 1 ~г(хг) ]_. к ^ м =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

п3к3 \ 4 Г 4(х) 3 Г 3(х) 2 Г2 (х) 1 Г (х) ) п3к3'

С1

Значит, для дроби Ляпунова,

г = еп=^((6- -ев,))4) < сШ2-2 = ^

Гп (Е^о(Сз))2 < С2п3к3 пк п-. 0

т.е. условие центральной предельной теоремы Ляпунова [26, с. 241], выполнено и

А N (0,1).

Иными словами,

^ (* - -т) N (т. (ГМ - 2) *К). =^" К «2) .

т

Теперь рассмотрим асимптотическое поведение статистики Т = —:

51

^ ^ . . пк £п=1 тг1г(х) т т т

Т = Тп (Х) = пк---1-= ^7Х\ = ^.

пМ Еп=1 ^г(х) пМ Еп=1 ^г(х) ¿1п(Х) *

г

параметрами. Поэтому, используя дельта-метод, получаем

, . т . т . ( т \ Г2(х) ( . ( т \ \2 Г4(х)

9(Х) = Х, 9(Х) = -Х2, 9{т) = {д{т))=^г.

Для оценки Гп(х) = —, выполнено соотношение Гп(п) Г(х), поэтому

д(вп) = д(во) + (0п - во)д'(во) + О((вп - во)2) ^ д(вп) - д(во) = (вп - во)д'(во), /п"(9(вп) - д(во)) - у/п-(вп - во)д'(во) - N (а, (д'(во))2т\\ К "21 ^У) .

Но

( п'(й))2—\\К\ |2 1 -Г (Х) т |К| 12 1 -Г (Х) Г 4(Х) а -Г (Х))Г 2(Х),, К , 2

(зт —"к" -тцх^ = т"К" -—(XV'^тг =-т-"К",

откуда

у/п-(Гп(х) - Е(Гп(х)) А N (0, (1 -Г(Х))Г2(Х)" К "Л .

п—. у т )

Замечание 4.1. В оценке Гп(х) вместо статистики 51 можно использовать статистику (см. [27];

п— 1

- иг =1

которая также будет асимптотически нормальна, с теми же параметрами, что и у Б1.

¿1° (х) = ^2(иг+1 -щ ) гмг(х),

Замечание 4.2. Так как предельная дисперсия оценки Рга(х) зависит, от, неизвестной функ-Р( х)

статистику

&2(х) = г+4(х)г К^щ+1 - х)Кь(Щ - х),

которая является состоятельной оценкой функции

т(1 -Р(х))и К,,2 Р2(х) 1|К У .

т - 1

Р = —,-т

т + - 1 ( т, )

оценку функции распределения Р(х) вида, (т ^ 2)

Р (х) = 1 V т - 1 К(и±-х\

Рп[х) = пЬ^т + - IV Ь У

г=1

Оценка р является несмещенной оценкой, нижняя граница Крамера-Рао для ее дисперсии имеет вид

2

ЩР) >^

т

Найдем сначала второй начальный момент, а потом дисперсию. По определению

¥( г?-) = те ( т - 1)2 Г(т + к) гГгк = <пт те т - 1 Г(т + к - 1) пк

) (т + к- 1)2 к!Г(т) Р 4 Р т + к-1 к!Г(т- 1)4

(т + к - 1)2 к\Т(т) 1 ^ т + к - 1 к\Т(т - 1)

к—0 к—0

= рт 2Р1(т - 1,т - 1;т; д)

г1 т—1

= (т - 1)рт I 0

10 (1 д)т-1М'

где 2Р1(а, Ь; с; х) — гипергеометрическая функция Гаусса. В таком случае,

Е)(я) = рт 2Р1(т - 1,т - 1;т;д) - р2.

т = 2

Л

4)^2

*($) = -Р2( 1 + > ^

и при малых значениях д левая и правая части близки. Предельная дисперсия оценки Рп(х) будет равна

' = -р 2« ) ■

Если т = 3, то

,2 = В(й = ,, (^ + ^) > = ^. ■ 2Р1(2.2;3;х) = М + ^

и при малых значениях д левая и правая части, т.е. а^ и а^, также будут близки. Отметим, что

т-2

ЩР) = (т - Т

^ > дт-1

(-1Г-1 Шр+Ё^-1^ ^

к=1

Последнее соотношение впервые было получено в работе [29]

Можно также построить ядерную оценку функции распределения отталкиваясь от оценки максимального правдоподобия, которая равна

т

Р =-—.

т + г

В этом случае

Вд = ±ть • Р"'1к = Р'"Ыттт + 1:ч),

а (см. [30, с. 565, 5.2.11 (15)])

ТТ(Р2) = ^ т2 Г(т + к) тк = т2Рт [ +„-тЬ/л по—)-" Л

Е(р) = ^(ттгкг • 1щт^Р д =тр ,10 (1 — де ) ^

В частности, при т = 1 имеем:

= - р1пр 2) = ртоё(р).

При т = 2 имеем:

2р 4рг [

^(Р) =—(я + Р1ПР), Е(Р2) =--2~(1ПР + ^к^(р)), гДе сШоё(ж) = J

Я я2 ] 1 —t

1

Отсюда видно, что оценка максимального правдоподобия р не является состоятельной оценкой Р т = 2

с. т 1 — р

О =

2(т + г)1+ р(\ир — 1): но эта оценка имеет риск больший, чем оценка (4.1).

4.2. Оценка квантиля. В данном разделе мы изучим асимптотическое поведение оценок квантилей в зависимости доза-эффект по фиксированным планам эксперимента в модели отрицательной биномиальной регрессии.

Определим оценку квантиля порядка 0 < Л < 1 следующим образом:

¿Л = Ш{х е Я : Р„(х) > Л} . (4.3)

Положим а =™'«^ — 2{).

2 Ла

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В следующей теореме доказана асимптотическая нормальность оценок £п\.

Теорема 4.2. Пусть £п\ — оценка квантиля порядка, 0 < Л < 1, определенная формулой (4-3), {щ,г = 1, 2,...,п} — последовательность Ван дер Корпута, выполнены, условия регулярности и )(Ы > 0. Тогда,

^ — ь — а„2) а N (о.'Утъж)

п \ т / 2( £х) у

Доказательство. Пусть а2 = (-)—1| К \\2, 5 = 5(х) = +

т ^ (6)'

Имеем:

(Уп"!'(Сх))(1п,X - Ы ^ ^ хэ/Р ^ хч „/^ ,хч ^ чч -с ( т ^ Л

(-ст-< Х) ^^ <6>=Р(ГМ >Х>=Р (щ—Ш > V

=р(п £.г<Кн(щ. - 5) <fj

(1 п 1 п \

— Е (2гКн(иг - 5) - 0г) < - £ ^ - ^

г=1 г=1 )

„ I X2 ^ /^ / с-ч „ ч V— X2 1 ^ /т „и

=Р --V (ггКн(иг - 6) - 9 г) < ----V - - 9г

\ тстп ^ тст п ^ V X у

=1 =1

где

т

ег = е ( ггКн(иг - 5)) = -—кн(иг - 5).

Г( иг)

Заметим, что к2 = 1/л/п— и функция Ки(и - 6) равна нулю вне отрезка

л = [а - к+хк2а/!(ы, а+к+хк2а/!(а)].

Кроме того, функция 1/Г(и) > 0 монотонно убывает на 3х, {иг, % = 1, 2, ...,п} есть последовательность Ван дер Корпута, поэтому (1/Г(и)) < те и из [16] следует, что

П Е^г = 1 Е Г?-)Кн(иг - *)= [ Гт-)Кн(и - 5) йи + О (/-) . пТ^ пТ^Г (иг) -ЬхГ (и) \V1hJ

=1 =1

Делая замену

и -

г =

к

и учитывая, что 0 < и < 1, заключаем, что

1 (1—$)/н.

т т

/т с г—

—Кн(и - 5) йи = у Г(Х+"к) К

о —6/н

где

хст ,

= 1 + Ж)

и для достаточно большого п (п ^ п1),

1

т

п

ап = ——-— К (Ь) (М .

7 Г (ах + "1к) ( ' 1

где

Пусть 1х | < Г, гДе Г — достаточно большое и Ш] = ш/Х. Тогда

Г (6 + "1к) = Х + ДЫМ + "2к2 + шк3 = Х(1 + слк + Ь1к2 + Ш1к3),

!(£х). Ь 2хст + 12! '(^х) а1 = —:— I, Ь1 =

X ' 1 2Х

а из условий теоремы следует, что | Ш] | ограничена. Так как для п ^ —2

1 - 1 + а1к - (а] - Ь1)к2

1 + а1к + Ьф2 + ш1к3

((Ь1 - а2)ш1к2 + (а1ш1 + Ь2 - О^Ь])" + 2а1Ь1 - ш1 -1 + а]к + Ь]к2 + Ш1 к3

к3 < С2к3,

/]1 ЪК(1) М = 0, то получаем, что

О. = - - '^{Х + (Х!'«X) - ^М"2(К ') М2 + О("2) .

Отсюда следует, что последовательность

(°п - + (

(п \ + (Х + (X! '(Iх) - 2! 2(Сх)) У2(К )\ —СТ-2 Ла'п X) + ^ + 2X0 )

сходится к нулю равномерно по 1х | < Г при п ^ те, ГДе Г > 0 выбрано достаточно большим. Пусть

1 п

£п(Х) = - Е (ггКН(иг - 5) - вг) . п =1

Покажем, что

^ Тп(х) Л N(0,1).

тст п—.

Для этого рассмотрим дисперсию величины Тп(х): 1 п 1 п

ЩТп(х)) = -2 Е В (2гКн(иг - 5)) = ^ ^ ^г - 5)^^) п п

=1 =1

1 ^ К 2 ( иг -й\т(1 -Г (иг)))

£К 2( V)

=1

—2к2 Г? V к ) -2 (иг)

"К2(йи (1 + о(1))

Г1 т(1 -Г(и)) К2(и-5\ пк2.1о Г2 (и) V к )

- т(1 - Ъ "К "2 пкX2 "К "

равномерно по 1х | < Г в последнем соотношении, откуда

МБ Тп(х)\ = 1.

п—. I тст

)

Условия Ляпунова проверяются как при доказательстве теоремы 4.1.

Таким образом, выполнены условия центральной предельной теоремы Ляпунова [26, с. 241], поэтому для 1х I < Г

^Тп(х) Л N(0, 1). тст п

Осталось показать, что для любого е > 0 можно выбрать Г > 0 и п ^ —о так, что

& = Р ^Х))1 Ьх - (X 1 > Г)

.п = Р1 --п,х >ь \ <е.

Так как ¡,п < ¡1п + 32п, где

^ = р ^«хЖпх - (X) > Л , ^ = р ^((хЖпх - (X) <

то рассмотрим первое слагаемое. Рассуждая как выше, получим '/1-X2 1 , ч лч /1-X2 1

о -^/^/пк^2 1 г/т,, л/пкX2 1 -Лл /т \\

31п = Р---> ^ (ггКн(иг - 5Щ) - вг) >---> — - вг

\ тст п ^ тст п ^ \X ) )

=1 =1

Т"{Г) >Г+а) +0(1).

и

114

М.С. ТИХОВ

Положим х = L + а и пусть ф(х) = etx,t ^ 0. Тогда

л' . л Лл ( л2 , тл^^л^ EWZn(L)))

р

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

;ML) >х) L)) > <

muh2 J \ \muh2 J J ф(х)

Поэтому

(JL

, Л\ i2

lim lnP ( —Era(L) > х J < —tх + ф(г), п^ж \mah2 J

где

т=пшlnЕ (ехф(m^En(L>))=T.

Так как минимум функции —tх + ф(1) достигается при t = х и равен —х2/2, то из теоремы Gärtner-Ellis [31] следует, что

lim ßVn < exp(—(L + а)2/2).

n^-X

Выберем L так, чтобы для заданного е > 0 было exp(—(L + а)2/2) < е/2. Аналогично разбирается второе слагаемое, поэтому для так выбранного L получим lim ßn < е. Отсюда следует результат теоремы 4.2. □

4.3. Многомерный случай. В данном разделе мы изучим асимптотическое поведение оценок двумерной функции распределения в зависимости доза-эффект по фиксированным планам эксперимента в модели отрицательной биномиальной регрессии ограничившись двумерным случаем.

д2 д Обозначим Fij = -—-—F(х1,х2), Fi = ——F(х1,х2), Vp = (F1 ,F2), сдхгдху ддх^ p

=(Z Z)• н=('01 h02)• jT^ h=Hj=(t)■

Пусть К,(х) = К(х1, х2) есть симметричная, финитная ограниченная, интегрируемая с квадратом плотность распределения, такая, что

/ xxFК,(х) dx = v2(K,)Is,

где V2(fc) — действительное число, а I2 — единичная матрица порядка 2, ^н(%) = | Н | ^(Н х), N = п1п2,

1 ni n

S1 = S 1(х) = Е Е (Щ — х), FN(х) = m. (4-4)

Теорема 4.3. Пусть (х) — оценка функции распределения Р(х), определенная формулой (4-4)> = 1, 2,...,п1;] = 1, 2,...,п2; } — последовательность Холтона, выполнены, условия регулярности. Тогда, при N А ж,

т т

(г) Е(Я1(х)) = + 2Рт^)(2УТРЬНТ Ут — )(1 + о(1));

(гг) = т(\н1р2(х) \^\2(1 + °(1));

(г г г) у/ЩЩ (Р„ (х) — Е(Рп( N)) —А N (о, (1 — Р (х))Р 2(х) \\ к \\Л .

у т )

Доказательство. Ход доказательства аналогичен одномерному случаю, поэтому отметим отличия. Разложим функцию Р(х + Н1;), где tТ = (11,12) в ряд Тейлора:

F(х + Ht) = F(х1 +11 h1, х2 + t2h2) =F(х1, х2) +

д д

hh1---+ t1h1-—

дх1 дх2

1 Г , д , д 12

h h1---+ hh1—-

д х1 д х2

F (х1, х2) F(хъх2)+о(1Щ).

Тогда

—-—- и 1 =\ - aihi - a2h2 + l((2aj - bn)hj

1 + aihi + a2h2 + iihl + 2bi2hih2 + b22h2) 2 \

+ (4aia2 - bi2)hih2 + (2a22 - b22)h2^ + ...

tihi-— + tihi-— F2(xi,x2) dxi dx2

F (xi,X2)

+

д д

tihi---+ hhi—-

dxi ox2

F (xi,x2) F (xi,x2)Sj

F3(xi, x2)

д

Отсюда B(Si)

m

F(xi, x2)

+m

д д

tihi---+ tihi——

dxi dx2

F( x

tihi---+ tihiTT-

д xi

д dx2

F( xi, x2)

F 2(xi,x2)

+

, x2)

V2(K)

F3(xi, x2)

д д

tihi---+ tihi—-

dxi dx2

F( xi, x2)

2

m

+

m

F(x) 2F3(x)

F2(xi,x2) I

(2VTFhhTVF - U2(K)F(x)hTHFh) (1 + o(1))

Точно так же,

^г) ~ m(l-F(X) ЮГ-

п\Н\Г 2(х)

Условия Ляпунова проверяются как в одномерном случае, откуда мы получаем часть (111) теоремы. □

2

2

СПИСОК ЛИТЕРАТУРЫ

1. D.J. Finney. Probit Analysis. Cambridge University Press, NY. 1971. 333 p.

2. M. Razzaghi. Statistical Models in Toxicology. Taylor k, Fransis Group, NY. 2020. 270 p.

3. C.B. Криштопенко, M.C. Тихов, Е.Б. Попова. Доза-эффект. M.: Медицина. 2008. 288 с.

4. R.L. Haves, N.Mantel. Procedures for computing the mean age of eruption of human teeth // J. Dental Research. 35:5, 938-947 (1958).

5. M.C. Bisi, R. Stagni. Evolution of toddler different strategies during the first six-months of independent walking: A longitudinal study // Gait Posture. 41:2, 574-579 (2015).

6. M.C. Тихов, K.H. Шкилева. Непараметрическое оценивание квантилей в модели бинарной регрессии // Вестник ТвГУ. Серия: Прикладная математика. 1, 5-19 (2020).

7. M.S. Tikhov. Statistical Estimation Based on Interval Censored Data // Parametric and Semiparametric Models with Applications to Reliability, Survival Analysis, and Quality of Life (ed. N.Balakrishnan etc.). Springer, NY. 555 p., 211-218 (2004).

8. M.C. Тихов, Д.С. Криштопенко. Оценивание распределений в зависим,ост,и доза-эффект при фиксированном, плане эксперимента // Статистические методы оценивания и проверки гипотез: межвуз. сб. науч. тр., Перм. ун-т, Пермь. 66-77 (2006). English translation: M.S. Tikhov, D.S. Krishtopenko, Estimation of distribution under dose-effect dependence with fixed experiment plan // J. Math. Scien. 220:6, 753-762 (2017).

9. Е. Надарая, П. Бабилуа, Г. Сохадзе. Об интегральной квадратической мере уклонения одной непараметрической оценки бернуллиевой регрессии // Теория вероятн. и ее примен. 57:2, 322336 (2012).

10. Н. Okumura, К. Naito. Weighted kernel estimators in nonparametric binomial regression // J. Nonparametr. Statist. 16:1-2, 39-62 (2004).

11. M.S. Tikhov, T.S. Borodina. Kernel estimators of quantiles in dose-effect relationships // Automatic Control and Computer Sciences. 2, 29-43 (2013).

12. M.S. Tikhov. Negative binomial regression in dose-effect relationships // The 5th International Conference on Stochastic Methods (ICSM-5): Proc. of Int. Scien. Conf. Peoples Frindship University of Russia. M. 205-208 (2020).

13. M. Кендалл, А. Стьюарт. Теория распределений. M.: Наука. 1966. 588 с.

14. В. Феллер. Введение в теорию вероятностей. Т.1 . М.: Мир. 1984. 528 с.

15. И.П. Натансон. Теория функций вещественной переменной. М.: Лань. 2008. 560 с.

16. Н. Niederreiter. Random number generation and quasi-Monte Carlo method. SIAM, Philadelphia. 1992. 241 p.

17. И.М. Соболь. Многомерные квадратурные формулы и функции Хаара. М.: Наука. 1969.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

18. Т.М. Товстик. Вычисление дискрепанса конечного числа точек в n-мерном единичном, кубе // Вестник СПбГУ, Сер.1, 118-121.

19. Л. Кейперс, Г. Нидеррейтер. Равномерное распределение последовательностей. М.: Наука. 1985. 408 с.

20. J. Kiefer. On large deviations of the empiric d.f. of vector chance variables and a law of the iterated logarithm // Pacific. J. Math. 11:2, 649-660 (1961).

21. J.H. Halton. Algorithm 24-7: Radical-inverse quasi-random point sequence // CACM. 7:12, 701-702 (1964).

22. L.K. Hua, Y. Wang. Applications of number theory to numerical analysis. Springer-Verlag, NY. 1981. 241 p.

23. H.M. Колобов. Теоретико-числовые м em оды в приближенном анализе. М.: МЦНМО. 2014. 285 с.

24. E.L.Lehmann. Elements of Large-Sample Theory. Springer, NY. 1999. 632 p.

25. М.С.Тихов. Непараметрическое оценивание эффективных доз по данным, бинарных откликов II Уфимск. матем. журн. 5:2, 94-108 (2013).

26. Б.В. Гнеденко. Курс т,еории вероятностей. М.: УРСС. 2005. 488 с.

27. М.В. Priestly, М.Т. Chao. Nonparametric function fitting //J. Royal Statist. Soc., Ser. B. 34, 385-392 (1972).

28. Н.Л. Джонсон, С. Коц, А. Кемп. Одномерные дискретные распределения. М.: БИНОМ. Лаборатория знаний. 2010. 559 с.

29. М. DeGroot. Unbiased sequential estimation for binomial populations // Ann. Math. Stat., 30:1, 80-101 (1959).

30. Ф.П. Прудников, Ю.А. Брычков, О.И. Маричев. Интегралы и ряды. Т.1. Элементарные функции. М.: ФИЗМАТЛИТ. 2002. 632 с.

31. R.S. Ellis. Large deviations for a general class of random vectors // Ann. Statist. 12:1, 1-12 (1984).

Михаил Семенович Тихов,

Нижегородский государственный университет им. Н.И.Лобачевского, пр. Гагарина, 23,

603950, г. Нижний Новгород, Россия E-mail: tikhovm®mail .ru

i Надоели баннеры? Вы всегда можете отключить рекламу.