Научная статья на тему 'Об уменьшении погрешности наблюдений при оценивании зависимости доза эффект'

Об уменьшении погрешности наблюдений при оценивании зависимости доза эффект Текст научной статьи по специальности «Математика»

CC BY
119
33
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЗАВИСИМОСТЬ ДОЗА-ЭФФЕКТ / НЕПРЯМЫЕ НАБЛЮДЕНИЯ / ПОГРЕШНОСТИ НАБЛЮДЕНИЙ / РЕГРЕССИЯ / DOSE-EFFECT DEPENDENCE / INDIRECT OBSERVATIONS / OBSERVATION ERRORS / REGRESSION

Аннотация научной статьи по математике, автор научной работы — Ярощук Марина Владимировна

Рассматривается математическая модель зависимости доза-эффект в случае непрямых наблюдений. Предлагаются и исследуются способы уменьшения погрешности наблюдений для оценивания неизвестной функции распределения.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON REDUCTION OF OBSERVATION ERRORS IN ESTIMATING THE DOSE-EFFECT DEPENDENCE

A mathematical model of doze-effect dependence in case of indirect observations is considered. The ways to reduce observational errors for the estimation of an unknown distribution function are proposed and studied.

Текст научной работы на тему «Об уменьшении погрешности наблюдений при оценивании зависимости доза эффект»

Математическое моделирование. Оптимальное управление Вестник Нижегородского университета им. Н.И. Лобачевского, 2012, № 3 (1), с. 170-174

УДК 519.2

ОБ УМЕНЬШЕНИИ ПОГРЕШНОСТИ НАБЛЮДЕНИЙ ПРИ ОЦЕНИВАНИИ ЗАВИСИМОСТИ ДОЗА - ЭФФЕКТ

© 2012 г. М.В. Ярощук

Нижегородский госуниверситет им. Н.И. Лобачевского

marina.yaroschuk@yandex.ru

Поступила в редакцию 26.03.2012

Рассматривается математическая модель зависимости доза-эффект в случае непрямых наблюдений. Предлагаются и исследуются способы уменьшения погрешности наблюдений для оценивания неизвестной функции распределения.

Ключевые слова: зависимость доза-эффект, непрямые наблюдения, погрешности наблюдений, регрессия.

Введение

В работе рассматривается математическая модель зависимости доза-эффект (см. [1]) для схемы непрямых наблюдений, т.е. когда вводимая в организм доза измеряется с некоторой ошибкой, а реакция организма (эффект) идет на «чистую» вводимую дозу. Рассмотрен случайный план эксперимента, когда вводимая доза является случайной величиной. Данная модель при наличии погрешности измерения в основном отражает применяемую методику проведения клинических испытаний лекарственных препаратов. В схеме непрямых наблюдений, если распределение ошибки неизвестно, устранить ее влияние в определенных случаях можно либо при помощи специальных ядер (см. [2]), либо используя априорные сведения о распределении ошибок. Однако, как показали результаты численного моделирования, указанные методы устранения ошибок работают для оценки плотности, а для оценки функции распределения дают неудовлетворительные результаты. Мы предлагаем и исследуем способы уменьшения погрешности для оценки функции распределения в некоторых случаях, имеющих важное значение для приложений. Так, если распределение с.в. X является нормальным Щ(а, о2) с неизвестными параметрами, распределение ошибки е также

N(0,а2)

подчиняется нормальному закону

22 известной дисперсией а 0, где дисперсия а 0

2

много меньше дисперсии о , мы строим оценку, предельное распределение которой мало зависит от погрешности измерения.

В задаче доза-эффект для случайных планов эксперимента математическая модель в схеме непрямых наблюдений имеет следующий вид. Измерения вводимой дозы и осуществляются с

погрешностью е, имеющей плотность £(х), то есть вместо с.в. и наблюдается с.в. Y. Эта ошибка может накладываться аддитивно, тогда

Y = и + е, при фиксированном значении и = и распределение величины Y имеет плотность д(у - и). В общем случае распределение ошибки описывается условной плотностью ^(у|и).

Имеем: X], X2,...Xn - независимые одинаково распределенные случайные величины (н.о.р.с.в.) с функцией распределения (ф.р.) F(x), и1, и2,...,ип - независимые между собой и одинаково распределенные с.в., независимые от {X,■, 1 < 1 < п}, с неизвестной ф.р. G(x), Yl, Y2,...,Yn -н.о.р.с.в. с неизвестной ф.р. Q(y). Мы наблюдаем повторную выборку Y(n) = {(^-, Щ), 1 < 1 < п}, где Щ = 1(и. >X) есть индикатор события {и > > X}, т.е. Yi - наблюдаемое значение, а реакция организма осуществляется на величину и.

Определим статистики 1 п

(X) = - £ К ^ - X),

пт1 1 п

S2*п(X) = -^ - X), п и

где И = сп15, с - некоторая заданная положительная константа, функция К(х) - ядерная

функция (ядро), К И (х) = И К ^ И ^ .

По выборке {(^ ,Щ )}= построим оценку для F(x) как отношение статистики S2n (х) к Sln (х)

*( X) = ^(х)

Х,п М

полагая ¥*п (X) = 0, если S1*n (X) = 0. Пусть т(X) = |F(у)g(X - у) dy.

Известно (см. [3, 4]), что при некоторых условиях регулярности оценки (1) являются состоятельными и асимптотически нормальными оценками неизвестной функции распределения F(x) и кроме того

4nh (s* (x) - l)—U N (о,| 1*112), (2)

V II II /

( 2 ^ ■Jnhisln(x) -m(x))—N — m"(x),||*112m(x) , (3)

V ^

( 2 ^ 4nh(F.(x) -m(x))——^N — m”(x), ||*||2 o2 (x) , (4)

где ст

k =

J K 2(x) dx .

N1

(о,I |K|| ■)

Tv2 ,, „2

N — /(x), F(x)||K||

V 2 У

g (x) =

l

V2rc

expI

x

2

О У

Пусть с.в. X є N (a, а2), т.е. F(t) = P(X < t)

= ФІ x-a | ,Ф(X) = -^= Je“2 dt .

о

Тогда m(x) = JF(t)g(x -1)dt -

свертка двух

нормальных распределений. Применяя теорему Фубини [5], заключаем, что

m'( x) = J / (t) g (x -1 )dt-

(t-a)2

„•ч/їло

- ( x-t )2

О

-e 0 dt =

(x) = m(x)(l - m(x)), v2 = J x2K (x)dx,

72п(оО + °2)

Следовательно,

x l (t-a)2

m(x) = ^СЁ?

( x-a)

2 (о2 +о2)

(

оЛ/2л(а О + а2)

x - a

ЧУаО +а2 У

и

Результаты и их обсуждение

Мы рассмотрим задачу устранения погрешности измерений, когда:

1) погрешность е имеет известное нормальное распределение N (о, ст 0), распределение случайной величины X - нормальное N(a, o2), параметры (a, o2) неизвестны;

2) погрешность е имеет известное нормальное распределение N (о, ст 0), функция распределения F(x) случайной величины X неизвестна;

3) погрешность е имеет известное нормальное распределение N (о, ст 0), распределение случайной величины U - нормальное N(a, o2), параметры (a, o2) неизвестны, распределение случайной величины X неизвестно.

1. Если ошибка е имеет нормальное распределение N (о, ст 0), то из соотношений (2) и (3) заключаем, что нормированные разности 4nh (s* (x) -1) и 4nh (s 2*n (x) - F (x)) имеют асимптотически нормальные

( 2 ^ 4nh (S 2*n (x) - F (x))—-^ N — m"( x), m(x)\*2

V ^

Теперь из (4) заключаем, что 4nh (m (x) - F (x))—

N

— т"(X), m(x)(l - т(X))К||

ч у

где т (х) = (x) = .

^п (Х)

Таким образом, установлено, что при нормальном распределении с.в. XЩ(а, о2) и извест-

ной дисперсии о0 с.в. е е N(0,о2) предельное распределение оценок получилось аналогичным тому, что и в схеме прямых наблюдений. Отличие состоит в том, что дисперсии распределений m(x) и F(x) различны.

Чтобы найти оценку т^), вычислим первый и второй начальные моменты ц1 и ц 2:

J xdm (x) = J (l - m (x)) dx - J m (x) dx = |Il,

распределения

I

соответст-

J x2 dm (x) = |I 2.

венно.

Пусть распределение случайной величины U имеет плотность

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Положим р2 = ц2 -ц^. Тогда неизвестные

2

параметры а и о найдем из системы уравнений

v —

a + — + m (x) = ц1 .

— 2 2 2 p = а +аО,

v

а = ц- - — т (x\

;;2 „2 —2

а =р -аО.

Функцию yn(x) определим соотношением

m( x+h) - 2m( x)+m(x - h)

Vn(x) = m"(x) =■

h2

l

l

l

и

2

Заметим, что если с.в. X имеет функцию распределения F(x) и функцию времени жизни

да да

5(X) = 1 - F(X), то ^xdF(X) = ^S(X)dx.

0 0

Далее,

1

(у-и )2

dF (X) 5^

g(У, и) = Ч(у1 и) • g(и) = г— е п° • g(u),

V 2ПО0

а маргинальная плотность распределения величины 1 будет равна

да да 1 _(у-и )2

Ч(у) = Г g (у, и) du = Г ,— е 2п“ g(и) du .

-да -да^2п00

Кривая регрессии и по 1 имеет вид:

Г1Г5(и) аи ^=Г1Г5(и) йи

5 2( X)

I-

1

( у-и)2

Г 5(и) du

да да

0 0

Г 5(и) du • S(x) dx -

= -ц2 - 2xj 5(и) du + 2^ xS(x) dx =

X 0 0

дада

= -ц2 + Г 5(X) d (X2) = -ц2 + Г X2 dF(X).

00 Поэтому эмпирические моменты можно считать используя приведенные соотношения и подставляя вместо теоретической функции распределения эмпирическую.

Найденные значения а и а2 подставим в функцию распределения с.в. X и получим оценку этой функции распределения.

2. Пусть 1 = и + е - сумма независимых случайных величин и и е, причем распределение е -нормально с нулевым математическим ожидани-

2

ем и известной дисперсией а 0, а случайная величина и имеет неизвестную плотность g(u) > 0. Для устранения погрешности е мы воспользуемся следующей идеей работы Э. Надарая [6]. Кривая регрессии и по 1 имеет вид:

рМ

и(X) = Е(и 11 = X) =

Ч(х)

где

да ^ (X—и) да

р^) = Г ug(u) е 2а° du, ч(^) = Г g(u)

•' л/2лап

( X -и )

-е 2п° du .

Чу и( у 1 и) = Ч(у 1 и) = -

1

( у-и )2

___ е 2а° g(u) du

u(x) = Е(и 11 = X) = -да 2л°°----------------= ^Ф.

ЧС*} чС*)

С помощью этой кривой регрессии мы будем «исправлять» выборочные данные и использовать их для оценки распределения величины X «без ошибки».

Представим последнее соотношение в другом виде. Для этого рассмотрим производную Ч'^). Она равна

да 1 ч'м = Г-^-

•'л/2ла„

(

X - и

\ - (x-и)2

а

е а0 g (и) du =

0 У

Отсюда

= - xч( X) + р (X).

Ч'( x) Ч(^

Р(x)

а„

а 0 Ч( x)

значит,

Р(^ _2 Ч'(x)

= а---------------+ X.

Ч(x) чМ

Пример 1. Пусть случайная величина 1 имеет нормальное распределение с неизвестным математическим ожиданием а и неизвестной дисперсией о2, ее плотность равна

1

( x-а)2

Тогда

Ч(x) = ^^~ е 2а

л/2^а

ч' (x)

Ч(x)

Ч(x)

= (1п ч( x)), =-

а

2 ч'(X) а -а0 а0

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

и а 0 / ч + X =------X + а

2

0.

2

д/ 2ла 0

Найдем условное распределение 1 при условии и = и. Имеем

Р (1 < у |и = и) = Р (и + е< у |и = и) =

= Р (и + 8 < у | и = и) = Р (е < у - и), поэтому условная плотность 1 на и равна

аа Поскольку а и о2 неизвестны, то мы оценим их по выборке у1, у2,....уп с помощью следующих статистик:

пп

а = у = - £ у. и а 2 = 52 = - £ (у,. - у)2 .

п и п м

В качестве приближения по выборочным данным мы рассмотрим статистику

ип (x) = а2 ^4“: + x ,

л/0ла 0

Совместная плотность пары (1, и) будет равна

где

Р п (x) =

Чп (x)

1 п

Чп (x) = - £ Ки (у, - x)

пт1

Чп (X + И) - Чп (X - И)

2И '

да / да

да / да

2

1

+

X

+

X

1

и

Имеет место следующий результат.

Теорема 1. Пусть I - произвольный конечный интервал [а, Ъ] на прямой и выполнены следующие условия: K(x) - неотрицательная, нормированная, четная, финитная функция с ограниченной вариацией ц = V(K), nh ^да>, при n^-да, плотность q(x) имеет до третьего порядка непрерывные и ограниченные производные.

Тогда

p

sup |un(x)-u(x)| ^ 0.

xel n

Доказательство повторяет с небольшим отличием идею доказательства работы [6].

Пусть е > 0 и V2n = sup 1 Рn (x) - E(Рn (x))|.

Имеем:

V2n = supI Pn (x) - E(Pn (x))I =

x

sup

q„(x+h) -q„(x-h) Jq„(x+h) -q„(x-h)

2h = sup

2h

au-x-lL | dF_ (u) -

Kl'u-x+L | dF_ (u) -

u-x+h

— J

h2 J

- 2?J ± Jk( ^ ^+£ J 4

i-J(F„(u) - F (u))dK V h

2h J (Fn (u) - F (u)) dKf u - x - h

= sup

x

h

u - x+ h

dFu)

< sup |Fn (x) - F(x)| • — .

x 2h

P

D >

h

< P(sup \Fn (x) - F(x) > є—) < C1e

x ц

-A^nh1

supI E (p n(x)) - q'( x)I =

= sup

у - x - h

2h2 J K1 q(у)Ф -

-1— f K\

>h2 J I

у - x + h

q( у) "у - q '(x)

2h 2 J i h

=sup 2ї J (q( x+(z+1)h) -

— q(x + (z - 1)h))K(z) dz - q(x)

= sup

' 2 ' ' ' 6 x (q "" (^l)+qm (S 2))K (z) d^ q'(x)

(v2 + 2)L3 , 2

з

h2.

Поэтому при и > N1(e) P (sup 1 Pn (x) -

x

- q’(x)| >e) < Ci e^nlf, где Pi = -2 .

Обозначим (ln q(x)) " = V (x), и пусть

"Hj = minq(x) Ф 0 , h2 = max| V(x) |.

xel xel

Тогда

P

sup

xєI

P n(x)

- V (x)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Пусть Dn (x) = sup j Fn (x) - F(x)|, где F(x) -

x

ф.р. с.в. X, а Fn(x) - эмпирическая ф.р. с.в. X. Как показано в [7], для n > N0 существует такая универсальная константа C1, что

( 7 ]

— < с e ^

1— — •

V„ У

Принимая во внимание эти неравенства, заключаем, что для є > О,

P (sup I Рп (x) - E(Рп (x))I > є) <

q„(x)

< P(supb„(x)-V(x)q„(x)I >

xєI

> є(Р- - є)) + P (supI q„(x) - q(x)I > є) <

xєI

< P(supIP„(x)-V(x)qn(x)I >

xєI

> є(Р- - є)) + P (supI q„(x) - q(x)I > є) <

xєI

< P (supIP „ (x) - q’( x) I + supI V (x) (q„ (x) - q( x)) I >

xєI xєI

> є(Ц - є)) + P (supI q„(x) - q(x)I > є) <

xєI

< P(supb„(x) - q"(x)I > є(П- - є)/2) +

xєI

+ P (supI q„(x) - q(x)I > є) +

xєI

+P (supI (q„(x) - q(x)) I > є(п- - є) )) <

гдеР = .

Ввиду того, что плотность ч(x) имеет непрерывные и ограниченные производные до третьего порядка включительно, причем

sup| Ч " (x)| ^ ^,

< C4 (e~P-nh2 + e-p2nh2 + e-рзnh2), 2

, рз =P2 / ^2.

По условию теоремы nh2^-*, поэтому

p

sup I u„ (x) - u(x)I ^ 0.

xєI „^да

Теорема доказана.

x

x

x

x

x

+

x

2

Поскольку a и o2 неизвестны, то возьмем их оценки: а = у, О2 = s2. Поэтому

3. Рассмотрим случай, когда имеются наблюдения 1 = и + е; и, е независимы и имеют нормальные распределения соответственно Щ(а, о2) и N(0,о°), о0 известна. Здесь условная плотность распределения ч(и|у) имеет нормальное распределение N(ц1(у), р2), где Значение Fn (V*) будем использовать в каче-

* s v = x—-----

-- у = x + (x - у)-

а

s -a.

s -a.

Ц-( у) =

aa„

уа

22 а2 + а2

22 а2 + а2

p- =

22 a a 0 2 2 a о +a

т.е.

1

l

, где ф( x) = ^= e v2n

Ч(и 1 у) = — Ф

Р1

пп

Пусть у = - £ у,, 52 = - £(у,- у)2.

п и пт-

Предположим, что случайная величина Z имеет нормальное распределение М^р2) с функцией распределения Ф((x - ц)/р, Ф (X) =

= Г ф(?) dt.

, I x - а

стве оценки ФI--------| в точке x.

Если условие —^ << 1 не выполнено, то v

найдем из уравнения

(

1 + a 0

22 s -a„

(x - у) - у,

где X - заданная точка функции распределения ^).

Список литературы

При n ^ да последовательность {Fn (v), n > 1} сходится к среднему

R(v) = J Ф

u - ц

Л

l

(

p У

f

u - Ц-О!)

Л

Pi

Ц-О!) - ц

du =

V Pl У

U

p2 + Pi2

У

o2 ст 2

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Если —2- << 1, то заменим , 1 +—2 на 1 и o V ст

потребуем, чтобы

Ф

aо„

2 2 2 2 о + о о + о

-a

Отсюда

aa„

va

22 а2 + а2

22 а2 + а2

x-a

значит,

22 а о + а

v = x--2---a .

а2

1. Тихов М.С. PC-оценки функции распределения в модели доза-эффект по случайным планам эксперимента // Вестник Нижегородского университета. 2012. Вып.1(1). С. 138-143.

2. Fan J., Truong Y. Nonparametric regression with errors in variables // The Annals of Statistics. 1993. V. 21, № 4. P. 1900-1925.

3. Тихов М.С., Ярощук М.В. Статистическое оценивание распределений по интервально цензурированным выборкам в схеме непрямых наблюдений // Нелинейный мир. 2007. Т. 5, №1. 2. С. 4-8.

4. Ярощук М.В. Имитационное моделирование зависимости доза-эффект и статистический анализ оценок функции эффективности // Обозрение прикл. и пром. математики. 2009. Т. 16. В. 6. С. 1148-1150.

5. Колмогоров А.Н., Фомин С.В. Элементы теории функций и функционального анализа. М.: Наука, 1976. 542 с.

6. Надарая Э.А. О непараметрических оценках плотности вероятности и регрессии // Теория веро-ятн. и ее примен. 1965. Т. 10. В.1. С. 199-203.

7. Dvoretzky A., Kiefer J. and Wolfowitz J. Asymptotic minimax character of the sample distribution function and of the classical multinomial estimator // Annals of Mathematical Statistics. 1956. V. 27. P. 642-669.

+

о

2

x

о

*

v=

о

о

+

ON REDUCTION OF OBSERVATION ERRORS IN ESTIMATING THE DOSE-EFFECT DEPENDENCE

M. V. Yaroshchuk

A mathematical model of doze-effect dependence in case of indirect observations is considered. The ways to reduce observational errors for the estimation of an unknown distribution function are proposed and studied.

Keywords: dose-effect dependence, indirect observations, observation errors, regression.

i Надоели баннеры? Вы всегда можете отключить рекламу.