Научная статья на тему 'Учет информации об sƒ-равноплечной симметрии при обработке цензурированных данных'

Учет информации об sƒ-равноплечной симметрии при обработке цензурированных данных Текст научной статьи по специальности «Математика»

CC BY
150
38
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ПРОГРЕССИВНО ЦЕНЗУРИРОВАННАЯ ВЫБОРКА / ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ / МАТЕМАТИЧЕСКОЕ ОЖИДАНИЕ / СИММЕТРИЗАЦИЯ / АПРИОРНАЯ ИНФОРМАЦИЯ / PROGRESSIVE CENSORED SAMPLE / DISTRIBUTION FUNCTION / SAMPLE MEAN / SYMMETRIZATION / A PRIORY INFORMATION

Аннотация научной статьи по математике, автор научной работы — Зенкова Жанна Николаевна

Вводится понятие Sƒ-равноплечной симметрии функции распределения, показано, что данным свойством обладает произвольная непрерывная функция распределения, в том числе экспоненциальная и логнормальная. Получены оценки функции распределения, модифицированные с учетом априорной информации об Sƒ-равноплечной симметрии, как для полной, так и для цензурированной справа выборки, изучены их свойства. Методом подстановки получены оценки математического ожидания.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

F(t) possesses Sƒ -equal-shoulder symmetry property, if a distribution function satisfies to a condition ( ) 1 ( ( ) F t = −F S t + 0),tR, where S(t) is continuous, decreasing and (S) 1(t) S(t), S( ) − = ƒ = ƒ, (S) 1(t) − is inverse function for S(t), F(ƒ)= 0.5, ƒ is known center of symmetry. Note if S(t) = 2ƒ −t we receive the ordinary symmetry of distribution function concerning median value ƒ F(t) =1−F(2ƒ −t +0). Theorem 1. If F(t) is continuous and increasing then F(t) satisfies to property F(t) =1−F(S(t)+ 0),tR, where S(t)=F−1(1−F(t)), ƒ = F−1(0.5), F−1(t) is inverse function for F(t). Theorem consequence is that exponential, uniform and lognormal distributions are Sƒ -equalshoulder symmetrical. In this paper we use the knowledge about property (1) for estimating a distribution function and its numerical characteristics on progressive censored sample ( ) {( ) ( ) ( )} X,I = X1,I1,X2,I2,...,XN,IN , where for i= 1,N 0, full observation; 1, censored observation; i i i X I X = ⎧⎨⎩ −− moment T1 and share g of censoring are non casual. The estimation is defined by 2 ( )(1 ) N S S N ti i i where { } ( ) 0:,1: AIx x A x A = ∉ , for 1, i N = Smin{, ( )},S1, Xi = XiS Xi Ii = −Ii S max{, ( )},S 1, XN+i= Xi S Xi IN+i= −Ii (3) r is a number of full observations in [0,T1].

Текст научной работы на тему «Учет информации об sƒ-равноплечной симметрии при обработке цензурированных данных»

ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА

2011 Управление, вычислительная техника и информатика № 2(15)

УДК 519.25

Ж.Н. Зенкова

УЧЕТ ИНФОРМАЦИИ ОБ £"-РАВНОПЛЕЧНОЙ СИММЕТРИИ ПРИ ОБРАБОТКЕ ЦЕНЗУРИРОВАННЫХ ДАННЫХ

Вводится понятие S а-равноплечной симметрии функции распределения, показано, что данным свойством обладает произвольная непрерывная функция распределения, в том числе экспоненциальная и логнормальная. Получены оценки функции распределения, модифицированные с учетом априорной информации об S а-равноплечной симметрии, как для полной, так и для цензурированной справа выборки, изучены их свойства. Методом подстановки получены оценки математического ожидания.

Ключевые слова: прогрессивно цензурированная выборка, функция распределения, математическое ожидание, симметризация, априорная информация.

При обработке статистических данных нередко возникает необходимость построения оценки неизвестной функции распределения исследуемой случайной величины и/или ее числовых характеристик. При этом на практике имеют место ситуации, когда существует дополнительная информация об исследуемой случайной величине, например о непрерывности, симметричности, значениях моментов или квантилей распределений и пр. Источником этой информации могут служить условия эксперимента, результаты предыдущих исследований, теоретические выводы, физический смысл анализируемой случайной величины и т.д. Следовательно, возникают вопросы учета имеющейся дополнительной информации при разработке статистических процедур, а также исследовании свойств получаемых при этом статистик [1, 2].

Рассматриваемая проблема становится еще более важной в случае, если выборка является неполной, например цензурированной. Данные такого рода встречаются в практической работе довольно часто, особенно в теории надежности, при проведении медицинских, биологических, демографических, экономических исследований и пр. [3 - 6]. Цензурирование приводит к существенным потерям информации, поэтому привлечение дополнительных сведений о распределении -важная и перспективная задача.

Кроме того, проведение многих экспериментов затратно или требует много времени для получения результатов, поэтому возникает задача привлечения априорных сведений о распределении для сокращения количества испытаний и продолжительности опытов.

В работе рассматривается задача привлечения априорной информации об £ а-равноплечной симметрии случайной величины типа времени жизни при статистической обработке прогрессивно I типа однократно цензурированных справа выборок. Получены модифицированные оценки функции распределения неизвестной случайной величины, проанализированы ее свойства, показано, что оценка является несмещенной, при этом ее использование повышает точность оценивания неизвестной функции распределения в смысле минимизации дисперсии. Полученные результаты позволяют утверждать, что привлечение дополнительной информации дает возможность получать оценки, которые по точности превосхо-

дят эмпирическую функцию распределения, построенную по полной выборке без цензурирования, однако уступают по точности симметризованной эмпирической функции распределения, при этом точность оценивания падает с ростом доли цензурированных наблюдений.

Также в работе методом подстановки найдены модифицированные оценки математического ожидания и дисперсии, изучены их свойства. Полученные формулы обобщают классические результаты.

1. Оценка функции распределения по цензурированной выборке

В данной работе рассматривались прогрессивно цензурированные выборки (ц.в.), цензурирование I типа.

Определение. Под прогрессивно цензурированной выборкой (п.ц.в. [3 - 6]) понимается такая ц.в., характер цензуры которой неслучаен.

Определение. Будем говорить, что имеет место цензурирование I типа, если /-й опыт (цензурирован или нет) производится независимо от других опытов.

Пусть т - случайная величина (с.в.) типа времени жизни, те[0, Т], с функцией распределения (ф.р.) F(t),(Х,I) = {(Х1,11),(Х2,12),...,(Хы, 1Ы)}- п.ц.в. объема N где для / = 1, N

[0, Х/ - полная наработка;

[1, Х{ - неполная наработка до цензурирования;

при этом момент цензурирования Т1 неслучаен.

Рассмотрим п.ц.в., построенные по следующей схеме цензурирования: количество неполных наработок в интервале (Т1, Т] - с.в., численно равная доле g, 0 < g < 1, от числа исправных изделий в конце интервала [0, Т1 ]. Тогда оценка функции распределения определяется формулой [3,5]

[0,

I/ =

(*) =

[0,* )(Х, )1 1

N (1 - g) N ~=1

Г

N,

1,

N = 0

* < 0,

0</<т,

Т < * < т , * > т ,

(1)

где для / = 1, N I/ = 1 -1/, г - число полных наработок в интервале [0, Т1 ], 1А (х) = {0: х г А,1: х е А} - индикаторная функция, N1 = (N - г)(1 - g).

Оценка (1) асимптотически несмещенная, при этом

0,

F (*)(1 - F (*)), F (*)(1 - F (*)) +

* г[0, т ],

* е [0, Т1]

g (F (*) - р)(1 - F (*)) (1 - р)(1 - g ) ’

* е(Т1,Т],

Г

где p = F(T), p е (0,1),

аЦ (t) = lim NDFN (t). (2)

N

Здесь D£ - дисперсия с.в. £ .

2. & а-равноплечная симметрия функции распределения

Определение. Будем говорить, что с.в. теR является Sа-равноплечно симметричной относительно центра симметрии а, если ф.р. F(t) удовлетворяет условию

F(t) = 1 - F(S(t) + 0), t е R, (3)

где функция S(t) является непрерывной, монотонно убывающей и удовлетворяет требованиям

(S) 1 (t) = S (t), S (а) = а.

Здесь (S) 1 (t) - обратная к S(t) функция, F(а) = 0,5. Заметим, что в случае S(t) = 2а -1 получим обычную симметрию ф.р. относительно медианы

F (t) = 1 - F (2а-1 + 0).

Теорема 1. Если ф.р. F(t) является непрерывно возрастающей, то F(t) обладает свойством (3), при этом

S(t) = F-1 (1 - F (t)), (4)

а = F- (0.5), где F- (t) - обратная к F(t) функция.

Доказательство. Так как ф.р. F(t) непрерывно возрастает, то обратная функция F- (t) также является непрерывной и возрастающей, в то время как с ростом t значение выражения 1-F(t) убывает. Из этого следует, что функция S(t), определяемая по формуле (4), является убывающей.

Нетрудно убедиться, что (S) 1 (t) = S(t), при этом для а = F- (0,5)

S(а) = F- (1 -F(а)) = F- (1 -0,5) = F- (0,5) = а.

Выполнение условия (3) таким образом очевидно. Теорема доказана.

Следствие 1. Экспоненциальная ф.р. F (t; X) = 1 - e~Xt, t > 0, с параметром X > 0 обладает свойством (3), при этом

S(t) = -аln(-е">, а = ini.

ln 2 X

x — a

Следствие 2. Равномерная ф.р. F(x; a,b) =---------, x е [a,b], с параметрами

b - a

-w < a <b < +w обладает свойством (3), где а = ° + b , S(х) = 2а- x = a + b - x.

Рассмотрим с.в. £, с логнормальной ф.р. / (х; 0, ст2 )• С.в. п = 1пI является

нормальной с.в. с параметрами 0 ист2, следовательно, п обладает свойством симметрии относительно центра 0

/ (х) = 1 -/ (20 -х),

где / (х) = Р(п < х) - ф.р. с.в. п. Тогда

/ (х) = Р(| < х) = Р(п| < 1пх) = / (1пх) = 1 - / (20- 1пх) =

= 1 -P(< 20-lnх) = 1 -F(e2e-lnх) = 1 -F%

f е2ВЛ

Таким образом, для х > 0 F| (х) = 1 - F|

f е20^

„20

Рассмотрим S (х) = -

х > 0 . Данная функция является непрерывной и моно-

тонно убывающей при х > 0, при этом очевидно, что (£) 1 (/) = £(/). Найдем а,

20

удовлетворяющее условию £ (а) =-------= а. Отсюда получим а = е0 , при этом

а

/ (а) = / (1па) = / (1пе0) = / (0) = 0,5.

Таким образом, ф.р. логнормальной с.в. с параметрами 0 и ст2 обладает свойством £ “-равноплечной симметрии относительно центра а = е0 с функцией

а2

£ (х) = —, т.е. для всех х > 0 выполняется равенство

х

F (х) = 1 - F

= 1 - F

f е20^

3. Учет информации об S а-равноплечной симметрии при оценивании функции распределения

Пусть известно, что с.в. те [0, T ] является S “-равноплечно симметричной от-

T

носительно известного центра a = у, т.е. ф.р. F(t) удовлетворяет условию (3) для t е [0, T].

Построим оценку ф.р. F(t) с использованием информации о свойстве (3) на основе S “-равноплечно симметризованной выборки

(Xs , Is ) = { , l{ ), (X S, 12S ),..., ((, ISN )},

где для i = 1, N

Xs = min {Xi, S (Xi)}, Is = 1,,

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

XsN+i = max {Xi, S (X,)}, Is+i = Ц,

V х у

по формуле

1 ¿,1V ---

FN«> = 2 (г + (N - г)(1 - ,)) 5^>(XS)lf. (5)

Найдем математическое ожидание (м.о.) оценки (5). Воспользуемся формулой

M| = M {M {||п}}, (6)

где |,п - произвольные с.в., M {M {| | п}}- условное м.о.

Теорема 2. Пусть с.в. | имеет ф.р. F(х), обладающую свойством S^-равно-плечной симметрии (3), тогда с.в. п = min{|,S(|)} имеет ф.р.

Fn (х) = min {1,2F(х)}. (7)

Доказательство. Рассмотрим

P(n < х) = P(min{|, S(|)} < х) = 1 -P(min{|,S(|)} > х) =

= 1 -P(| > х} n {S(|) > х}) = 1 -P({| > х} n { < S- (х)).

Так как S (х) = S - (х) монотонно убывает, то

P(п< х) = 1 -P(|> x}n{|< S(х)}) =

= min{1,1 - P (х < | < S(х)) = min{1,1 - F (S(х) + 0) + F(х)}. Воспользуемся свойством (3), получим

P(п <х) = min{1,F(х) + F(х)} = min{1,2F(х)}.

Теорема доказана.

Следствие 2.1. Пусть с.в. | имеет ф.р. F(х), обладающую свойством Sа-равноплечной симметрии (3), и п = min {|, S (|)}, тогда

+ад

Mn=M|- | (х-S(х))dF(х). (8)

а

Доказательство. Рассмотрим

а а а

Mп = 2 | xdF(х) = | xdF(х) + J xdF(х).

-ад -ад -ад

Воспользуемся свойством (3), будем иметь

а а а а

Ып = | xdF(х) + | xd(1 -F(S(х))) = J xdF(х)- J xdF(S(х)).

-ад -ад -ад -ад

Произведя замену y = S (х) с учетом свойств S (х), будем иметь

а +ад +ад +ад

Mп= | xdF(х) + | S(x)dF(х) = J xdF(х) - J (х -S(х))dF(х) =

-ад а -ад а

+ад

= M|- J (х - S(х))dF(х).

а

Следствие доказано.

Следствие 2.2. Пусть с.в. | имеет ф.р. F(x), обладающую свойством Sа-равноплечной симметрии (3), и n = min {|, S (I)}, тогда

+ад

Бц = D| + J (((х)-M|)2 -(x-MI)2)(x). (9)

a

Доказательство. Воспользуемся формулами (7) и (8), получим

+ад a i +ад Л2

Dn= J (х-Mn)2 dFn (x) = 2 Jl x-M| + J (x-S(x))dF(x) dF(x) =

-ад -ад V a J

a a +ад

= 2 J (x-M|)2 dF(x) + 4 J (x-MI)dF(x) J (x-S(x))dF(x) +

-ад -ад a

i+ад Л2 a +ад

J (x-S(x))dF(x) = D|+ J (x-M|)2 dF(x)- J (x-M|)2 dF(x) + S,

a J -ад a

a +ад А+ад Л2

где S = 4 J (x-MI)dF(x) J (x-S(x))dF(x) + 21 J (x-S(x))dF(x)

-ад a V a J

+ад f a +ад ,

= 2 J (x-S(x))dF(x)<¡2 J (x-MI)dF(x) + J (x-S(x))dF(x)J.

a I -ад a J

Раскрыв скобки, а также произведя во втором интеграле замену y = S (x), по-

лучим

+ад ( a +ад a ,

S = 2 J (x - S (x) )dF(x) <2 J xdF(x) - 2F (a)M|+ J xdF(x) + J ydF (S (y))J.

a I -ад a -ад J

Следствие доказано.

Теорема 3. Пусть с.в. | имеет ф.р. F(x), обладающую свойством S^-равно-плечной симметрии (3), тогда с.в. n = max{|,S(|)} имеет ф.р.

Fn (x) = max 0 {1,2 F (x) -1}. (10)

Доказательство. Рассмотрим

P (n < x) = P (max {|, S (|) < x) = P ( < x}n{S (|) < x}).

Так как S(x) = S- (x) - монотонно убывает, то

P (n< x) = P (| < x} n{| > S_1(x)}) = max{0, P (S(x) < | < x)} =

= max {0, F (x) - F (S (x) + 0)}.

Воспользуемся свойством (3), получим

P (n< x) = max {0, F (x) -1+ F (x)} = max {0,2 F (x) -1}.

Теорема доказана.

Следствие 3.1. Пусть с.в. £, имеет ф.р. F(х), обладающую свойством Sa-равноплечной симметрии (3), тогда для с.в. n = max{,S(§)}

+W

Mn=M§+ J (х-S(х))dF(х). (11)

а

Доказательство аналогично доказательству следствия 2.1.

Следствие 3.2. Пусть с.в. £, имеет ф.р. F(х), обладающую свойством

S^-равноплечной симметрии (3), тогда для с.в. n = max{,S(§)}

+W

Dn= Щ - J {((х)-M|)2 -(х-M|)2 JdF(х). (12)

а

Доказательство аналогично доказательству следствия 2.2.

Так как с.в. r распределена биномиально с параметрами p = 0,5 и N, то

Mr = pN, поэтому для t е [0, T1 ] с учетом I типа цензурирования и теоремы 2

M (S (t )| r )= —---------------------------------------------------1-- f 2 F (t) If = F ((() (r +(N - r )(1 - g)) = = (t).

' 1 ' 2(r + (N - r)(1 - g)) (r + (N - r)(1 - g))

Для t e[T„ T ]

1 1 N ---

M (S (t) r) = 2 2 ( + (N )(1 )) f FF(t) - 1)If =

v 1 7 2 2 (r + (N - r )(1 - g) ))

= 1 + (2F(t) - 1)(r + (N - r)(1 - g)) = р(t)

2 (r + (N - r )(1 - g)) ().

Таким образом, для t е [0, T]

M (NS (t)) = M (M (f/ (t) )r ) = F (t).

Следовательно, оценка (5) обладает свойством несмещенности.

Найдем дисперсию оценки (5). Воспользуемся формулой

D% = M {D (||n}} + D {M {||n}}. (13)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Выше было получено, что для t е [0, T]

M (t )| r ) = F (t),

следовательно,

D (M (FNS (t )|r )} = D(F (t )} = 0.

Для t е[0, T ] рассмотрим

D (M «>1 r ) = D { 2 (r + (N - r)(, - g)) f ^( К

С учетом I типа цензурирования и теоремы 2

D(((t)|r) = r +(N-rX‘-g>, D{I[0,, FV,S)j = M(t)M2F(,)) ).

' '' 4 (r + (N - r )(1 - g))2 * ' ” 2 (r + (N - r)(1 - g))

Таким образом,

D ((t) )= M L f it) (0,5 - F (t) )±Ckpk (1 - P'-k

V ' 1 r + (N - r )(1 - g) J wv w^k=0 k + (N - k )(1 - g)

= F (t) (0,5 - F (t)) = F (t) (0,5 - F (t))

рЫ + (N - Ыр)(1 - я) N(1 - 0,5я)

Для случая t е [Т, Т ] аналогично можно получить, что

(1 - Р ^) )0,5 - Р (t))

D (FNf (t))

N (1 - 0,5 я)

В итоге для t е [0, Т] дисперсию оценки можно представить в следующем виде:

CT2 (t) = ND ((t)) = F (tmin )(5 F (tmin)) , (14)

4^w V N w/ n(1 - 0,5g)

где

tmin = min {t, S (t)}. (15)

Сравним дисперсии оценок (1) и (5). Для t e [0, Zj ]

ct2 (t) = (1 - 0,5g)F(t)(1 - F(t)) = (1 - 0,5g)(1 - F(t)) > 1

СТЦ5 (t) Р (t) (0,5 - Р (t)) 0,5 - Р (t)

если

0,5 - Р(t) < (1 - Р(t))(1 - 0,5я) = 1 - Р(t) - 0,5я + 0,5яР^) или, что то же самое,

0,5 - 0,5я + 0,5яРО1) > 0,

1 - я + Р(t) > 0,

что истинно, так как я е (0,1) и Р(t) е [0,1].

Для t е [Т|, Т] с учетом того, что р = 0,5,

стц(1) = (1 - 0,5я) Р ^ )(1 - Р (t)) + я (1 - 0,5 я)(Р (t) - 0,5)(1 - Р (t))

ct2s (t) (1 - F (t))(F (t) - 0,5) 0,5(1 - g )(1 - F (t))(F (t) - 0,5)

= F(t)(2 -g) + g(2 - g) = (2 - g)(g + (1-g)F(t)).

если

2F (t) -1 (1 - g (1 - g )(2F (t) -1)

(2 - g) ( + (1 - g)F(t)) > (1 - g)(2F(t) -1),

-> 1,

т.е.

я(1 - я) - яР(t)+я2Р(t)+1 > 0.

С учетом того, что здесь Р(!) е (0,5, 1] и я е (0,1), получим

я(1 - я) - яР(t)+я2р^)+1 > я(1 - я) -1+я2Р(t)+1 = я(1 - я)+я2р(t) > 0.

Таким образом, для t е [0, Т] стЦ^ (Г) < стЦ ^).

В [5] была предложена оценка неизвестной ф.р. с.в. типа времени жизни с учетом свойства (3), которая определяется формулой

Fjs *(t) = FN (t)+'- f (s (t >+0), (16)

при этом было показано, что MFNS* (t) = F (t),

ct2s* (t) = lim NDFjS* (t) = (2 - g)F (tmin )(0,5 - F (tmin)), (17)

Ц N2(1 - g)

где tmin определяется формулой (15).

Сравним нормированные дисперсии оценок (5) и (16). Нетрудно получить, что для любого t e [0, T]

CTJs(t) = 4(1 - g) < 1

74S *(

ctJs *(t) (2 - g )2

если 4(1 - я) = 4 - 4я < (2 - я)2 = 4 - 4я + я2,

т.е. я2 > 0, что истинно, так как я е (0,1).

При отсутствии цензурирования в качестве оценки неизвестной ф.р. используется эмпирическая ф.р. (э.ф.р.), которая определяется следующим образом:

1 N

Ры ^) = ~N X '[0,0 (X). (18)

Л ¿=1

Известно, что э.ф.р. - несмещенная оценка ф.р., при этом [6] ст2(1 ) = NDРN ^) = Р ^ )(1 - Р ^)).

Заметим, что при я = 0, т.е. при отсутствии цензурирования, э.ф.р. (18) и оценка (1) совпадают, при этом значение ст2 (^ есть частный случай (2).

Нетрудно убедиться, что для любого t е [0, Т ]

СТк« = Р(тш)(0,5-Р(тт)) < 1 ст2(1) (1 - 0,5 я) Р ^ )(1 - Р ^)) .

В [1] рассматривалась оценка ф.р. Р(0 , построенная на основе полной выборки с учетом свойства (3),

р,(0 = рк () +1 -^ (30> + о), (19)

которая является несмещенной, при этом

ст N (0 = NDРN (0 = Р (tmIn )(0,5 - Р (tmIn)). (20)

Заметим, что формула (20) совпадает с (14) при я = 0, т.е. при отсутствии цензурирования. Очевидно,что

ст^^ = 1 > 1

стЦ(1) 1 - 0,5 я ’

при этом рассматриваемое соотношение возрастает с ростом я .

На рис. 1 - 3 приведены графики нормированных дисперсий оценок (1), (5), (16), (18) и (19) для случая Р(0 = Л[01](0 - равномерного в [0,1] распределения,

я = 0,3 (рис.1), я = 0,6 (рис. 2), я = 0,9 (рис. 3).

Рис. 1. Графики ст^ (/) (гр. 1), ст23 (^ (гр. 2), ст2(1) (гр. 3),

стц0) (гр. 4), ^*0) (гр. 5) д™ Р(t) = Лр>,ц(0 , я = 0,3

Рис. 2. Графики ст^(/) (гр. 1), ст23(t) (гр. 2), ст2(1) (гр. 3),

стцО) (гр. 4), ) (гр. 5) для Р(t) = ^0,1]« , я = 0,6

Рис. 3. Графики стЦд(г) (гр. 1), (Г) (гр. 2), ст2(Г) (гр. 3),

стЦ(г) (гр. 4), стЦх,(г) (гр. 5) дга р(г) = ^од](г), я = 0,9

Таким образом, предложенная оценка (5) является несмещенной и эффективной оценкой ф.р., построенной на основе однократно цензурированной выборки с использованием информации об £ “-равноплечной симметрии относитель-

Т

но известного центра а = — = Т1. При этом чем меньше доля цензурированных

наблюдений в выборке, тем ближе ее дисперсия к дисперсии оценки (19), построенной с использованием свойства (3) по полной выборке.

4. Оценка математического ожидания по симметризованной прогрессивно цензурированной выборке

Традиционно в качестве оценки математического ожидания исследуемой с.в. т, Мт = 9 , используется выборочное среднее [7 - 9]

— 1 Ы

X = —V X, (21)

N^1 " К ’

где X,, , = 1, N, - выборочные значения. Если выборка является неполной, то X применять некорректно.

Пусть имеется п.ц.в. объема N, построенная по уже упомянутой выше схеме. Тогда оценку м.о. можно найти с помощью метода подстановки [7, 8]:

Т 1 N 1 г+^-г )(1-я)

Щ = | ^ (0=-V Х(,)+£, Х»), <22)

где FN (г) - оценка (1), Х(Г), , = 1, г + (1 - я)(N - г), - члены вариационного ряда, построенного по полным наработкам п.ц.в. (X,I).

Заметим, что при я = 0, т.е. при отсутствии цензурирования, классическая

оценка (21) совпадает с (22).

Покажем, что оценка (22) является несмещенной. Используя формулу (6), получим

M9N = М {М (9^г})= М 9+ (Я1- я) 9|= М 9 = 9.

Найдем дисперсию оценки (22) с помощью формулы (13). Получим

Б {М (9^г}} = Б9 = 0.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Если Бт = S2 < +оо, то

D s 2+ы-ж> s,=i! (r+p: |

* N (1 -g)2N N К 1 -g )

Зная, что Mr = pN = 0.5N, получим

DeN = M¡D{eN|r}}^ 1 -0,5g S2.

N I l NMi N(1 -g)

Так как S2 < , то lim DeN = 0.

N

Пусть известно, что ф.р. F(t) обладает свойством (3). Найдем оценку м.о. с.в. r методом подстановки:

T

еЩ =j tdFNS (t),

0

где F»S (t) определяется формулой (5).Тогда

е» = ^ £(()+xSk-) )• <23>

i=1

где К = r + (N - r )(1 - g), XSS) • i = 1,2K, - члены вариационного ряда, построен-

ного по полным наработкам симметризованной выборки (х5,15).

Используя следствия из теорем 2 и 3, нетрудно показать, что оценка (23) является несмещенной, при этом

ДеЦ? = М { {еЦ?|г}} + БЄ = М { {ОХ( ( + 2соу(Х), Х5(к+і )) + БХ5(к+0 )} =

= М { (X + 2соу (х* , {+г)) + БХК+0 )} =

і 1 \( Т ^ 5 2 + 7

= м\-----1 52 +| (х -Є)(5 (х) -Є)^Р (х)

= M, ,

\2К)

где S2 = Бт,

Z =J (х - 0)( S (x) - 0)dF (x).

0

Заметим, что Z < 0 , так как функция S(х) убывает по х є [0, T].

Сравним дисперсии оценок м.о. (22) и (23), получим

так как 1 - я < 1 - я + 0,25я2 для я 6 (0,1) и 1 < 0 . Здесь £2 = Бт.

Таким образом, учет информации об £ “-равноплечной симметрии позволил получить модифицированную оценку м.о., построенную по п.ц.в., при этом новая оценка является несмещенной и эффективной.

5. Оценка дисперсии по симметризованной прогрессивно цензурированной выборке

С помощью метода подстановки нетрудно также получить оценку дисперси

где 9ц, - оценка математического ожидания (22), Х^, / = 1, г + (N - г)(1 - я), -члены вариационного ряда, построенного по полным наработкам п.ц.в. (X,I).

Заметим, что при я = 0, т.е. при отсутствии цензурирования, оценка (24) совпадает с классической выборочной дисперсией

где £2 = Бт.

Заметим, что оценка дисперсии смещенная, при этом в случае отсутствия цензурирования, т.е. при я = 0 формула (26) принимает значение

т.е. совпадает с м.о. классической оценки (25) [2], при этом с ростом объема наблюдений N смещение оценки (24) сходится к нулю.

г+( N-г )(1-g )

(25)

Найдем математическое ожидание (24), используя формулу (6), получим

из чего следует, что

м^2 = м {М {{| г} = М {м {) - е+г} -М -е)2| г}} =

Таким образом,

(26)

Заключение

В данной работе рассмотрен вопрос привлечения априорной информации об S “-равноплечной симметрии при обработке прогрессивно однократно I типа справа цензурированных данных, в частности, построена оценка неизвестной функции распределения по цензурированной выборке, методом подстановки получены оценки математического ожидания и дисперсии, изучено качество этих оценок, проведено сравнение с классическими результатами. Знание симметрии позволило значительно улучшить качество оценивания и восполнить потерянную при цензурировании информацию.

ЛИТЕРАТУРА

1. Дмитриев Ю.Г., Зенкова Ж.Н. Об оценивании симметричного распределения по цензурированной выборке // Труды X юбилейного симпозиума по непараметрическим и робастным статистическим методам в кибернетике. Томск: Изд-во НТЛ, 2004. С. 22-30.

2. Дмитриев Ю.Г, Устинов Ю.К. Статистическое оценивание распределений вероятностей с использованием дополнительной информации. Томск: Изд-во ТГУ, 1988. 194 с.

3. Klein John P., Moeschberger Melvin L. Survival Analysis: Techniques for Censored and Truncated Data. Springer, 2005. P. 547.

4. Marubini E., Valsecchi M.G. Analysing Survival Data from Clinical Trials and Observational Studies. Willes, 2004. P. 417.

5. Анализ надежности технических систем по цензурированным выборкам / В.М. Скрипник, А.Е. Назин, Ю.Г. Приходько, Ю.Н. Благовещенский. М.: Радио и связь, 1988. 84 с.

6. Скрипник В.М., Назин А.Е. Оценка надежности технических систем по цензурированным выборкам / под ред. А.И. Широкова. Минск: Наука и техника, 1981. 144 с.

7. Тарасенко Ф.П. Непараметрическая статистика. Томск: Изд-во ТГУ. 1976.

8. Боровков А.А. Математическая статистика. Новосибирск: Наука; Изд-во Института математики, 1997. 772 с.

9. Айвазян С.А., Мхитарян B.C. Теория вероятностей и прикладная статистика. М.: ЮНИТИ-ДАТА, 2001. 656 с.

Зенкова Жанна Николаевна Томский государственный университет E-mail: thankoffiean@mail.ru

Поступила в редакцию 1 ноября 2010 г.

i Надоели баннеры? Вы всегда можете отключить рекламу.