Научная статья на тему 'СРАВНЕНИЕ НЕПАРАМЕТРИЧЕСКИХ ОЦЕНОК ФУНКЦИИ ВЫЖИВАНИЯ'

СРАВНЕНИЕ НЕПАРАМЕТРИЧЕСКИХ ОЦЕНОК ФУНКЦИИ ВЫЖИВАНИЯ Текст научной статьи по специальности «Науки о Земле и смежные экологические науки»

CC BY
3
0
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
оценки / случайное цензурирование справа / функция выживания / доверительные полосы / estimators / random censorship from the right / survival function / confidence bands

Аннотация научной статьи по наукам о Земле и смежным экологическим наукам, автор научной работы — А.А. Абдушукуров, C.Б. Бозоров

В статье проводится сравнение трех видов оценок: экспоненциальной, множительной и степенной структур для функции выживания при случайном цензурировании наблюдений справа. Ранее было установлено, что все эти три оценки при растущем объеме выборки эквивалентны, т. е. при одинаковой центровке и нормировке сходятся к одному и тому же гауссовскому процессу. Конкретно в выборке показано, что степенные оценки определены на всей прямой в отличие от экспоненциальной и множительных оценок. Следовательно, степенные оценки являются лучше, чем остальные две. Подвергнутые цензуре данные используются при анализе выживаемости, в биомедицинских испытаниях, в промышленных экспериментах. Существует несколько схем цензурирования (справа, слева, с обеих сторон, в сочетании с конкурирующими рисками и другими). Однако в статистической литературе широко распространено правостороннее случайное цензурирование, поскольку его легко описать с методологической точки зрения. В статье также рассмотрен этот вид цензурирования, чтобы сравнить наши результаты с другими исследованиями.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по наукам о Земле и смежным экологическим наукам , автор научной работы — А.А. Абдушукуров, C.Б. Бозоров

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

COMPARISON OF NONPARAMETRIC ESTIMATES OF THE SURVIVAL FUNCTIONS

The article compares three types of estimates: exponential, multiplying and power structures for the survival function of three random censoring observations on the right. It was previously established that all these three estimates are equivalent with a growing sample size, i.e. three with the same centering and normalization converge to the same Gaussian process. For specific samples, it is shown that power estimates are defined on the entire line, in contrast to exponential and multiply estimates. Therefore, power estimates are better than the other two. Censored data is used in survival analyses, biomedical trials, and industrial experiments. There are several censoring schemes (right, left, both sides, combined with competing risks, and others). However, right-sided random censoring is common in the statistical literature because it is easy to describe from a methodological point of view. Here we also consider this type of censoring, to compare our results with others.

Текст научной работы на тему «СРАВНЕНИЕ НЕПАРАМЕТРИЧЕСКИХ ОЦЕНОК ФУНКЦИИ ВЫЖИВАНИЯ»

МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ MATHEMATICAL MODELLING

Научная статья DOI: 10.18287/2541-7525-2023-29-3-82-88

УДК 512.531; 519.7 Дата: поступления статьи: 24.07.2023

после рецензирования: 31.08.2023 принятия статьи: 30.10.2023

А.А. Абдушукуров

Московский государственный университет, филиал в г. Ташкенте, Ташкент, Узбекистан E-mail: a_abdushukurov@rambler.ru. ORCID: https://orcid.org/0000-0002-0994-8127

С.Б. Бозоров

Гулистанский государственный университет, Гулистан, Узбекистан E-mail: suxrobbek_8912@mail.ru. ORCID: https://orcid.org/0009-0001-8133-4963

СРАВНЕНИЕ НЕПАРАМЕТРИЧЕСКИХ ОЦЕНОК ФУНКЦИИ

ВЫЖИВАНИЯ

АННОТАЦИЯ В статье проводится сравнение трех видов оценок: экспоненциальной, множительной и степенной структур для функции выживания при случайном цензурировании наблюдений справа. Ранее было установлено, что все эти три оценки при растущем объеме выборки эквивалентны, т. е. при одинаковой центровке и нормировке сходятся к одному и тому же гауссовскому процессу. Конкретно в выборке показано, что степенные оценки определены на всей прямой в отличие от экспоненциальной и множительных оценок. Следовательно, степенные оценки являются лучше, чем остальные две. Подвергнутые цензуре данные используются при анализе выживаемости, в биомедицинских испытаниях, в промышленных экспериментах. Существует несколько схем цензурирования (справа, слева, с обеих сторон, в сочетании с конкурирующими рисками и другими). Однако в статистической литературе широко распространено правостороннее случайное цензурирование, поскольку его легко описать с методологической точки зрения. В статье также рассмотрен этот вид цензурирования, чтобы сравнить наши результаты с другими исследованиями.

Ключевые слова: оценки; случайное цензурирование справа; функция выживания; доверительные полосы.

Цитирование. Абдушукуров А.А., Бозоров С.Б. Сравнение непараметрических оценок функции выживания // Вестник Самарского университета. Естественнонаучная серия / Vestnik of Samara University. Natural Science Series. 2023. Т. 29, № 3. С. 82-88. DOI: http://doi.org/10.18287/2541-7525-2023-29-3-82-88.

Информация о конфликте интересов: авторы и рецензенты заявляют об отсутствии конфликта интересов.

© Абдушукуров А.А., Бозоров С.Б., 2023 Абдурахим Ахмедович Абдушукуров — профессор кафедры прикладной математики и информатики, Московский государственный университет имени М.В. Ломоносова, филиал в г. Ташкент, 100060, Узбекистан, г. Ташкент, пр. Амира Темура, 22.

Сухроб Баходирович Бозоров — докторант кафедры математики факультета информационных технологий, Гулистанский государственный университет, 120100, Узбекистан, Сырдарьинская область, г. Гулистан, 4 микрорайон, 1.

1. Предварительные сведения

Исследования непараметрических оценок, экспоненциальной, множительной и степенной структур показывают их асимптотическую эквивалентность (при п ^ то). Некоторые отличительные свойства этих оценок проявляются при фиксированном объеме выборки, и они проведены в монографии [1].

Пусть {Zj, j ^ 1} и {Yj ,j ^ 1} — взаимонезависимые последовательности, независимые и одинаково распределенные случайная величина с непрерывными функциями распределения H и G соответственно. Наблюдается выборка объема n:

C(n) — {(j, Aj), 1 < j < n},

где

£j — min (Zj; Yj), Aj = I(Zj < Yj)

(I (А) — это индикатор события А.

1. Если Zj < Yj, то £j —min (Zj; Yj) — Zj, Aj — 1, и в этом случае мы можем наблюдать Z;

2. Если Yj ^ Zj, то £j — min(Zj; Yj) — Yj, Aj — 0, это будет случай цензурирования.

Задача состоит в оценивании функции выживания 1-H(x) по выборке C С") при мешающей функции распределения G. Для 1 — H справедливо представление [2]:

1 — H (x) — exp(-Л(х; 1)),

Л (х; 1) — у (1 - H (u-)) — 1dH (u) — J (1 - N (u-))—1dM (u; 1), (—(—

N (x) — P (j < x) — 1 - (1 - H (x)) (1 - G (x)) — M (x;1) + M (x;0), M (x; 1) — P (j < x, Aj — i), i — 0; 1.

Hm (x) —1 - П exp{ - —— 1 - exp (-Л„ (x; 1)),

H2n (x) —1 - П ex^1 - Mn(t^—U—;14 , (1)

U^X

H3n (x) —1 - (1 - Nn (x))Rn(x),

Rn(x) — Лn(x; 1)(Лn(x)) — 1,

1

(u )

где

где

Лп (x;1) = J (1 - Nn (u-)) dMn (u;1),

(—оо;ж]

Лп (x) = J (1 - Nn (u-)) dNn (u),

( — о; ж]

Nn (x) = Mn (x; 1) + Mn (x; 0) = 1 VI (j < x)

П < J J

X; 0) / 1 (S3

n ^

3=1

Мп (х; г) = П ^1 (& < х, Aj = г), г = 0,1. П j=l

Таким образом, рассматриваемая модель является моделью случайного цензурирования справа Zj при помощи Yj, где Zj наблюдаемы лишь при Aj = 1.

Пусть 0\п(х), 02п(х) и Озп(х) соответствующие оценки мешающей функции распределения О(х), определяемые формулами (1) с заменой Мп(х; 1) на Мп(х;0). В рассматриваемой модели 1 — N(х) = = (1 — Н(х))(1 — О(х)) для всех х € К. Однако для этих трех типов оценок имеем:

I.

(1 — Н\п(х))(1 — Огп(х)) = ехр(—Лп(х)) = 1 — ^(х)

и при

х > £(п) = тех {&} , тах (Н\п(х); С1п(х)) < 1.

II.

(1 — Н2п(х))(1 — С2п(х)) = 1 — ^(х)

и при

х > С(п)

оценки Н2п(х) и 02п(х) неопределенны.

III. Для степенных оценок

(1 - H3rí(x))(1 - G3n(x)) = 1 - Nn(x) и, следовательно, при x ^ £(п), H2n(x) = G2n(x) = 1.

Таким образом, для случая непрерывных распределений H и G, только оценки степенной структуры Hзп и Gзп являются идентифицируемыми с моделью. Для демонстрации свойств оценок (1) рассмотрим выборку объема n = 97 из работ [3; 5]. Это данные из центра уединения Ченнинг Хаус (Channing House) в г. Пало Альто (Palo Alto) в Калифорнии (США). Вариационный ряд, построенный по этим данным, есть:

(777;1), (781;0), (843;0), (866;0), (869;1), (872;1), (876;1), (893;1), (894;1), (895;0), (898;1), (906;0), (907;1), (909;l), (911;1), (911;0), (914;0), (927;1), (932;1), (936;0), (940;0), (942,5;0), (943;0), (945;1), (945;0), (948;1) (951;0), (953;0), (956;0), (957;1), (957;0), (959;0), (960;0), (966;1), (966;0), (969;1), (970;0), (971;1), (972;0), (973;0), (977;0), (983;1), (984;0), (985;1), (989;1), (992,5;1), (993;1), (996;1), (998;1), (1001;0), (1002;0), (1005;0), (1006;0), (1009;1), (1011,5;1), (1012;1), (1012;0), (1013;0), (1015;0), (1016;0), (1018;0), (1022;1) (1023;0), (1025;1), (1027;0) (1029;1), (1031;1), (1031;0), (1031,5;0), (1033;1) (1036;1) (1043;1) (1043;0) (1044;1), (1044;0), (1045;0), (1047;0), (1053;1), (1055;1), (1058;0), (1059;1), (1060;1), (1060;0), (1064;0) (1070;0), (1073;0), (1080;1), (1085;1), (1093;0), (1093,5;1), (1094;1), (1106;0), (1107;0), (1118;0), (1128;1) (1139;1), (1153;0).

Здесь данные представлены в месяцах, причем находящееся с рядом число 1 в парах означает нецензурирование (т. е. смерть), а 0 — цензурирование. При этом 46 человек умерли с начала открытия центра в 1964 году по 1 июля 1975 года ко дню сбора данных. Это нецензурированные данные. Из остальных данных о 51 человеке 5 были выписаны из центра, а 46 еще были живы к 1 июля 1975 года. Это цензурированные данные. По этим 97 данным приведены графики оценок Hm.g7(x), m = 1, 2,3 на рис. 1-3 по отдельности и на рис. 4 вместе:

sssxsissssissssssas^

К. К. аз ® за аэ оьсьаьсьсТй а а ^ т.

Рис. 1. Оценка 1 — H1;97(x) Fig. 1. Estimator 1 — Hí-97(x)

Из рисунков видно, что в отличие от экспоненциальных и множительных оценок только степенные оценки определены на всей прямой. Теперь при помощи оценок (1) построим доверительные полосы для неизвестной функции 1 — Н(х). Для этого будем следовать работам [3; 4] и используем доверительные полосы вида

где т = 1, 2, 3,

¿и (х) 1

И 2

¿п

М£П (x,Vl,№) = Hmn (x) - П 1 (1 - Hmn (x)) ( ^dП (T) + Ц2 ■ ^ ^ ) ,

V dl (T)J

Hmn (x)+ n-1 (Vidl (T)+ M2 Mi2l (x,^i,^2)= v dn(T)J

1 + n-1 Lidl (T) +

\ d2 (T)

dn(x)

Рис. 2. Оценка 1 - ff2;97(x) Fig. 2. Estimator 1 — H2;g7(x)

Рис. 4. Оценка 1 — Hm.97(x), m = 1, 2, 3 Fig. 4. Estimator 1 — Hm.97(x), m = 1, 2, 3

Т = 1128; Ц1 = 1; = 1, 37 и ¿п (х) = / (1 — Nn (и—)) 2¿Мп (и; 1). Эти полосы для данных объема

( — то; ж]

п=97 с использованием оценок (1) приведены на рис. 5-7.

Рис. 5. Доверительные полосы Mi*;9i(x; 1; 1, 37) Fig. 5. Confidence bands Mi*;g7(x; 1; 1, 37)

Рис. 6. Доверительные полосы M2*;97(x; 1; 1,37) Fig. 6. Confidence bands M2*;97(x; 1; 1,37)

Рис. 7. Доверительные полосы M3*;97(x; 1; 1,37) Fig. 7. Confidence bands M3*-g7(x; 1; 1,37)

Заключение

Сравнивают три вида оценок: экспоненциальной, множительной и степенной для функции выживания при случайном цензурировании справа. Ранее была установлена асимптотическая эквивалентность этих трех видов оценок при растущем объеме выборки в смысле сходимости к одному и тому же гаус-

совскому процессу. Для конкретной конечной выборки объема п = 97 показаны некоторые преимущества степенной оценки по сравнению с остальными двумя. Следовательно, эта оценка лучше, чем остальные. Имеются численные примеры демонстрации результатов.

Литература

[1] Абдушукуров А.А. Статистика неполных наблюдений. Ташкент: Университет, 2009. 269 с.

[2] Abdushukurov A.A., Bozorov S.B., Nurmukhamedova N.S. Nonparametric Estimation of Distribution Function Under Right Random Censoring Based on Presmoothed Relative — Risk Function // Lobachevskii Journal of Mathematics, 2021, vol. 42, no. 2, pp. 257-268. DOI: https://doi.org/10.1134/S1995080221020049.

[3] Csorgo S. Estimating in the proportional hazards model of random censorship // Statistics. 1988. Vol. 19, Issue 3. Pp. 437-463. DOI: https://doi.org/10.1080/02331888808802115.

[4] Csorgo S., Horvath L. Confidence bands from censored samples // Canadian Journal of Statistics-revue Canadienne De Statistique. 1986. Vol. 14, Issue 2. Pp. 131-144. DOI: https://doi.org/10.2307/3314659.

[5] Efron B. Censored Data and the Bootstrap // Journal of the American Statistical Association, 1981, vol. 76, № 374, pp. 312-319. DOI: http://doi.org/10.2307/2287832.

DOI: 10.18287/2541-7525-2023-29-3-82-88 Submited: 24.07.2023

Revised: 31.08.2023 Accepted: 30.10.2023

A.A. Abdushukurov

Lomonosov Moscow State University, Tashkent branch, Tashkent, Uzbekistan E-mail: a_abdushukurov@rambler.ru. ORCID: https://orcid.org/0000-0002-0994-8127

S.B. Bozorov

Gulistan State University, Gulistan, Uzbekistan E-mail:suxrobbek_8912@mail.ru. ORCID: https://orcid.org/0009-0001-8133-4963

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

COMPARISON OF NONPARAMETRIC ESTIMATES OF THE SURVIVAL

FUNCTIONS

ABSTRACT

The article compares three types of estimates: exponential, multiplying and power structures for the survival function of three random censoring observations on the right. It was previously established that all these three estimates are equivalent with a growing sample size, i.e. three with the same centering and normalization converge to the same Gaussian process. For specific samples, it is shown that power estimates are defined on the entire line, in contrast to exponential and multiply estimates. Therefore, power estimates are better than the other two. Censored data is used in survival analyses, biomedical trials, and industrial experiments. There are several censoring schemes (right, left, both sides, combined with competing risks, and others). However, right-sided random censoring is common in the statistical literature because it is easy to describe from a methodological point of view. Here we also consider this type of censoring, to compare our results with others.

Key words: estimators; random censorship from the right; survival function; confidence bands.

Citation. Abdushukurov A.A., Bozorov S.B. Comparison of nonparametric estimates of the survival functions. Vestnik Samarskogo universiteta. Estestvennonauchnaya seriya / Vestnik of Samara University. Natural Science Series, 2023, vol. 29, no. 3, pp. 82-88. DOI: http://doi.org/10.18287/2541-7525-2023-29-3-82-88. (In Russ.)

Information about the conflict of interests: authors and reviewers declare no conflict of interests.

© Abdushukurov A.A., Bozorov S.B., 2023 Abdurakhim A. Abdushukurov — professor of the Department of Applied Mathematics and Informatics, Lomonosov Moscow State University, Tashkent branch, 22, Amir Temur Street, Tashkent, 100060, Uzbekistan.

Sukhrob B. Bozorov — Doctoral student of the Department of Mathematics, Faculty of Information Technology, Gulistan State University, 4th House of Saodat Street in the neighborhood of Gulistan City Mevazor, Gulistan, 120100, Uzbekistan.

References

[1] Abdushukurov A.A. Statistics of incomplete observations. Tashkent: Universitet, 2009, 269 p. (In Russ.)

[2] Abdushukurov A.A., Bozorov S.B., Nurmukhamedova N.S. Nonparametric Estimation of Distribution Function Under Right Random Censoring Based on Presmoothed Relative - Risk Function. Lobachevskii Journal of Mathematics, 2021, vol. 42, no. 2, pp. 257-268. DOI: https://doi.org/10.1134/S1995080221020049.

[3] Csörgö S. Estimating in the proportional hazards model of random censorship. Statistics, 1988, vol. 19, issue 3, pp. 437-463. DOI: https://doi.org/10.1080/02331888808802115.

[4] Csörgö S., Horvath L. Confidence bands from censored samples. Canadian Journal of Statistics-revue Canadienne De Statistique, 1986, vol. 14, № 2, pp. 131-144. DOI: https://doi.org/10.2307/3314659.

[5] Efron B. Censored Data and the Bootstrap. Journal of the American Statistical Association, 1981, vol. 76, no. 374, pp. 312-319. DOI: https://doi.org/10.2307/2287832.

i Надоели баннеры? Вы всегда можете отключить рекламу.