УДК 519.23 Вестник СПбГУ. Сер. 1. 2013. Вып. 3
РЕКОРДНЫЕ ВЕЛИЧИНЫ С ОГРАНИЧЕНИЯМИ
B. Б. Невзоров
C.-Петербургский государственный университет, д-р физ.-мат. наук, профессор, probabil@pisem.net
1. Введение. Рассмотрим случайные величины (с.в.) XI,Х2,... и определим рекордные моменты Ь(п) и рекордные величины X(п), п = 1, 2,..., следующим образом:
¿(1) = 1, X (1) = 1,
Ь(п) = шт{.? > £(п - 1) : X. > X(п - 1)}, X (п) = XL(n) = шax{XьX2,...,XL(n)}, п = 2, 3,...
Здесь мы имеем дело с так называемыми верхними рекордами. Соответственно, последовательности с.в., определяемые равенствами
1(1) = 1, ж(1) = X1, 1(п) = ш1п{^ > 1(п - 1) : X.,- <ж(п - 1)}, ж(п) = X¡(n) = шin{Xl, X2,..., ^(п)}, п = 2, 3,...,
представляют собой нижние рекордные моменты 1(п), п =1, 2,..., и нижние рекордные величины ж(п), п =1, 2, .. .
Рассмотрение величин У1 = -XI, У2 = -X2,... вместо исходных X-ов позволяет перейти от верхних рекордов к нижним. Поэтому достаточно ограничиться исследованием только верхних рекордов. Мы также ограничимся рассмотрением рекордных величин в ситуации, когда исходные с.в. имеют непрерывные функции распределения (ф.р.).
В классической хорошо разработанной (см., например, монографии [1-3]) теории рекордов рассматриваются, как правило, независимые одинаково распределенные с.в. Xl,X2,... Менее исследованными являются ситуации, в которых исходные с.в. могут иметь разные распределения. Здесь в первую очередь упомянем так называемые —а-схемы [4-7], в которых ф.р. (ж) = Р{Xk < ж} связаны соотношениями
—й (ж) = — а(й)(ж), к = 1, 2,...,
где а(1), а(2),... —произвольные положительные константы, а — (ж) —некоторая ф.р.
Отметим также рекордную модель [8], в которой XI, X2,..., Xm, Xm+l,..., X2m,... представляют собой серии Xm(k-l)+l, Xm(k-l)+2,..., Xmk, к = 1, 2,..., независимых случайных величин с ф.р. —2,..., —т. В этой рекордной схеме предполагается, что
(ж) = Р ^^^ < ж}, к = 0,1, 2,...,
для каждого г = 1, 2,..., т.
В приведенных выше схемах уход от «классической» модели был связан с отказом от одинакового распределения исходных Х-ов. В то же время появились рекордные схемы, в которых Xl,X2,..., как и раньше, были независимыми и одинаково
© В. Б. Невзоров, 2013
распределенными, но уже сами рекордные величины определялись «неклассически». Рассмотрим ниже ряд таких схем.
2. Рекорды с превышением. В 1996 г. в работе [9] были введены так называемые рекорды с ¿-превышением (S-exceedance records). В этой схеме для объявления очередного наблюдения рекордным требовалось, чтобы оно превышало предыдущее рекордное достижение более чем на некоторое значение S. В указанной работе фиксировался некоторый порог превышения S >0. Далее для последовательности независимых с.в. Xi, X2,..., имеющих одинаковую плотность распределения f (ж), рекордные моменты T(n) и рекордные величины X(n) определялись следующим образом:
T (0) = 1,X (0) = X1,
T(n) = min{j > T(n - 1): Xj > XT(n_i} + S}, X(n) = XT(n), n = 1, 2,...
Было показано, в частности, что совместная плотность распределения f (жо, xi,..., жи) рекордных величин X(0), X(1),..., X(n) задается следующими равенствами:
f(XaX, х )-_1М______f(x ) m
если Xj > Xj — 1 + S, j = 1, 2,..., n, и f (жо, xi,..., жи) = 0 иначе.
Естественно, что при S = 0 равенство (1) совпадает с соответствующим выражением, полученным для классических рекордных величин. При S > 0 равенство (1) становится не очень удобным для работы с ним. Однако все существенно упрощается в ситуации, когда исходные с.в. имеют экспоненциальное распределение. В частности, если Xi, X2,... —независимые с.в. с плотностью распределения f (ж) = exp(—ж), ж > 0, то основной результат статьи [9] можно переформулировать следующим образом: для любого n =1, 2,... распределение вектора {X(0), X(1),..., X(n)} совпадает с распределением вектора
{Со, £о+а + S, ..., £о+а +...+с„ + nS},
где Со, Ci,... независимы и также имеют экспоненциальное распределение с плотностью f (ж) = exp(—ж), ж > 0. Отсюда следует, что X(n) при любом n = 1, 2,... совпадает по распределению с суммой Со + Ci + ... + Си + nS, т. е. X(n) имеет Гамма-распределение с плотностью
(ж — nS)n
fn(x) = ехр{ — (х — nS)}-;-, X > nS. (2)
n!
Видим также, что межрекордные величины X(0), X(1) — X(0),..., X(n) — X(n — 1) в этом случае являются независимыми.
Данная схема предполагает, что не рассматриваются в качестве рекордных небольшие (меньшие S) превышения предыдущих наблюдений. Такого рода модель выглядит достаточно естественной в ситуации, когда, например, не может быть достигнута высокая точность измерения результатов. Скажем, в марафонском беге (в отличие от спринтерских дистанций) в качестве нового рекордного может быть засчитан лишь результат, который лучше предыдущего рекорда не менее чем на одну секунду (десятые и тем более сотые доли секунды здесь в расчет не берутся).
3. Рекорды с ограничением. I. В связи с упомянутой выше схемой достаточно естественным дополнением к ней является предлагаемая ниже модель рекордов с ограничениями. В этой рекордной модели игнорируются все наблюдения, которые превышают последнее рекордное значение более чем на некоторую фиксированную положительную константу С. Если вернуться к результатам спортивных соревнований, то там слишком существенные превышения предыдущих рекордов могут просто вызвать опасения, что данный результат достигнут нечестными путями. Например, могли быть использованы нестандартные спортивные снаряды или спортсменами употреблялись запрещенные препараты.
Как и в схеме рекордов с ¿-превышением, совместные распределения рекордов с ограничением в общем случае достаточно громоздки, но для экспоненциально распределенных X-ов удается существенно упростить полученные результаты. Итак, рассматриваем последовательность независимых одинаково распределенных с.в. X!, X2,... и фиксируем некоторую положительную константу С. В качестве первой рекордной величины и первого рекордного момента берем X(1) = Xl и Ь(1) = 1. Последующие рекордные величины X(п) и рекордные моменты Ь(п) получаем последовательно следующим образом:
Ь(п) = шт{.? > £(п - 1) : X(п - 1) < X. < X(п - 1) + С},
X (п) = X¿(n), п = 2, 3,.... (3)
Предполагаем, что исходные с.в. имеют некоторую плотность распределения р(ж). Сравнительно просто получить выражение для условной плотности распределения рп(жп|ж!, ж2,..., жп_1), т. е. для плотности распределения рекордной величины X(п) при условии, что зафиксированы значения
X (1) = жь X (2) = ж2,..., X (п - 1) = жп-1 ,
где 0 < X, - Xj_l < С, ] = 2, 3, ...,п - 1. Несложные рассуждения приводят к равенству
рп(ж„|жьж2,...,жп_1) = —--р, -г, (4)
— (ж„_1 + С) - — (ж„_1)
если жп_1 < жп < жп_1 + С, и рп(жп|ж1, ж2,... ,жп_1) = 0 иначе. Отсюда следует, что плотности распределения соседних рекордных величин X (п - 1) и X (п) связаны соотношением
Рп(х)=р(х)[ ( п = 2,3,... (5)
■!х_с\—(и + С) - — (и)/
Последовательно применяя равенство (5) при п = 2, 3,..., получаем, что совместная плотность распределения рп(ж1, ж2,..., жп) рекордных величин X(1), X(2),..., X(п) имеет следующий вид:
1 ч / ^ р{х 2) _р(хп)_
Рп ЖЬЖ2,...,Ж„)=р Ж1 —-—-——•••—-—-—--, 6
—(ж1 + С) - — (ж1) — (ж„_1 + С) - — (ж„_1)
если ж1 < ж2 < ж1 + С, ж2 < жз < ж2 + С, ..., жп_1 < жп < жп_1 + С, и рп(ж1, ж2,..., жп) = 0 иначе.
Когда имеем дело со случайными величинами, множество значений которых ограничено снизу некоторым а > -то, удобнее немного изменить предложенную схему, введя дополнительно X(0) = а, Ь(0) = 0 и определяя X(1) и Ь(1) равенством
(3), выполняемым при п = 1. В этом случае совместная плотность распределения с.в. X(1),Х(2),...,Х(п) примет следующий вид (немного отличающийся от равенства (6)):
( ч _ Р{х 1)__р(х2) _р(хп)_
рп(х1,х2,...,хп) р{а + с)р{х1 + с)_р{х1) ••>(Хп_1 + С)-^(хп_1) •••'
если а < < а + С, х2 < хз < х2 + С, .. ., хп-1 < хп < хп-1 + С.
4. Рекорды с ограничением для экспоненциально распределенных величин. Полученные выше общие соотношения существенно упрощаются, если исходные случайные величины имеют экспоненциальное распределение. Рассмотрим этот частный случай. Для удобства введем следующие обозначения. Пусть 2о =0 и 21,22,... —независимые с.в., имеющие экспоненциальное распределение с ф.р. ^(х) = тах{0,1 — ехр(—х)}. Соответствующие рекордные (с ограничением С > 0) величины и рекордные моменты обозначим как
0 = 2(0) < 2(1) < 2(2) < ... и 0 = Т(0) < Т(1) < Т(2) < ...
Из равенства (7) при а = 0 получаем, что для этого частного случая совместная плотность распределения Л.(х1, х2,..., хп) с.в. 2(1), 2(2),..., 2(п) определяется соотношением
если 0 < Х1 < С, Х1 < Х2 < Х1 + С, ..., хп-1 < хп < хп-1 + С, и Л.(х1, х2,..., хп) = 0 иначе. Из равенства (8) получаем, что совместная плотность д(«1,«2,..., «п) разностей
V (1) = 2 (1) — 2 (0), V (2) = 2 (2) — 2 (1),..., V (п) = 2 (п) — 2 (п — 1) задается равенством
=-т:-г „ЛЛг)-, 0 < VI < С,..., 0 <уп<с. 9
(1 — ехр{—С})п
Принимая во внимание соотношение (9), приходим к утверждению, что межрекордные разности V(1)^(2),...^(п) независимы и имеют одинаковую плотность распределения вида
ехр х
^ = 1 — ехр{—С*}' <10>
если 0 < х < С, и д(х)=0 иначе. Отсюда получаем результат, заключающийся в том, что одинаково распределенными являются случайные векторы
{2 (1), 2 (2),..., 2 (п)} и {^1,^1 + ^,...,^1 + " + ... + "п},
где независимые с.в. "1, ..., "п имеют плотность распределения (10). Таким образом, рекордная величина 2(п) представима в виде суммы п независимых одинаково распределенных случайных величин. Отметим, что математическое ожидание и дисперсия величин , задаются равенствами
/ л 1 — (1 + С) ехр{—С}
а{с) = Ь\Ук =---¡——-
1 — ехр{—С }
2( , nv 1 — (2 + С2) exp{—С} + exp{—2C} cr (c) = DVk =-----, к = 1, 2,....
(1 - exp{—C})2
Учитывая приведенные факты, можно получить для Z (n) ряд предельных теорем, справедливых для сумм независимых случайных величин. В частности, сразу получаем асимптотическую нормальность с.в. (Z(n) — na(c))/a(c)n1/2.
Естественным образом результаты, сформулированные выше для случайных величин Zi,Z2, имеющих стандартное экспоненциальное распределение, переносятся на случай, когда эти величины имеют более общие экспоненциальные плотности распределения вида Лexp{—A(x — a)}, x > а, где Л > 0 и —то < а < то.
5. Рекорды с ограничением. II. Близкой к описанной выше рекордной модели является схема, в которой также зафиксировано некоторое значение C > 0, определяющее допустимый порог превышения предыдущего рекорда. Но в этом случае наблюдение, превышающее более чем на C существующий рекорд X(n), не теряется, и очередной рекордной величиной объявляется X (n + 1) = X (n) + C. Если же новое наблюдение попадает в интервал (X(n),X(n) + C], то оно и становится рекордной величиной X (n + 1). В частности, если мы вернемся к исходным независимым экспоненциальным (с плотностью распределения p(x) = exp{— x}, x > 0) с.в. Zi,Z2,... и оставим обозначения Z(1) < Z(2) < ... для видоизмененных таким образом рекордных величин, то рассуждения, аналогичные приведенным выше, позволяют установить, что разности Vk = Z(k) — Z(k — 1), k = 1, 2,..., как и в предыдущей ситуации, независимы, но только в этом случае
P{Vk < x} = 1 — exp{—x}, если 0 < x < C, и P{Vk < x} = 1, если x > C. (11)
Это означает, в частности, что
P {Vk = C} = exp{—C}, k = 1, 2,...
Видим, что для данной рекордной схемы и любого n = 1, 2, . . . распределение вектора {Z(1), Z(2),..., Z(n)} совпадает с распределением вектора {vi, vi + V2,..., vi + V2 + ... + vn}, где vi, V2,... — независимые с.в. с функцией распределения (11).
Литература
1. Ahsanullah M. Record values. New York: Nova Science Publishers, 1995.
2. Arnold B. C., Balakrishnan N., Nagaraja H. N. Records. New York: John Wiley and Sons, 1998. 312 p.
3. Невзоров В. Б. Рекорды. Математическая теория. М.: Фазис, 2000. 244 с.
4. Yang M. C. K. On the distribution of the inter-record times in an increasing population // Journal of Applied Probability. 1975. T. 12. P. 148-154.
5. Деовельс П., Невзоров В. Б. Рекорды в Fа-схеме. I. Мартингальные свойства // Записки научных семинаров ПОМИ. 1993. Т. 207. C. 19-36.
6. Деовельс П., Невзоров В. Б. Рекорды в Fа-схеме. II. Предельные теоремы // Записки научных семинаров ПОМИ. 1994. Т. 216. C. 42-51.
7. Shakil M., Ahsanullah M. Review on order statistics and record values from F"-distributions. Pakistan Journal of Statistics and Operation Research. 2008. Vol. VIII, N1. P. 101-120.
8. Невзоров В. Б. О среднем числе рекордов в последовательностях неодинаково распределенных случайных величин // Вестн. С.-Петерб. ун-та, 2012. Т. 45, №4. C. 28-32.
9. Balakrishnan N., Balasubramanian K., Panchapakesan S. ¿-exceedance records // Journal of Applied Statistical Science. 1996. Vol. 4. P. 123-132.
Статья поступила в редакцию 28 марта 2013 г.