Научная статья на тему 'Асимптотическое поведение экстремумов случайных признаков частиц в ветвящихся процессах с наследственностью'

Асимптотическое поведение экстремумов случайных признаков частиц в ветвящихся процессах с наследственностью Текст научной статьи по специальности «Математика»

CC BY
80
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ ПРИЗНАКА / БИОЛОГИЧЕСКИЕ ПОПУЛЯЦИИ / КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ / СЛУЧАЙНЫЕ ПРИЗНАКИ ЧАСТИЦ / ВЕТВЯЩИЕСЯ ПРОЦЕССЫ / NORMAL DISTRIBUTION OF A SIGN / BIOLOGICAL POPULATIONS / COMPUTER MODELLING / CASUAL SIGNS OF PARTICLES / BRANCHING PROCESSES

Аннотация научной статьи по математике, автор научной работы — Лебедев Алексей Викторович

В работе изучаются зависимые признаки частиц реальных биологических популяций. Рассматривается случай нормального распределения признака и случай тяжелых (правильно меняющихся хвостов). Такая модель может описывать возможность больших скачков (мутаций).

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ASYMPTOTIC BEHAVIOUR OF EXTREMAS OF CASUAL SIGNS OF PARTICLES IN BRANCHING PROCESSES WITH HEREDITY

In the article dependent signs of particles of real biological populations are studied. The case of normal distribution of a sign and a case of heavy (correctly varying) tails are considered. Such a model can describe possibility of the big jumps (mutations).

Текст научной работы на тему «Асимптотическое поведение экстремумов случайных признаков частиц в ветвящихся процессах с наследственностью»

МАТЕМАТИКА

А.В. Лебедев

АСИМПТОТИЧЕСКОЕ ПОВЕДЕНИЕ ЭКСТРЕМУМОВ СЛУЧАЙНЫХ ПРИЗНАКОВ ЧАСТИЦ В ВЕТВЯЩИХСЯ ПРОЦЕССАХ С НАСЛЕДСТВЕННОСТЬЮ

В работе изучаются зависимые признаки частиц реальных биологических популяций. Рассматривается случай нормального распределения признака и случай тяжелых (правильно меняющихся хвостов). Такая модель может описывать возможность больших скачков (мутаций).

Ключевые слова: нормальное распределение признака, биологические популяции, компьютерное моделирование, случайные признаки частиц, ветвящиеся процессы.

A.V. Lebedev

ASYMPTOTIC BEHAVIOUR OF EXTREMAS OF CASUAL SIGNS OF PARTICLES IN BRANCHING PROCESSES WITH HEREDITY

In the article dependent signs of particles of real biological populations are studied. The case of normal distribution of a sign and a case of heavy (correctly varying) tails are considered. Such a model can describe possibility of the big jumps (mutations).

Keywords: Normal distribution of a sign, biological populations, computer modelling, casual signs of particles, branching processes.

Работа выполнена при поддержке по грантам РФФИ N 07-01-00077, N 07-01-00373.

1. Введение. В работах [1, 2], а также автором в [1] изучались максимумы на ветвящихся процессах с дискретным временем. А именно, рассматривался классический процесс Гальтона-Ватеона [4], в котором каждая частица обладает некоторым случайным признаком, и изучалось поведение максимумов признака в популяции. Если в качестве случайного признака частицы берется число ее потомков, получаем задачу о максимальном размере семейства [5]. В [6] изучались процессы с двумя типами частиц. Некоторые итоги исследований подведены в [7]. Автором в [2] изучались также процессы с непрерывным временем. Всюду предполагалось, что признаки частиц не зависимы и одинаково распределены.

Однако для реальных биологических популяций предположение о независимости признаков является довольно грубым. На самом деле между ними существует зависимость, обусловленная общностью происхождения организмов, их наследственностью. До сих пор этот фактор при изучении максимумов никак не учитывался.

Следует упомянуть, что вопрос о зависимости количественных признаков детей и родителей изучался еще Ф.Гальтоном в конце XIX века [9]. Как раз для описания этого явления он ввел модель линейной регрессии, получившую впоследствии широкое распространение. Мы также будем полагать зависимость между признаками родственных частиц линейной. Учет наследования признаков "через поколение "приводит к авторегрессии второго порядка и т.д.

Далее сначала рассмотрим случай, когда признаки частиц имеют стандартное нормальное распределение, а корреляции между ними зависят от степени родства частиц.

Оказывается, что при условии экспоненциального убывания корреляций максимум признака в популяции асимптотически ведет себя так же, как в случае независимых величин.

Потом мы рассмотрим случай тяжелых (правильно меняющихся) хвостов. Такая модель может описывать возможность больших скачков (мутаций), которые крайне маловероятны при нормальном распределении. Оказывается, что в этом случае наследственность оказывает большое влияние на асимптотическое поведение максимума.

Основные результаты для модели авторегрессии первого порядка были кратко изложены в [10], однако в полном объеме до сих пор не были опубликованы.

Введем необходимые объекты и обозначения.

Пусть — число частиц в п-м поколении; Z0 = 1. Будем рассматривать надкритические процессы без вырождения: число непосредственных потомков не менее одного, имеет конечное среднее р и конечный второй момент. Напомним, что тогда имеет место сходимость почти наверное [4, гл. 1, §8]:

— ^ Ш, п (1)

рп к '

Случайная величина Ш в нашем случае оказывается положительной почти наверное. Ее преобразование Лапласа-Стилтьеса, однозначно определенное теоремой 8.2. [4, гл. 1, §8], обозначим через

Пусть £т,п — признак т-й частицы в п-м поколении. Нас интересует асимптотическое поведение величины

Мп = \/ £т,п, П ^ Ю. т= 1

Рассматривая частицы текущего поколения, будем говорить, что они находятся в ^-родстве, если они имеют ближайшего общего предка к поколений назад. В генеалогической терминологии (например, по женской линии) частицы 1-родетва имеют общую мать и являются сестрами, 2-родетва — имеют только общую бабушку и являются двоюродными сестрами и т.д. Кроме того, ^-родственной группой назовем совокупность частиц, находящихся не более чем в ^-родстве между собой. Вся популяция в любой момент времени разбивается на такие группы однозначно.

2. Гауссовский случай. Предположим, что признаки всех частиц имеют стандартное нормальное распределение Ф и зависимость между ними определяется только степенью родства. А именно, пусть признаки частиц, находящихся в ^-родстве, имеют коэффициент корреляции р^. Так, в модели Гальтона получаем р^ = р2к., где р — коэффициент корреляции между признаками частицы и ее непосредственного предка (в силу того, что путь на генеалогическом дереве, соединяющий частицы, находящиеся в ^-родстве, имеет длину 2к). В общем случае мы не определяем корреляции между признаками частиц разных поколений, поскольку для наших целей это не нужно.

Введем следующее условие па величины р^ к > 1, Пусть существует число г Е (0,1) такое, что

к|< гк, Ук > 1. (2)

Это условие заведомо выполняется для любой модели наследственности типа стационарной авторегрессии конечного порядка [11], поскольку в этом случае вклад общих предков в признаки родственных частиц убывает экспоненциально, причем все рк > 0.

Если говорить о теоретической возможности отрицательной зависимости признаков, то она вряд ли может быть обусловлена наследственностью, однако может возникнуть, например, когда на признак сильно влияют условия жизни (питание или жизненное пространство) в условиях конкуренции частиц за ресурсы.

Напомним, что стандартное нормальное распределение принадлежит области притяжения максимум-устойчивого закона Гумбеля Л(х) = ехр{—е-х} с известными нормирующими константами. С помощью теоремы 1.5.3 [12] получаем

Ф3(а(в)х + Ь(в)) ^ Л(х), ^ ^ то, ф) = (21пв)-1/2, Ъ(в) = (21пв)1/2 - 2(21п5)-1/2(1п1п5 + 1п4^),

где Ф(х) — функция стандартного нормального распределения. Тогда, согласно теореме 1 [1], в случае независимых признаков частиц имеет место асимптотика

Р( Мп < а(/1п)х + Ь(/лп)) ^^(е-ж), п ^ то, (3)

где ^(¿) — преобразование Лапласа-Стилтьеса случайной величины Ш в предельном соотношении (1). Отсюда, в частности, следует, что Мп ~ (2п 1п^)1/2, п ^ то (по вероятности). Кроме того, в ряде случаев предельное распределение можно выписать явно. Например, если число непосредственных потомков частицы распределено геометрически, то ^(¿) = 1/(1 + ¿), откуда р(е-х) = 1/(1 + е-х), т.е. предельный закон для максимумов оказывается логистическим.

Теорема 1. При условии (2) верно (3).

Доказательство. Далее будем пользоваться следующей оценкой для стандартных нормальных величин Х1,..., Х^ с корреляциями г^, удовлетворяющими условию |г^ | < 8 < 1. Согласно следствию 4.2.4 [12] для них выполнено неравенство

Р ( V Хг <и) - Ф"(и) <К(6) £ | ехр{ -

1 1 ех^ - . (4)

Обозначим ип = а(/1п)х + Ь(/1п). Заметим, что имеет место асимптотика

( и2п \ г- _х (2п 1п^)1/2 ехр |2ке --^—, п ^ то. (5)

п

— случайное число непосредственных потомков частицы, тогда среднее число всевозможных пар в 1-родетвенной группе составляет М£(( - 1)/2. Обозначим это число через

поколении, со средним 1. Таким образом, среднее число пар частиц в 1-родетве составляет \ Рассуждая далее, получаем, что среднее число пар частиц в к-родстве равно ь>^п+к-\ 1 < к < п. Таким образом, из (2) и (4) следует

м / К (г)и Г и1

|Р( Мп < ип) - МФ^(ип)| < Щ^Р» £(^)* ехр {-. (6)

Поскольку гк ^ 0 к ^ то, можно выбрать число I = 1(г,^) такое, что

1п(яг V1) 2

1 + "Г-) - <

1п ^ 1 + г

Обозначим

тогда правая часть (6) может быть записана в виде С(Ап + Вп). Используя асимптотику (5), получаем

Л < l(pr V 1)У ехр (--- Clnl/(l+r)p(l-2/(l+r))n ^ 0, п

{ 1 + г}

Аналогично,

~ U2n1+1/(1+' )иап, п ->■ оо

Вп < n((ßr V -)р)п exp { -J - CW+1/(1+rl)V

1 + rl

где в силу выбора I имеем

Ыиг V 1) 2

а = 1 + -^-1 -Т—1 < 0,

In р 1 + г1

а значит и Вп ^ 0 п ^ ж, С учетом (1) и (6) получаем

lim P(Mn < ип) = Iim МФ^(ип) = MAW(х) = р(е-х).

Заметим, что наш результат имеет асимптотический характер. На практике наследственность может приводить к стохастическому уменьшению максимума (за счет сокращения разброса признака в популяции), что в гауссовеком случае также следует из нормальной леммы сравнения (следствие 4.2.3 [12]) при > 0 к > 1.

3. Случай тяжелых хвостов. Пусть наследственность описывается линейной авторегрессией первого порядка:

+ Ктп, а Е (0,1),Ь> 0, (7)

где £т,п — признак т-й частицы в п-м поколении, к(т, п) — помер предка этой частицы в предыдущем поколении, а случайные инновации f^m т > 1, п > 1, не зависимы и имеют одинаковое распределение F, которое удовлетворяет условиям:

F(x) ~ х-1 L(x), F(-x)/F(x) ^ г > 0, ж ^ ж, 0, (8)

где L(x) — медленно меняющаяся функция [13, гл. 8, §8]. Этим условиям, в частности, удовлетворяют устойчивые распределения с показателями 7 е (0, 2), распределения Парето, лог-гамма и др.

Определим также неотрицательную функцию u(s), s > 0, такую, что sF(u(s)) ^ 1, s ^ ж, Заметим, что u(s) определена корректно и правильно меняется с показателем 1/7, т.е. u(s) ~ sl/lL2(s), s ^ ж, где L2(s) — медленно меняющаяся функция [14, §1.5].

В модели (8) существует и единственно стационарное распределение Ф, совпадающее с распределением случайного ряда

X = ^ Ъак Zk,

к=0

где не зависимы и имеют распределение Р. По лемме АЗ.26 [7, с. 583] получаем асимптотические соотношения:

Ь1 -

Ф(ж) -1 Р(х), Ф(-ж)/Ф(ж) ^ г, х ^ то.

Далее полагаем, что все признаки частиц имеют стационарное распределение.

Для выявления роли наследственности "в чистом виде "желательно обеспечить независимость распределения признаков от коэффициентов авторегрессии (как это имело место в гауссовеком случае). Здесь можно добиться этого только для строго устойчивых распределений, полагая

а1 + Ь1 = 1. (9)

Для произвольных Р, удовлетворяющих (8), условие (9) обеспечивает асимптотическую эквивалентность хвостов: Ф(ж) — Р(х), х ^ то, Будем предполагать, что это условие выполнено.

Обозначим для краткости С = Ь1 /(1 — а1 /у).

Теорема 2. При условиях (1) и (8) верно

Мп Л

и(^п)

(СШ)1/1 ъ п ^ то, (10)

где Ш определено в (1), гц имеет распределение Фреше Ф-у (ж) = ехр{—ж-1} х > 0, и не зависит от Ш.

Доказательство. Утверждение (10) можно представить в виде

Р(Мп < хи(^п)) ^ М ехр { — СШх-1} , п ^ то, х> 0.

Обозначим через Мк максимум признака в ^-родственной группе (к < п) при условии, что ее основатель (общий предок в к-ш поколении) произошел от непосредственного предка с признаком, равным нулю. Тогда легко получить рекуррентную формулу

С

мк = у М®! + Ъак^ Мо =

г=1

где мк%\ £ не зависимы, М^ = Мк, £ = ^д, ( имеет распределение числа непосредственных потомков.

Воспользовавшись известными свойствами распределений с правильно меняющимися хвостами [13, гл. 8, §8], получаем

Р(Мк > х) — СкР(х), х ^ то; Ск = ^Ск-1 + (Ьак)1, со = Ь1, откуда следует асимптотика

Ск - С/, к ^ то. (11)

Для стохастического оценивания Мп снизу разобьем популяцию па ^-родственные группы, порожденные частицами (п — к)-то поколения. Рассмотрев два случая: когда

все признаки частиц (п — к — 1)-го поколения не менее —u(ßn) и когда хотя бы один из них меньше, получаем оценку

P(Mn < xu(iin)) <

< ßn-[k+l)^(—u(ßn)) + MPz-k (Mk < (x + ak+l)u(ßn)) ^ ^ ß-[k+l)rb1 /(1 — a1) + M exp{—ckß-kW(x + ak+l)-1}, n ^ ж.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Переходя к пределу по к ^ ж с учетом (11), получаем

lim sup P(Mn < хи(рп)) < M exp { — CWx-1} ,

Для получения стохастической оценки Мп сверху заметим, что максимумы признаков по отдельным fc-родетвенным группам положительно зависимы (ассоциированы) между собой как возрастающие функции от независимых величин {£т,га} [16, 17]. Поэтому их общий максимум (по всей популяции) стохастически оценивается сверху максимумом случайных величин с теми же распределениями, но независимыми. Таким образом, получаем

P(Mra < xu(ßn)) > MPz^-k (Мк + ak+l£ < xu(ßn)) ^ ^ M exp { — (ck + al[k+l))ß-kWx-1} , n ^ ж.

Переходя к пределу по к ^ ж с учетом (11), получаем

liminf P(Mra < хи(рп)) > M exp { — CWx-1} ,

Совпадение верхнего и нижнего пределов доказывает теорему.

При условии (9) получаем С = (1 — а1 )/(1 — а1 /ß). Таким образом, наследственность приводит к появлению в асимптотике максимумов дополнительного множителя (от 0 до 1) по сравнению с максимумами независимых величин, причем этот множитель убывает с ростом коэффициента а. Подобный эффект выглядит вполне естественно: чем сильнее наследственность, тем меньше разброс признака в поколении и, соответственно, меньше максимум.

В теории экстремумов стационарных случайных последовательностей известно понятие экстремального индекса # [7, §8.1]. А именно, во многих случаях максимум п элементов последовательности асимптотически растет как максимум вп независимых случайных величин с тем же распределением. Таким образом, экстремальный индекс описывает влияние зависимости на максимум. Распространяя это понятие с последовательностей на поколения частиц, приходим к выводу, что величина С здесь как раз и играет роль экстремального индекса.

Для последовательностей значение 9 е (0,1) означает, что превышения высокого уровня происходят не по одиночке, а группами (кластерами) средней величины 1/9. В нашем случае также можно предположить образование подобных кластеров. Очевидно, речь должна идти о родственных группах частиц, имеющих общего предка с аномальным признаком и унаследовавших эту мутацию.

Было проведено компьютерное моделирование. Для простоты рассмотрен ветвящийся процесс, в котором каждая частица имеет ровно двух непосредственных потомков. Инновации имели распределение Стыодента с двумя степенями свободы (так что 7 =2);

параметр а = 0,9, В этом случае получаем С ~ 0, 32 и ожидаемый средний размер кластера 1 /С & 3,13.

Результат для популяции из 1024 частиц (в 10-м поколении) представлен на рис. 1. Видно, что основная масса (более 80%) сосредоточена в диапазоне признаков [-2, 2], но есть и значительные отклонения. Частицы пронумерованы в лексикографическом порядке (по своему положению на двоичном дереве), поэтому родственники находятся рядом (обратное необязательно). Группы родственных частиц с аномальными признаками выглядят как вертикально вытянутые группы точек.

В заключение отметим, что популяция (в каждом поколении) может быть описана случайным полем в некотором (случайном) метрическом пространстве, точки которого соответствуют отдельным частицам, а расстояния между ними — степени их родства. Коэффициенты к > 1, либо модели авторегрессии определяют структуру зависимости поля, а задача сводится к изучению его глобального максимума.

Одна из особенностей введенного пространства в том, что из любых трех расстояний между точками (частицами) либо равны все три расстояния, либо два равны, а третье — меньше. Пространство, обладающее таким свойством, называют ультраметрическим. Подобные пространства возникают в различных разделах математической физики и др. В качестве обзора на эту тему можно указать [18]. Таким образом, мы изучаем экстремумы случайного поля в ультраметрическом пространстве.

Автор благодарен Л.Г.Афанасьевой, М.В.Козлову и Е.Б.Яровой за внимание к работе и полезное обсуждение.

Библиографический список

1. Arnold B.C., Villa-senor J.A. The tallest man in the world / Statistical theory and applications. Papers in honor of H.A.David. Springer. 1996. P. 81-88.

2. Pakes A.G. Extreme order statistics on Galton-Watson trees // Metrika, 1998. V. 47. P. 95-117.

3. Лебедев, А.В. Максимумы случайных признаков частиц в надкритических ветвящихся процессах [Текст] // Вестник МГУ. Сер.1. Математика. Механика, 2008. N5. С. 3-6.

4. Харрис, Т. Теория ветвящихся случайных процессов [Текст]. - М,: Мир, 1966.

5. Rahimov L., Yanev G.P. On maximum family size in branching processes //J. Appl, Probab. 1999. V. 36. P. 632-643.

6. Mitov K.V., Yanev G.P. Maximum individual score in critical two-type branching processes 11 С. E. Acad. Bulg. Sci. 2002. V. 55. N11. P.17-22.

7. Yanev G.P. Revisiting offspring maxima in branching processes // Pliska Studia Mathematica Bulgarica. 2007. V. 18. P.401-426.

8. Lebedev A.V. Maxima of random particles scores in Markov branching processes with continuous time // Extremes. 2008. V. 11. N2. P. 203-216.

9. Секей, P. Парадоксы в теории вероятностей и математической статистике [Текст] . - М,: Институт компьютерных исследований, 2003.

10. Лебедев, А.В. Максимумы наследуемых признаков частиц в ветвящихся процессах [Текст] // Труды V Колмогоровских чтений. - Ярославль. Изд-во ЯГПУ, 2007. - С. 62-66.

11. Бокс, Дж., Дженкинс, Г. Анализ временных рядов [Текст]. - М,: Мир, 1974.

12. Лидбеттер, Л/.. Линдгрен, Г., Pomcen X. Экстремумы случайных последовательностей и процессов [Текст]. - М,: Мир, 1989.

13. Феллер, В. Введение в теорию вероятностей и ее приложения [Текст]. - Т.2. - М,: Мир, 1984.

14. Сенета, Е. Правильно меняющиеся функции. [Текст]. - М,: Наука, 1985.

15. Embrechts P., Kliippelberg С., Mikosh Т. Modelling Extremal Events for Insurance and Finance. Springer, 1997.

16. Esary J., Prochan F., Walkup D. Association of random variables with applications // Ann. Math. Stat. 1967. V. 38. N5. P. 1466-1474.

17. Булинский, А.В., Шашкин, А.П. Предельные теоремы для ассоциированных случайных полей и родственных систем. [Текст]. - М,: Физматлит, 2008.

18. Rammal R., Toulose G., Virasoro M.A. Ultrametricitv for physicists // Rev. Mod. Phvs, 1986. V. 58. P. 765-788.

A.B. Лебедев

О РАСПРЕДЕЛЕНИИ РАЗМЕРОВ КЛАСТЕРОВ ПРЕВЫШЕНИЙ В РЕКУРРЕНТНЫХ ПОСЛЕДОВАТЕЛЬНОСТЯХ С ЛОГ-ЛАПЛАСОВСКИМИ КОЭФФИЦИЕНТАМИ

В работе изучаются лог-лапласовские распределения случайных процессов с кластерами превышений степенного хвоста. Получены все характеристики в явном виде. Кластеры наблюдаются в виде вертикально вытянутых групп точек (выбросов).

Ключевые слова: компьютерное моделирование, рекуррентные последовательности, лог-лапласовские коэффициенты, кластеры превышений.

A.V. Lebedev

ABOUT DISTRIBUTION OF THE SIZES EXCESS CLUSTERS IN RECURRENT SEQUENCES WITH LOG-MECHANICAL FACTORS

In the article is studied a broad log-mechanical distribution of casual processes with excess clusters of a sedate tail. All characteristics are received in an explicit form. Clusters are observed in the form of vertically extended groups of points (emissions).

Keywords: computer modelling, recurrent sequences, log-mechanical factors, excess clusters.

Работа выполнена при поддержке по грантам РФФИ N 07-01-00077, N 07-01-00373 1. Введение. Рассмотрим процесс Yn, п > 1, удовлетворяющий стохастическому рекуррентному уравнению

Уп = AnYn-i + Вп, п > 1, Ус > 0, (12)

i Надоели баннеры? Вы всегда можете отключить рекламу.