Труды Карельского научного центра РАН № 5. 2011. С. 4-9
УДК 519.2
О ЧИСЛЕ ДЕРЕВЬЕВ ЗАДАННОГО ОБЪЕМА В СЛУЧАЙНОМ НЕПОМЕЧЕННОМ НЕКОРНЕВОМ ЛЕСЕ
Е. С. Берникович
Институт прикладных математических исследовании Карельского научного центра РАН
Рассматривается множество Fn,u всех случайных лесов, состоящих из N упорядоченных некорневых деревьев и n незанумерованных вершин, на котором задано равномерное распределение вероятностей. Для таких лесов доказаны предельные теоремы о числе деревьев заданного объема при N, n ^ то так, что 1 < n/N < L = 2.0512772...
Ключевые слова: случайные леса, число деревьев заданного объема, обобщенная схема размещения, предельные теоремы.
E. S. Bernikovich. ON THE NUMBER OF TREES OF A GIVEN SIZE IN A RANDOM UNLABELLED UNROOTED FOREST
We consider the set FN,n of all random forests consisting of N ordered unrooted trees and n unlabelled vertices with uniform probability distribution on this set. We prove limit theorems for the number of trees of a given size in such forest as N, n ^ то so that 1 < n/N ^ L = 2.0512772...
Key words: random forests, number of trees of a given size, generalized allocation scheme, limit theorems.
Введение
Нахождение предельных распределений таких важных характеристик как максимальный объем дерева и число деревьев заданного объема является традиционным направлением исследований различных типов случайных лесов (см. [Pavlov, 2000; Павлов, Лосева, 2002; Хворостянская, 2002; Колчин, 2004]). Для изучавшихся ранее типов случайных лесов было показано, что такие распределения близки и часто отличаются друг от друга только значениями параметров. Основными методами получения результатов были методы теории ветвящихся процессов (в тех случаях, когда
лес генерируется процессом Гальтона-Ватсона ([Pavlov, 2000]) и обобщенная схема размещения частиц по ячейкам, введенная и подробно изученная В. Ф. Колчиным (см., например, [Колчин, 2004]). В настоящей статье доказываются предельные теоремы, описывающие распределение числовой характеристики ^r,
равной числу деревьев, содержащих r вершин, в случае, когда N, n ^ то так, что 1 < n/N ^ L = 2.0512772..., для непомеченных некорневых лесов. Заметим, что для таких лесов в работе [Берникович, Павлов, 2011] получено полное описание предельного поведения другой характеристики - максимального объема дерева, где под объемом понимается число вершин, содержащихся в этом дереве.
Основные результаты
Обозначим ^^,п - множество случайных непомеченных лесов, состоящих из N некорневых деревьев, упорядоченных одним из N! возможных способов, с общим числом вершин п. Зададим на этом объекте равномерное распределение вероятностей.
Пусть независимые одинаково распределенные целочисленные случайные величины £1,..., имеют распределение следующего ви-
да:
Рк = Р{6 = к} = 4 Ак£-1(А), (1)
к = 1,2,
где ^ - число непомеченных некорневых деревьев, содержащих к вершин. Рассмотрим производящую функцию
(2)
к=1
Следуя [Берникович, Павлов, 2011], в качестве А берем решение уравнения
А^/(А)/^(А) = п/Ж. (7)
Обозначим т = Е£1, ст2 = й£1. Из (1), (2) и (7) получаем, что
т
А£'(А) п 2 А2£"(А)
*(А) N Положим
тт, ст
^(А)
+т-т2. (8
стг
= рг 1 — рг —
(т — г)2
ст2
Рг
(9)
Свойства функции (2) изучены в [Харари, Палмер, 1977]. Показано, что начало этой суммы вглядит следующим образом:
£(х) = х + X2 + X3 + 2х4 + 3х5 + 6х6 + 11х7 + ...,
и радиус сходимости ряда Д = 0.3383219... Кроме того, функцию £(х) можно представить в виде
£(х) = ао — а1 (Д — х) + а2(Д — х)3/2 + ..., (3)
где а0 = £(Я) = 0.5628769..., а1 = £;(Я) = 3.4127749..., а2 = 6.4243753.... При к ^ то
4 = а (Vк5/2) -1 + О ^(Vк7/2) -^ , (4)
где а = (3а2/4^л) Д3/2 = 0.5349485...
В работе [Берникович, Павлов, 2011] показано, что справедливо равенство:
Р{П1 = к1, ...,пм = %} =
Р{£1 = къ ...,£м = км|£1 + ... + = п} (5)
где П1,...,Пм - случайные величины, равные объемам деревьев леса из ^,п. Это равенство означает, что для рассматриваемых случайных лесов выполнены условия обобщенной схемы размещения частиц по ячейкам (см., например, [Колчин, 2004]).
Пусть
Ь = а1Д/ао = 2,0512772...
(6)
Справедливы следующие утверждения о предельном поведении числа вершин заданного объема ^г.
Теорема 1. Пусть N п ^ то, n/N ^ 1, п — N ^ то. Тогда для любого г ^ 2 'равномерно относительно иг = (к — Жрг )/у^рг в любом фиксированном конечном интервале для целых неотрицательных к
Р{^г = к} = )к ехр{—Жрг }(1 + о(1)).
Теорема 2. Пусть N п ^ то так, что 1 < С1 ^ n/N ^ С2 < Ь. Тогда равномерно относительно иг = (к — Жрг)/(стггу^) в любом фиксированном конечном интервале для целых неотрицательных к
Р{^г = к} = (стгг V2пN) е-и"2 /2(1 + о(1)).
Теорема 3. Пусть N, п ^ то так, что п/Ж ^ Ь, N (Ь — n/N)3 ^ то. Тогда для целых неотрицательных к:
1. при фиксированном г равномерно относительно иг = (к — Жрг) / (стггу^) в любом фиксированном конечном интервале
Р{^г = к} = (стгг V2пN) е-и"2 /2(1 + о(1));
2. при г ^ то равномерно относительно иг = (к — Жрг)/у^рТ в любом фиксированном конечном интервале
Р{^г = к} = )к ехр{—Жрг }(1 + о(1)).
Ниже приводятся леммы 1-4, с помощью которых будут доказаны сформулированные теоремы.
Вспомогательные утверждения
Пусть г - натуральное число. Введем независимые вспомогательные случайные величи-
(г)
ны , г = 1,..., N такие, что
Р{£(г) = к} = Р{£ = к|£ = г}. (10)
Положим
См = £1 + ... + £м, СЙ° = £(г) + ... + £?.
Обозначим также тг = Е £(г), ст^ = й £(г). Из (1), (8) и (10) вытекают следующие соотношения:
т — грг
При выполнении условий теорем 1-3 из (8) и (11) видим, что
СТг = ст(1 + о(1)).
(13)
тг
1 — Рг
ст
стг
(1 — Р г ) 2
1 — Р г — Рг
(т — г)2
ст2
(11)
Пусть ^>(и),^>(г)(и), ^^(и) - характе-
ристические функции случайных величин
£1, £(г), (С$Т) — Бт )/(стг ^Б) соответственно. Используя (1), (2) и (10), нетрудно получить, что
^(и) =
*(АЯШ) (г), ^
-Щ- ) (и) =
<^(и) — Рг ег" 1 — Рг
(12)
В условиях обобщенной схемы размещения, как показано в [Колчин, 2004], удобно использовать следующую лемму, которая является следствием соотношения (5).
Лемма 1. Справедливо равенство Р {^г = к} =
Леммы 3 и 4 будем доказывать для случая г ^ то, поскольку для фиксированного г их утверждения следуют из результатов работ [Колчин, 2003; Павлов, 2005].
Лемма 3. Пусть Ж, п ^ то так, что выполнено одно из условии:
1. п/^ ^ 1, п — N ^ то, г ^ 2;
2. 1 < С1 ^ п/# < С2 < Ь;
3. п/# ^ Ь, N (Ь — п/^3 ^то.
Тогда при Б = N(1 — Рг)(1 + о(1)) 'равномерно по и в любом конечном интервале
<^г)(и) ^ е-и2/2.
Доказательство. В дальнейшем нам потребуется явный вид третьей производной (1п ^(г)(и))/"и. Для удобства обозначим р(и) = ^>(и) — Ргетг. Из (12) получаем, что
(1п ^(г)(и))/// = (^"(и) + гг3Рг етг) р-1 (и)
— 3(^/(и) — ггРг етг )(^>"(и) + г2Рг етг )р-2 (и)
+2(^(и) — ггРг е™г )3р-3(и). (14)
Используя (1), (2), (4), (8), (11), (13) и лемму 2, можно убедиться в выполнении соотношения
стгл/Б ^ то (15)
при каждом из условий леммы 2.
Поскольку
N ^ Р*(1 Р)«* = п — кг}
к Г" (1 — Рг' Р(С« = п} •
Лемма 1 показывает, что для изучения предельного поведения ^г достаточно изучить предельное поведение сумм независимых слу-
11 иьдыюпиъ 11\^0^/1^П11^у ъ У IV!IV! ПЪ0аОИЪИШО1Л ълу /■ . г-1 N / / \ \
(г) (г) ^ ) гБтги \ ( (г) ( и \ \
чайных величин и и биномиальных ве- ^ (и) = ехР <-------------------^ > I ^>( ) I -----------I I
/ N \ ^ стгЛ/^ ^ V \стгл/Б//
роятностей ( к ) Р* (1 — Рг)
N-к
Из соотношений (1) - (4) и (6) - (8) нетрудно получить утверждения следующей леммы.
Лемма 2. Пусть N п ^ то.
1. Если п/^ ^ 1, то
А = (п/^ — 1) (1 + о(1)), ст2 = 2А(1 + о(1)).
2. Если 1 < С1 ^ п/^ ^ С2 < Ь, то
0 <С1 ^ А < С2 <Д, ст2 = 2А(1 + о(1)).
3. Если п/^ ^ Ь, то
4 / п \ 2
А = Д — ( 1 —(1 + о(1))
стгл/Б
справедливо равенство г5тг и
1п ^^г)(и) = —'
и
стг^Б ^ V стг л/Б /
(16)
При достаточно малых и имеет место разложение
1п ^>(г)(и) = и
д 1п ^>(г)(и)
ди
«=о
и
+Т
2 / д21п ^>(г)(и)
ди2
и
«=о
9а2
и2ст2
3
= гит
ЬN /
+ ~^(и), 2 6 ^
(17)
где
ст2 = (3а2)/(4ао)Д2(Д — Ь) 1/2 (1 + о(1)).
Ю(и)\ < 2 тах 11п^(г)(т)Т"\. (18)
|т |^|и|
6’
Отсюда и из (15) - (18) следует, что при выполнении условий леммы при любом фиксированном и справедливо соотношение
1п <^Г)(и) = “ +
и
и
я
2 \оул/Б
и
(19)
Для доказательства леммы достаточно показать, что второе слагаемое равенства (19) стремится к нулю.
Из (18) следует, что ,3
и
6ст3\/Б
я
и
О
■ у/Б
и3
< ^ Яі(и), (20)
где
Ниже приводится лемма 4, в которой устанавливается локальная сходимость распреде-
(г)
ления суммы к нормальному закону.
Лемма 4. Пусть N п ^ то так, что выполнено одно из условии леммы 3. Тогда при
Б = N (1 — Рг)(1 + о(1))
■ л/2п5
о
в-"2/2 (1 + о(1))
^1 (и) = тах \ 1п (^(т^Дст^л/Б).
|т |^|м/(о-г ^6)|
(21)
Рассмотрим случай, когда 1 < С1 ^ п/^ ^ С2 < Ь. Из (1), (2) и (12) следует, что производные ц>'(и), ^//(и), ^///(и) ограничены, а г3Рг ^ 0 при г ^ то. Отсюда, из (11), (13) -(15) и (19) - (21) получаем, что
1п ^6г)(и) = (—и2/2)(1 + о(1)). (22)
Пусть теперь
п/^ ^ 1, п — N ^ то, г ^ 2.
Из (1) и (11), применяя лемму 2, нетрудно вывести, что
ст3 ^Б = ^8(п — N )3/2^-1(1 + о(1)). (23)
Из (2) и (12) получаем выражения:
^>(и) = 1 + О(А), ^/ (и) = г + О(А),
^//(и) = —1 + О(А), ^///(и) = —г + О(А).
Ясно, что при г ^ 2 из (1) следует, что Рг ^ 0. Таким образом, из (14) получаем, что 1п ^(г)(и)Ц^/ = О(А). Откуда, применяя (23), получаем соотношение
1п ^(г)(и)Щ//(ст3^Б) = (п — ^)-1/2(1 + о(1))
а значит из (19) - (21) следует (22).
Осталось рассмотреть случай
п/^ ^ Ь, N (Ь — п/^)3 ^ то.
Аналогично (23), делаем вывод, что в этом случае
стг3 ^Б = (3а2)/(4ао)3/2Д3(Д — Ь)-3/4(1 + о(1)).
(24)
Из (1), (2) и (12) следует, что ^/(и) ^
еопв^ ^>"(и) ^ то, ^(и) ^ то, а
(А)/(ст3 ^) х ((Ь — п/^)#)-1/2 . Тогда из (19) - (21) и (24) получаем (22). □
равномерно по I, для которых г = (I — £тг) /оул/Б находится в любом фиксированном конечном интервале.
Доказательство. Следуя классическому доказательству локальных предельных теорем, представим рассматриваемую вероятность по формуле обращения в виде интеграла
г
Поскольку
2п о г л/ Б
у е-^^4г)(^.
(25)
,-^/2
2п
е-«*е-*72л
(26)
разность
Д = л/2п ^оу л/2п5 Р | (^г) = і} — е ^2/2^
можно представить в виде суммы Дз = Л + ^2 + /з + ^4)
(27)
где
А
/і = J е-іг* (^(і) — е-*2/2) Йі,
-А
/2 = J е-г^^4Г)(і)ЙІ,
А<|і|^єстг —5
/з = У е-г2:У5г) (і)йі,
—5<|і|^по-г —5
/4 = — е
А<И
—ігі—і2
/2^і,
1
1
1
положительные постоянные А, £ будут выбраны позднее. Для доказательства леммы достаточно показать, что разность Д можно сделать сколь угодно малой при больших п, N. Из (26) следует, что \/4\ ^ / е-*2/2^£, и,
А<|*|
выбрав достаточно большое А, мы можем сделать /4 сколь угодно малым.
Оценим /3. Пусть 1 < С ^ п/^ ^ С2 < Ь. Поскольку максимальный шаг распределения
£(г) равен 1, 0 < С3 ^ А ^ С4 < Д, при £ < \£\ ^ п выполняется неравенство
^(*)
-с-5
(28)
ЭоЗх/Б
тогда из (19):
я
о,
\Йг)(£)\ <е-С7* .
Отсюда делаем вывод, что интеграл /2 может быть сделан сколь угодно малым при достаточно большом А.
□
Доказательства теорем
В работе [Берникович, Павлов, 2011] было показано, что для суммы при выполнении условий теорем 1 - 3 выполняется соотношение
Р {(м = п} = (ст/2п^)-1(1 + о(1)) (29)
равномерно относительно п.
При выполнении условий теоремы 1 Рг ^ 0. Поэтому, как известно, для целых положительных к
Здесь и далее С5,С6,... означают некоторые положительные постоянные. Поэтому
П (7 г
\/3\ ^ ^ У е-Сб6^ С6стг^Бе-Сб6
и /3 0 при Б то и постоянном £ > 0. При
условии п/^ ^ Ь, N (Ь — п/^)3 ^ то, выполнено (28), поэтому, проводя аналогичные выкладки, находим, что \ /3 \ ^ 0 ив этом случае.
Пусть теперь п/^ ^ 1, п — N ^ то. Из (2), (3), (12) и того, что Рг ^ 0, получаем соотношение \^>(г)(£)\5’ ^ е-С®Л6. Тогда по лемме 2
\/3\ < Сдстг^Бе-СвЛ6
и /3 ^ 0 при Б ^ то и постоянном £ > 0.
Оценим теперь /1 и /2 при фиксированных £ и А. По лемме 3 слабая сходимость к нормальному распределению равномерна на любом конечном интервале и, следовательно, интеграл /1 ^ 0 при Б ^ то. Для интеграла /2 справедлива оценка
\/2\ < У \^6г) (£)И£.
А<|4|^£7г ^6
При каждом из условий леммы 3 и £ < £стг\/Б из леммы 2, (20) и (21) следует выполнение следующего неравенства:
£ ^ / £
N к ,Рг
рк(1 — Рг)*-к = е-Мрг (1 + 0(1))
к!
(30)
равномерно относительно (к — ^Рг )/\/^Рг в любом конечном интервале. Для оценки вероятности Р | сМ"- * = п — кг} используем лемму 4, полагая Б = N — к и I = п — кг :
Р {СЇ-к = п — кг} = (ол/2п^ — к))
і
х ехр < —
(п — кг — ^ — к)тг )2 2о2 ^ — к)
(1 + 0(1)).
Заметим, что N — к = N(1 — Рг — иу^/^). Отсюда, из леммы 2, (8), (9), (11), (13), вытекает,
что
(п — кг — ^ — к)тг )2
2о2 (N — к)
->■ 0,
следовательно,
(г)
р <! к = п — ы =
(сту7 2п(^ — к)) 1(1 + о(1)).
Отсюда и из (29) получаем, что
Р {<$-* = п — кг} / Р {См = п} ^ 1. (31)
Для завершения доказательства осталось применить лемму 1 и (30).
Для доказательства теоремы 2 заметим, что
к = ^Рг +иг стгг л/^, N—к = N (1—Рг )(1+о(1)),
(32)
где иг ^ С < то. Используя нормальное приближение для биномиального распределения при ^Рг(1 — Рг) ^ то, находим, что
(1 — Рг)
1 + 0(1)
л/^РТ)
x exp -
(k — Npr )2 2Npr (1 — Pr)
(33)
равномерно относительно
(к — ^Рг)/л/^Рг (1 — Рг)
в любом фиксированном конечном интервале. Поскольку из (8) и (9) следует, что ст^ ^ Рг(1 — Рг), то равенство (33) справедливо равномерно и по (к — ^Рг)/(стг^у/^).
По лемме 4 при Б = N — к и I = п — кг, из (8), (9), (11) и (32) можно установить, что
P {Zn-k = n — kr} = ^r V2nN(1 — pr))
1
x exp
(m — r)2pr u2
2а2 ^1 — pr + (urаrr)/VN^
Нетрудно получить, что
(k — Npr )2 (m — r)2pr u.
(1+o(1)).
(34)
+
2Npr(1 — pr) 2а2(1 — pr)
ur
T
Отсюда, из (29), (33) и (34), применяя лемму 1, получаем утверждение теоремы 2.
Утверждения теоремы 3 очевидным образом следуют из лемм 1 и 4, (29) - (31), (33).
Литература
Берникович Е. С., Павлов Ю. Л. О максимальном объеме дерева случайного непомеченного некорневого леса jj Дискретная математика. 2011. Т. 23, № 1. С. 3-20.
Колчин А. В. Предельные теоремы для обобщенной схемы размещения jj Дискретная математика. 2003. Т. 15, № 4. С. 148-157.
Колчин В. Ф. Случайные графы. М.: Физмат-лит, 2004. 256 с.
Павлов Ю. Л., Лосева Е. А. Предельные распределения максимального объема дерева в случайном рекурсивном лесе jj Дискретная математика. 2002. Т. 14, № 1. С. 60-74.
Павлов Ю. Л. Предельные теоремы для объемов деревьев в случайном непомеченном лесе jj Дискретная математика. 2005. Т. 17, № 2. С. 7086.
Харари Ф., Палмер Э. Перечисление графов. М.: Мир, 1977. 326 с.
Хворостянская Е. В. Об условии возникновения гигантского дерева в случайном непомеченном лесе jj Дискретная математика. 2002. Т. 19, № 3. С. 35-50.
Pavlov Yu. Random forests. Utrecht: VSP, 2000.
СВЕДЕНИЯ ОБ АВТОРЕ:
Берникович Елена Сергеевна
аспирант лаб. теории вероятностей и компьютерной статистики
Институт прикладных математических исследований КарНЦ РАН
ул. Пушкинская, 11, Петрозаводск, Республика Карелия, Россия, 185910 эл. почта: [email protected] тел.: (8142) 761218
Bernikovich, Elena
Institute of Applied Mathematical Research, Karelian Research Centre, Russian Academy of Science
11 Pushkinskaya St., 185910 Petrozavodsk, Karelia, Russia
e-mail: [email protected] tel.: (8142) 761218