УДК 514.765
М.А. Львова, В.В. Славский
Число компонент связности случайного графа*
M.A. Lvova, V.V. Slavsky
The Number of Components of Connectivity of the Random Graph
Изучаются случайные толерантные бинарные отношения или случайные графы, еще более точнее - модель Эрдеша-Реньи случайных графов.
Ключевые слова: случайные отношения, случайные графы.
This article focuses on random tolerant binary relations or random graphs. Specifically, the study aimed to investigate the Erdos- Renyi random graph model.
Key words: random relations, random graphs.
В естественных науках (астрономия, биология, география, геология, физика, химия и др.), а также в общественных науках (археология, экономика, история, лингвистика, психология и др.) часто возникает задача классификации или кластеризации объектов по их характеристикам. Исходными понятиями в подобных задачах являются толерантное бинарное отношение между объектами и мера несходства объектов.
На практике матрица толерантного отношения в на конечном множестве объектов X определяется эмпирически и, следовательно, неточно, то в связи с этим возникают интересные проблемы.
Рассмотрим для примера случай, когда множество X состоит из 4 объектов.
Теорема 1. Пусть толерантное отношение в имеет вероятностное распределение Бернулли, т.е. в(ж*, хі) = 1 и при і = і
в (а
j) =
І с вероятностью p
О с вероятностью q = І - p.
Случайные величины в(хі, х^ ) независимы. Тогда вероятности Рк того, что транзитивно замыкание в имеет к классов эквивалентности, равны:
P1
p3
(—6p3 + 24p2 — 33p + Іб)
Р2 = (1 — р)3р2 (15 — 11р)
Рз = 6(1 — р)5р Ра = (1 — р)6 Доказательство. Другими словами, рассмотрим случайный граф в смысле определений Пола Эрдоса и Альфреда Реньи [2].
* Работа выполнена при частичной финансовой поддержке РФФИ (проект № 08-01-98001), а так же ФЦПК «Научные и научно-педагогические кадры инновационной России» на 2009 — 2013 годы, тема «Фундаментальные проблемы анализа и геометрии» (номер заявки в информационной компьютеризированной системе «2012-1.1-12-0001003-014».
1. Вероятность того, что в состоит из 1 класса эквивалентности.
Далее будем рассматривать отношения толерантности как графы, в нашем случае с четырьмя вершинами. Чтобы транзитивно замыкание имело 1 класс эквивалентности, необходимо и достаточно, чтобы граф отношения толерантности был связным. Связный граф с минимальным количеством ребер - это дерево. На £ вершинах можно построить £4-2 различных деревьев. На четырех вершинах - 42, при этом такие деревья будут иметь 3 ребра. Итого получается вероятность появления такого отношения 42 • р3 • (1 — р)3.
Графы с 4-мя вершинами с 4-мя или более ребрами все будут связными. Вероятность появления соответствующих отношений толерантности
с4 • р4 • (1 — р)2 + с • р5 • (1 — р) + с6 • р6.
Соответственно, вероятность того, что в состоит из 1 класса эквивалентности
Р1 = 42 • р3 • (1 — р)3 + С;4 • р4 • (1 — р)2 +
+с5 • р5 • (1 — р) + с6 • р6.
2. Вероятность того, что в распадется на два класса.
Графы с 3-мя ребрами и 2-мя связными компонентами, их число С3 — 42.
Графы с 2-мя ребрами и 2-мя связными компонентами. 2С42 - число графов, где одна компонента состоит из 2-х вершин, вторая - тоже из двух, С4 • 31 - число графов, где одна компонента состоит из одной вершины, вторая - из трех.
Соответственно, вероятность того, что в распадется на два класса, равна
Р2 = (С3 — 42) • р3 • (1 — р)3+
+1 С2 • р2 • (1 — р)4 + зс]р2(1 — р)4.
Число компонент связности случайного графа
3. Вероятность того, что распадется на три класса.
Рз = С6р(1 — р)5.
4. Вероятность того, что в распадется на четыре класса. Это возможно только, если все недиагональные элементы нули. оответственно, эта вероятность равна
(4-1)4 „
Ра = (1 — р) _-г_ = (1 — р)6.
Теорема доказана.
Теорема 2. Пусть толерантное отношение в на множестве X из п элементов имеет вероятностное распределение Бернулли, т.е. в(хі, хі) = 1 и при
і = і'
в(хі ,х^- )
1 с вероятностью р 0 с вероятностью д =1 — р.
Случайные величины в(хі,х^) независимы. Тогда вероятности Р(к, п) того, что транзитивно замыкание в имеет к классов эквивалентности, находятся с помощью рекуррентных равенств:
• Р (1,1) = 1;
• при 2 < к < п
Р(к, п) =
Е
1 <Г1 <'"<гк г1 +-+ гк =п
( ” ) Уг1,...,гк/
£(гь...,Гк)
(1 — рГ
п - Г------
Р(1,гі) • ... • Р(1,Гк)•
(1)
где число £(г1,..., гд) = в1! • • • в4!, здесь в1,... ,в4
- длины отрезков в неубывающей последовательности Г1 < • • • < гд, состоящие из равных между (обой чисел (пример: £(2, 2, 3,4,4, 5) = 2!1!2!1!), ( ") = ——г - биномиальные коэффициен-
ты.
• при к =1;
Р(1, п) = 1 — Р(2, п) — Р(3, п) — • • • — Р(п, п).
Доказательство. Р(1,1) = 1 означает, что на одной вершине можно построить только один граф, который состоит из одной компоненты связности.
Граф с п вершинами содержит к компонент связности тогда и только тогда, когда у него существует к связных подграфов таких, что не существует пути из вершины одного подграфа в вершину другого, причем общее число вершин таких подграфов равно числу вершин графа. Пусть
О = (V, Е), |У | = п - граф с п вершинами и к компонентами связности. Занумеруем эти компоненты (которые также являются подграфами) по возрастанию числа вершин: О1 = (У]_, Е1),..., Од = (УД , Ед). Обозначим количество вершин *-го подграфа, как г* = |У |. Учитывая способ нумирации, имеем Г1 < • • • < гд и Г1 + • • • + гд = п.
Таким образом, чтобы посчитать вероятность того, что граф с п вершинами состоит из к компонент связности, нужно учесть всевозможные разбиения множества из п элементов на к подмножеств У1,..., УД. Мощности этих множеств должны удовлетворять условиям г1 < • • • < гд и г1 + • • • + гд = п. Для каждого набора чисел г1,..., гд количество способов выбора соответствующих подмножеств вершин равно
/~ІТ1 Ґ-1Г2 ґ-ігк
• . . . •
П —Т1—...—Тк-1
Гі! • ... • Тк!
п
Гі , . . . , Гк
Заметим, что если в неубывающей последовательности Гі < • • • < Гк встречаются в одинаковых чисел, то при подсчете количества способов выбора подмножеств вершин, у нас в! раз рассматривается один и тот же способ при каждом наборе оставшихся подграфов, т.е число раз равное количеству перестановок порядка в. Если исключить повторение такого рода, то количество способов разбить граф на подграфы равно
( П )
\Т1,...,Тк/
^(Г1, . . . ,Гк)’
где число ^(г1,..., гк) = в1! • • • в4!, здесь в1,..., в4 есть длины отрезков в неубывающей последовательности Г1 < ••• < г к, состоящие из равных между собой чисел.
Также необходимо учесть,что не существует пути из вершины одного подграфа в вершину другого. Всего ”(”2 1) пар вершин. Для каждого подграфа гі(г2—1). Итого, остается п(п—^ —
Ек ГіІті — 1)
і=1 “^2— пар вершин, которые не должны быть связаны ребрами. Преобразуем это выражение
п(п — 1) гі(гі — 1) п2 — п Г2 — Гі
= ““2 2^ =
І=1
2
2 \—'к 2 ( \—'к \ 2 \—'к 2
= п2 — Ь і=1 г2 — (п — Ь і=1 гі) = п2 — Ь і=1 г2
2 2 . Из вышеприведенных рассуждений следует, что при 2 < к < п
Р(к, п) =
( ” )
= Е ^(1,Г1) • ... • Р(1,Гк)^
1 <Г1 <'"<гк
Г1 +----+ гк=п
п2
• (1 — р) _
^(Г1,. .. ,Гк)
Для графа с п вершинами справедливо
1 = Р(1, п) + Р(2, п) + Р(3, п) + ... + Р(п, п).
п!
2
к
Из чего следует третье выражение из условия теоремы
P(1, n) = 1 — P(2, n) — P(3, n) — • • • — P(n, n).
Теорема доказана.
Пример. Выпишем рекуррентные формулы для п = 5.
P(2, 8) = (p — 1)7p6(13068p15 — 22Б036p14+ +1813980p13 — 9083Б64p12+ 31615787p14—
—810602Б9p10 + 1Б82Б4628p9 — 239732560p8+ +28434Б642p7 — 264338326p6 + 191274720p5 —
— 10Б964740p4 + 43Б9Б0ББp3 — 12608323p2+ +2300624p — 200704);
P(3, 8) = —14(p — 1)13p5(938p10 — 10822p9+ +Б6393p8 — 174947p7 + 358193p6—
—Б06371p5 + Б01339p4 — 3439Б1p3+ +1Б6929p2 — 43171p + Б472);
P(2, 5)= J P(1,1)P(1,4)(1 — p)4+ + (2“3)P(1, 2)P(1, 3)(1 — p)6;
(l,1,3)
P(З, Б) = p(1,1)P(1,1)P(1, з)(і — p)7+
+ 11^Ap(і, i)p(1, 2)P(1, 2)(1 — p)8;
P(4, Б)
2,2J
l!
5
.1,1,2V
"зГ
(l,1^1,2)
P(1,1)4P(1, 2)(1 — p)9;
(l,l,5,l,l)
P(Б, Б) = p(1, 1)5(1 — p)10;
P(1, Б) = 1 — P(2, Б) — P(З, Б) — P(4, Б) — P(Б, Б).
P(4, 8) = 7(p — 1)18p4 (967p6 — 6730p5 + 19605p4— —30680p3 + 2728Бp2 — 13134p + 269Б) ;
P(Б, 8) = —70(p — 1)22p3 (28p3 — 98p2 + 115p — 46) ; P(6, 8) = 14(p — 1)25p2(23p — 27);
P(7, 8) = —28(p — 1)27p;
P(8, 8) = (1 — p)
28
Замечание. Известны, также, другие рекуррентные формулы для Р (1,п) [1, 2]:
1
1 — P(1,n) = £ P(1,k)Ck-1(1 — p)k(
(n-k)
k=1
С увеличением п полиномы Р(к,п) быстро усложняются. Приведем результат окончательных вычислений для п = 8.
P(1, 8) = p7 (—5040p21 + 120960p20 — 1386000p19+ +10086720p18 — 52319190p17+ 205732800p16—
—636845160p15 + 1590501640p14 — 3258291120p13+
В данной работе в отличии от [1], во-первых получены новые рекуррентные формулы, во-вторых определены величины:
Q(rb . . .,rk)
( n )
Vrl ,...,rfc/ .
J(rl,... ,rk)'
+5536123600p12 — 7856193296p41 + 9345271992p10 —
—9324568001p9 + 7786027816p8 — 5410382880p7+ +3098951072p6 — 1441519296p5 + 532354536p4 —
— 150657080p3 + 30802240p2 — 4068456p + 262144) ;
х Р(1,п) ••• Р(1,г*)(1 — р) 2 ,
где 1 < г1 < • • • < гд, п = г1 + • • • + гд. Данные величины представляют независимый интерес и равны вероятностям того, что случайный граф с п вершинами в модели Эрдеша-Реньи имеет в точности к компонент связности объемов соответственно г1 < • • • < гд.
2 _2
Библиографический список
1. Gilbert, E.N. Random graphs, Annls Math. 2. Bela Bollobas. Random Graphs. Cambridge
Statist. 30, 1141-1144, 1959. studies in advanced mathematics, 73. Cambridge
University Press 2001.