Исследование максимального размера плотного подграфа случайного графа
1,2 Н.Н. Кузюрин <[email protected]> 2Д.О. Лазарев <[email protected]> 1 Институт системного программирования им. В.П. Иванникова РАН, 109004, Россия, г. Москва, ул. А. Солженицына, д. 25 2Московский физико-технический институт, 141700, Московская область, г. Долгопрудный, Институтский пер., 9
Аннотация. Для описания случайных сетей используется модель случайного графа Эрдёша-Реньи G(n,p). При исследовании современных случайных сетей часто требуется определить размер максимальной плотной подсети. В настоящей статье приводятся оценки максимального размера c-плотного подграфа, асимптотически
почти наверно содержащегося в случайном графе GO,1). Было показано, что при
„ 1 т Ч
c < —, G(n,—) — асимптотически почти наверно c-плотный; получены верхняя и
нижняя оценки размера максимального 1 -плотного подграфа, асимптотически почти
наверно. содержащегося в G(n,—); а при c > — получена оценка сверху на размер максимального с-плотного подграфа асимптотически почти наверно содержащегося в
Ключевые слова: случайный граф; случайный граф Эрдёша-Реньи; плотность графа; максимальный плотный подграф.
DOI: 10.15514/ISPRAS-2017-29(6)-12
Для цитирования: Кузюрин Н.Н., Лазарев Д.О. Исследование максимального размера плотного подграфа случайного графа. Труды ИСП РАН, том 29, вып. 6, 2017 г., стр. 213-220. DOI: 10.15514/ISPRAS-2017-29(6)-12
1. Введение
Вероятностный метод — эффективный и широко применяемый математический метод, позволяющий доказывать существование объекта с заданными свойствами. Он заключается в оценке вероятности того, что случайный объект из заданного класса удовлетворяет нужному условию. Если доказано, что эта вероятность положительна, то объект с нужными свойствами существует. Несмотря на явную неконструктивность метода, на его основе могут быть созданы вероятностные алгоритмы построения объекта с параметрами, близкими к параметрам, оцененным с помощью вероятностного метода. Вероятностный метод — сравнительно молодой и динамически развивающийся метод, основоположником которого по праву считается выдающийся венгерский математик Пол Эрдёш. Несмотря на то, что метод применялся и до Эрдёша, например, Селёшем для доказательства
(n -1)!
существования турнира на n вершинах не менее чем с ——— гамильтоновыми
циклами, именно Пол Эрдёш в полной мере осознал его потенциал, именно ему, его ученикам и соавторам принадлежит большее число доказательств, ставших впоследствии классическими.
Различные разделы науки постоянно ставят всё новые и новые задачи, так или иначе связанные со случайными графами. Впервые случайный граф был определен в рассматриваемой в работе модели Эрдёшем и Реньи в их совместной работе [1]. Данная модель используется и по сей день при исследовании свойств объектов, связанных со случайными сетями. Широко изучается, в связи с его важной ролью в биологических и социальных сетях, также и понятие плотности графа. Например, в работе [2] приведён алгоритм нахождения плотного подграфа в гигантском графе, вроде графа цитирования в Интернете, а в работе [3] предложен алгоритм нахождения k самых плотных подграфов в динамическом графе.
Ниже приведены основные определения, которые будут многократно использоваться в работе.
Определение 1. Дан граф H с p (p>1) вершинами и q рёбрами. Его плотностью называется величина D, равная отношению количества рёбер графа к числу рёбер в полном графе с числом вершин, равным числу вершин в графе H:
D =
p( p -1)
Определение 2. Случайным графом в модели Эрдёша-Реньи, или просто случайным графом с n вершинами и вероятностью выпадения ребра, равной p, называется вероятностное пространство над пространством всех графов на n вершинах, в котором вероятность события, для любого ребра полного графа на n вершинах заключающегося в том, что оно принадлежит графу, не зависит
от аналогично определённых событий для других рёбер и равна р. Данное пространство обозначается С(п,р).
Определение 3. Скажем, что некоторое свойство выполняется асимптотически почти наверно (а.п.н.) для некоторого семейства случайных графов, если при п ^ от вероятность того, что граф на п вершинах из данного семейства обладает данным свойством стремится к 1.
Многократно используется в работе следующее неравенство, доказанное русским математиком А. А. Марковым:
Если X — случайная величина, принимающая целые неотрицательные значения, то Р(Х > 0) < Е(Х), где Р(У) — вероятность события У, а Е(X) — математическое ожидание случайной величины х.
В настоящей работе исследовался размер максимального с-плотного подграфа случайного графа в модели Эрдёша-Реньи на п вершинах ^п,1). Было доказано, что
• При с <1, ^о,1) — асимптотически почти наверно с-плотный;
• Получены верхняя и нижняя оценки размера максимального ^ 1 -плотного подграфа, а.п.н. содержащегося в ^С«,1);
• При с >1 получена оценка сверху на размер максимального с-плотного подграфа, а.п.н. содержащегося в ^О,1).
2. Максимальный размер клики в случайном графе в модели Эрдёша-Реньи
В работе [4] Эрдёшем и Боллобашем исследовался размер максимальной
клики в случайном графе ^О,1). Было установлено, что асимптотически
почти наверно данная величина имеет плотную концентрацию. Обозначим за к(п) верхнюю целую часть решения уравнения
« 12 12 > = 1; к (п) = (1 + о(1)) п
Тогда имеет место следующее утверждение: TeopeMa.(Erdos and Bollobas, 1 равен либо k (и), либо к(и) -1.
TeopeMa.(Erdos and Bollobas, 1976). Размер максимальной клики в ^и,1) а.п.н.
Kuzyrin N.N., Lazarev D.O. Analysis of size of the largest dense subgraph of random hypergraph. Trudy ISP RAN/Proc. ISPRAS, vol. 29, issue 6, 2017, pp. 213-220
Идея доказательства: оценка сверху получается вычислением математического ожидания числа клик размера k графа Gin,1); для оценки снизу требуется воспользоваться методом второго момента.
3. Оценки размера максимального c-плотного подграфа случайного графа G(n,c) при различных значениях c
Обозначим за k(n,c), при c >1 наименьшее целое решение неравенства:
n) Pr(Bi (2 > {2)}>1
где Bi(n, p) — биномиальное распределение с параметрами n и p, а Pr(—
вероятность события X.
Теорема.
1) При c <1 сам случайный граф а.п.н. c-плотный.
2) При c =1 выполняется:
n
а) При k = ——, где f (n) ^ да произвольно медленно при n ^ да,
j(n)
1 i граф G(n,—) а.п.н. содержит -- плотный подграф размера k.
, n n In n n , , , n , ,
б) ПРи k = 4 "V ~r i In-nhhta n "V 32lnn taln n
3s = 1, 3N0 : Vn > N0, верно: рг[о(п,1) содержит 1 - плотный подграф размера k^ >s
3) При1 < c < 1, размер максимального с-плотного подграфа графа GO,1) а.п.н.
не превосходит k(n, c) +1. Доказательство.
Г n) Г п
1) Оценив соотношение соседних биномиальных коэффициентов 1.1 и\
k I 1 k +1)
можно установить верность следующей леммы: Лемма.
Pr( Bi| n,1 |> cn) e
2-\n Ii-c ,2"
■
cn c
cn
Пусть m = ^иJ. Число рёбер в случайном графе G(n, p) имеет биномиальное
(иЛ ( и Л
распределение Bi(m, p). Используя равенство КМ А и лемму, можно получить:
Pr^Bi(m, 1) > c^j = 1 - Pr^Bi(m, 1) > (1 - c)m^ ^ 0, m ^ <x Следовательно, G(n,1) — а.п.н. c-плотный.
2) а) Заметим, что
Pr( плотность G(n,1) > 1\ > 1
Разобьём вершины графа GO,1) на [f (и)] множеств размера либо
^лиЦ^1.
f (и).
+1. Вероятность того, что каждый из подграфов,
порождённых этими множествами вершин, имеет плотность, меньшую —, не превосходит 1. Стало быть, вероятность того, что ни один из подграфов не
имеет плотность £ >1 не превосходит 24(п) ^ 0, « Следовательно, граф
1 1 0(п,-) а.п.н. содержит --плотный подграф размера ^ что и требовалось
доказать.
б) В работе [5] Боллобаш, в частности, показывает, что, если за Ап обозначить событие, заключающееся в том, что степень каждой вершины 0(п,1) — не
и
менее, чем
2 V 2 Vln и V 32ln и
при и ^ да; также известно, что
и ln и и и , , , ,
fc |П|П и 132Ьи hh и, то ^ 1
рг(2 >2,
следовательно ^N0 :
Pr |(ниоднавершинаG (n, 1) неимеетстепеньменьше " -ln ln ln n - J32^n ln
(D(G(n,i))£i))
П
1
для всех n > N0. Рассмотрим подмножество H множества вершин графа
1 3n n In n n n
GO,-) размером не менее M = T + ]^2~ + \knlnlnlnn + n и
дополнительное к нему множество H'. Из любой вершины H в H идёт по
крайней мере n рёбер. Значит, суммарное число рёбер в подграфах GO1)
4 2
,порождённых множествами вершин H и H ' не превосходит
n(n -1) (n - M )n n(M -11 (h - M - 1)(и - M) M(M -1)
---= - <--1--
4 4 4 4 4
Значит, либо плотность подграфа GO,1), порождённого множеством вершин
1 1 H менее -, либо плотность подграфа G(-,—), порождённого множеством
вершин H' менее 1, что и требовалось доказать.
3) Вычислим E(n,k,c) - математическое ожидание количества порождённых подграфов размера k случайного графа GO,1), имеющих плотность, не меньше c:
E(n, k, c) = |n) Pr(плотностьслучайного графа на k вершинах > c)
" н>Ш<
Г k)
Решая уравнение E(n,k,c) = 1, и учитывая, что, по Лемме(обозначим II за m)
Pr(Bi\m, 1) > cm) e
Г m ) 1 - c Г m
2-m I I—, 2-m I
\ cm) c \cm
,получаем:
k (n, c) = (1 + o(1))21og
Для нахождения верхней оценки размера максимального с-плотного подграфа случайного графа, учитывая соотношение, которое может быть получено анализом выражения E(n,k,c):
Е(п, к (п, с) +1, с) 1 Е(п, к (и, с), с) п
выполняющееся для любого с >1 при любом п > Мс, можем получить, что
1 1 Е(и, к(п, с) +1, с) < — Е (п, к(п, с) + 1, с) < -. Стало быть, по неравенству Маркова,
п п
Рг^существуетподграф п,1 ^ на к(п,с) +1 вершина^ ^ 0, при п ^да . ■
Стоит отметить, что, так как 2cC (1 - c)1-c ^ 2 при c ^ 1, то при c = 1 настоящий результат совпадает с результатом, полученным Боллобашем в работе [4]: k = (1 + o(1))2log2 n для плотности подграфа, равной 1.
Список литературы
[1]. P.Erdos and A. Renyi. On Random Graphs. Publicationes Mathematicae (Debrecen), Vol. 6, 1959, pp. 290-297.
[2]. D.Gibson, R.Kumar and A.Tomkins. Discovering Large Dense Subgraphs in Massive Graphs. Proceedings of the 31st international conference on Very large data bases, 2005, pp. 721732.
[3]. Valari E., Kontaki M., Papadopoulos A.N. Discovery of Top-k Dense Subgraphs in Dynamic Graph Collections. In: Ailamaki A., Bowers S. (eds) Scientific and Statistical Database Management. SSDBM 2012, Lecture Notes in Computer Science, vol 7338. Springer, Berlin, Heidelberg, pp 213-230, DOI: 10.1007/978-3-642-31235-9_14.
[4]. B. Bollobas and P. Erdos. Cliques in Random Graphs. Mathematical Proceedings of the Cambridge Philosophical Society, Volume 80, Issue 3, 1976, pp. 419-427, DOI: 10.1017/S0305004100053056.
[5]. B. Bollobas. Degree sequences in Random Graphs. Discrete Mathematics, Volume 33, Issue 1, 1981, pp. 1-19, DOI: 10.1016/0012-365X(81)90253-3.
Analysis of size of the largest dense subgraph of random
hypergraph
1,2 N.N. Kuzyrin <[email protected]> 2 D.O. Lazarev <[email protected]> 1 Ivannikov Institute for System Programming of the Russian Academy of Sciences, 25, Alexander Solzhenitsyn st., Moscow, 109004, Russia 2 Moscow Institute of Physics and Technology, Dolgoprudnyj, Institutskij alley, Moscow region, 141700, Russia
Abstract. Random networks are often described using Erdos-Renyi model of random graph C(n,p). The concept of graph density is often used in random network analysis. In this
article, the maximal size of c-dense subgraph almost surely included in random graph Gin,1) was evaluated. It was shown, that if c < 1 , then Gin,1) is almost surely c-dense; the upper and lower bounds for the size of maximal 1 -dense subgraph almost surely included in G(n,-^) were determined; in case when c >1, the upper bound for the maximal size of c-dense subgraph almost surely included in G(n,-^) was attained.
Keywords: random graph; Erdos-Renyi model; graph density; maximal dense subgraph.
DOI: 10.15514/ISPRAS-2017-29(6)-12
For citation Kuzyrin N.N., Lazarev D.O. Analysis of size of the largest dense subgraph of random hypergraph. Trudy ISP RAN/Proc. ISP RAS, vol. 29, issue 6, 2017. pp. 213-220 (in Russian). DOI: 10.15514/ISPRAS-2017-29(6)-12
References
[1]. P.Erdos and A. Renyi. On Random Graphs. Publicationes Mathematicae (Debrecen), Vol. 6, 1959, pp. 290-297.
[2]. D.Gibson, R.Kumar and A.Tomkins. Discovering Large Dense Subgraphs in Massive Graphs. Proceedings of the 31st international conference on Very large data bases, 2005, pp. 721732.
[3]. Valari E., Kontaki M., Papadopoulos A.N. Discovery of Top-k Dense Subgraphs in Dynamic Graph Collections. In: Ailamaki A., Bowers S. (eds) Scientific and Statistical Database Management. SSDBM 2012, Lecture Notes in Computer Science, vol 7338. Springer, Berlin, Heidelberg, pp 213-230, DOI: 10.1007/978-3-642-31235-9_14.
[4]. B. Bollobas and P. Erdos. Cliques in Random Graphs. Mathematical Proceedings of the Cambridge Philosophical Society, Volume 80, Issue 3, 1976, pp. 419-427, DOI: 10.1017/S0305004100053056.
[5]. B. Bollobas. Degree sequences in Random Graphs. Discrete Mathematics, Volume 33, Issue 1, 1981, pp. 1-19, DOI: 10.1016/0012-365X(81)90253-3.