Научная статья на тему 'Исследование максимального размера плотного подграфа случайного графа'

Исследование максимального размера плотного подграфа случайного графа Текст научной статьи по специальности «Математика»

CC BY
82
16
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛУЧАЙНЫЙ ГРАФ / СЛУЧАЙНЫЙ ГРАФ ЭРДЁША-РЕНЬИ / RANDOM GRAPH / ПЛОТНОСТЬ ГРАФА / GRAPH DENSITY / МАКСИМАЛЬНЫЙ ПЛОТНЫЙ ПОДГРАФ / MAXIMAL DENSE SUBGRAPH / ERDOS-RENYI MODEL

Аннотация научной статьи по математике, автор научной работы — Кузюрин Н.Н., Лазарев Д.О.

Для описания случайных сетей используется модель случайного графа Эрдёша-Реньи. При исследовании современных случайных сетей часто требуется определить размер максимальной плотной подсети. В настоящей статье приводятся оценки максимального размера c-плотного подграфа, асимптотически почти наверно содержащегося в случайном графе. Было показано, что при, асимптотически почти наверно c-плотный; получены верхняя и нижняя оценки размера максимального -плотного подграфа, асимптотически почти наверно. содержащегося в ; а при получена оценка сверху на размер максимального с-плотного подграфа асимптотически почти наверно содержащегося в.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Analysis of size of the largest dense subgraph of random hypergraph

Random networks are often described using Erdos-Renyi model of random graph. The concept of graph density is often used in random network analysis. In this article, the maximal size of c-dense subgraph almost surely included in random graph was evaluated. It was shown, that if, then is almost surely c-dense; the upper and lower bounds for the size of maximal -dense subgraph almost surely included in were determined; in case when, the upper bound for the maximal size of c-dense subgraph almost surely included in was attained.

Текст научной работы на тему «Исследование максимального размера плотного подграфа случайного графа»

Исследование максимального размера плотного подграфа случайного графа

1,2 Н.Н. Кузюрин <nnkuz@ispras.ru> 2Д.О. Лазарев <dennis810@mail.ru> 1 Институт системного программирования им. В.П. Иванникова РАН, 109004, Россия, г. Москва, ул. А. Солженицына, д. 25 2Московский физико-технический институт, 141700, Московская область, г. Долгопрудный, Институтский пер., 9

Аннотация. Для описания случайных сетей используется модель случайного графа Эрдёша-Реньи G(n,p). При исследовании современных случайных сетей часто требуется определить размер максимальной плотной подсети. В настоящей статье приводятся оценки максимального размера c-плотного подграфа, асимптотически

почти наверно содержащегося в случайном графе GO,1). Было показано, что при

„ 1 т Ч

c < —, G(n,—) — асимптотически почти наверно c-плотный; получены верхняя и

нижняя оценки размера максимального 1 -плотного подграфа, асимптотически почти

наверно. содержащегося в G(n,—); а при c > — получена оценка сверху на размер максимального с-плотного подграфа асимптотически почти наверно содержащегося в

Ключевые слова: случайный граф; случайный граф Эрдёша-Реньи; плотность графа; максимальный плотный подграф.

DOI: 10.15514/ISPRAS-2017-29(6)-12

Для цитирования: Кузюрин Н.Н., Лазарев Д.О. Исследование максимального размера плотного подграфа случайного графа. Труды ИСП РАН, том 29, вып. 6, 2017 г., стр. 213-220. DOI: 10.15514/ISPRAS-2017-29(6)-12

1. Введение

Вероятностный метод — эффективный и широко применяемый математический метод, позволяющий доказывать существование объекта с заданными свойствами. Он заключается в оценке вероятности того, что случайный объект из заданного класса удовлетворяет нужному условию. Если доказано, что эта вероятность положительна, то объект с нужными свойствами существует. Несмотря на явную неконструктивность метода, на его основе могут быть созданы вероятностные алгоритмы построения объекта с параметрами, близкими к параметрам, оцененным с помощью вероятностного метода. Вероятностный метод — сравнительно молодой и динамически развивающийся метод, основоположником которого по праву считается выдающийся венгерский математик Пол Эрдёш. Несмотря на то, что метод применялся и до Эрдёша, например, Селёшем для доказательства

(n -1)!

существования турнира на n вершинах не менее чем с ——— гамильтоновыми

циклами, именно Пол Эрдёш в полной мере осознал его потенциал, именно ему, его ученикам и соавторам принадлежит большее число доказательств, ставших впоследствии классическими.

Различные разделы науки постоянно ставят всё новые и новые задачи, так или иначе связанные со случайными графами. Впервые случайный граф был определен в рассматриваемой в работе модели Эрдёшем и Реньи в их совместной работе [1]. Данная модель используется и по сей день при исследовании свойств объектов, связанных со случайными сетями. Широко изучается, в связи с его важной ролью в биологических и социальных сетях, также и понятие плотности графа. Например, в работе [2] приведён алгоритм нахождения плотного подграфа в гигантском графе, вроде графа цитирования в Интернете, а в работе [3] предложен алгоритм нахождения k самых плотных подграфов в динамическом графе.

Ниже приведены основные определения, которые будут многократно использоваться в работе.

Определение 1. Дан граф H с p (p>1) вершинами и q рёбрами. Его плотностью называется величина D, равная отношению количества рёбер графа к числу рёбер в полном графе с числом вершин, равным числу вершин в графе H:

D =

p( p -1)

Определение 2. Случайным графом в модели Эрдёша-Реньи, или просто случайным графом с n вершинами и вероятностью выпадения ребра, равной p, называется вероятностное пространство над пространством всех графов на n вершинах, в котором вероятность события, для любого ребра полного графа на n вершинах заключающегося в том, что оно принадлежит графу, не зависит

от аналогично определённых событий для других рёбер и равна р. Данное пространство обозначается С(п,р).

Определение 3. Скажем, что некоторое свойство выполняется асимптотически почти наверно (а.п.н.) для некоторого семейства случайных графов, если при п ^ от вероятность того, что граф на п вершинах из данного семейства обладает данным свойством стремится к 1.

Многократно используется в работе следующее неравенство, доказанное русским математиком А. А. Марковым:

Если X — случайная величина, принимающая целые неотрицательные значения, то Р(Х > 0) < Е(Х), где Р(У) — вероятность события У, а Е(X) — математическое ожидание случайной величины х.

В настоящей работе исследовался размер максимального с-плотного подграфа случайного графа в модели Эрдёша-Реньи на п вершинах ^п,1). Было доказано, что

• При с <1, ^о,1) — асимптотически почти наверно с-плотный;

• Получены верхняя и нижняя оценки размера максимального ^ 1 -плотного подграфа, а.п.н. содержащегося в ^С«,1);

• При с >1 получена оценка сверху на размер максимального с-плотного подграфа, а.п.н. содержащегося в ^О,1).

2. Максимальный размер клики в случайном графе в модели Эрдёша-Реньи

В работе [4] Эрдёшем и Боллобашем исследовался размер максимальной

клики в случайном графе ^О,1). Было установлено, что асимптотически

почти наверно данная величина имеет плотную концентрацию. Обозначим за к(п) верхнюю целую часть решения уравнения

« 12 12 > = 1; к (п) = (1 + о(1)) п

Тогда имеет место следующее утверждение: TeopeMa.(Erdos and Bollobas, 1 равен либо k (и), либо к(и) -1.

TeopeMa.(Erdos and Bollobas, 1976). Размер максимальной клики в ^и,1) а.п.н.

Kuzyrin N.N., Lazarev D.O. Analysis of size of the largest dense subgraph of random hypergraph. Trudy ISP RAN/Proc. ISPRAS, vol. 29, issue 6, 2017, pp. 213-220

Идея доказательства: оценка сверху получается вычислением математического ожидания числа клик размера k графа Gin,1); для оценки снизу требуется воспользоваться методом второго момента.

3. Оценки размера максимального c-плотного подграфа случайного графа G(n,c) при различных значениях c

Обозначим за k(n,c), при c >1 наименьшее целое решение неравенства:

n) Pr(Bi (2 > {2)}>1

где Bi(n, p) — биномиальное распределение с параметрами n и p, а Pr(—

вероятность события X.

Теорема.

1) При c <1 сам случайный граф а.п.н. c-плотный.

2) При c =1 выполняется:

n

а) При k = ——, где f (n) ^ да произвольно медленно при n ^ да,

j(n)

1 i граф G(n,—) а.п.н. содержит -- плотный подграф размера k.

, n n In n n , , , n , ,

б) ПРи k = 4 "V ~r i In-nhhta n "V 32lnn taln n

3s = 1, 3N0 : Vn > N0, верно: рг[о(п,1) содержит 1 - плотный подграф размера k^ >s

3) При1 < c < 1, размер максимального с-плотного подграфа графа GO,1) а.п.н.

не превосходит k(n, c) +1. Доказательство.

Г n) Г п

1) Оценив соотношение соседних биномиальных коэффициентов 1.1 и\

k I 1 k +1)

можно установить верность следующей леммы: Лемма.

Pr( Bi| n,1 |> cn) e

2-\n Ii-c ,2"

cn c

cn

Пусть m = ^иJ. Число рёбер в случайном графе G(n, p) имеет биномиальное

(иЛ ( и Л

распределение Bi(m, p). Используя равенство КМ А и лемму, можно получить:

Pr^Bi(m, 1) > c^j = 1 - Pr^Bi(m, 1) > (1 - c)m^ ^ 0, m ^ <x Следовательно, G(n,1) — а.п.н. c-плотный.

2) а) Заметим, что

Pr( плотность G(n,1) > 1\ > 1

Разобьём вершины графа GO,1) на [f (и)] множеств размера либо

^лиЦ^1.

f (и).

+1. Вероятность того, что каждый из подграфов,

порождённых этими множествами вершин, имеет плотность, меньшую —, не превосходит 1. Стало быть, вероятность того, что ни один из подграфов не

имеет плотность £ >1 не превосходит 24(п) ^ 0, « Следовательно, граф

1 1 0(п,-) а.п.н. содержит --плотный подграф размера ^ что и требовалось

доказать.

б) В работе [5] Боллобаш, в частности, показывает, что, если за Ап обозначить событие, заключающееся в том, что степень каждой вершины 0(п,1) — не

и

менее, чем

2 V 2 Vln и V 32ln и

при и ^ да; также известно, что

и ln и и и , , , ,

fc |П|П и 132Ьи hh и, то ^ 1

рг(2 >2,

следовательно ^N0 :

Pr |(ниоднавершинаG (n, 1) неимеетстепеньменьше " -ln ln ln n - J32^n ln

(D(G(n,i))£i))

П

1

для всех n > N0. Рассмотрим подмножество H множества вершин графа

1 3n n In n n n

GO,-) размером не менее M = T + ]^2~ + \knlnlnlnn + n и

дополнительное к нему множество H'. Из любой вершины H в H идёт по

крайней мере n рёбер. Значит, суммарное число рёбер в подграфах GO1)

4 2

,порождённых множествами вершин H и H ' не превосходит

n(n -1) (n - M )n n(M -11 (h - M - 1)(и - M) M(M -1)

---= - <--1--

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

4 4 4 4 4

Значит, либо плотность подграфа GO,1), порождённого множеством вершин

1 1 H менее -, либо плотность подграфа G(-,—), порождённого множеством

вершин H' менее 1, что и требовалось доказать.

3) Вычислим E(n,k,c) - математическое ожидание количества порождённых подграфов размера k случайного графа GO,1), имеющих плотность, не меньше c:

E(n, k, c) = |n) Pr(плотностьслучайного графа на k вершинах > c)

" н>Ш<

Г k)

Решая уравнение E(n,k,c) = 1, и учитывая, что, по Лемме(обозначим II за m)

Pr(Bi\m, 1) > cm) e

Г m ) 1 - c Г m

2-m I I—, 2-m I

\ cm) c \cm

,получаем:

k (n, c) = (1 + o(1))21og

Для нахождения верхней оценки размера максимального с-плотного подграфа случайного графа, учитывая соотношение, которое может быть получено анализом выражения E(n,k,c):

Е(п, к (п, с) +1, с) 1 Е(п, к (и, с), с) п

выполняющееся для любого с >1 при любом п > Мс, можем получить, что

1 1 Е(и, к(п, с) +1, с) < — Е (п, к(п, с) + 1, с) < -. Стало быть, по неравенству Маркова,

п п

Рг^существуетподграф п,1 ^ на к(п,с) +1 вершина^ ^ 0, при п ^да . ■

Стоит отметить, что, так как 2cC (1 - c)1-c ^ 2 при c ^ 1, то при c = 1 настоящий результат совпадает с результатом, полученным Боллобашем в работе [4]: k = (1 + o(1))2log2 n для плотности подграфа, равной 1.

Список литературы

[1]. P.Erdos and A. Renyi. On Random Graphs. Publicationes Mathematicae (Debrecen), Vol. 6, 1959, pp. 290-297.

[2]. D.Gibson, R.Kumar and A.Tomkins. Discovering Large Dense Subgraphs in Massive Graphs. Proceedings of the 31st international conference on Very large data bases, 2005, pp. 721732.

[3]. Valari E., Kontaki M., Papadopoulos A.N. Discovery of Top-k Dense Subgraphs in Dynamic Graph Collections. In: Ailamaki A., Bowers S. (eds) Scientific and Statistical Database Management. SSDBM 2012, Lecture Notes in Computer Science, vol 7338. Springer, Berlin, Heidelberg, pp 213-230, DOI: 10.1007/978-3-642-31235-9_14.

[4]. B. Bollobas and P. Erdos. Cliques in Random Graphs. Mathematical Proceedings of the Cambridge Philosophical Society, Volume 80, Issue 3, 1976, pp. 419-427, DOI: 10.1017/S0305004100053056.

[5]. B. Bollobas. Degree sequences in Random Graphs. Discrete Mathematics, Volume 33, Issue 1, 1981, pp. 1-19, DOI: 10.1016/0012-365X(81)90253-3.

Analysis of size of the largest dense subgraph of random

hypergraph

1,2 N.N. Kuzyrin <nnkuz@ispras.ru> 2 D.O. Lazarev <dennis810@mail.ru> 1 Ivannikov Institute for System Programming of the Russian Academy of Sciences, 25, Alexander Solzhenitsyn st., Moscow, 109004, Russia 2 Moscow Institute of Physics and Technology, Dolgoprudnyj, Institutskij alley, Moscow region, 141700, Russia

Abstract. Random networks are often described using Erdos-Renyi model of random graph C(n,p). The concept of graph density is often used in random network analysis. In this

article, the maximal size of c-dense subgraph almost surely included in random graph Gin,1) was evaluated. It was shown, that if c < 1 , then Gin,1) is almost surely c-dense; the upper and lower bounds for the size of maximal 1 -dense subgraph almost surely included in G(n,-^) were determined; in case when c >1, the upper bound for the maximal size of c-dense subgraph almost surely included in G(n,-^) was attained.

Keywords: random graph; Erdos-Renyi model; graph density; maximal dense subgraph.

DOI: 10.15514/ISPRAS-2017-29(6)-12

For citation Kuzyrin N.N., Lazarev D.O. Analysis of size of the largest dense subgraph of random hypergraph. Trudy ISP RAN/Proc. ISP RAS, vol. 29, issue 6, 2017. pp. 213-220 (in Russian). DOI: 10.15514/ISPRAS-2017-29(6)-12

References

[1]. P.Erdos and A. Renyi. On Random Graphs. Publicationes Mathematicae (Debrecen), Vol. 6, 1959, pp. 290-297.

[2]. D.Gibson, R.Kumar and A.Tomkins. Discovering Large Dense Subgraphs in Massive Graphs. Proceedings of the 31st international conference on Very large data bases, 2005, pp. 721732.

[3]. Valari E., Kontaki M., Papadopoulos A.N. Discovery of Top-k Dense Subgraphs in Dynamic Graph Collections. In: Ailamaki A., Bowers S. (eds) Scientific and Statistical Database Management. SSDBM 2012, Lecture Notes in Computer Science, vol 7338. Springer, Berlin, Heidelberg, pp 213-230, DOI: 10.1007/978-3-642-31235-9_14.

[4]. B. Bollobas and P. Erdos. Cliques in Random Graphs. Mathematical Proceedings of the Cambridge Philosophical Society, Volume 80, Issue 3, 1976, pp. 419-427, DOI: 10.1017/S0305004100053056.

[5]. B. Bollobas. Degree sequences in Random Graphs. Discrete Mathematics, Volume 33, Issue 1, 1981, pp. 1-19, DOI: 10.1016/0012-365X(81)90253-3.

i Надоели баннеры? Вы всегда можете отключить рекламу.