Научная статья на тему 'О кластеризации условного конфигурационного графа'

О кластеризации условного конфигурационного графа Текст научной статьи по специальности «Математика»

CC BY
121
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
СЛУЧАЙНЫЙ КОНФИГУРАЦИОННЫЙ ГРАФ / RANDOM CONFIGURATION GRAPH / УСЛОВНЫЙ ГРАФ / CONDITIONAL GRAPH / КЛАСТЕРНЫЙ КОЭФФИЦИЕНТ / CLUSTERING COEFFICIENT / ПРЕДЕЛЬНЫЕ ТЕОРЕМЫ / LIMIT THEOREMS

Аннотация научной статьи по математике, автор научной работы — Павлов Юрий Леонидович

Рассматриваются конфигурационные графы с N вершинами. Степени вершин являются независимыми одинаково распределенными ограниченными случайными величинами. Они равны числу занумерованных в произвольном порядке полуребер. Граф строится путем попарного равновероятного соединения полуребер для образования ребер. Изучается подмножество таких случайных графов при условии, что сумма степеней известна и равна п. Важной характеристикой топологии графа является локальный кластерный коэффициент. При N, n → ∞ найдены предельные распределения локального кластерного коэффициента и числа треугольников одной вершины. Мы рассмотрели также предельное поведение их математических ожиданий.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ON CLUSTERING OF CONDITIONAL CONFIGURATION GRAPHS

We consider configuration graphs with N vertices. The degrees of the vertices are independent identically distributed limited random variables. They are equal to the number of vertex semiedges that are numbered in an arbitrary order. The graph is constructed by joining all of the semiedges pairwise equiprobably to form edges. We study the subset of such random graphs under the condition that the sum of vertex degrees is known and it is equal to n. An important characteristic of the topology of a graph is the local clustering coefficient. We obtained the limit distributions of the local clustering coefficient and the number of triangles of each vertex as N and n tend to infinity. We also considered the limit behaviour of their mathematical expectations.

Текст научной работы на тему «О кластеризации условного конфигурационного графа»

Труды Карельского научного центра РАН №7. 2018. С. 57-61 DOI: 10.17076/mat780

УДК 519.179.4

О КЛАСТЕРИЗАЦИИ УСЛОВНОГО КОНФИГУРАЦИОННОГО ГРАФА

Ю. Л. Павлов

Институт прикладных математических исследований КарНЦ РАН, ФИЦ «Карельский научный центр РАН», Петрозаводск, Россия

Рассматриваются конфигурационные графы с N вершинами. Степени вершин являются независимыми одинаково распределенными ограниченными случайными величинами. Они равны числу занумерованных в произвольном порядке полуребер. Граф строится путем попарного равновероятного соединения полуребер для образования ребер. Изучается подмножество таких случайных графов при условии, что сумма степеней известна и равна п. Важной характеристикой топологии графа является локальный кластерный коэффициент. При N, п ^ œ найдены предельные распределения локального кластерного коэффициента и числа треугольников одной вершины. Мы рассмотрели также предельное поведение их математических ожиданий.

Ключевые слова: случайный конфигурационный граф; условный граф; кластерный коэффициент; предельные теоремы.

Yu. L. Pavlov. ON CLUSTERING OF CONDITIONAL CONFIGURATION GRAPHS

We consider configuration graphs with N vertices. The degrees of the vertices are independent identically distributed limited random variables. They are equal to the number of vertex semiedges that are numbered in an arbitrary order. The graph is constructed by joining all of the semiedges pairwise equiprobably to form edges. We study the subset of such random graphs under the condition that the sum of vertex degrees is known and it is equal to n. An important characteristic of the topology of a graph is the local clustering coefficient. We obtained the limit distributions of the local clustering coefficient and the number of triangles of each vertex as N and n tend to infinity. We also considered the limit behaviour of their mathematical expectations.

Keywords: random configuration graph; conditional graph; clustering coefficient; limit theorems.

Введение

В работе [4] были введены конфигурационные графы, широко использующиеся в настоящее время для моделирования сложных сетей коммуникаций (см., например, [5]). Мы будем рассматривать конфигурационные гра-

фы с N вершинами, степени которых являются независимыми одинаково распределенными случайными величинами £i,...,£n. Обозначим £ случайную величину, равную степени любой вершины графа, и пусть

pk = P{£ = k}, k = 1,2,... (1)

Степень вершины равна числу выходящих из нее различимых полуребер. Понятно, что сумма степеней вершин любого графа должна быть четной, поэтому в случае необходимости в граф вводится дополнительная вершина единичной степени. В статье [6] отмечается, что появление такой вспомогательной вершины не влияет на асимптотические свойства графа при стремящемся к бесконечности числе вершин. Граф строится путем попарного равновероятного соединения полуребер друг с другом для образования ребер. Легко видеть, что такие графы могут содержать петли и кратные ребра.

Далее мы будем изучать условные конфигурационные графы при условии, что сумма степеней известна и равна п. Такие условные графы впервые рассматривались в [2]. В последние годы опубликован ряд работ, в которых исследовалось предельное поведение степенной структуры условных конфигурационных графов при различном характере стремления N и п к бесконечности (см. [1, 3] и библиографию в них).

Важной характеристикой топологии графа является кластерный коэффициент, впервые введенный в [7]. Локальным кластерным коэффициентом вершины г, имеющей степень ¿г, 1 ^ г ^ N называется величина

C (i) =

2Ti

di(di - 1):

(2)

1

N

C = ^E C

i=1

Полученные результаты являются только первым шагом в исследовании процессов кластеризации в условных конфигурационных графах.

Результаты

Введем обозначения:

т = Е£, ст2 = (4)

Ниже доказаны следующие утверждения.

Теорема 1. Пусть N п ^ ж, п > N, тах £ = 0(1). Тогда для любого г, 1 ^ г ^ N, справедливы следующие соотношения:

Р{Т = 0} =

= 1 -

(m - 1)2(ст2 + m2 - m)

2П3

P{Ti = 1} =

1 + O -n

(m — 1)2(ст2 + m2 — m) f Q f 1 2n3 \ \n

P{Ti = k} = O(n-3k), k> 1;

ETi

(m - 1)2(ст2 + m2 - m)

2П3

1 + O -

n

где Тг - число пар соседей вершины г, соединенных друг с другом хотя бы одним ребром. Понятно, что под соседом вершины понимается любая другая смежная с ней вершина. Заметим, что Тг равно числу различных треугольников, одной из вершин которых служит вершина г, а стороны - ребра графа, которые могут быть и кратными. Коэффициент С (г) можно рассматривать как вероятность того, что два различных соседа вершины г тоже являются соседями друг другу. Кроме локального кластерного коэффициента (2) используется также средний локальный кластерный коэффициент:

Теорема 2. Пусть выполнены условия теоремы 1. Тогда для любого i, 1 ^ i ^ N, и всех j, 2 ^ j ^ max£, справедливы следующие соотношения:

P{C (i) = 0} =

=1

(m - 1)2(ст2 + m2 - m)

2П3

P C(i) = 1/

1 + O -

n

A (m - 1)2

2У n3 j !+ O("

P C(i) = к/1 2 I j = O(n-6), 2 < k < v 21, EC =(m - 1)2(1 - P1> ^ + o( 1

n3

n

(3) Доказательства теорем

В данной статье при N п ^ ж изучается предельное поведение Тг,С(г) и С. В теореме 1 найдены асимптотики распределения Тг, и ЕТг, а в теореме 2 рассматриваются С (г) и ЕС. В следующем разделе приводятся формулировки теорем 1 и 2, а в последнем разделе статьи собраны доказательства этих теорем.

Пусть выполнены условия теоремы 1. По формуле полной вероятности

Р{Тг = к} = £ Р{Тг = Щг = Яр. (5)

Очевидно, что

Р{Тг = 0|& = 1} = 1. (6)

58

j

2

Рассмотрим пару смежных ребер, соединенных вершиной г. Обозначим д вероятность события 5, состоящего в том, что другие концы этих ребер являются смежными, т. е. соединенными хотя бы одним ребром. Пусть и - степени этих концевых вершин. Понятно, что

q = Ej>2 p{S|di = d2 = 1} x

(7)

поскольку

P{S |di = 2,d2 = 2}

1

(n - 7)!! (n - 1)!!

(n - 1)(n - 3)(n - 5)' Рассуждая аналогично, получаем, что

P{S |di = 2,d2 = 3} =

P{S|di = 2,d2 = 1} =

2

(n - 1)(n - 3)(n - 5)

I- 1

(n - 1)(n - 3)(n - 5)'

l>2

P2 (P2 + 2рз + 3p4 + ...)

P2(m - 1)

(m - 1)2

х Р{^1 = ¿, = 1},

= 1,^2 = 1} = 0,

Р{£|^1 = ¿,¿2 = 1} = 0.

Нетрудно видеть, что число всех возможных различных способов построения рассматриваемого графа равно (п — 1)(п — 3) ■ ... ■ 3 ■ 1 = (п — 1)!! и все такие реализации графа равновероятны. Поэтому

(n - 1)(n - 3)(n - 5)'

Вернемся к случайной величине Tj. Если степень вершины i равна двум, то у этой вершины может быть петля. Если это не так, то возможны два случая: соседи вершины i могут быть или не быть смежными. Поэтому

P{T=0|i.=2} = £т-§ +

+ (П - 2)(П - 3)"(1 - q) = 1 - q + q

(n - 1)!! Отсюда и из (8) получаем, что

P{T = 0|6 = 2} =

^ Л + o(n

n3 V V n

n — 1

(9)

Далее находим:

p{T = о|& = 3} =

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

n — 1

+

+ (n - 3)(n - 4)(n - 5)!! (1 - «)(2) = = ! - (^im-])! (,+о ( 1

n

(10)

n3

Тогда, в силу независимости степеней вершин, ^ P{S |di = 2, d2 = 1}P{di = 2, d2 = 1} =

Здесь и далее мы используем факт, что, в силу (8), для любого натурального £ > 2

(1 — д)(2) = 1 — (2)д + °(п-6).

Если = 4, то вершина г может иметь две петли, или одну петлю, или ни одной. Учитывая это, с помощью (8) выводим:

(n - 1)(n - 3)(n - 5) (n - 1)(n - 2)(n -Таким же образом приходим к выводу, что

5)

P{T = 0|& = 4} =

= 1 -I Tï^ Г1 + о( 1

(11)

n3

n

£ P{S|di = j, d2 = 1}P{di = j, d2 = 1}

= (j - 1)Pj(m - 1) (n - 1)(n - 2)(n - 5).

Отсюда и из (1), (4) и (7) следует:

Повторяя эти рассуждения, из (6), (8)-(11) и условия тах£ = 0(1) по индукции заключаем:

р{т = о& = ¿} =

(12)

= 1—а " ^ (1+о (1"

n3

n

q

(m - 1)(p2 + 2p3 + ...) (n - 1)(n - 3)(n - 5)

поэтому из (1), (4) и (5) при k = 0 следует: Р{Тг = 0} =

и

1 -E j^i!+o( 1I i*

j>i

n

(13)

^ (m - 1)2(ст2 + m2 - m) Л ^ /1 2n3 \ \ n

что и доказывает первое утверждение теоремы 1.

Положим теперь к = 1 в (5). Очевидно, что Р{Тг = 1|& = 1} = 0. (14)

Легко видеть также, что, в силу (8),

Р{Тг = 1* =2} = . =

n 1 n3

n

p{Ti = 1й = 3} = |3У" - 4><n-3>" x

2) (n - 1)!!

x q(1 - q)2 =

2 _ (3\ (m - 1)2

2 n3

1 + O\ 1

n

и, в более общем виде, с учетом (14), при ] ^ 1 Р{Тг = 1|& = ;} =

(15)

A (m - 1)2 2 n3

1 + O[ 1

n

Тогда, согласно (5),

Р{Тг = 1} =

(т - 1)2(ст2 + т2 - т) = 2Й3

(16)

1 + O( -n

Следуя той же схеме доказательства, получаем, что

Р{Тг = 2|& = 3} =

= (п - 4)(п - 3)!! о = 0 (}_ (п -1)!! 4 0^п6

и, аналогично, для всех ] > 3

p{Ti = 2iCi = j} = O[~, ). (17)

Поэтому

P{T = 2} = ^ ).

Общий случай, как легко видеть, теперь выглядит так:

Р{Тг = к} = 0(п-3к), к ^ 2, (18)

что и приводит к третьему утверждению теоремы. Последнее утверждение очевидным образом следует из равенства

ETi = E kP{Ti = к}

к^0

и из (13), (16) и (18). Теорема 1 доказана.

Пусть выполнены условия теоремы 2. Из (12) следует, что

Р{С (г) = 0} = £ Р{Тг = 0|6 = Лр =

£(! - С\ + 0 ('^ а =

j>1

2n

3

n

(19)

^ (т - 1)2(ст2 + т2 - т) Л 0(1 2п3 \ \п

поэтому первое утверждение теоремы доказано. Используя (2), (15) и (18), легко понять, что

P{C(i) = 1} = £ ^ Ti j>2

ii = n Pj

(20)

= ^ (1+Чп)) +о(£'.

Опять используя (15), получаем, что

P C(i) = 1/

= P{Ti = 1 i ii = 3}P3 =

3\ (m - 1)2 Л

u Рз 1 + O -

n3

n

и, обобщая на все j, 3 ^ j ^ max £,

P C(i) = 1/

(21)

^ (m - 1)2pj (1 + o( 1

n3

n

откуда и вытекает второе утверждение теоремы. Третье очевидным образом следует из (17). Переходим наконец к оценке математического ожидания С (г) с помощью (19)-(21):

ЕС(.) = £ ^^Р, (1+ О (1

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

j>2

n3

n

60

j

2

(m - 1)2(1 - pi)

n3

-Pj

1 + O -n

Отсюда и из (3) очевидным образом следует последнее утверждение теоремы 2.

Финансовое обеспечение исследований осуществлялось из средств федерального бюджета на выполнение государственного задания КарНЦ РАН (Институт прикладных математических исследований КарНЦ РАН) и при финансовой поддержке РФФИ (проект № 16-01-0005а).

Литература

1. Павлов Ю. Л. Условные конфигурационные графы со случайным параметром степенного распределения степеней // Математический сборник. 2018. Т. 209, вып. 2. С. 120-137. аок 10.4213/эт8832

2. Павлов Ю. Л., Чеплюкова И. А. Случайные графы интернет-типа и обобщенная схема размещения // Дискретная математика. 2008. Т. 20, вып. 3. С. 3-18. ао1: 10.4213/^1008

3. Павлов Ю. Л., Чеплюкова И. А. Об асимптотике степенной структуры конфигурационных графов с ограничениями на число ребер // Дискретная математика. 2018. Т. 30, вып. 1. С. 21-39. doi: 10.4213/dm1445

4. Bollobas B. A probabilistic proof of an asymptotic formula for the number of labelled regular graphs // European J. Comb. 1980. Vol. 1, iss. 4. P. 311-316. doi: 10.1016/S0195-6698(80)80030-8

5. Hofstad R. Random Graphs and Complex Networks. Vol. 1. Cambridge University Press, 2017. 337 p.

6. Reittu H., Norros I. On the power-law random graph model of massive data networks // Performance Evaluation. 2004. Vol. 55, iss. 4. P. 3-23. doi: 10.1016/S0166-53/6(3)00097-x

7. Watts D. J., Strogats S. Collective dynamics of "small-world"networks // Nature. 1998. Vol. 393(6684). P. 440-442. doi: 10.1038/30918

Поступила в редакцию 19.02.2018

References

1. Pavlov Yu. L. Conditional configuration graphs with random parameter of the power-law degree distribution. SB MATH. 2018. Vol. 209. doi: 10.1070/sm8832 (in print).

2. Pavlov Yu. L., Cheplyukova I. A. Random graphs of Internet type and the generalised allocation scheme. Discrete Mathematics and Applications. 2008. Vol. 18, iss. 5. P. 447-464. doi: 10.1515/DMA.2008.033

3. Pavlov Yu. L., Cheplyukova I. A. Ob asimptotike stepennoi struktury konfiguratsion-nykh grafov s ogranicheniyami na chislo reber [On the asymptotics of degree structure of configuration graphs with restrictions on the number of edges]. Discrete Mathematics and Applications (in print).

4. Bollobas B. A probabilistic proof of an asymptotic formula for the number of labelled regular graphs. European J. Comb. 1980. Vol. 1, iss. 4. P. 311-316. doi: 10.1016/S0195-6698(80)80030-8

5. Hofstad R. Random Graphs and Complex Networks. Vol. 1. Cambridge University Press, 2017. 337 p.

6. Reittu H., Norros I. On the power-law random graph model of massive data networks. Performance Evaluation. 2004. Vol. 55, no. 4. P. 3-23. doi: 10.1016/S0166-53/6(3)00097-x

7. Watts D. J., Strogats S. Collective dynamics of "small-world" networks. Nature. 1998. Vol. 393(6684). P. 440-442. doi: 10.1038/30918

Received February 19, 2018

СВЕДЕНИЯ ОБ АВТОРЕ:

CONTRIBUTOR:

Павлов Юрий Леонидович

главный научный сотрудник, д. ф.-м. н., проф. Институт прикладных математических исследований КарНЦ РАН, Федеральный исследовательский центр «Карельский научный центр РАН» ул. Пушкинская, 11, Петрозаводск, Республика Карелия, Россия, 185910 эл. почта: pavlov@krc.karelia.ru тел.: (8142) 781218

Pavlov, Yury

Institute of Applied Mathematical Research,

Karelian Research Centre,

Russian Academy of Sciences

11 Pushkinskaya St., 185910 Petrozavodsk,

Karelia, Russia

e-mail: pavlov@krc.karelia.ru

tel.: (8142) 781218

i Надоели баннеры? Вы всегда можете отключить рекламу.