Научная статья на тему 'МОДЕЛИ СЕТЕЙ С ПРЕДПОЧТИТЕЛЬНЫМ ПРИСОЕДИНЕНИЕМ'

МОДЕЛИ СЕТЕЙ С ПРЕДПОЧТИТЕЛЬНЫМ ПРИСОЕДИНЕНИЕМ Текст научной статьи по специальности «Математика»

CC BY
96
12
i Надоели баннеры? Вы всегда можете отключить рекламу.
Область наук
Ключевые слова
модели комплексных сетей / масштабно-инвариантные сети / механизм предпочтительного присоединения / complex network analysis / scale-free networks / networks models / preferential attachment

Аннотация научной статьи по математике, автор научной работы — Щербакова Наталья Григорьевна

В статье представлен краткий обзор механизмов генерации и роста, свойственных реальным комплексным сетям. Основное внимание уделено моделям, порождающим масштабноинвариантные сети.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

MODELS OF NETWORKS WITH PREFERENTIAL ATTACHMENT

Modeling is one of the methods of analyzing organizational principles of complex networks that define their topology and behavior. Traditionally networks with no apparent design principles were described as random graph that were first studied by Paul Erdos and Alfred Renvi fl, 2]. But it is known that the topology of real networks deviates from a random graph and many of them self-organize into scale-free (SF) state. The basic motivation of main theoretical models that come under review in this article is to explain the origin of this scale invariance. The example of a network with in-degree and out-degree power-law distribution is the citation network observed by Derek de Sofia Price in [4, 5]. He discovered that in order the network to have these properties the rate at which a paper gets new citations should be proportional to the number that it already has. He called the process cumulative advantage. Now it is known as preferential attachment due to [6]. Barabasi-Albert model (BA) incorporates two ingredients: growth and preferential attachment. The algorithm of network evolving starts with m0 nodes and at each step one new node with m < mo is added. When choosing nodes to which the new node connects it is assumed that the probability П that the new node will be connected to node i depends on the degree ki hi of node i such that П (ki) = . Analytical studying predicts the emergence of power law degree kj distribution P(k) k3. BA model lays the foundation of many extensions and modifications motivated by the reason that it can’t explain a behavior of all real-world SF networks. Thus in [15] the model with edges rewire have been introduced. Krapviskv, Redner in [13] have examined the initial attractiveness n((ki) = C + ki) and the case where probability of attachment to a node is not linear. In [12, 17, 18] the effect of ageing have been investigated and the extended models have been suggested. In the BB-model [20, 21] parameter fitness of the node accounts for the competitive aspect of link obtaining. These added parameters have an effect on a network behavior and can vary the law of degree distribution.

Текст научной работы на тему «МОДЕЛИ СЕТЕЙ С ПРЕДПОЧТИТЕЛЬНЫМ ПРИСОЕДИНЕНИЕМ»

MODELS OF NETWORKS WITH PREFERENTIAL

ATTACHMENT

N. G. Shcherbakova

Institute of Computational Mathematics and Mathematical Geophysics SB EAS,

630090, Novosibirsk, Russia

Modeling is one of the methods of analyzing organizational principles of complex networks that define their topology and behavior. Traditionally networks with no apparent design principles were described as random graph that were first studied by Paul Erdos and Alfred Renvi fl, 2]. But it is known that the topology of real networks deviates from a random graph and many of them self-organize into scale-free (SF) state. The basic motivation of main theoretical models that come under review in this article is to explain the origin of this scale invariance.

The example of a network with in-degree and out-degree power-law distribution is the citation network observed by Derek de Solla Price in [4, 5]. He discovered that in order the network to have these properties the rate at which a paper gets new citations should be proportional to the number that it already has. He called the process cumulative advantage. Now it is known as preferential attachment due to [6]. Barabasi-Albert model (BA) incorporates two ingredients: growth and preferential attachment. The algorithm of network evolving starts with m0 nodes and at each step one new node with m < m0 is added. When choosing nodes to which the new node connects it is assumed that the probability n that the new node will be connected to node i depends on the degree

ki

ki of node i such that n (ki) = . Analytical studving predicts the emergence of power law degree

l^j kj

distribution P(k) ~ k3.

BA model lays the foundation of many extensions and modifications motivated by the reason that it can't explain a behavior of all real-world SF networks. Thus in [15] the model with edges rewire have been introduced. Krapviskv, Redner in [13] have examined the initial attractiveness n((ki) = C + ki) and the case where probability of attachment to a node is not linear. In [12, 17, 18] the effect of ageing have been investigated and the extended models have been suggested. In the BB-model [20, 21] parameter fitness of the node accounts for the competitive aspect of link obtaining. These added parameters have an effect on a network behavior and can vary the law of degree distribution.

Key words: complex network analysis, scale-free networks, networks models, preferential attachment.

References

1. Erdos P., renyi A. On random graphs // Publicationes Mathematicae Debrecen. V. 6. 1959. P. 290-297.

2. Erdos P., renyi A. On the evolution of random graphs // Bull. Inst. Internat. Statist. V. 38, № 4. 1961. P. 343-347.

3. Watts D. J., Strogatz S.H. Collective dynamics of "small-world" networks // Nature. 1998. V. 393. P. 440-442.

4. Price D. J. de Solla. Networks of Scientific Papers // Science. 1965. V. 149. P. 510-515.

5. Price D.J. de Solla. A general theory of bibliometric and other cumulative advantage processes // J. of the American Society for Information Science. 1976. V. 27(5-5). P. 292-306.

© N. G. Shcherbakova, 2019

6. barabasi A.-L., Albert R. Emergence of scaling in random networks // Science. 1999. V. 286. P. 509-512.

7. Barabasi A.-L., Albert R., Jeong H. Mean-field theory for scale-free random networks // Phvsica A 272. 1999. P. 173-187.

8. Albert R., Barabasi A.-L. Statistical mechanics of complex networks // Rev. Mod. Phvs. 2001.V. 47, N. 74. P. 47-97.

9. dorogovtsev S. N., Mendes J. F. F. Evolution of networks // Advances in Phvs. 2002. V. 51, 1079.

10. Dorogovtsev S. N., Mendes J. F. F., Samukhin A. N. Structure of growing network with preferential attachment // Phvs. Rev. Lett. 2000. V. 85, 4633.

11. Kullmann L., KertESZ J. Preferential growth: exact solution of the time dependent distributions // Phvs. Rev. E. 63.051112. 2001.

12. Krapvisky P.L., Redner S., Leyvraz F. Connectivity of growing random networks // Phvs. Rev. Lett. V. 85, 4629. 2000.

13. Krapvisky P. L., Redner S. Organization of growing random networks // Phvs. Rev. E 63, 066123. 2001.

14. Albert R., Jeong H., Barabasi A.-L. Error and attack tolerance of complex networks // Nature. 2000. V.406. P. 378-482.

15. Albert R., Barabasi A.-L. Topology of evolving networks: local events and universality // Phvs. Review Letters. 2000. V. 85. P. 5234-5237.

16. Dorogovtsev S. N., Mendes J. F. F. Scaling behavior of developing and decaying networks // Europhes. Lettr. 2000. V.52, N. 3. P. 33-39.

17. Dorogovtsev S.N., Mendes J.F.F. Evolution networks with aging of sites // Phvs. Rev. E62, 1842. 2000.

18. Zhu H., Wang X., Zhu J-Y. The effect of aging on network structure // Phvs. Rev. E 68, 056121. 2003.

19. Hajra К. В., Sen P. Phase transitions in an aging network // Phvs. Rev. E 70, 056103. 2004.

20. BlANCONl G., Barabasi A.-L. Bose-Einstein condensation in complex networks // Phvs. Rev. Lett. 86, 5632. 2001.

21. Bianconi G., Barabasi A.-L. Competition and multiscaling in evolving networks // Europhvsics Letters, 54: 436-442, 2001.

22. Ergun G, Rodgers G. J. Growing random network with fitness // arXiv: cond-mat/0103423.

23. Wang D., Song C., Barabasi A.-L. Quantifying long-term scientific impact // Science. 2013. V.342. P. 127-131.

24. VAZQUEZ A. Knowing a network by walking on it: emergence of scaling // arXiv:cond-mat/0006132.

25. McGlohon XL. Akoglu L., Faloutsos C. Weighted graphs and disconnected components // PAKDD'10 Proc. of the 14th Pacific-Asia conference on advances in knowledge discovery and data mining. 2010. Vol. P. 2. P. 410-421.

26. Kumar R., Raghavan P., Rajagopalan S., Sivakumar I).. Tomkins A., Uppal E. Stochastic models for the Web graph // Proc. of the 41th IEEE svmp. on foundations of computer science. 2000. P. 57-65.

27. Leskovec J., Kleinberg J. XL. Faloutsos C. Graph evolution: Densification and shrinking diameters // ACM Transactions on Knowledge Discovery from Data (TKDD). 2007. V. 1, iss. 1. Art. 2.

© N. G. Shcherbakova, 2019

МОДЕЛИ СЕТЕЙ С ПРЕДПОЧТИТЕЛЬНЫМ ПРИСОЕДИНЕНИЕМ

Н. Г. Щербакова

Институт вычислительной математики и математической геофизики СО РАН,

630090, Новосибирск, Россия

УДК 519.177

В статье представлен краткий обзор механизмов генерации и роста, свойственных реальным комплексным сетям. Основное внимание уделено моделям, порождающим масштабно-инвариантные сети.

Ключевые слова: модели комплексных сетей, масштабно-инвариантные сети, механизм предпочтительного присоединения.

Введение. Моделирование является одним из методов анализа организационных принципов комплексных сетей, определяющих их топологию и функционирование. Модели призваны объяснить процессы, управляющие эволюцией реальных сетей. Базовые идеи были изложены в работах [1, 2] в виде двух ER-моделей порождения случайных графов (сетей). Модель G(n,m) го всех графов с n вершинами и m ребрами равновероятно выбирается любой. Согласно ER-модели G(n,p) граф порождается. Первоначально имеется n изолированных вершин. Ребро появляется с вероятностью Per независимо от других ребер. Вероятность того, что вершина будет иметь степень k, следует распределению Пуассона

P (k) =e-AAk/kl,

где A = Ck_iPeR(1 — pER)n-l-k■ Обычно термин "случайный граф" без уточнения относится именно к графам или сетям, порожденным согласно одной из этих моделей.

Модель WS, представленная в работе [3], предполагает построение случайного гра-

n

k

ближайшими соседями, k/2 с каждой стороны, число ребер kn/2. Переключаемое ребро выбирается с вероятностью pws (не допускаются петли и кратные ребра), вершина, к которой происходит переключение, выбирается случайным образом. При pws ^ 1 распре-

k

деление степеней стремится к распределению, свойственному модели ER с pER = —. Сети,

n

построенные согласно И'.S'-.модели. обладают структурными свойствами "малого мира":

n

пропорционально log n; большой коэффициент кластеризации.

Модели ER и WS предполагают, что число вершин зафиксировано изначально, а вероятности pER и pws не зависят от степени вершин. Распределение степеней вершин соответствующих графов имеет экспоненциальный хвост. При исследовании реальных сетей выясняется, что они, как правило, имеют другое распределение степеней узлов. Так, в

© Н. Г. Щербакова, 2019

работе [4] показано, что сеть научных публикаций обладает свойством: доля научных публикаций, получивших k цитирований (для больших k), уменьшается как k-7, 2 < y < 3, То есть вероятность того, что узел имеет входящую степень k, подчиняется степенному закону:

P(k) - k-Y. (1)

Сеть, для которой распределение степеней следует степенному закону (обычно подразумевается, что 2 < y < 3), называемую безмасштабной (scale free) или масштабно-инвариантной (scale-invariantl), обозначим как SF-сеть. Механизм, приводящий к тому, что распределение цитирований подчиняется степенному закону, назван в работе [5] "cumulative advantage" (кумулятивное преимущество). Идея Прайса заключается в том, что в результате роста сети скорость, с которой публикация получает новые цитирования, должна быть пропорциональна числу полученных ранее цитирований. Впоследствии механизм стал рассматриваться как возможное объяснение степенного распределения степеней узлов в различных реальных сетях. Он заложен в основу многих сетевых моделей. Модели случайных сетей, расширяющихся за счет добавления узлов с присущими им свя-

k

будем называть GiV-моделями,

1. Механизм предпочтительного присоединения. В работе [6] приводятся две основные причины, благодаря которым распределение степеней сети будет подчиняться степенному закону: а) сеть постоянно расширяется за счет добавления новых улов; б) новый узел присоединяется к узлам, уже имеющим высокую степень. Это свойство, называемое préférentiel attachment (предпочтительное присоединение), обозначим РА. Из работ [6, 7] следует, что правила (а) и (б) должны выполняться совместно, В общем случае вероятность того, что в результате РА узел г, имеющий степень kj, приобретает новое ребро, выражается формулой

ka

n(k ) = Yk~f (2)

j

1,1 Модель Барабаши - Альберт {ВА). Предпочтительное присоединение является фундаментом модели, предложенной в работах [6, 8, 9], Алгоритм построения сети таков. Рост сети начинается с небольшого числа узлов (то). На каждом шаге добавляется новый узел с m (m < т0) ребрами, с помощью которых новый узел связывается с m различными уже присутствующими узлами, будем называть их узлами назначения. Предполагается, что присоединение к узлу назначения г, имеющему входящую степень kj, происходит с вероятностью

kj

П (kj) = j (3)

j

Зависимость вероятности присоединения от степени носит линейный характер. Заметим, что большинство реальных сетей ориентированные. Обычно интерес представляет входящая степень узла, но в модели В А ребра не имеют ориентации, поэтому речь идет о степени. Можно считать, что для модели В А исходящая степень любого узла - константа, равная т. После t временных шагов получится сеть с n = t + m0 узлами и mt ребрами, Численное моделирование показывает, что такая сеть эволюционирует к масштабно-

инвариантному состоянию с вероятностью того, что узел будет иметь степень к, следующей степенному закону (1) со значением ysf = 3,

В работе [7] рассмотрены две ограниченные модели A и B, согласно которым сеть развивается либо за счет роста числа узлов, либо за счет механизма PA (3), Так, в модели A рост сети начинается с m0 узлов и на каждом шаге добавляется новый узел с m ребрами, но узел назначения i выбирается из всех имеющихся с равной вероятно-

1

стью, так что П (кг) =-.Показано, что P (к) будет иметь экспоненциальный вид:

mo + t — 1

P(k) = Bexp(—в&), B = e/m, в = 1/m. В модели В построение сети начинается с n узлов, ребра отсутствуют. На каждом шаге выбирается случайным образом узел, который присоединяется к узлу i согласно (3). В результате P(к) с течением времени будет иметь вид нормального распределения. То есть для того, чтобы распределение степеней узлов было степенным, важны оба момента: рост числа узлов и линейное РА. 1.2. Методы исследования модели В А.

1.2.1. При исследовании динамических свойств модели В А используются несколько теоретических подходов. В работах [6, 7] приведены аналитические выкладки, устанавливающие зависимость степени кг узлa i от времени, основанные на предположении, что к -непрерывная вещественная переменная и скорость ее изменения пропорциональна П(к). Такой подход назван теорией непрерывности, (continuum theory). Скорость, с которой узел i

dkj . kj — = mn ) = m (4)

Е к-j=1

m

кj = 2mt — m.

j

Таким образом,

dkj кг

И = 2t. (5)

Каждый узел i при появлении в сети в момент t имеет степень ki(ti) = m, поэтому решение уравнения (5) имеет вид

кг (t) = , в =1/2. (6)

Равенство (6) указывает, что степени всех узлов изменяются одинаковым образом, следуя степенному закону. Дальнейшие выкладки показывают, что функция распределения степеней представляется равенством

, ч dP(kj(t) < k) 2m1/et 1 P (k) =-IT.-^^^ x

dk m0 +1 k1/e+r

При t ^ го вероятность того, что узел будет иметь степень к, асимптотически равна:

P (k) - 2m1/ek_Y, y = 1/в + 1 = 3.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

(7)

Параметры в и y ^ зависят от m.

Таким образом, несмотря на непрерывный рост, сеть достигает стационарного состояния, а коэффициент C в степенном распределении P (k) — Ck_Y пропорционален квадрату средней связности узлов сети, C — m2,

1,2,2, В работе [10] предложен метод исследования 6'/V-.моделей на основе анализа вероятности p(k, tj, t) того, что узел г, появляющийся в сети в момент tj, та времени t будет k

m

mn(k) = k/2t (4, 5) или останется прежней, основное уравнение (master equation), определяющее p(k,tj,t), имеет вид

p (k, tj, t + 1)

k - 1 ч / k —p (k - 1,tj,t)+ 1 - -)P (k,ti,t).

(8)

Распределение степеней узлов сети:

P(k)

lim

t —> oo

^ p(k, tj, t)

P (k)

k - 1

k + 2 2

P (k - 1)

(m + 2)'

k > m + 1, k = m.

P(k)

P (k)

2m(m + 1) k(k + 1)(k + 2),

(9)

т, е, близко к (7),

Подобный метод используется также в работе [11], где рассматривается модель роста системы, состоящей из нескольких групп элементов. На каждом шаге новый элемент добавляется к некоторой группе. Вероятность р, с которой новый элемент добавляется к группе г, пропорциональна размеру N группы (^¿/^), С вероятноетыо q = 1 — р новый элемент образует новую группу. Процесс описывается равенством

k - 1

Pi(k,t)= p-—-Pj(k - 1,t - 1)+ p 1 -

k

t1

t1

Pi(k,t - 1)+

+ (1 - p)Pj(k,t - 1) + (1 - p)nt_i(t - 1)4,1 (1 - &i)

где РДк, /) - вероятность того, что группа г в момент / будет содержать к элементов, ПД/) — вероятность того, что в момент / в системе будет г групп (здесь и далее 6 - дельта Кронекера), При этом

П (*) = - р)*-1.

Для всей системы распределение вычисляется как среднее распределений размеров групп:

1 4

P (k,t) =

t i=1

При достаточно большом t вероятность стремится к стационарной величине

P(k) = lim P(k, t).

t—y^o

Зависимость этой величины от p при достаточно больших k и t оценивается как

P(k) - k-1-(1/p), а вероятность Pj(k,t) при росте числа групп оценивается как

(г4" lim Pi(k,t)= -

t, i —те у t

1,2,3, В работе [12] авторы исследуют функцию Nk (t) распределения среднего числа

tk сети нового узла Nk (t) изменяется как

dN (k - l)Nfc-i(t) - kN(t)

"dt" = Ш--+ ^ (10)

k>1

Это так называемое уравнение скорости (rate equation). В (10) учитывается, что новый

узел может присоединиться к узлу со степенью k — 1, в результате чего степень станет

kk

k, кроме того, добавляемый узел может иметь m = k. Асимптотические пределы N"(t) ~

tP(k^, kNk(t) ~ 2mt, что приводит к рекурсивному равенству (9), k

Рассмотренные методы предсказывают одни и те же асимптотические результаты, и любой из них может использоваться для исследования динамики распределения степеней узлов сети в рамках модели,

1,3, Свойства модели ВА. SF-сети, порождаемые согласно модели ВА, обладают рядом свойств, отличающих их от случайных графов с той же средней степенью вершин и с тем же размером,

а) Признаки "малого мира" (см, [8]): с ростом n средняя длина пути SF-сетъ растет приблизительно как log n; коэффициент кластеризации с ростом сети уменьшается приблизительно следуя степенному закону, а у случайных графов как <k> /n (<k> - среднее значение степени),

nk

узлов степени k, nkl - число непосредственно связных узлов со степенями k и /, то nkl = nknb Более вероятно, что узлы с подобными степенями спонтанно соединяются между

k

и /, nki = nkщ.

в) Специфика изменения размеров компонент е ростом сети. Входящая компонента узла х - это множество всех узлов, из которых существует ориентированный путь в узел х; исходящая компонента - это множество всех узлов, которые достижимы из х, В работе [13] проведено исследование изменения размеров компонент с ростом сети. Для модели В А с т =1 исходящая компонента - это узлы единственного ориентированного пути, начинающегося в х. Число /,(/) входящих компонент с 5 узлами удовлетворяет уравнению скорости:

(5 — 1)/5-1 —

ж=-/-+651

Показано, что при линейной скорости присоединения 13 подчиняется степенному закону: 13 а 5-2, При изучении исходящих компонент исследовался размер "поколений". Так, поколение 0 содержит единственный начальный узел. Поколение 1 - это присоединенные к нему узлы вне зависимости от того, когда это произошло, и т. д. Изучается Ь9 (¿) - размер поколения д в момент показано что для некоторого фиксированного (большого)

значения ¿имеет место ¿тах — , . Число "поколений" растет логарифмически с ро-

л/2п 1п /

стом числа узлов при условии линейной зависимости предпочтительного присоединения от степени узлов,

г) Устойчивость к разрушению, В работе [14] показано, что <5Р-сети более устойчивы к выходу из строя случайных узлов (диаметр практически не меняется), чем сети с экспоненциальным хвостом распределения степеней узлов, в то же время они более уязвимы к атакам, заключающимся в выходе из строя важных узлов, плотно связных с остальными,

2. Обобщения модели В А. Исследования реальных сетей показывают, что схема развития даже 5Р-сетей не исчерпывается моделью В А. Так, модель прогнозирует экспоненту 7 = 3 (см, (1)), в то время как для реальных сетей она варьируется от 3 до 5, Кроме того, реальные сети имеют отклонение от степенного закона. Сеть может иметь локальные свойства, от которых зависит тенденция роста, например возникновение локальных связей (ребер между ранее добавленными узлами); переключение ребер; исчезновение ребер, Поэтому появилось значительное число работ, посвященных расширению модели В А и другим моделям развития сетей,

2,1, Нелинейное предпочтительное присоединение. Для нелинейного предпочтительного присоединения вероятность того, что узел г, имеющий степень к^, получит присоединение со стороны нового узла, определяется формулой (2),

Такие модели (для случая т =1) рассматриваются в работе [12], Анализ свойств моделей производится на основе уравнения скорости, подобного (10), но уравнение имеет вид

^ = -т1- [(к — 1№-1(/) — (/)] + 6*1, (11)

<и м

а

где Ма = (¿). Показано, что от значения а существенно зависит вид функции

распределения степеней узлов: для а < 1 распределение степеней относится к растянутому экспоненциальному (степенной закон в экспоненте Р(к) ~ е* 7), в то время как для а > 1 ожидается феномен "застывания", когда один узел присоединяется почти ко всем другим, а=1

2,2, Асимптотическая, зависимость от степени. В работе [13] рассмотрено несколько моделей СЖ-сетей, Вероятность того, что новый узел присоединится к узлу назначения,

имеющему степень к, при условии, что вероятность зависит исключительно от к, обозначена Ак, В дополнение к строгому равенетву Ак = ка рассмотрена модель, для которой характерна асимптотическая зависимость: Ак ~ ка, к ^ то, Показано, что если а = 1, то N ~ к-7, но 7 может принимать значения в диапазоне 2 < 7 < то,

2,3, Модели с переключением ребер. В работе [15] рассмотрена модель, в которой развитие сети, начинающейся с т0 изолированных узлов, допускает три возможности:

1) С вероятностью р добавляется т новых ребер между уже существующими узлами. При этом в качестве начальной точки ребра произвольно выбирается узел, а второй конец -согласно предпочтительному присоединению с вероятностью

к. + 1

П(к0 = Е(к+П). (12)

з

т

2) С вероятностью д переключаются т ребер. Сначала произвольно выбирается узел г и ребро (г,^), оно удаляется и образуется новое ребро (г,/). При этом / выбирается с вероятностью П(к), согласно (12), Процесс повторяется т раз,

3) С вероятностью 1 — р — д добавляется новый узел, имеющий т новых ребер и подключающийся к существующему узлу г с вероятноетыо П(к^),

Для этой модели справедлива обобщенная форма степенного закона

Р(к) к (к + к(р,д,т))-7(м'т),

( \ < ^2т(1 — . Л ( ч 2т(1 — д) + 1 — р— я.,

где к(р, д, т) = (р — д) ---1-1+1; 7(р, д, т) =--+ 1.

\ 1 — р — я ) т

Данная модель предполагает существование двух режимов: безмасштабного и экспоненциального, в зависимости от параметров р, д, т. Подробности см, в работе [15].

Модели с переключением ребер, названные (ЖД-моделями, представлены также в работе [13]. Так, рассматривается модель развития сети когда в каждый момент времени добавляется новый узел / и единообразно из существующих выбирается узел назначения ж (т = 1). С вероятностью 1 — г создается ребро от / до ж, а с вероятностью г ребро направляется от узла / на узел у, являющийся предшественником ж(ж ^ у), Здесь уравнение скорости (ср. (10), (11)) имеет вид:

^Аъ 1 — г г г

' 41 + - №-1 — N] + — (к — 2)^-1 — (к — . (13)

dt M0 k 1 M0l

Если r = 0, то уравнение скорости (13) для GNR имеет тот же вид, что и для СЖ

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В работе [13] показано, что рассматриваемый случай GNR-модели можно свести к б'/V. Замечено, что предпочтительное присоединение модели В А можно рассматривать как линейную зависимость со сдвигом Ak = k + w и перейти к рассмотрению ориентированной сети. Степень k в ориентированном графе - это сумма входящей степени g и исходящей степени h. В данном случае исходящая степень h = 1, k = g + 1, зависимость от степени определяется как

Ak = a(k — 1) + b = k + w, где w = —1 + b/a; —1 <w< то.

Степенной закон для распределения P (^сохраняется, так как при k ^ то влияние константы сдвига уменьшается. GN^ можно свести к GN со сдвигом:

= (к — 1)г + 1 — г = к + ад, ад = (1 — г)/г — 1 =--2.

г

2.4, Добавление и удаление ребер. Класс моделей развития неориентированных сетей с добавлением и удалением ребер между старыми узлами рассмотрен в работе [16]. Предполагается, что сеть развивается по следующим правилам: в каждый момент времени добавляется новый узел с одной связью, вероятность его присоединения к имеющемуся узлу следует из (3); вместе с этим может добавиться с ребер (с > 0), вероятность появления ребра между несвязными узлами г и ] пропорциональна произведению их степеней к^к^ (развивающаяся сеть); или могут исчезнуть равновероятно |с| связей (с < 0, раепа-

с

1 + 2с

(6) с динамическим параметром в = ^ —у распределение степеней Р(к) соответствует (7) с параметром 7 = 2 +--, Для развивающейся сети: если с ^ го, то в ^ 1

1 + 2с

7 ^ 2, обе величины <кг(/)> и Р(к) демонстрируют следование степенному закону. Для распадающейся сети только <кг(/)> соответствует степенному закону на всем диапазоне —1 < с < 0 Р(к)

с

изменениям структуры сети, чем добавление,

2.5, Эффект возраста. При изучении реальных сетей цитирования выясняется, что интерес к выдающимся работам со временем не снижается, в то время как в основном значимость работ постепенно утрачивается, так как представленные в них идеи уже внедрены и расширены в других работах, В моделях с линейным предпочтительным прнсоединенн-

г

формулой

П(кг, ¿г) а к/&), (14)

где - время появления в сети узла г. Определение функции от времени /(¿г) зависит от модели: если / (¿г) = 1 для любо го г, то это модель В А. В результате вид функции / (¿г)

Р(к)

В работе [17] аналитические выкладки относятся к модели, в которой в каждый момент времени присоединяется один узел согласно (14), возрастное затухание определяется как /(¿г) = (/ — ¿¿). Показано, что в случае, когда параметр в < 1 (см. (6)), сохраняется степенной закон (1), Причем если в стремится от —го к 0, то значение 7 стремится от 2 к 3, т, е., приближается к распределению, свойственному модели без учета возраста. Дальнейшее возрастание в от 0 к 1 сопровождается стремлением 7 к бесконечности. При в > 1

Влияние возраста исследуется также в работе [13], Узел имеет возраст а означает, что

он добавлен в момент = / — а, Среднее число узлов возраста а, имеющих входящую

г

степень к — 1 в момент ¿, обозначим как с*(¿, а). Тогда N(¿) = j ^ас*(¿,а). Совместное

о

распределение эволюционирует согласно формуле

+ 6и6(а),

где A(t) = AjNj(t), Для Ak = k показано, что распределение степеней узлов фик-j >1

сироваппого возраста имеет экспоненциальное затухание и при а ^ t средняя степень <k> ~ (1 — a/t)-1/2, "Молодые" у злы (а/t ^ 0) имеют небольшую степень, а "старые" -большую. Слабое затухание распределения степеней старых узлов приводит к степенному закону,

В работе [18] рассматривается модель, в которой вероятность присоединения определяется формулой (14), а функция f (t) = exp(at). Показано, что сеть не будет SF-сетью, если а < 0,

Модель развития сети с добавлением в каждый момент времени одного узла (m = 1) рассмотрена в работе [19], Вероятность присоединения определяется формулой n(kj,tj) a keto*. Влияние параметров а и в на структуру сети представлено в виде диаграммы па а—в плоскости. Пространство делится на две фазы: малый мир и регулярные сети. Безмасштабное поведение наблюдается вдоль прямой линии для в > 1 в рамках фазы малого мира, В фазе малого мира при в ^ 1 наблюдается тенденция узлов подключаться к одному и тому же узлу; для в < 1 а < — 1 распределение степеней приближается к растянутому экспоненциальному,

3. Модель Бианкони — Барабаши (ВВ). Модель Бианкони - Барабаши ( ИИ), представленная в работах [20, 21], является расширением модели В А. Предполагаются рост и предпочтительное присоединение, но предпочтительное присоединение помимо степени k зависит еще от одного параметра - качества {fitness) n, характеризующего скрытые свойства узла, обеспечивающие получение дополнительных связей. Например, это может быть оценка узла со стороны сообщества, В каждый момент времени к системе добавляется новый узел j с соответствующим значением j выбираемым из распре деления p(n)-Вероятность того, что новый узел присоединится к узлу г, определяется формулой

Параметр пь участвующий в формуле (15), называют мультипликативным. Согласно теории непрерывности (см, (4)), степень узла изменяется как

Если все узлы будут иметь одинаковое качество, то (16) сводится к (4) для модели ВА, т. е, кД£) ~ ¿1/2. Допустим, временная эволюция степени узла к также следует степенному закону, но с экепонентой в(п0:

П = " '

г Enj kj

(15)

dki niki

(16)

j

(17)

Согласно (16), (17), динамическую экспоненту можно представить в виде

n

в (n) = ^

где

р(п)т—щ ^

Таким образом, более молодые узлы могут приобретать ребра несмотря на небольшое значение степени, а старые узлы с большим значением параметра качество могут играть центральную роль, В модели ВА степень со временем росла как квадратный корень от времени, экспонента в = 1/2 (см. (6)). В модели ВВ, в предположении, что эволюция кг следует степенному закону, экспонента, согласно (18), пропорциональна т- е. уникальна для каждого узла,

С применением теории непрерывности (см, (3)-(6)) получено, что распределение степеней имеет вид

С

Р(к) - У ¿пр(п) С ^ П , (19)

Р(к)

распределения параметра качество р(п)-

Модель получила дальнейшее развитие. Так, в работе [22] рассматриваются модели с предпочтительным присоединением, модифицированным с помощью аддитивного параметра качества п

П = (к — 1) + Пг и аддитивно-мультипликативного качества:

П = Пг (к — 1) + Сг.

Показано, что в первом случае экспонента 7 в равенстве (1) зависит от среднего значения параметра качество, а во втором случае - от всего множества значений параметра для узлов сети. Кроме того, рассмотрена модель ориентированной сети, в которой входящие и исходящие ребра имеют разные значения мультипликативного качества,

4. Комбинированная модель роста сети. В работе [23] представлена комбинированная модель, учитывающая одновременно предпочтительное присоединение, эффект возраста и качество применительно к сети цитирования публикаций.

Вероятность того, что публикация г в момент времени £ будет процитирована, определяется как

Пг(£) - ПгС Рг(£). (20)

Здесь с* - общее число цитирований к моменту £ (предпочтительное присоединение), п _ качество. Затухание влияния, связанного с возрастом, Рг(£), определено как

Рг(£)

(1П £ — ^г)2 2а?

v/2Пt

а,-

- среднее, отражает актуальноеть, аг - стандартное отклонение, отражает продолжительность, То есть затухание имеет логнормальный вид. Используя уравнение (8), на основе определения (20), можно прогнозировать рост цитирований в зависимости от времени:

1

е

С = m

( вПг ( ln t - М \

—-ф -

A V 0 /1

e \ / — 1

/

(21)

1 x 2

где Ф(х) = ,_ / e_y /2 dy; m - среднее число ссылок в публикациях; в отражает рост

V 2п _с

-те

общего числа публикаций; А - нормализующая константа. Параметры m в A являются глобальными, их значение одинаково для всех публикаций. Величина ni = Пгв/A -относительное качество публикации i

Уравнение (21) охватывает все три механизма, влияющие на историю цитирования публикаций. Если определить отмаештабированные переменные как

с = (lnt - /04; с = ln (1 + ci/m) /ni,

получаем

с = Ф (t) . (22)

Равенство (22) - основной результат работы [23], прогнозирующий, что история цитирования каждой публикации следует одной и той же универсальной формуле, только отмас-штабированной согласно индивидуальным

5. Модели с неявным РА. Свойство хорошо связных узлов успешно приобретать новые связи наблюдается во многих реальных системах, В модели ВА этот принцип заложен в алгоритм роста сети. Однако существуют модели сетей, в которых ребра между узлами организуются согласно иным законам, но в результате роста сети становятся SF-сетями. Так, в работе [24] предложена модель ориентированной сети, алгоритм построения которой основан на случайном блуждании. Начальное состояние - один узел без ребер. Эволюция состоит из двух этапов: добавление нового узла, который присоединяется к одному случайно выбранному узлу; блуждание по узлам, которые достижимы из первого выбранного, и присоединение к ним с вероятностью p, пока это возможно. Затем повторяется добавление узла. То есть этап добавления узла отделен от этапа построения ребер,

p

равную нулю. Показано, что в случае p = 0 распределение входящих степеней имеет экспоненциальный вид: P(k) = 2_(fc+1), Для p =1 входящая степень рассматриваемого узла увеличивается при добавлении нового, если новый присоединится к нему сразу или присоединится к другому узлу, который имеет ребро с рассматриваемым. Таким образом, узлы с большой входящей степенью имеют преимущество в приобретении ребер, т, е., имеет место предпочтительное присоединение вида П(к) = (k + 1)/n, Хвост распределения входящих степеней имеет вид степенного закона P(k) ~ k_2. Параметр 7 ~ 2 в отличие от значения 7 ~ 3 для модели В А. Так как значения 0 и 1 дл я вероятности p определяют качественно разное поведение сети, предполагается, что должно быть пороговое значение pc, такое что для р> pC хвост распределения начинает подчиняться степенному закону. Экспериментально установлено, что pc ~ 0,4, Мотивацией являлось моделирование сети цитирования, однако для реальных сетей цитирования параметр 7 ~ 3,

Модель порождения сети на основе случайного блуждания (" butterfly") представлена также в работе [25], Модель имеет три параметра: phost - вероятность, с которой новый узел выбирает имеющийся узел (uhost")~, plink - вероятность образования ребра между

двумя узлами; pstep _ определяет, переходить ли к соседнему узлу, который будет выступать в качестве нового "host". В представленной модели в каждый момент времени добавляется один узел. Параметры phoSi и p1ink одинаковы для всех новых узлов, a pstep -индивидуальный.

Модели эволюции сети с копированием ссылок, предложенные в работе [26], мотивированы на выявление принципов роста веб-графов. Для модели с линейным ростом в каждый момент времени t добавляется один узел, имеющий исходящую степень, равную константе. Узел назначения для ориентированных ребер выбирается следующим образом. Из числа имеющихся узлов выбирается "прототип". Затем г-е ребро с вероятностью р присоединяется к любому узлу и с вероятностью 1 — p присоединяется к узлу назначения г-го ребра "прототипа", В результате вероятность того, что узел с входящей степенью k получит новое ребро, пропорциональна (1 — p)k, т. е, наблюдается линейное предпочтительное присоединение,

Частично метод копирования ссылок прототипа используется в модели FF (forest fire), представленной в работе [27], Определяются два параметра: риг. Процесс добавления нового узла v состоит из трех этапов:

а) Случайным унифицированным образом выбирается "прототип" w и организуется исходящая дуга к w,

б) Генерируются два случайных числа x и y геометрически распределенные со средними значениями р/(1 — р) и гр/(1 — гр) соответственно. Новый узел v выбирает x исходящих дуг и y входящих дуг узла w. Пусть wi,w2,... ,wx+y - концы этих дуг,

в) Узел v образует исходящие дуги к w1,w2,... ,wx+y.

Этап (б) повторяется для каждого узла w1,w2,... ,wx+y, при этом ни один узел не выбирается дважды, В сети, развивающейся согласно модели FF, при присоединении нового узла предпочтение имеют хорошо связные узлы, а хвосты распределений входящих и исходящих степеней подчиняются степенному закону.

Заключение. Для изучения реальных сетей в области науки и социальных отношений разрабатываются модели, способные демонстрировать основные свойства этих сетей. Здесь рассмотрены модели сетей, в процессе роста которых вероятность присоединения

k

В модели В А зависимость от степени узла назначения носит линейный характер. Рост и линейное предпочтительное присоединение являются основными механизмами, ответственными за то, что хвост распределения степеней узлов сети, развивающихся

k

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В А получила развитие за счет введения дополнительных мотиваций, влияющих на предпочтительное присоединение, таких как "возраст" узла назначения, первоначальная "привлекательность" или "качество". От вида функций, определяющих эти дополнения, зависит, останется ли сеть безмасштабной или распределение степеней будет иметь экспоненциальный вид. Масштабная инвариантность при определенных условиях свойственна также рассмотренным здесь моделям, допускающим добавление, переключение и удаление ребер между существующими узлами.

Список литературы

1. Erdos P., RENYI A. On random graphs // Publicationes Mathematicae Debrecen. V. 6. 1959. P. 290-297.

2. Erdos P., RENYI A. On the evolution of random graphs // Bull. Inst. Internat. Statist. V. 38, № 4. 1961. P. 343-347.

3. Watts D. J., Strogatz S.H. Collective dynamics of "small-world" networks // Nature. 1998. V. 393. P. 440-442.

4. Price D. J. de Solla. Networks of Scientific Papers // Science. 1965. V. 149. P. 510-515.

5. Price D.J. de Solla. A general theory of bibliometric and other cumulative advantage processes // J. of the American Society for Information Science. 1976. V. 27(5-5). P. 292-306.

6. BarabASI A.-L., Albert R. Emergence of scaling in random networks // Science. 1999. V. 286. P. 509-512.

7. Barabasi A.-L., Albert R., Jeong H. Mean-field theory for scale-free random networks // Phvsica A 272. 1999. P. 173-187.

8. Albert R., Barabasi A.-L. Statistical mechanics of complex networks // Rev. Mod. Phvs. 2001.V. 47, N. 74. P. 47-97.

9. dorogovtsev S. N., Mendes J. F. F. Evolution of networks // Advances in Phvs. 2002. V. 51, 1079.

10. Dorogovtsev S. N., Mendes J. F. F., Samukhin A. N. Structure of growing network with preferential attachment // Phvs. Rev. Lett. 2000. V. 85, 4633.

11. Kullmann L., KertESZ J. Preferential growth: exact solution of the time dependent distributions // Phvs. Rev. E. 63.051112. 2001.

12. Krapvisky P.L., Redner S., Leyvraz F. Connectivity of growing random networks // Phvs. Rev. Lett. V. 85, 4629. 2000.

13. Krapvisky P. L., Redner S. Organization of growing random networks // Phvs. Rev. E 63, 066123. 2001.

14. Albert R., Jeong H., Barabasi A.-L. Error and attack tolerance of complex networks // Nature. 2000. V.406. P. 378-482.

15. Albert R., Barabasi A.-L. Topology of evolving networks: local events and universality // Phvs. Review Letters. 2000. V. 85. P. 5234-5237.

16. Dorogovtsev S. N., Mendes J. F. F. Scaling behavior of developing and decaying networks // Europhes. Lettr. 2000. V. 52, N. 3. P. 33-39.

17. Dorogovtsev S.N., Mendes J.F.F. Evolution networks with aging of sites // Phvs. Rev. E62, 1842. 2000.

18. Zhu H., Wang X., Zhu J-Y. The effect of aging on network structure // Phvs. Rev. E 68, 056121. 2003.

19. Hajra К. В., Sen P. Phase transitions in an aging network // Phvs. Rev. E 70, 056103. 2004.

20. BlANCONl G., Barabasi A.-L. Bose-Einstein condensation in complex networks // Phvs. Rev. Lett. 86, 5632. 2001.

21. Bianconi G., Barabasi A.-L. Competition and multiscaling in evolving networks // Europhvsics Letters, 54: 436-442, 2001.

22. Ergon G, Rodgers G. J. Growing random network with fitness // arXiv: cond-mat/0103423.

23. Wang D., Song C., Barabasi A.-L. Quantifying long-term scientific impact // Science. 2013. V.342. P. 127-131.

24. vazquez A. Knowing a network by walking on it: emergence of scaling // arXiv:cond-mat/0006132.

25. McGlohon M., Akoglu L., Faloutsos C. Weighted graphs and disconnected components // PAKDD'10 Proc. of the 14th Pacific-Asia conference on advances in knowledge discovery and data mining. 2010. Vol. P. 2. P. 410-421.

26. Kumar R., Raghavan P., Rajagopalan S., Sivakumar D., Tomkins A., Upfal E. Stochastic models for the Web graph // Proc. of the 41th IEEE symp. on foundations of computer science. 2000. P. 57-65.

27. Leskovec J., Kleinberg J. M., Faloutsos C. Graph evolution: Densification and shrinking diameters // ACM Transactions on Knowledge Discovery from Data (TKDD). 2007. V. 1, iss. 1. Art. 2.

Щербакова Наталья Григорьевна — ст. науч. сотр. Ин-та вычислительной математики и математической геофизики СО РАН; e-mail: nata@nsc.ru.

Наталия Щербакова окончила Новосибирский государственный университет по специальности „Математическая лингвистика" в 1967 году. С 1967 г. работала в Институте математики СО РАН, затем в Институте автоматики и электрометрии СО РАН в области создания программного обеспечения систем передачи данных. С 2000 года — сотрудник Института вычислительной математики и математической геофизики СО РАН, где с 2002 занимает должность старшего научного сотрудника. Являлась участником проекта „Сеть Интернет Новосибирского Научного "

анализа IP-сетей. Автор и соавтор более 40 работ, соавтор монографии „Анализ цитирования

"

области исследования методов оценки научной деятельности на основе анализа цитирования научной литературы.

Natalia Shcherbakova graduated from Novosibirsk State University in 1967 (mathematical linguistics). Since 1967 she worked at Institute of Mathematics SB RAS, then at Institute of Automation and Electrometry SB RAS in the field of software design for data transmission systems. In 2000 — the employee of Institute of Computational Mathematics and Mathematical Geophysics SB RAS, since 2002 works as senior researcher. She is a member of „Akademgorodok Internet Project", dealt with software of monitoring and the analysis of IP networks. She is the author and co-author of more

than 40 works, the co-author of the monograph

"

research interests lie in the field of bibliometrics: methods of measuring of scientific.

Дата поступления — 20.06.2019

i Надоели баннеры? Вы всегда можете отключить рекламу.