УДК 519.8;519.301
МИКРО- И МАКРОМОДЕЛИ СОЦИАЛЬНЫХ СЕТЕЙ. Ч. 2. Идентификация и имитационные эксперименты
A.B. Батов, В.В. Бреер, Д.А. Новиков, АД Рогаткин
Рассмотрены вопросы идентификации введенных в первой части работы микро- и макрохарактеристик социальных сетей по данным из реальных онлайновых социальных сетей — Facebook, LiveJournal и Twitter. Представлены результаты ряда соответствующих имитационных экспериментов, дано их сравнение.
Ключевые слова: пороговое поведение, социальная сеть, теория графов.
ВВЕДЕНИЕ
где
В статье [1] были введены понятия микро- и макромоделей социальных сетей с единым относительным порогом 9 е [0, 1] (см. также в указанной статье соответствующий обзор близких исследований).
В микромодели поведение агента в рамках игрового подхода описывается с помощью его наилучшего ответа BR (Best Response) — агенты одновременно и независимо принимают решение в каждом периоде времени k:
xf = БЩ (x-k- ^ -
1, I j -1 >9 d
j е D j
о, I k- ;
x
<9d;
j е
D,
i е N = {1, 2, ..., n},
(1)
где d. = \D.\ — число соседей агента i, D, — мно-
(k - 1) , (k - 1) жество его соседей, х-г- = {x\ .
x( k - D x2
x( k - 1) x( k - 1) xi - 1 , xi + 1 ,
Х-"- } — обстановка для агента /.
Здесь х\к е {0; 1}, где х\к = 1 означает, что агент
действует, а х\к = 0 — бездействует в период времени к.
Макромодель описывает динамику доли действующих агентов рк = 1 ^ х® е [0, 1]:
n i
Pk + 1 = Fn^v 9),
(2)
n - 1
Fn(P, 9) = I B(p, d, 9)M(d), (3)
d = 1
[0d]
B(p, d, 9) = 1 - X cdpk(1 - p)d k — функция от
k = 0
биномиального распределения, M(d) — вероятностное распределение числа соседей d в графе социальной сети (см. подробнее в работе [1]).
Для проверки адекватности и сравнения между собой теоретических моделей (1) и (2) могут быть использованы данные из реальных онлайновых социальных сетей (СС). В настоящей работе для микромодели (1) применяются методы имитационного моделирования, для макромодели (2) — различные виды аппроксимаций функции распределения (3).
1. ПОСТАНОВКА ЗАДАЧ ИССЛЕДОВАНИЯ
Связи между агентами реальной СС можно представить в виде ориентированного графа G. Ориентация ребра графа от одного агента (узла) к другому интерпретируется как влияние одного агента на другого. В микромоделях явно используется граф влияния, а в макромоделях — его макрохарактеристика: распределение M(-) числа соседей. Исходя из условий возможности применения макромодели (2), а именно из того, что число агентов должно быть достаточно велико, были исследованы данные о подобных связях влияния в трех социальных сетях: русскоязычные сегменты СС Facebook (F), LiveJournal (L) и Twitter (T).
Таблица 1
Макропоказатели социальных сетей
СС MaxFrnds Users Nonzero users Links AvgFriends
Facebook 4199 3 250 580 3 084 017 77 639 757 50,35
Live Journal 2499 5 758 706 3 586 959 124 729 288 34,77
Twitter 759 313 ~41 700 000 35 427 738 1 418 363 662 40,04
Так, в сети Facebook определенный агент связан со своими друзьями, что может интерпретироваться как связи влияния этих друзей на агента. В социальных сетях LiveJournal и Twitter в качестве ориентированных связей влияния использовались подписки агента на просмотр и комментирование информации других агентов. Во всех трех социальных сетях агентов, которые влияют на данного агента, будем считать его соседями (см. выражение (1)).
В табл. 1 приведены макропоказатели трех исследуемых СС: максимальное число соседей (MaxFrnds), число агентов (Users), число агентов с ненулевым количеством соседей (Nonzero users), общее число связей (Links) и среднее число соседей у агентов с ненулевым числом соседей (AvgFriends = Links/Nonzero users).
Как видно из табл. 1, в рассматриваемых СС количество агентов велико, что позволяет выдвинуть гипотезу о применимости для них макромодели (2).
В функции распределения (3) макромодели (2) присутствуют две составляющие: вероятность B(p, d, 9) того, что доля p из числа d агентов будут действовать, и распределение M(-) числа соседей в СС. Определять эти функции можно по-разному, что порождает следующий набор задач исследования.
Задача 1. Идентификация функций распределения M(-) в указанных трех СС. В рамках этой задачи строятся эмпирические распределения Mp(-), ML(-) и MT(-) и ищутся аппроксимирующие их в аналитическом виде функции MP (•),
Ml(•) и Mt (•).
Задача 2. Построение и исследование имитационных моделей порогового поведения, которое задается наилучшим ответом (1). Так, действующими в начальный момент времени считались случайно выбранные агенты и вычислялось, согласно выражению (1), число действующих агентов на следующем шаге. Затем результат усреднялся по случайным множествам первоначально выбранных агентов. В результате было построено семейство функций (зависящее от параметра 9), которые сравнивались с другими функциями распределения, полученными в результате решения других задач настоящего исследования (см. табл. 5).
Задача 3. Аппроксимация сигмовидными функциями зависимостей, полученных при имитационном моделировании в рамках решения задачи 2.
Задача 4. Нахождение семейства функций распределения (3) (зависящего от параметра 9), в которые вместо М(-) подставляются эмпирические функции распределения степеней узлов графов связей для трех рассматриваемых реальных СС — Мр(•),М£(0 и Мт(-).
Задача 5 аналогична четвертой, но вместо эмпирических функций распределения СС используются их аппроксимации Мр(•), Мь(•) и Мт (•), найденные в результате решения задачи 1.
Для решения задач 2—5 применялись два метода: анализ эмпирических данных и их аналитическая аппроксимация. Схему исследования можно представить в виде табл. 2.
Задача 7. Исследование зависимости от единого относительного порога 9 положений равновесия коллективного поведения в рамках модели Грано-веттера [1, 2], которую можно построить для рассматриваемых СС.
Перейдем к последовательному рассмотрению и описанию результатов решения перечисленных задач.
2. ОСНОВНЫЕ РЕЗУЛЬТАТЫ
2.1. Идентификация функций распределения М (•) числа соседей агентов в социальных сетях
(задача 1)
Существует множество исследований онлайновых СС, свидетельствующих, что распределение числа соседей или, другими словами, распределение степени узлов больших СС хорошо аппроксимируется степенным распределением (см., на-
Таблица 2 Модели и методы для решения задач 2—5
Модель Метод
Анализ эмпирических данных Аналитическая аппроксимация
Микромодель СС Макромодель СС Задача 2 Задача 4 Задача 3 Задача 5
Рис. 1. Графики функций распределений числа соседей агентов в социальных сетях и ее линейной аппроксимации: а — CC
Facebook; б — CC LiveJournal; в — СС Twitter
пример, работы [3—5]). Результаты исследований этой зависимости для рассматриваемых СС приведены на рис. 1, где в двойном логарифмическом масштабе (когда по обеим осям отложены логарифмы соответствующих величин) построены графики эмпирических распределений числа соседей
ИР(•),Иь(•) и Мт (•). Так как степенная функция
в двойном логарифмическом масштабе имеет вид прямой с наклоном а и значением в нуле Ь, то была найдена наилучшая линейная аппроксимация. Полученные значения коэффициентов аппроксимации для различных СС приведены в табл. 3. Остальные обозначения будут описаны далее.
Кривая распределения степеней узлов графа С для малого числа соседей может быть приближена горизонтальной прямой, что приводит к «срезан-
ным» линейным аппроксимациям ИР (•), Иь (•) и
Мт (•), которые представлены на рис. 2 (см. также табл. 4).
Была выбрана горизонтальная аппроксимаци-онная прямая для малых значений числа соседей, поскольку:
— необходимо обеспечить выполнение условия нормировки распределения — площадь под графиком должна быть равна единице; если осуществлять нормировку непосредственно, то изменяются коэффициенты степенного распределения и тем самым изменяется точность аппроксимации;
— «срезанная» линейная аппроксимация дает меньшую ошибку ^-квадрат в сравнении с другими аппроксимациями: как альтернатива рассматривалась аппроксимация кривой распределения Парето (с параметром а_раШв, см. табл. 3), которая в двойном логарифмическом масштабе имеет вид прямой. Как видно из табл. 4, «срезанная» линейная аппроксимация приближает эмпирическое распределение лучше.
Значение с аргумента, при котором линейная горизонтальная аппроксимация переходит в «наклонную»:
I ехр [ Ь ] х йа, й > с,
вычислялось (см. значения с_геа1 в табл. 3) исходя из условия нормировки распределения:
п
X м (й) = 1.
й = 1
После построения аппроксимаций распределения степеней графов реальных СС, которые будут
Таблица 3
Коэффициенты аппроксимации функций •), ML( •) и MT( •)
Функция a b c_real a_pareto
M(-) -2,181 3,274 26,628 0,688
MLC) -2,208 2,828 16,878 0,765
Mj(') -1,802 -0,196 1,8233 0,799
Таблица 4
Точность «срезанной» линейной и Парето-аппроксимаций (Я-квадрат)
Аппроксимация СС «Срезанная» линейная Парето
Facebook LiveJournal Twitter 0,962 0,929 0,849 0,916 0,884 0,849
Рис. 2. Графики «срезанной» линейной аппроксимации функции М(*>: а — CC Facebook; б — CC LiveJournal; в — СС Twitter
использованы далее в рамках решения задачи 4, перейдем к описанию результатов имитационного моделирования поведения агентов в микромодели (1).
2.2. Построение и исследование имитационных моделей порогового поведения с наилучшим ответом (1) (задача 2)
Имитационное моделирование состояло в следующем. В СС Facebook и LiveJournal, заданных своими графами связей, случайным образом «возбуждалось» некоторое число q агентов (доля q/n е [0; 1]). Далее по формуле (1) для каждого агента вычислялся его наилучший ответ (действовать или бездействовать). Получающаяся в результате доля действующих агентов, согласно форму-
ле (2) — это значение функции Т^/п, 9). Эксперимент повторялся многократно для каждого из различных значений q, лежащих на отрезке [0, 1]. Относительное отклонение значения функции Fn(q/n, 9) составляло порядка 0,001 во всех экспериментах (разброс значений связан со случайностью выбора множества первоначально возбужденных агентов). Кривые Вп^/п, 9) при различных
значениях параметра 9 изображены на рис. 3.
Рис. 3. Результаты имитационного моделирования порогового поведения: а — CC Facebook; б — CC LiveJournal; в — СС Twitter; х - 0 = 0; □ - 0 = 0,1; О - 0 = 0,2; #= - 0 = 0,3; + - 0 = 0,4; * - 0 = 0,5; ♦ - 0 = 0,6; о - 0 = 0,7; А - 0 = 0,8; V - 0 = 0,9
Получив результаты имитационного моделирования, перейдем к их аппроксимации.
2.3. Аналитическое приближение функций Рп(р, 6), полученных при имитационном моделировании
(задача 3)
Необходимо найти аналитическое приближение семейства функций Fn(p, 0) для каждой из рассматриваемых СС. На основании проведенных исследований были сделаны следующие наблюдения:
— полученные кривые относятся к классу сиг-моид (рис. 4);
— кривые ^п(р, 0) имеют перегиб при р « 0.
С учетом этих наблюдений, в качестве кандидатов для аппроксимации были выбраны следующие параметрические семейства функций:
/(р, 0, а, А, у) = а *агс1+А(р - 0) + у
и
g(p, 0, а, А, у) =
а
1 + е
м р - 0)
+ у.
Из условия, что функции /(•) и ^(')должны являться функциями распределения, получаем параметрические (зависящие от параметра А) семейства функций:
г( 0 а) = агс 1+А (р - 0 ) + сгс++ ( А0 ) У(p, , ) ас++ А (+ - 0 ) + сг++ ( А0)
(4)
и
g(p, 0, А)
1 - е
гх р
V1 + е
-Х(д - 0)
1 + е
-Х( 1 - 0)
1 -М 1 - е у
Таким образом, задача 3 сводится к нахождению одного неизвестного параметра А, при котором поверхность /(р, 0, А) или g(p, 0, А) наилучшим образом приближает экспериментальные данные, и выбору семейства функций, которое дает меньшую ошибку приближения.
Рис. 4. Приближение экспериментальных данных в) (точки) аналитическим семейством f(р, в, 1^) (сетка) для социальной сети РасеЬоок
Оказалось, что экспериментальные данные для всех социальных сетей лучше приближаются семейством функций (4), при этом минимум ошибки приближения достигается при А^ = 13,01, Аь = 9,18, Ат = 7,34 (график для СС БасеЪоок приведен на рис. 4).
Наличие аналитического выражения для функции (3) дает возможность построить однопарамет-рическую модель поведения агентов (при различных значениях единого порога 0), что важно, в частности, для задач управления СС [6].
2.4. Макромодель (2) на основе эмпирического распределения числа соседей в графе
(задача 4)
Как отмечалось ранее, данная задача состоит в нахождении семейства функций распределения (зависящего от параметра 0) макромодели (3), в которых явно присутствует теоретическая составляющая В(р, й, 0), т. е. в выражении (3) вместо М(т) подставляются эмпирические функции распределения степеней узлов графов связей для трех СС — М^(-), Мь(-) и Мт(-). Результаты представлены на рис. 5.
Таким образом, мы построили семейство функций (3). Перейдем к их рассмотрению, используя «срезанные» линейные аппроксимации, полученные в результате решения задачи 1.
2.5. Макромодель (2) на основе распределения числа соседей, аппроксимированного
аналитической функцией (задача 5)
Данная задача подобна задаче 4, но вместо эмпирических функций распределения СС используются их аппроксимации МР(•), Мь(•) и Мт (•). Результаты представлены на рис. 6.
Видно, что семейство функций (3) качественно аналогично полученному в результате решения задачи для соответствующих СС. Строгое сравнение осуществляется в рамках решения задачи 6.
2.6. Сравнение результатов решения задач 2—5
(задача 6)
Решив задачи 2 и 3 (имитационное моделирование и аппроксимация микромодели (1)), а также задачи 4 и 5 (различные виды аппроксимаций макромодели (2)), можно сравнить полученные результаты — см. табл. 5, в заголовках столбцов которой содержатся пары номеров сравниваемых задач.
Видно, что макро- и микроописания дают схожие результаты (см. пары задач 2 и 3, 2 и 4, 3 и 4). Близость результатов решений задач 2 и 5, 3 и 5, 4 и 5 меньше, и в перспективе стоит вопрос нахождения функции, которая бы лучше приближала функцию распределения степеней графа М(-).
Рис. 5. Макромодель (2) с эмпирическим распределением числа соседей в графе: а — CC Facebook; б — CC LiveJournal; в — СС Twitter; s - 0 = 0; □ - 0 = 0,1; О - 0 = 0,2; Ф - 0 = 0,3; + - 0 = 0,4; * - 0 = 0,5; ♦ - 0 = 0,6; о - 0 = 0,7; А - 0 = 0,8; V - 0 = 0,9
Рис. 6. Макромодель (2) с аппроксимированной функцией распределения: а — CC Facebook; б — CC LiveJournal; в — СС Twitter; s - 0 = 0; □ - 0 = 0,1; О - 0 = 0,2; Ф - 0 = 0,3; + - 0 = 0,4; * - 0 = 0,5; ♦ - 0 = 0,6; о - 0 = 0,7; А - 0 = 0,8; V - 0 = 0,9
Сравнение результатов решения задач (значение R-квадрат)
Таблица 5
СС Задачи 2 и 4 Задачи 2 и 5 Задачи 4 и 5 Задачи 2 и 3 Задачи 3 и 4 Задачи 3 и 5
Facebook 0,9976 0,9932 0,9911 0,9973 0,9973 0,9907
LiveJournal 0,9999 0,9872 0,9872 0,9960 0,9960 0,9855
Twitter 0,9998 0,9631 0,9642 0,9949 0,9950 0,9599
2.7. Исследования положений равновесия в социальных сетях (задача 7)
Как было показано в работе [1], поведение агентов в модели с единым относительным порогом эквивалентно пороговому поведению в модели Грановеттера [2]. Для последней важны такие свойства положений равновесия (точки, характеризуемые уравнением ¥п(р, 0) = р), как их число и устойчивость (пересечение биссектрисы первого квадранта в точке равновесия «слева-сверху»). Ответим на эти вопросы для рассматриваемых СС. Из анализа графиков кривых, представленных на рис. 3—6, можно сделать вывод о том, что в зависимости от параметра 0 возможны различные наборы положений равновесия (их число, устойчивость и неустойчивость и др.).
В самом деле, точка пересечения кривой Fn(p, 0) с диагональю единичного квадрата, лежащая внутри интервала (0, 1), является неустойчивым положением равновесия, так как кривая Fn(p, 0) пересекает диагональ «снизу вверх» (см. работу [2]).
Как видно из рис. 3, это свойство имеет место при 0 е [-0,1; -0,9] для всех исследуемых социальных сетей. При этом точки q = 0 и д = 1 являются устойчивыми положениями равновесия.
Если же 0 < 0,1, то в системе имеются два положения равновесия: точка д = 0 является неустойчивым положением равновесия, а точка д = 1 — устойчивым.
Аналогично, при 0 > 0,9, в системе имеются два положения равновесия: точка д = 0 является устойчивым положением равновесия, а д = 1 — неустойчивым.
Исходя из рис. 7, можно также определять положение равновесия для рекуррентной процедуры (2) макромодели для различных соотношений между начальным положением р0 и единым порогом 0. Так, если вектор (р0, 0) лежит в области II (см. рис. 7), то процесс (2) завершится в положении равновесия р = 0. Если вектор (р0, 0) лежит в
р
0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 ОД
; ; ______
; :
1 À
, //
i
: 1 "7\
: : : VVТ ]....... I_____tÎ______
: : УЖ : : \ \ \
Ж .......1......1......].......
^\ i......î......i...... i i i
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0
Рис. 7. Зависимость положения точки пересечения кривой в) с диагональю единичного квадрата от единого порога в:
—О--Facebook; —□--LiveJournal; —О--Twitter
области I, то процесс (2) завершится в положении равновесия р = 1.
ЗАКЛЮЧЕНИЕ
Предложенные в работе [1] теоретические макромодели социальных сетей исследовались с помощью имитационного моделирования на реальных данных и аппроксимации его результатов.
Из полученных результатов можно сделать два важных вывода.
Вероятностное описание макромодели согласуется с микроописанием: результаты имитационного моделирования хорошо совпали с результатами вычисления по вероятностной модели на основании реального распределения степеней графа связей для различных социальных сетей.
Оказалось, что, несмотря на существенные различия масштабов и структуры графов связей реальных социальных сетей, их макромодели (2) качественно очень похожи: имеют вид сигмоиды и хорошо приближаются параметрическим семейством функций (4) с различными значениями коэффициента А.
Авторы благодарны канд. техн. наук Д.А. Губанову, А.Ш. Яхину и Лаборатории Цифрового Общества — за предоставленные данные по социальным сетям Facebook и LiveJournal, канд. техн. наук А.В. Макаренко — за консультации по методам аппроксимации экспериментальных данных.
ЛИТЕРАТУРА
1. Бреер В.В., Новиков Д.А, Рогаткин А.Д. Микро- и макромодели социальных сетей. Ч. 1. Основы теории // Проблемы управления. — 2014. — № 5. — C. 28—33.
2. Granovetter M. Threshold Models of Collective Behavior // The American Journal of Sociology. — 1978. — Vol. 83, N 6. — P. 1420—1443.
3. Albert R, Barabasi A.-L. Statistical mechanics of complex networks // Rev. Mod. Phys. — 2002. — N 74. — P. 47—97.
4. Barabasi A., Albert R. Emergence of scaling in random networks // Science. — 1999. — № 286. — P. 509—512.
5. Barabasi A. Scale-free Networks // Scientific American. — 2003. — № 5. — P. 50—59.
6. Бреер В.В., Новиков Д.А, Рогаткин А.Д. Стохастические модели управления толпой // Управление большими системами. — 2014. — Вып. 52. — С. 85—117.
Статья представлена к публикации членом редколлегии Ф. Т. Алескеровым.
Батов Алексей Владимирович — науч. сотрудник, Институт проблем управления им. В.А. Трапезникова РАН, г. Москва, © (495) 334-90-30, И batov@ipu.ru, Бреер Владимир Валентинович — канд. техн. наук, бизнес-аналитик, ЗАО «Авиахэлп Групп», г. Москва, И breer@live.ru,
Новиков Дмитрий Александрович — чл.-корр. РАН,
зам. директора, Институт проблем управления
им. В.А. Трапезникова РАН, г. Москва,
© (495) 334-75-69, И novikov@ipu.ru,
Рогаткин Андрей Дмитриевич — мл. науч. сотрудник,
Институт проблем управления им. В.А. Трапезникова РАН,
г. Москва, Иandreyrogatkin@gmail.com.