ВЕСТН. МОСК. УН-ТА. СЕР. 15. ВЫЧИСЛ. МАТЕМ. И КИВЕРН. 2024. .V 1. С. 61 66 Ьошоповоу СошргЛа^опа! Matllematics аш! CyЬorllotics Лоигпа!
УДК 519.6:316.472.45 М. А. Толстых
ИДЕНТИФИКАЦИЯ ФУНКЦИИ ПРОПУСКНОЙ СПОСОБНОСТИ СОЦИАЛЬНОЙ СЕТИ
Рассматривается диффузионная логистическая модель распространения информации в социальной сети в виде одномерного нестационарного параболического уравнения. Поставлена задача параметрической идентификации как экстремальная задача для поиска параметра в виде прострапствеппо-распределешгой функции пропускной способности сети. Применены градиентные методы оптимизации. Полученные результаты продемонстрировали равномерную сходимость к точному решению в методе с регулируемым направлением спуска.
Ключевые слова: социальные сети, математическое моделирование, идентификация, оптимизация.
Б01: 10.55959/М8и/0137 0782 15 2024 47 1 61 66
1. Введение. Модели распространения информации в социальных сетях могут использоваться для влияния на общественное мнение, прогнозирования социальных явлений, формирования рынка потребительских товаров и услуг, для борьбы с асоциальными и криминальными группами и мнш'ого другого. На сегодняшний день существует множество моделей, которые описывают процессы распространения информации в социальных сетях. Большинство из них [1, 2| учитывают либо только временную составляющую распространения информации без учета структуры сети, это так называемые динамические БШ-нодобные модели, либо учитывают только структурные закономерности, это статические модели в виде каскадной модели или линейной пороговой модели. Подобные модели дают достаточно точные прогнозы только в пределах одного измерения, времени или пространства. Модели, основанные на частных производных [3,4], могут описать диффузию информации в обоих измерениях, однако, из-за отсутствия механизмов надежного автоматизировавших) выбора оптимальных параметров моделей, их прогнозы редко превышают 90%. Среди подобных моделей наиболее перспективной представляется модель диффузионной логистики |4|.
Идентификация оптимальных параметров модели диффузионной логистики может значительно повысить ее точность. Параметры модели, в общем случае, представляют собой функции, которые в данной работе предлагается идентифицировать прямым экстремальным подходом. Такая идентификация параметров способна обеспечить наиболее точное соответствие модели реальному распространению информации в социальных сетях.
Мы рассмотрим задачу идентификации оптимального распределенного параметра-функции, представляющего собой коэффициент пропускной способности модели диффузионной логистики глобальной социальной сети.
2. Постановка задачи идентификации. Пусть х — это расстояние в графе сети, измеряемое минимальным набором ребер, по которым может быть передана информация у(х,€) от узла-источника информации в виде, например, репоетов определенной новости. Считаем, что источник информации находится в узле ха и в момент времени Ь = ¿о генерирует информацию V (ха, ¿о) в виде одной новости. Количество репоетов или их плотность (количество репоетов па
х
х
большим, чтобы сеть считать сплошной средой. При этом распространение информации будет подчиняться законам диффузии. Здесь состояние информационных процессов можно моделировать параболическим уравнением [5]
1 Физико-техпический факультет ДопГУ, е-шаП: pliysicist.oOyandex.ru
dv d2v
dt - - ruv = € П = (ха,хь) x (to,ti) . (1)
Состояние модели v(x,t) € ¿2(П), где L2 — евклидово пространство функций с интегрируемым квадратом, П — замыкание пространственно-временного множества П. В данном уравнении р(х) € L2 (ха, хь) — коэффициент популярности информации, который влияет на степень диффузии информации извне социальной сети, функция r(t) € L2 (to,ti) — скорость роста информации за счет пользователей, поделившихся новостью внутри сети, функция u(x) € ¿2(5), S = (ха, хь) — пропускная способность, т.е. максимально возможное количество поделившихся новостью пользователей на расстоянии х. Все функции р(х), r(t) и u(x) определены на П, но зависят только от времени или пространства.
Следует отметить, что в реальной сети v(x, t) ограничено пропускной способностью социаль-
х
нользователей на данном растоянии.
Граничные условия для уравнения (1) заданы на концах отрезка [ха, хь] в виде условия первого рода (условие Дирихле) и второго рода (условие Неймана) соответственно:
dv
v = ^а Гй = х„ x (to,ti), т- = 0 на Гь = хь x (to,ti).
dx
Информация в источнике ха всегда равна единице, ибо содержание информации в первом узле ограничивается одной новостью, а хь — это расстояние, на котором поток указанной информации обнуляется. Начальные условия зададим в виде отсутствия обсуждаемой новости в сети в момент to:
v = 0 на Г = [ха,хь] x to.
Функция пропускной способности социальной сети и(х) является управлением для уравнения (1). Оптимальное управление и*(х) можно найти на основании некоторых наблюдений за состоянием информации в области П. Отклонение модельного со стояния v от экспериментально наблюдаемого ve в реальной сети можно оценить следующим критерием качества идентификации модели в виде функционала:
J(u) = JJ (v - ve)2 drdi € E, (2)
n
Где e — это евклидово пространство действительных чисел. Наилучшее значение параметра u = u* будет доставлять минимум целевому функционалу J(u). Отметим, что J(u) зависит от u не явно, а через состояние модели (1). Это существенно усложняет решение оптимизационной
Ju
Рассматриваемую задачу параметрической идентификации для модели (1) можно сформулировать как экстремальную задачу [5,6]:
^(х) = arg min J(u), х € S. (3)
Данную задачу целесообразно решать прямым экстремальным подходом [7,8], который предполагает непосредственную минимизацию целевого функционала (2) на основе его градиента [5]
ti
VJ(u; х) = - J rv/dt € L2(S), (4)
to
значение которого определяется через решение сопряженной задачи /:
д/ д2/
- öt - Рдх2 - ruf + 2(v - ve) = 0, х,4 € П, (5)
с граничными и терминальным условиями:
д/
р/ = о на Га, р— = 0 па Гь, / = 0 на Г = [жа, хь] х (6)
дх
Будем использовать формально обобщенный на бесконечномерные пространства метод наискорейшего спуска (МНС) и метод с регулируемым направлением спуска (МРНС) [7], алгоритм которых можно записать как
ик+1(х) = ик (х) - Ьк а(х)У7 (ик; х) , х € (ха,хь), к = 0,1,..., (7)
где к — номер итерации, Ьк — шаговый множитель, который выбирался методом золотого сечения, а(х) — параметр регулирования направления спуска, для МНС он равен единице. Именно
а(х) может обеспечить сходимость ик(х) и*(х) равномерно на 5. В противном случае, если а отсутствует, то для бесконечномерных задач оптимизации (оптимизация в функциональных пространствах) сходимость к оптимуму и*(х) на 5 может отсутствовать или потребовать бесконечно много итераций, что по сути одно и то же.
В МРНС для квадратичных или близких к квадратичным функционалов параметр регули-а(х)
а(х) = ¡дахя ■ (8)
3. Решение тестовой задачи. Для оценки возможности применения экстремальных алгоритмов (7) при идентификации функции пропускной способности социальной сети, а также для оценки их эффективности, рассмотрим следующую тестовую задачу.
Примем параметры модели (1), полученные авторами [4| для социальной сети Digg:
. , 0.0059 / 0.0059 р = 0.01, г(*) =--е-1.5526М--1
и 'V; 1.5526 V 1.5526
Решение исходной (1) и сопряженной (5) параболических задач производилось с использованием неявной конечно-разностной схемы Кранка Николсона с четырехточечным шаблоном. Схема имеет первый порядок точности по времени и второй порядок по пространству. Задавалась сетка: {хг = ха + ¿Ах, i = 0,... п, Ах = = ¿о + з = 0,... т, А* = 0.15где А*
выбрано исходя из условия Куранта. При этом решение прямой задачи находилось на (3 + 1)-м слое, а сопряженной — в обратном направлении по времени, на (3 — 1)-м слое. Количество итераций в алгоритме (7) задавалось условием его практической сходимости:
||ик+1 _ ик II
IIй и 11^2(5) < 10-3
1К 11^2(5)
Зададим тестовое управление и*(х) = _0.03х2 + 0.2 а полученное решение V исходной задачи примем как экспериментальное V,,. График тестового оптимального управления показан па рис. 2 сплошной линией. Теперь будем решать задачу идентификации (3). Полученное управление сравниваем с тестовым значением.
Задавалось начальное приближение и0(х) = 0.45, которое удовлетворяет требованию МРНС: sgn VJ (и0; х) = сопвt Ух. Начальное приближение показано на рис. 2 точечной линией. При этом отклонение ||и0 _ и*|^2(5) = 0.479, а функционал J0 = 0.011. Градиент функционала для начального приближения VJ (и0; х) всюду положительный.
Для существования единственного минимума у функционала (2) он должен быть строго выпуклым. Оценку выпуклости J(и) выполним графически.
Зададим несколько постоянных функций управления в окрестности оптимального значения. При этом J(и) можно будет представить точками на одномерном графике. Пример такой функции для шести точек (постоянных управлений) представлен на рис. 1. Видно, что J(и) имеет
строго выпуклый вид. Более того, парабола, построенная по трем правым точкам, свидетельствует о том, что .7(и) хоть и не квадратичный, но очень близок к квадратичному отображению. Все это говорит о том, что, во-первых, высока вероятность того, что J(u) строго выпуклый, и имеет единственный минимум в рассматриваемой окрестности, во-вторых, вблизи минимума допустимо использовать формулу (8). Как показали дальнейшие тестовые расчеты, при переходе через минимум, всегда наблюдался возврат к нему, т.е. графическая оценка выпуклости .7(и) в расчетах подтвердилась.
0.006
0.005
0.004
,0.003
0.002
0.001
0.000
1_1_ - рагаЬо1а
< ►---^
0.01 0.07 0.13 0.19 0.25 0.31 0.37 и
Рис. 1. Оценка выпуклости и квадратичности целевого функционала
Сначала будем решать задачу посредством МНС. Полученные результаты идентификации представлены на рис. 2. Итерационный процесс закончился при к = 49 (пунктирная кривая) с плохой неравномерной сходимостью в пространстве управлений. При этом на последней итерации невязка II и49 — п* 11, = 0.227, функционал 749 = 1.02 • Ю-6. Видно, что идентифицированная функция не сходится к оптимальной на правой границе. Это объясняется существенно разной чувствительностью функционала к управлению в разных точках пространства. Традиционные градиентные методы не способны преодолевать подобные сложности и обеспечивать равномерную сходимость в бесконечномерных задачах оптимизации [7].
✓
/ / / / /
/ / / / /уГ /7 / /
- и.
и (X) и0 1 =3-
0.5
0.4
0.3
0.2
0.1
0.0
Рис. 2. Идентификация посредством МНС
Если ввести параметр регулирования спуска (8), то МРНС дает результат, представленный на рис. 3. Идентифицированная функция и(х) сходится равномерно к оптимальной на всей об-
ласти определения S. При этом необходимая точность была достигнута на 39-й итерации при И?/39 — ,w*||L2(4) = 0.005, а функционал J39 = 5.55 • Ю-10, что на четыре порядка лучше чем дал МНС.
Рис. 3. Идентификация посредством МРНС
Было сделано еще два численных эксперимента с разными начальными приближениями. На рис. 4 показаны результаты идентификации. Все количественные результаты сведены в таблице.
0.5 0.4 0.3 0.2 0.1 0.0
МНС —- ___
У
У /уг
— и.
и (х) ■■■■ и0
0.5 0.4 0.3 0.2 0.1 0.0
0.5 0.4 0.3 0.2 0.1 0.0
МРНС - U, и (X)
и 0
0 1 2 3 4 5
х
МРНС
4
— и,
и (х) Но
1 2 3 4 5
х
1 2 3 4 5
х
Рис. 4. Идентификация посредством МНС и МРНС с разными начальными приближениями
Мы видим, что МРНС дает очень хорошую равномерную на Б сходимость функции и(х) к оптимальному значению и*(х) за небольшое количество итераций, обеспечивая при этом практически нулевое минимальное значение критерия качества идентификации .].
Результаты идентификации с разными начальными приближениями
Метод u° J 0 J k k U - U* L2(S) k
МНС 0.45 0.011 1.02 ■ 10-6 0.227 49
МРНС 5.55 ■ 10-i° 0.005 39
МНС 0.04x 7.393 ■ 10-4 5.76 ■ 10-7 0.274 166
МРНС 4.71 ■ 10-9 0.005 13
МНС 0.03x2 0.5x + 0.2 1.571 ■ 10-5 5.32 ■ 10-5 0.172 13
МРНС 1.55 ■ 10-i° 0.011 21
4. Выводы. Полученные результаты говорят, во-первых, о возможности применения пря-Moi'o экстремального подхода для параметрической идентификации динамических и распределенных диффузионных моделей социальных сетей. Во-вторых, результаты свидетельствуют о высокой эффективности МРНС но сравнению с традиционным обобщением МНС на бесконечномерные пространства. Эффективность МРНС проявляется в равномерной сходимости иденти-фицируемохх) параметра-функции к оптимальному значению за относительно малое количество итераций. В-третьих, оптимальная идентификация параметров социальной сети может обеспечить минимум погрешностей моделирования потоков информации.
СПИСОК ЛИТЕРАТУРЫ
1. Li M.. W О. Г1 g X., G a о К.. Zhang S. A survey on information diffusion in online social networks: Models and methods // Information. 2017. 8. N 4. P. 118.
2. Kumar S.. Saini M.. Goel M.. Panda B. S. Modeling information diffusion in online social networks using a modified forest-fire model // J. Intelligent Information Systems. 2021. 56. P. 355 377.
3. H u Y.. Song R. J.. Chen M. Modeling for information diffusion in online social networks via hydrodynamics // IEEE Access. 2017. 5. P. 128 135.
4. Wang H.. Wang F.. Xu K. Modeling Information Diffusion in Online Social Networks with Partial Differential Equations. Springer Nature. 2020.
5. Толстых В.К.. Толстых M.А. Необходимое условие оптимальности параметрической идентификации для распределенной модели социальных сетей // Вести. Донецкого нац. ун-та. Серия Г. Технические науки. 2021. № 3. С. 63 68.
6. Толстых М.А. Задача идентификации параметров социальных сетей // Материалы Международного молодежного научного форума !'Ломоносов-2020". М.: МАКС Пресс. 2020. (URL: http: //lomonosov-msu.ru/archive/Lomonosov_2020/'data/section_34_ 19485.htm )
7. Толстых В.К. Прямой экстремальный подход для оптимизации систем с распределенными параметрами. Донецк: Юго-Восток. 1997.
8. Васильев Ф.П. Методы оптимизации. Т. 2. М.: МЦНМО, 2011.
Поступила в редакцию 26.04.23 Одобрена после рецензирования 20.10.23 Принята к публикации 20.10.23