Б. А. ТОРОПОВ,
доцент кафедры информационных технологий, кандидат технических наук
B. A. TOROPOV, Candidate of Technology, Assistant professor at the Department of Informational Technologies
И. В. ГУРЛЕВ,
главный научный сотрудник научно-исследовательского центра,
доктор технических наук, профессор (Академия управления МВД России)
I. V. GURLEV, Doctor of Technology, Professor, Chief Researcher at the Research Center (Management Academy of the Ministry of the Interior of Russia)
В. Б. КОРОБКО,
эксперт, доктор технических наук, профессор (Общероссийская общественная организация «Деловая Россия»)
V. B. KOROBKO, Doctor of Technology, Professor, Expert (All-Russia Public Organization «Business Russia»)
УДК 004.421
Теоретико-графовая модель анализа общественной опасности распространяемой экстремистской информации
Public danger of extremist information spread analisys, based on graph-theoretic model
Статья посвящена проблеме определения The paper is devoted to a problem of extremist
того, в какой мере изменяется общественная information spread public danger level calculation.
опасность при распространении экстремистской Authors show that finding top-k most individually
информации различными пользователями соци- important participants is not optimal solution,
альных сетей или группами таких пользователей. when the most important coalition of k needed.
Авторы показывают, что задача нахождения For such a problem solution, the group centrality
максимально влиятельной группы из k участ- concept is considered. This concept helps to
ников не решается оптимальным образом при estimate individual value, that each participant
включении в эту группу k наиболее влиятель- brings to coalition. ных по отдельности участников. Для решения задачи предлагается использование групповых метрик центральности и анализ вклада отдельных участников в эффективность группы.
Социальная сеть, теория графов, центральность, коалиция, экстремизм, информация.
Social network, graph theory, centrality, coalition, extremism, information.
Социальные сети — это на сегодняшний день один из наиболее интересных и распространенных объектов научных изысканий и практических задач, связанных с анализом процессов и явлений, протекающих в социуме. К социальным сетям вопреки уже устоявшемуся бытовому пониманию относятся не только широко известные онлайновые сервисы в Интернете, но и системы связей между социальными объектами в реальном мире. Социальные сети — это и сети, состоящие из абонентов телефонной связи, почтовых сообщений, и сети, формируемые в процессе повседневной деятельности человека и его взаимоотношений с другими людьми, а также сети, сформированные в научном сообществе на основе соавторства, рецензирования, совместного участия в научных собраниях.
С точки зрения правоохранительной деятельности, существенный интерес представляют социальные сети как среда распространения вредоносной информации, которая способна причинить вред личности, обществу, государству. Сегодня в свете продолжающегося научно-практического осмысления того, что следует относить к экстремистской информации, а также того, как противодействовать ее распространению, весьма важной представляется задача сравнительного анализа количественных характеристик распространяемой информации (охват аудитории, скорость распространения). Здесь полем функционирования социальных сетей, как правило, является Интернет и его популярные сервисы.
В современной России уже имеется практика уголовного и административного преследования пользователей онлайновых сервисов за размещение на своих страницах сведений, носящих противоправный характер. О проблемах, возникающих в этой связи, пишет ряд авторов, в частности В. В. Баранов [1]. Учитывая уровень популярности онлайновых сервисов и объемы информации, регулярно там размещаемой, можно предположить, что указанная правоохранительная практика, скорее всего, носит фрагментарный и избирательный характер. Сегодня она не учитывает того, насколько различна общественная опасность от размещения противозаконной информации на страницах разных пользователей. Понять то, в какой мере представляют общественную опасность те или иные факты распространения экстремистской информации, на наш взгляд, можно только оценив положение инициаторов распространения такой информации в структуре социальной сети.
Действительно, очевидным представляется то, что степень наносимого вреда от размещения одной и той же экстремистской информации на страницах разных пользователей будет различна.
Таким образом, в целях совершенствования правоохранительной практики противодействия распространению информации в Интернете, несущей в себе состав правонарушения, следует развивать методы выявления наиболее значимых пользователей социальных сетей, являющихся источниками экстремистской угрозы.
Значимость участников социальных сетей по степени
Для онлайновых социальных сетей характерна зачастую высокая связность отдельных групп пользователей, т. е. «те, кто в друзьях у меня, как правило, также в друзьях друг у друга». Поэтому составы таких друзей у разных пользователей существенным образом пересекаются.
Итак, представим социальную сеть в виде графа, состоящего из набора вершин и ребер (рис. 1). Самих участников социальной сети будем отождествлять с вершинами графа (например, ^ или v6), связи между участниками — с ребрами графа. Три участника сети с наибольшим числом друзей: v0 , v1 (по 6 друзей) и v7 (5 друзей). В соответствии с терминологией, принятой в теории графов, центральности по степени с/« [4] соответствующих вершин равны 6, 6 и 5.
Причем состав друзей у участников v0 или v1 при равном их количестве полностью совпадает, а у участника v7, наоборот, практически уникальная аудитория, хотя количественно и несколько меньше.
Рис. 1. Пример графа
Предположим, что какие-либо два участника сети собираются объединить усилия по распространению некой экстремистской информации среди других участников. Если это будут v1, то их общая аудитория от такого объединения не увеличится. Однако любой из них, объединившись с v1, способен вдвое увеличить ее. Суммарная степень вершин v1 без учета связи между ними самими равна 5, тогда как суммарная степень любой из них и v1 достигает 10. Данный пример демонстрирует, что дело не всегда в охвате аудитории, зачастую
наибольшую угрозу (источники экстремистской информации) представляют те участники сети, у которых не просто много друзей, но при этом друзья мало связаны между собой.
Несколько более формализованная запись для коалиционной центральности по степени для любой вершины графа выглядит следующим образом:
1
I
1
^ (1 + число соседей V) и е соседи V (1 + число соседей и)' где
Ф1, — это средняя полезность вершины V для произвольной коалиции вершин. Данное значение определяет, в какой мере вершина V способна увеличить центральность по степени для любой возможной коалиции;
и — вершина соседняя с V.
Однако центральность по степени важна скорее для небольших сообществ, в крупномасштабных сетях начинают играть ведущую роль другие характеристики.
Групповая центральность по близости
В контексте рассмотрения процессов распространения информации в онлайновых сервисах Интернета наибольший интерес представляет метрика центральности по близости (или просто близость). Рассмотрим данную метрику центральности применительно к участникам онлайновых социальных сетей.
Метрика центральности по близости показывает, в какой мере вершина V близка ко всем остальным вершинам графа. Она рассчитывается как величина обратно пропорциональная средней длине кратчайшего пути от V до каждой другой вершины (из тех, до которых путь существует в принципе).
c N
1
£ I
и уи
где N — общее число вершин графа, а значение N — 1 (количество путей от V к другим вершинам) используется для нормирования результатов;
1т — длина кратчайшего пути между вершинами V и и.
Данное определение формализует интуитивно понятную идею о том, что вершины, которые близки ко многим другим вершинам, являются более важными. Применительно к моделям реальных сетей и процессов, в них протекающих, близость позволяет решать ряд важных прикладных задач. Например, для социальной сети близость показывает, насколько эффективен будет тот или иной участник этой социальной сети как инициатор распространения информации, как быстро информация, исходящая от него, разойдется по сети. Однако традиционная метрика близости упускает важную осо-
бенность реальных сетей. Ведь сразу несколько участников социальной сети могут быть источниками распространения информации. Например, двое. Даже если оба они обладают примерно равной и относительно высокой по данной сети близостью, то их зоны охвата аудиторий могут и, скорее всего, будут пересекаться, ведь они могут находиться рядом друг с другом. В этом случае более эффективен был бы выбор таких двух участников, которые, находясь на существенном расстоянии друг от друга, взаимно сократят пути до наиболее удаленных частей сети.
Приведем другой пример. В сети, представленной на рис. 2, у вершины v12 наиболее высокая центральность по близости, согласно вышеприведенной формуле, равна следующему значению: <12 = 0,441. Вершины v0 и v11 также обладают высокой близостью, которая несколько меньше, чем у v12. Ее значение следующее:
<0=<11= 0,417
Рис. 2. Пример графа
Объединение вершин графа в коалицию представим в следующем виде: объединяющиеся вершины трансформируются в новую единую вершину, сохраняющую все их внешние связи (рис. 3).
Рис. 3. На графе сформирована коалиция {v0, v12}
В случае если в коалицию вступает наиболее важная по близости вершина v12 и, например, вершина то их суммарная близость станет равной 0,519 (рис. 4).
Рис. 4. На графе сформирована коалиция (г0, гп)
При этом, если в коалицию вступают не самые важные по близости вершины ^ и v11, то их суммарная близость возрастает сильнее и становится равной 0,636. При этом важность вершины изначально наиболее высокая, снижается до 0,424, уступая теперь таким вершинам, как v1, v2 и (рис. 4).
Итак, если вершины ^ и v11 отождествить с участниками социальной сети, которые собираются распространять информацию экстремистского характера, то в совокупности они нанесут больше вреда обществу, чем участник v12 или такие группы участников, как и v11, либо ^ и v12.
Вычислительная сложность алгоритмов и выводы относительно возможностей применения метода
Безусловно, для приведенного в примере графа вычисления не требуют применения каких-либо изощренных алгоритмов и сколько-нибудь значимых вычислительных мощностей. Однако в реальных онлайновых социальных сетях насчитывается огромное количество пользователей. Так, основатель сети Facebook Марк Цукерберг в 2011 г. объявил о том, что сервис насчитывает
более двух миллиардов пользователей1, что также констатирует официальный сайт компании.
Возможное число коалиций в таком графе рас__<-. х-1« у-ч к
считывается как количество сочетаний =0 С „, что равняется 2 „ . Учитывая, что для каждой вершины графа необходимо рассчитать ее вклад в каждую возможную коалицию, для графа с „ = 2 млрд такая задача вычислительно неразрешима в обозримо короткое время [5].
Описанная модель расчета центральности вполне применима и реализуема для небольших подграфов, например, для отдельных тематических сообществ социального сервиса в Интернете или объединений таких сообществ, либо для отобранного подмножества пользователей, интересующихся определенной тематикой, заданной набором ключевых слов (например, «оружие», «революция», «джихад» и т. п.). Хотя следует отметить, что попытки создания «быстрых» алгоритмов обсчета крупномасштабных графов предпринимаются постоянно [3].
Программное обеспечение, позволяющее реализовать подобные алгоритмы, чрезвычайно разнообразно, хотя, как правило, требует определенных навыков программирования. Основную сложность представляет сбор данных из социальных сервисов. Как правило, программные средства, реализующие его, распространяются на платной основе, а также подвержены ряду ограничений со стороны социальных сервисов по объемам загружаемых единовременно данных.
Однако на сегодняшний день в органах внутренних дел уже имеется некоторая практика по применению программных средств для загрузки и анализа данных социальных сетей [2]. Предлагаемый подход к расчету значимости участников сетей позволяет расширить и дополнить такую практику и перейти от фрагмен-тированного, избирательного преследования отдельных пользователей к планомерной работе по пресечению и предупреждению преступлений, связанных с распространением экстремистской информации.
1 Сообщение М. Цукерберга на персональной страничке в РасеЬоок.
Список литературы:
References:
1. Баранов В. В. Совершенствование правового обеспечения деятельности органов внутренних дел по противодействию проявлениям экстремизма в глобальной компьютерной сети // Труды Академии управления МВД России. 2016. № 4 (40).
2. Баранов В. В., Емельянова Е. В. О некоторых направлениях деятельности органов внутренних дел Российской Федерации в сфере противодействия проявлениям экстре-
1. Baranov V. V. The law provision perfection of law enforcement activity to counteraction for extremism manifestation in a global computer network // The Labors of the Management Academy of the Ministry of the Interior of Russia. 2016. № 4 (40).
2. Baranov V. V., Yemelyanova Ye. V. About some directions of the Russian Federation law enforcement activity in a sphere of counteraction extremism manifestation in a global computer
мизма в глобальной компьютерной сети // Трудный путь в науку: сб. матер. Международ. юбилейной науч. конф. «Факультету подготовки научных и научно-педагогических кадров Академии управления МВД России — 30 лет: история и современность». М., 2017. Т. 1.
3. Торопов Б. А. Центральность распада в социальных графах и адаптированный алгоритм Флажоле-Мартена для ее расчета // International Journal of Open Information Technologies. 2017. № 9. Т. 5.
4. Jackson M. O. Social and Economic Networks. Princeton University Press. 2008.
5. DengX., Papadimitriou C. On the complexity of cooperative solution concepts. Mathematics of Operations Research. 1994. 19 (2).
network // A difficult way to the science: the materials' compilation of the International anniversary science conference "The are 30 years old of the faculty of science and science pedagogical staff of the Management Academy of the Ministry of the Interior of Russia: history and modernity". M., 2017. T. 1.
3. Toropov B. A. The disintegration's centrality in social columns and adapted algorithm of Fla-jole-Marten for its calculation // International Journal of Open Information Technologies. 2017. № 9. T. 5.
4. Jackson M. O. Social and Economic Networks. Princeton University Press. 2008.
5. Deng X., Papadimitriou C. On the complexity of cooperative solution concepts. Mathematics of Operations Research. 1994. 19 (2).
E-mail: [email protected]
tfi S a E-
I
С S
и
и ^
te
и
204