Научная статья на тему 'Кластеры петербургских политических онлайн-сообществ в «ВКонтакте»'

Кластеры петербургских политических онлайн-сообществ в «ВКонтакте» Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
1211
184
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
BIG DATA / DATA MINING / КЛАСТЕРНЫЙ АНАЛИЗ / ОНЛАЙН-СООБЩЕСТВА / ПОЛИТИЧЕСКАЯ КОММУНИКАЦИЯ / СЕТЕВОЙ АНАЛИЗ / СМЕЖНАЯ АУДИТОРИЯ / СОЦИАЛЬНЫЕ МЕДИА / СОЦИАЛЬНЫЕ СЕТИ / ЭХО-КАМЕРЫ / CLUSTERING / ONLINE COMMUNITIES / POLITICAL COMMUNICATION / NET-WORK ANALYSIS / AUDIENCE ADJACENCY / SOCIAL MEDIA / SOCIAL NETWORKS / ECHO CHAMBERS

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Суслов Сергей Игоревич

В работе проводится сетевой анализ общественно-политического пространства петербургского сегмента социальной сети «ВКонтакте». Исследователи создали математическую модель графа в котором содержится совокупность виртуальных сообществ и набор связей между ними (общая аудитория). В работе произведен кластерный анализ и сравнение результатов кластеризаций. Обнаружены крупные кластеры: националистический и общественно-либеральный. Проведен подробный анализ структуры, численности и «публикационной активности». Библиогр. 38 назв. Ил. 4. Табл. 7.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Суслов Сергей Игоревич

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

SAINT-PETERSBURG’S POLITICAL ONLINE COMMUNITIES CLUSTERS IN “VKONTAKTE”

Social media creates the space for the development of online communities that are different in social setting and activities. Our ambition is to study the sociopolitical online communities of St. Petersburg. We try to explore how online communities structure the practices of political consumption, especially in the field of the online social network “VKontakte”. In this part of research, that can be described as the first step of the project, we focus on the mapping network of sociopolitical online communities of St. Petersburg. Our aim is to make a general picture of the sociopolitical online communities and to analyse its structure in terms of clustering. We examine 440 online communities collected via a sample extension algorithm. The methodological approach is based on mathematical graphing theory. The model is a set of communities and a set of audience adjacency. These intersections are regarded as the edge’s weights. In the second model ties are interpreted as the communication flow of reposts between communities. The edge’s weights are regarded as the edges merge with the same source and target node. It is interesting that the model of audience adjacency has the strong links. When reducing the weak edges we use the polarization simulation in echo chambers. In the model, we use the different types of affinity propagation in the Chinese Secret concept to divide the graph in more clusters: from 2 up to 15. Refs 38. Figs 4. Table 7.

Текст научной работы на тему «Кластеры петербургских политических онлайн-сообществ в «ВКонтакте»»

2016 ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА Сер. 12 Вып. 4

ТРАНСФОРМАЦИЯ СОВРЕМЕННОГО СОЦИАЛЬНО-КУЛЬТУРНОГО ПРОСТРАНСТВА

УДК 32.019.52 С. И. Суслов

КЛАСТЕРЫ ПЕТЕРБУРГСКИХ ПОЛИТИЧЕСКИХ ОНЛАЙН-СООБЩЕСТВ В «ВКОНТАКТЕ»

«Центр социологических и Интернет-исследований», Российская Федерация, 191060, Санкт-Петербург, ул. Смольного, 1/3

В работе проводится сетевой анализ общественно-политического пространства петербургского сегмента социальной сети «ВКонтакте». Исследователи создали математическую модель графа в котором содержится совокупность виртуальных сообществ и набор связей между ними (общая аудитория). В работе произведен кластерный анализ и сравнение результатов кластеризаций. Обнаружены крупные кластеры: националистический и общественно-либеральный. Проведен подробный анализ структуры, численности и «публикационной активности». Библиогр. 38 назв. Ил. 4. Табл. 7.

Ключевые слова: big data, data mining, кластерный анализ, онлайн-сообщества, политическая коммуникация, сетевой анализ, смежная аудитория, социальные медиа, социальные сети, эхо-камеры.

S. I. Suslov

SAINT-PETERSBURG'S POLITICAL ONLINE COMMUNITIES CLUSTERS IN "VKONTAKTE"

Center for Sociological and Internet Research,

1/3, ul. Smolnogo, St. Petersburg, 191060, Russian Federation

Social media creates the space for the development of online communities that are different in social setting and activities. Our ambition is to study the sociopolitical online communities of St. Petersburg. We try to explore how online communities structure the practices of political consumption, especially in the field of the online social network "VKontakte". In this part of research, that can be described as the first step of the project, we focus on the mapping network of sociopolitical online communities of St. Petersburg. Our aim is to make a general picture of the sociopolitical online communities and to analyse its structure in terms of clustering. We examine 440 online communities collected via a sample extension algorithm. The methodological approach is based on mathematical graphing theory. The model is a set of communities and a set of audience adjacency. These intersections are regarded as the edge's weights. In the second model ties are interpreted as the communication flow of reposts between communities. The edge's weights are regarded as the edges merge with the same source and target node. It is interesting that the model of audience adjacency has the strong links. When reducing the weak edges we use the polarization simulation in echo chambers. In the model, we use the different types of affinity propagation in the Chinese Secret concept to divide the graph in more clusters: from 2 up to 15. Refs 38. Figs 4. Table 7.

Keywords: big data, data mining, clustering, online communities, political communication, network analysis, audience adjacency, social media, social networks, echo chambers.

© Санкт-Петербургский государственный университет, 2016 DOI: 10.21638/11701/spbu12.2016.405 69

Введение

На сегодняшний день все больше исследователей полагают, что сетевой анализ является эффективной и современной методологией изучения общества и политики. Сетевой анализ находится на стыке разных дисциплин. «Он объединяет социологов, антропологов, математиков, экономистов, политологов, психологов, комму-никологов, статистиков, этологов, эпидемиологов, программистов, специалистов по организационному поведению, маркетологов и в последнее время физиков» [1, p. 5]. Более того, Гаммон (Hummon) и Карлей (Carley) после изучения цитирования пришли к выводу [2], что он отвечает признакам «нормальной» науки по Т. Куну [3].

Родоначальником сетевого анализа принято называть Я. Морено (J. Moreno), американского психиатра румынского происхождения, основателя социометрии, и Х. Вайта (H. White), американского социолога и профессора Колумбийского университета. Сетевой анализ применяется для разных исследований: определения лидеров [4], выявления ключевых хабов [5], поиска наиболее используемых конструкций [6], изучения распространение болезни [7] и информации [8]. Кроме того, сетевой анализ активно применяется в наукометрии [9].

В свою очередь, онлайн-сообщества становятся объектом исследования в рамках сетевого анализа. Центр Беркмана проводил исследование публичного дискурса российской блогосферы [10] и рускоязычного сегмента Twitter [11]. С. Грин подробно описал роль Twitter в российском протесте [12], Дж. Маричал (Marichal) описывал политические группы в Facebook [13], А. С. Шерстобитов проводил анализ политической мобилизации [14], А. Груздь и К. В. Цыганова исследовали сообщества за и против Майдана [15], Г. В. Градосельская проводила кластеризацию политических сообществ в Facebook [16].

Объектом нашего исследования выступают онлайн-сообщества (далее — сообщества), а предметом анализа — политические и общественные сообщества петербургского сегмента сети как региональная группа сообществ.

Целью нашего исследования является выявление структуры сети политико-общественных сообществ Петербурга в социальной сети «ВКонтакте». Другими словами, исследовательский вопрос заключается в том, как сообщества структурируют практики политического участия и политической коммуникации в сети? Таким образом, исследование носит разведывательный характер.

Задачи исследования:

1. Создание графа сообществ с укладкой ForceAtlas2 как карты политических сообществ;

2. Разделение сообществ на кластеры, что даст представление об общественно-

политическом пространстве.

В последующих разделах описаны методологическая и методическая основа математического моделирования, раскрыт подход к сбору данных, описаны результаты и перспективы исследования.

Методология и метод исследования

Сетевой анализ представляет собой междисциплинарную исследовательскую программу, которая стремится описать и предсказать структуру отношений между объектами или субъектами. В отличие от привычных подходов в социологии,

сетевой анализ исходит из предположения, что атрибуты актора второстепенны, в отличие от отношений, в которых состоит актор. Таким образом, сетевой анализ основан на восприятии структуры как скопления связей различных акторов. Также он основан на эмпирических данных, использует математические модели и дает визуальное представление структуры связей. Существенными элементами исследовательской программы являются определение сети и анализ данных.

Методология нашего исследования основана на теории графов. В изучении процессов реальной жизни принято называть модели сложными сетями (complex networks) [17, 18]. В сетевой теории сложными сетями называют сети с непростыми топологическими особенностями, которые присутствуют в графах-моделях реальных систем.

Мы используем математическое моделирование: модели ориентированного и неориентированного взвешенных графа. Граф G := (V, E) — это совокупность множества вершин V и наборов связей между ними E. В нашем исследовании узлами являются сообщества, а ребрами либо факт перепоста из сообщества в сообщество, либо пересекающаяся область множества участников сообществ —WAB = NA П NB, где A и B сообщества, N — это количество участников, WAB есть вес ребра между A и B; WAB е E.

Неориентированный взвешенный граф демонстрирует карту потребления информации, а также пристрастия аудитории. Мы полагаем, что членство в одном сообществе не является важным условием для составления карты. Исходя из этого, допустимым минимумом для ребра является членство пользователя в двух сообществах одновременно. Если в сообществах A и B состоят одновременно k пользователей, то k — это смежная аудитория. Смежная аудитория в нашем исследовании вычислялась и присваивалась как вес WAB ребра.

С целью выяснить, на какие подмножества разделяется общественно-политическое пространство, нами применяется алгоритм кластеризации «глухой телефон» (Chinese Whispers Clustering Algorithm), названный в честь детской игры. Он был разработан в 2005 г. К. Биманом (C. Biemann) и С. Тересинаки (S. Teresinak) [19]. Алгоритм принадлежит к жестким методам разделения. Это означает, что во время запуска процесса один узел может принадлежать только к одному кластеру.

Алгоритм работает следующим образом.

Все узлы изначально принадлежат к разным кластерам, то есть n есть количество узлов и кластеров.

В случайном порядке узлы начинают «перекрашивать» соседние. Узел присоединяется к кластеру, с которым он имеет наибольшее количество соединений.

Предыдущий этап повторяется до тех пор, пока не закончится заданное количество итераций или пока процесс не сойдется.

Алгоритмы кластеризации графов могут учитывать разные свойства распространения связей (affinity propagation). В статистике и в сборе данных распространение связей — это алгоритм кластеризации, построенный на распространении сообщения между узлами. В отличие от методов k-means и k-medoids ему не требуется заранее определять количество кластеров. В нашем инструментарии метод глухого телефона имеет три настройки распространения связей: «Вершина» (Top), «Логарифм дистанции» (Log. Distance) и «Дистанция» (Distance) для наилучшего понимания классификации узлов в зависимости от пересчета влияния связей [20].

Метод «Вершина» создает кластеры на основе суммы сети узлов, расположенных по соседству. Метод «Дистанция», в противовес предыдущему, показывает увеличивающуюся значимость каждого кластера, что дает повышенную точность классификации и разбивку графа на большее количество субграфов. В ходе данного процесса уменьшается влияние сильных узлов, увеличивается влияние транзитивных соседей. Логарифм дистанции делает то же самое, лишь приводя все веса ребер в логарифмическую шкалу, чтобы минимизировать влияние экстремальных значений отдельных узлов в графе.

Сбор данных

В качестве источника данных выступает социальная сеть «ВКонтакте». Она была выбрана как самая популярная социальная сеть на постсоветском пространстве: на сайте зарегистрировано более 350 млн пользователей, 2,5 млрд страниц открывается ежедневно, 80 млн посетителей заходят каждый день. [21]

API VK (application programming interface — интерфейс прикладного программирования) даёт огромные возможности социологу. Он позволяет любому разработчику получить доступ к информации, содержащейся в социальной сети даже без получения «ключа» access-token. API VK используется в исследованиях. Например, Г. Суворов представил данные об участниках протестных сообществ [22].

Мы организовали поиск информации в базах данных (data mining), используя язык программирования Python для написания программ, необходимых для цели исследования. Библиотека requests и различные методы VK API позволили создать несколько программных продуктов. Мы перечислим основные методы, использованные в исследовании:

1. users.get [23] — возвращает расширенную информацию о пользователях;

2. groups.getById [24] — возвращает информацию о заданном сообществе или о нескольких сообществах;

3. groups.getMembers [25] — возвращает список участников сообщества;

4. wall.get [26] — возвращает список записей со стены пользователя или сообщества.

Таким образом, поле исследования составило 440 сообществ, собранных в мае 2016 г., вся их неуникальная аудитория, численностью 1 199 169 человек, а также все публикации сообществ в количестве 2 309 430 постов. Ответы VK API содержат многомерные массивы, содержащие атрибуты наблюдений. Сумма наблюдений превышает 1 млн, что, по мнению некоторых исследователей, обладает необходимыми признаками для использования термина «большие данные» (big data) [27].

Результаты

В предыдущем исследовании [28] мы провели сетевой анализ политических сообществ, найденных по ключевым словам. Перед нами встала задача расширить выборку с целью обнаружить не только неучтенные политические сообщества, но также и связанные с ними. Здесь мы основывались на гомофилии в графах [29, 30]. Мы разработали специальное программное обеспечение. В итоге методом снежного кома выборка увеличилась с 110 до 440 сообществ, локализованных

в Санкт-Петербурге. Под последним понимался атрибут city в параметре fields метода groups.getByld. Также принадлежность к городу можно определять по составу сообщества (подавляющее большинство участников из одного города), но из-за неразработанного на тот момент алгоритма реконструкции данных мы вынуждены были отказаться от такого признака. Для расширения использовались коммуникативные связи перепостов (параметр owner_id в методе wall.get) и ссылки (атрибут links параметра fields метода groups.getByld). Таким образом, исследование является выборочным. У этой выборки есть ограничения: мы предполагаем, что есть много политических петербургских сообществ и сообществ, в которых подавляющее большинство составляют петербуржцы, но в профиле сообщества не указан атрибут города.

В выборку из 440 сообществ попали хоть и связанные сообщества, но зачастую не отвечающие признакам релевантности. Данную проблему сетевой выборки мы решили симуляцией эхо-камер и алгоритмом кластеризации графов.

После получения массива расширенной выборки нами был создан взвешенный граф смежной аудитории между сообществами. Изучив модель, мы пришли к выводу, что большинство ребер графа имеет низкий вес и неравномерное распределение. Медиана составляет 6, среднее арифметическое —26,31, асимметрия — 10,99; первый квантиль — 2, третий квантиль — 19, а верхний ус, или верхний предельный случай [31], (2,698а) диаграммы размаха — 191,5. Эти цифры позволяют судить о том, что в выборку входят пересекающиеся по аудитории сообщества, выбранные сообщества отвечают признаку предмета исследования — политические. Люди со схожими взглядами будут подписаны на примерно одинаковый набор сообществ. Высокая асимметрия демонстрирует, что большинство связей минимальное, а также свидетельствует о наличии групп с высокой интенсивностью пересечений. Кроме того, кластеризация графа разными алгоритмами не давала никаких результатов — обнаружился единственный кластер, так как плотность графа практически приближалась к единице.

Затем мы провели эксперимент с удалением ребер со слабыми весами и подсчетом модулярности графа на каждом шаге с целью симуляции возможности поляризации на эхо-камеры [32]. Модулярность — параметр, определяющий, как граф делится на подмножества [33]. Сети с высокой модулярностью имеют плотные внутренние связи в субграфе, но разряженные связи между субграфами.

На рис. 1 можно увидеть, как последовательно с шагом 5 удалялись все значения веса ребер графа от 0 до 100, а одновременно с этим проводился постоянный замер модулярности и количества сообществ, на которые распадается граф. Таким образом, был создан график зависимости операций.

На рис. 1 заметно, что график количества сообществ увеличивается практически постоянно, за исключением первых шагов. Кроме того, дельта минимальна. График модулярности также не уменьшается, но отличительным является то, что на первых шагах модулярность растет стремительно. Таким образом, идеальным является порог 20 между медианой и средним арифметическим. После удаления слабых связей в модели осталось 428 сообществ.

Применив кластеризацию методом глухого телефона с настройкой «Вершина», мы получили классификацию узлов на два крупных кластера (рис. 2). Один кластер объединяет в себе общественные, либеральные, социалистические

WEIGHT LOSS

Рис. 1. График зависимости модулярности и количества сообществ от веса ребер, подвергнутых удалению из графа. Размер верхнего графика — плотность, размер нижнего графика — количество сообществ

Рис. 2. Кластеризация «Вершина» графа симуляции эхо-камер

74

и ЛГБТ-сообщества. Назовем его условно «общественно-политический». Другой кластер содержит националистические и спортивные сообщества. Его будем именовать условно националистический. Сравнение кластеров дано в табл. 1.

Таблица 1. Метрики кластеризации «Вершина»

Кластер: общественно-политический националистический

% узлов 63,08 36,92

% ребер 53,01 24,48

Средняя степень узла 71,06 56,07

Средняя взвешенная степень 6692,51 9415,72

Диаметр 4 4

Средняя длина пути 1,81 1,69

Плотность ,36 ,35

Модулярность ,24 ,25

Количество сообществ 5 3

Средний коэффициент кластеризации ,81 ,82

Средний взвешенный коэффициент кластеризации ,85 ,88

В общественно-политический кластер входит 63,08 % сообществ. Численность неуникальной аудитории составляет 1 141 801 профиль. В националистический кластер входит 36,92 % сообществ, численность неуникальной аудитории — 1 167 629 профилей. Большинство ребер графа содержатся в общественно-политическом кластере — 53,01 %, а в националистическом — 24,48 %. Хоть средняя степень узла у общественно-политического кластера выше, чем у националистического, тем не менее по средней взвешенной степени он уступает националистическому. Кроме того, 22,52 % ребер со средней взвешенной степенью 1302,27 связывают кластеры. Эти степени говорят нам о том, что участники националистических сообществ подписаны на большее количество пабликов в своем кластере по сравнению с участниками другого кластера. Другими словами, степень вовлеченности намного выше. По остальным метрикам кластеры практически не отличаются.

Самый многочисленный кластер — второй. В нем в среднем на одно сообщество приходится 7390,06 участника. В первом кластере в среднем на одно сообщество приходится 4228,89 участника. В «публикационной активности» мы наблюдаем схожую картину: в среднем во втором кластере на одно сообщество приходится 4506,95 публикаций. В первом кластере на одно сообщество приходится 1858 публикаций. В первом кластере между «публикационной активностью» и количеством участников был обнаружен средний коэффициент корреляции Пирсона — 0,45 при р-уровне значимости менее 2,817*1015, что делает её значимой. Во втором кластере — 0,5 при р-уровне значимости меньше 1,488*10-11. Отсюда следует, что сообщества националистов многочисленнее и проявляют большую медиа-активность.

Кластеризация графа алгоритмом глухого телефона с использованием распространения связей «Логарифм дистанции» дала результат в виде разбивки на три кластера (рис. 3). Из общественно-политического кластера выделился отдельный — ЛГБТ-сообществ. Другие два кластера сохраняют свои основные черты.

Рис. 3. Кластеризация «Логарифм дистанции» графа симуляции эхо-камер

Таблица 2. Метрики кластеризации «Логарифм дистанции»

Кластер Общественно-политический Националистический ЛГБТ-сообщества

% узлов 57,24 37,38 5,37

% ребер 46,8 24,96 1,14

Средняя степень 69,15 56,46 17,91

Средняя взвешенная степень 6562,1 9398,45 3272,17

Диаметр 4 4 2

Средняя длина пути 1,8 1,7 1,2

Плотность ,28 ,36 ,81

Модулярность ,224 ,253 ,025

Количеств сообществ 4 4 2

Средний коэффициент кластеризации ,82 ,83 ,91

Средний взвешенный коэффициент кластеризации ,86 ,88 ,96

Сравнение кластеров представлено в табл. 2. Первый кластер по-прежнему аккумулирует общественные, либеральные и социалистические интернет-сообщества. Хотя ЛГБТ-кластер выделился из него, общественно-политический кластер остается самым крупным по количеству сообществ и самым связанным по количеству внутренних ребер. Численность неуникальной аудитории стала чуть мень-

ше — 1 005 235. Средняя взвешенная степень данного кластера — 6562. В среднем на одно сообщество приходится 4103 участника. В первом кластере на одно сообщество приходится 1830,77 публикаций. Между численностью и «публикационной активностью» была обнаружена средняя корреляция 0,49 при р-уровне значимости меньше 2,2*1016.

Второй кластер практически никак не изменился. Средняя взвешенная степень хоть незначительно уменьшилась, но остается самой высокой — 9398. Второй кластер остается самым многочисленным и самым активным в «публикационной активности». Корреляция является средней — 0,46 при р-уровне значимости меньше 6,65*1010.

Третий кластер связывает сообщества ЛГБТ. Он заметно меньше остальных: в кластере находятся всего 5,37 % узлов. Процент внутренних ребер также низкий. Численность неуникальной аудитории — 46 201 участник. Хотя кластер является малочисленным и имеет малое количество связей, поражает его плотность. Средняя взвешенная степень составляет 3272: она высока и на фоне самой короткой длины пути и высокой плотности. Это говорит о том, что солидарность в ЛГБТ-кластере чрезвычайно высока. Третий кластер является самым малочисленным — в среднем на одно сообщество приходится 2008,73 участника. На одно сообщество в среднем приходится 1615,59 публикаций. Здесь мы не обнаружили статистически значимой корреляции.

Таблица 3. Процент связей в кластеризации «Логарифм дистанции»

Кластер Общественно-политический Националистический ЛГБТ-сообщества

Общественно-политический 46,8 22,52 4,46

Националистический 24,96 ,12

ЛГБТ-сообщества 1,14

Таблица 4. Вес связей в кластеризации «Логарифм дистанции»

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Кластер Общественно-политический Националистический ЛГБТ-сообщества

Общественно-политический 6562,1 1299,93 250,5

Националистический 9398,45 4

ЛГБТ-сообщества 3272,17

Большинство связей — 72,9 % — приходится на внутрикластерные ребра. Из табл. 3 и 4 видно, что самые частые и интенсивные межкластерные связи мы наблюдаем между первым и вторым кластерами — 22,52 %, менее интенсивно первый связан с третьим кластером.

Кластеризация графа алгоритмом глухого телефона с использованием распространения связей «Дистанция» дала результат в виде разбивки на 15 кластеров (рис. 4). Из крупных кластеров выделились малочисленные. Тем не менее прежние центры поляризации продолжают существовать. Результат данной кластеризации представляет наибольший интерес для структурации политического участия в он-лайн-пространстве.

Рис. 4. Кластеризация «Дистанция» графа симуляции эхо-камер

Далее мы по численности получившихся кластеров дадим экспертную характеристику. В табл. 5 указаны данные только одиннадцати кластеров, последующие кластеры не являются политическими сообществами.

Самый крупный по количеству сообществ кластер состоит из сообществ общественных организаций и либеральных сообществ — «общественно-либеральный». Крупные сообщества данного кластера: «Красивый Петербург», «Петербург за честные выборы», «Помощь задержанным в Питере», «Движение "Весна"». Классифицировать каждое сообщество на предмет того, является ли оно политическим или общественным, дело другого исследования. В данный кластер входит 41,12 % он-лайн-сообществ с численностью неуникальной аудитории 221 722 профиля, таким образом, на одно сообщество приходится в среднем 2647,21 профилей. Количество внутренних ребер велико — 32,63 %. Средняя степень узла высока, а взвешенная степень не является самой высокой. Стоит отметить, что кластер в данном распространении связей довольно плотный и связанный, а между сообществами есть обилие интенсивных пересечений аудитории. «Публикационная активность» составляет 1358,06 постов на одно сообщество. Между численностью и «публикационной активностью» был обнаружен слабый коэффициент корреляции — 0,28 при р-уровне 0,0001339.

Второй по количеству сообществ в графе кластер остается националистическим. Мы перечислим для примера самые крупные сообщества: «Сопротивление», «Одежда Варгградъ | Русские Мануфактуры» (онлайн-магазин одежды, имеющей традиционалистскую символику), «Русский дайджест». Отличительной особенностью данного кластера является наличие коммерческих групп, существующих под

Таблица 5. Метрики кластеризации «Дистанция»

Кластер 1 2 3 4 5 6 7 8 9 10 11

% узлов 41,12 37,15 5,84 5,37 3,04 1,17 1,17 ,93 ,93 ,7 ,7

% ребер 32,63 27,33 1,23 1,14 ,35 ,04 ,05 ,03 ,02 ,01 ,02

Средняя степень узла 67,1 62,22 17,76 17,91 9,69 2,8 3,6 2,5 2 ,33 2

Средняя взвешенная степень 6086,13 9532,13 4726,56 3272,17 710,76 323,6 360,8 114,5 126 43,33 60

Диаметр 3 3 3 2 2 2 2 2 2 2 1

Средняя длина пути 1,627 1,64 1,26 1,18 1,19 1,3 1,1 1,16 1,33 1,33 1

Плотность ,383 ,394 ,74 ,814 ,8 ,7 ,9 ,83 ,66 ,66 1

Модулярность ,181 ,248 ,06

Количество сообществ 3 4 1 1 2 1 1 1 1 1 1

Средний коэффициент кластеризации ,86 ,83 ,93 ,91 ,9 ,87 ,9 ,83 ,78 1

Средний взвешенный коэффициент кластеризации ,9 ,87 ,94 ,96 ,93 ,73 ,96 ,49 ,61 1

чо

лозунгом «Покупай у своих»; политических, общественных и тематических (ЗОЖ, помощь задержанным) сообществ.

Националистический кластер включает 37,15 % сообществ, в которых состоит неуникально 783 474 профилей, в среднем на одно сообщество приходится 9764,51 профиля. «Публикационная активность» по-прежнему высокая: на одно сообщество приходится 5121,7 публикаций. Мы обнаружили умеренную корреляцию 0,44 при р-уровне меньше 5,38*10-9.

Третий кластер является производным от националистического — это спортивные сообщества. С националистическим кластером с весом 475,88 его связывают 4,66 % ребер. Что интересно, все сообщества посвящены единоборствам. Как и в предыдущем кластере, присутствуют онлайн-магазины, а также сообщества спортивных секций. Спортивный кластер состоит из 5,84 % сообществ, численность неуникальной аудитории составляет 63 687, в среднем на одно сообщество приходится 8212,44 профилей. Высокая средняя взвешенная степень и плотность позволяют судить о высокой солидарности в выборе источников информации и участия. «Публикационная активность» высока — 2547,48 на одно сообщество. Мы обнаружили сильную корреляцию 0,76 при р-уровне 1,043*10-5.

Десятый кластер есть группа/обединение трех образовательных сообществ националистов: «Семинар по выживанию в экстремальных условиях», «Курс высотной подготовки», «Семинар по военно-полевой медицине». Имеет внешние связи только с националистическим кластером.

Четвертый кластер посвящен ЛГБТ-сообществам и их проектам. Перечислим для примера самые крупные сообщества: «ЛГБТ-инициативная группа "Выход"» (группа поддержки), «ЛГБТ-кинофестиваль Бок о Бок». Отличительной особенностью данного кластера является то, что ЛГБТ-сообщества породили много сообществ поддержки.

В кластере ЛГБТ находятся 5,37 % сообществ численностью в 35 543 неуникальных профиля, что в среднем — 2008,73 профиля на сообщество. По-прежнему мы наблюдаем высокую плотность с низким диаметром: участники кластера подписаны на большинство сообществ. «Публикационная активность» составляет 1615,59 поста на одно сообщество. Корреляция между численностью и публикациями статистически не значима.

Из разных кластеров тематически можно сгруппировать лишь социалистов и коммунистов. Удивительно, что они находятся в разных кластерах: велико влияние центров поляризации, и, скорее всего, расколов. Также они довольно малочисленны. Следующие кластеры мы причислили к «левой группе». Пятый кластер объединяется вокруг «Профсоюза МПРА». Среднее количество участников составляет 1067,23. Шестой кластер образован вокруг партии КПРФ — «КПРФ — Ленинград». Среднее количество участников — 1128,4. Седьмой кластер имеет в центре объединения организацию «Суть времени — Ленинград 2.0» и относительно многочисленен (в среднем 1622 участника). Восьмой кластер образуют «Революционный КОМСОМОЛ — Ленинград» и партия РКРП — «РКРП-КПСС Коммунисты | марксисты | ленинцы». В среднем в кластере 598,75 участника. Одиннадцатый кластер образует сообщество «Депутат-коммунист Ирина Комолова». В среднем — 238,33 участника. Двенадцатый кластер является образовательной площадкой левых — «Красный университет» и «Ленин в современном мире», где в среднем — 338,5 участников. Из всех левых

кластеров самым крупным по количеству сообществ является пятый, выстроенный вокруг МПРА. Он содержит 3,04 % сообществ, в то время как остальные левые кластеры имеют незначительное число сообществ. Принимая во внимание их общую идеологическую основу и низкие показатели, рассмотрим их в совокупности.

Группа «левых» содержит 7,48 % сообществ и 57 024 неуникальных подписчика, в среднем на одно сообщество приходится 1782 профиля. «Публикационная активность» невысока — 981,65 поста на одно сообщество, но все же есть лидеры по этому показателю. «Публикационная активность» седьмого кластера поражает: в среднем — 4197,4. Это второй кластер по данному значению во всей выборке. Остальные левые группы имеют не такие высокие показатели. Восьмой кластер обладает 1927,25 публикаций на одно сообщество. Пятый кластер — 1482,46. Шестой — 1198,2. В данной группе обнаруживаются сверхсильные коэффициенты корреляции. В седьмом кластере коэффициент корреляции составляет 0,97 при р-уровне 0,005.

Девятый кластер представляет собой объединение локальных сообществ Петродворцового района Санкт-Петербурга, посвященных улучшению городской среды: «Независимый Общественный Совет Петродворцовый р-н», «Петродвор-цовый район | новости», «Петергоф за велогород», «Новости Стрельны». Данный кластер небольшой по количеству участников — 401,25 в среднем. В среднем

Таблица 6. Процент связей в кластеризации «Дистанция»

Кластер 1 2 3 4 5 6 7 8 9 10 11

1 32,63 21,2 ,36 4,01 2,04 ,28 ,34 ,1 ,18 ,16

2 4,66 ,52 ,73 ,34 ,56 ,11 ,04 ,06 ,06

3

4 ,05

5 ,08 ,03 ,15 ,08

6 ,02 ,02 ,01

7 ,02 ,01

8 ,02

9 ,02

10

11

Таблица 7. Вес связей в кластеризации «Дистанция»

Кластер 1 2 3 4 5 6 7 8 9 10 11

1 6086,13 1427,36 14,28 229,55 81,85 10,19 13,17 2,81 5,63 5,09

2 475,88 23,49 38,03 21,92 45,14 6,85 1,46 2,93 2,65

3

4 1,72

5 4,1 1,33 6,27 2,24

6 2,47 1 ,43

7 ,55 ,13

8 ,52

9 ,46

10

11

«публикационная активность» на уровне 641. Девятый кластер обладает коэффициентом 0,97 при р-уровне 0,02.

Большинство связей (62,86 %) приходится на внутрикластерные ребра. Из табл. 6 и 7 видно, что самые частые и интенсивные межкластерные связи мы, как и в предыдущей кластеризации, наблюдаем между первым и вторым кластерами — 21,2 %, со средней взвешенной степенью 1427,36, и между вторым и третьим — 4,66 %, со средней взвешенной степенью 475,88. Первый и второй кластеры имеют одинаковое количество связей — около 28 %, но разный вес. Второй кластер имеет общую аудиторию с другими кластерами в количестве 2045, первый — 1789,93, а без связей друг на друга — 618,35 и 362,57 соответственно. Таким образом, националисты более интенсивны (по количеству) в своем интернет-участии.

Выводы и перспективы исследования

Резюмируя все вышесказанное, мы можем сделать вывод о структуре политического участия и политической коммуникации в социальной сети «ВКонтакте».

Во-первых, расширение выборки на основании связей и перепостов дало хороший результат: выборка была увеличена в несколько раз. Однако, трудно оценить, какой процент от генеральной совокупности она занимает. Решить данную задачу можно, лишь собрав всю информацию из социальных сетей.

Во-вторых, полученная математическая модель в виде взвешенного графа показала плотность, приближающуюся к единице. Это означает, что все общественно-политические сообщества в выборке имеют тесные связи между собой: они не замыкаются в изолированные эхо-камеры, а представляют собой множества, которые пересекаются в потреблении информации и политическом участии в социальной сети. Но нельзя утверждать, что все связи имеют высокую интенсивность. Среднее по медиане составляет всего 6, а среднее арифметическое — 26,31. Межкластерные связи являются частотными, а внутрикластерные — весомыми. Именно по этой причине необходимо было применить симуляцию эхо-камер. Кроме того, модель, плотность которой приближалась к единице, не является информативной. Выбранная исследователями симуляция эхо-камер позволила нивелировать слабые и частотные связи, чтобы изучить сообщества, из которых состоит сеть, более подробно.

Раскрывая структуру общественно-политической сети, мы провели кластеризацию с разными настройками распространения связи, а также сравнение кла-стеризаций. Используя разные настройки распространения связей, мы каждый раз дробили граф на большее количество сообществ — с двух до одиннадцати. Граф политических сообществ, который был построен с использованием укладки БогсеЛ1:1а82, называется картой, она демонстрирует два крупных и многочисленных кластера: националисты и общественно-либеральный кластер с постоянной демаркационной линией. Только лишь в кластеризации с использованием меток «Дистанция», снижающих масштаб разделения на сообщества, появилась «буферная зона» из разрозненных кластеров социалистов.

Необходимо отметить, что в метрическом центре графа оказались общественные организации, которые привлекают сторонников различных идеологий, в частности сообщество «Красивый Петербург». Неполитические сообщества выполня-

ют необходимую роль сетевых мостов. Интересно, что в националистическом кластере, а также в выделяемом из него спортивном кластере такую роль выполняют коммерческие сообщества, занимающиеся торговлей товарами с соответствующей символикой и разнообразной атрибутикой.

Результат применения разных настроек распространения связей позволил выявить на всех срезах два крупных центра: общественно-либеральные сообщества и националистические сообщества. Данные кластеры отличаются топологией сети, количеством участников и «публикационной активностью». У националистов значительно выше как степень вовлеченности в сетевое участие и потребление информации, так и среднее количество участников и публикаций, однако число сообществ в целом меньше. Другими словами, можно сказать, что вовлечение в виртуальную националистическую среду носит контагиозный характер: очень велика роль вхождения в ядро кластера (участие во множестве сообществ), при условии, когда другой кластер более фрагментирован и не имеет интенсивных пересечений аудиторий. Общественно-либеральный кластер отличается большим количеством сообществ, которые можно выделять в отдельные подкластеры, снижая масштаб кластеризации. Применив распространение связей «Дистанция», мы получили качественную характеристику состава кластера националистов и общественно-либерального кластера — сведения о подкластерах. Сильные и плотные межкластерные связи националистов со спортивным кластером говорят о диффузии аудиторий. Другая отличительная особенность — это отдельный кластер курсов по подготовке к чрезвычайным ситуациям. Мы нашли образовательный кластер в другом политическом спектре — у левых, но националисты занимаются скорее практикой, чем теорией. Общественно-либеральный кластер включает множество сообществ ЛГБТ, социалистов и общественных движений. Это интересный вопрос для дальнейшего изучения различий в характере участия и потребления информации. Любопытно, что при уменьшении масштаба кластеризации из кластеров выделяются подкластеры, которые практически не имеют пересечений с противоположным «родительскому» кластеру. Более того, они могут иметь и более высокую плотность, как, например, обстоит дело с ЛГБТ-кластером.

Подробный анализ зависимости между численностью и информационной активностью подтверждает высокую активность двух главных кластеров, когда в их подкластерах активность снижается. Подобные выводы мы встречаем в работах Градосельской [16].

Другой вывод — это разобщенность и слабость левых, пространство вокруг их сообществ мы назвали «буферной зоной». Количество сообществ в этой группе мало, точно так же как и количество участников. Они фрагментированы и не связаны между собой, а также обнаруживаются только в настройке «Дистанция», и не как единый кластер. Интересно, что некоторые из них являются активными.

Говоря о перспективах исследования, необходимо отметить, что данному исследованию не хватает подробного анализа мер центральности для кластеров [34, 35], чтобы понять отличия между ними, кроме «публикационной активности» и количества участников. Более того, центральность выявляет сообщества-хабы [36] с разными сетевыми ролями. Изучение коммуникационных обменов также представляет большой интерес для исследователей, интересующихся вопросами распространения идей [37, 38] и анализом сетевой структуры — кластеры более дробны.

Кроме того, в дальнейшем стоило бы сравнить региональные кластеры политических сообществ по количеству участников, степени вовлеченности и качественному составу.

В будущем мы планируем решить проблемы, связанные с выборкой, посредством выгрузки информации обо всех сообществах и участниках социальной сети «ВКонтакте» для получения наиболее полного представления о неучтенных политических сообществах, а также провести сравнение с региональными кластерами, принимая в расчет их количество, состав и пересечения.

Литература

1. Freeman L. C. The development of social network analysis: A study in the sociology of science. Vancouver: Empirical Press, 2004. 205 p.

2. Hummon N. P., Carley K. Social networks as normal science // Social Networks. 1993. N 15. P. 71-106.

3. Kuhn T. S. The Structure of Scientific Revolutions. Chicago: University of Chicago Press, 1962. 212 p.

4. Bonacich P. Power and Centrality: A Family of Measures // American Journal of Sociology. 1987. N 92. P. 1170-1182.

5. Newman M. E. J. Modularity and community structure in networks // In Proceedings of the National Academy of Sciences of the United States of America. 2006. N 103 (23). P. 8577-8696.

6. JiangB., Claramunt C. Integration of space syntax into GIS: new perspectives for urban morphology // Transactions in GIS. 2002. N 6 (3). P. 295-309.

7. Lentz H. H. K., Koher A., Hovel P., Gethmann J., Sauter-Louis C., Selhorst T., Conraths F. J. Disease Spread through Animal Movements: A Static and Temporal Network Analysis of Pig Trade in Germany // PLoS ONE. 2016. N 11 (5). P. e0155196.

8. Hajek B. Communication Network Analysis. 2006. URL: http://www.ifp.illinois.edu/~hajek/Papers/ networkanalysisDec06.pdf (дата обращения: 21.06.2016).

9. Brandes U., Pich C. Explorative Visualization of Citation Patterns in Social Network Research // Journal of Social Structure. 2011. Vol. 12. P. 1-19.

10. Etling B., Alexanyan K., Kelly J., Faris R., Palfrey J., Gasser U. Mapping RuNet Politics and Mobilization // Berkman Center Research Publication. 2010. N 2010-11. URL: http://cyber.law.harvard.edu/sites/ cyber.law.harvard.edu/files/Public_Discourse_in_the_Russian_Blogosphere_2010.pdf (дата обращения: 21.06.2016).

11. Mapping Russian Twitter / Etling B., Faris R., Palfrey J., Gasser U., Kelly J., Alexanyan K., Barash V // Berkman Center Research Publication. 2012. N 2012-3. URL: http://ssrn.com/abstract=2028158 (дата обращения: 21.06.2016).

12. Грин С. А. Твиттер и российский протест. Мемы, сети и мобилизация // Рабочие материалы ЦИИО. 2012. URL: http://www.scribd.com/doc/94393467/Твиттер-и-российский-протест-РМ-ЦИИ0-2012-1 (дата обращения: 21.06.2016).

13. Marichal J. Political Facebook groups: Micro-activism and the digital front stage. First Monday, 2013. URL: http://ojphi.org/ojs/index.php/fm/article/view/4653 (дата обращения: 21.06.2016).

14. Шерстобитов А. С., Брянов К. А. Технологии политической мобилизации в социальной сети «ВКонтакте»: сетевой анализ протестного и провластного сегментов // Исторические, философские, политические и юридические науки, культурология и искусствоведение. Вопросы теории и практики. 2013. № 10-1 (36). С. 196-202.

15. Gruzd A., Tsyganova K. Information Wars and Online Activism During the 2013 / 2014 Crisis in Ukraine: Examining the Social Structures of Pro- and Anti-Maidan Groups // Policy & Internet. 2015. Vol. 7, issue 2. P. 121-158.

16. Градосельская Г. В., Пильгун М. А. Коммуникативные процессы в сетевой среде: Междисциплинарный анализ политически активных сообществ в Фейсбуке // Вопросы психолингвистики. 2015. С. 44-57.

17. Kim J., Wilhelm T. What is a complex graph? // Physica A: Statistical Mechanics and its Applications. 2008. Vol. 387, issue 11. P. 2637-2652.

18. Barabasi A., Bonabeau E. Scale-Free Networks // Scientific American. 2003. N 288. P. 50-59.

19. Biermann C. Chinese Whispers — an Efficient Graph Clustering Algorithm and its Applications to Natural Language Processing Problems. 2006. URL: http://wortschatz.uni-leipzig.de/~cbiemann/pub/2006/ BiemannTextGraph06.pdf (дата обращения: 21.06.2016).

20. Cherven K. Mastering Gephi Network Visualization. Packt Publishing Ltd, 2015. 315 p.

21. Аудитория ВКонтакте. URL: https://vk.com/page-47200925_44240810 (дата обращения: 21.06.2016).

22. Суворов Г. Кто был на Болотной площади. URL: http://basilisklab.com/bolotoanalis-posetitelei. html (дата обращения: 21.06.2016).

23. Метод — users.get. URL: vk.com/dev/users.get (дата обращения: 21.06.2016).

24. Метод — groups.getById. URL: vk.com/dev/groups.getById (дата обращения: 21.06.2016).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

25. Метод — groups.getMembers. URL: vk.com/dev/groups.getMembers (дата обращения: 21.06.2016).

26. Метод — wall.get. URL: vk.com/dev/wall.get (дата обращения: 21.06.2016).

27. Журавлева Е. Ю. Социология в сетевой среде: к цифровым социальным исследованиям // Социологические исследования. 2015. № 8. С. 25-33

28. Суслов С. И. Сетевой анализ смежности аудиторий политических онлайн-сообществ Санкт-Петербурга в социальной сети «ВКонтакте» // Современная наука и инновации. 2016. № 2 (14). С. 196-206.

29. McPherson M., Smith-Lovin L., Cook J. M. Birds of a Feather: Homophily in Social Networks // Annual Review of Sociology. 2001. N 27. P. 415-444.

30. Tsang A., Larson K. The Echo Chamber: Strategic Voting and Homophily in Social Networks // Proceedings of the 2016 International Conference on Autonomous Agents & Multiagent Systems. Singapore: International Foundation for Autonomous Agents and Multiagent Systems. 2016. P. 368-375.

31. Mc.Gill R., Tukey J. W., Larsen W. A. Variation of Box Plots // The American Statistician American Statistical Association. 1978. Vol. 32, N 1. P. 12-16.

32. Sunstein C. Echo chambers. Princeton, New Jersey: Princeton University Press, 2001. 108 p.

33. Newman M. E. J. Assortative mixing in networks // Physical review letters. 2002. Vol. 89, N 20. P. 208701.

34. Newman M. E. J. Networks An Introduction. Oxford University Press, 2010. P. 720.

35. Hansen D. L., Shneiderman B., Smith M. A. Analyzing social media networks with NodeXL: Insights from a Connected World. Morgan Kaufmann, 2010. 304 p.

36. Рябченко Н. А., Гнедаш А. А. Online и offline социальные сети: к вопросу о математическом обосновании стохастической модели функционирования // Политическая экспертиза: ПОЛИТЭКС. 2014. № 3. C. 91-100.

37. Ferguson R. Word of mouth and viral marketing: Taking the temperature of the hottest trends in marketing // Journal of Consumer Marketing. 2008. N 25 (3). P. 179-182.

38. Jackson N., Lilleker D. G. Building an architecture of participation? Political parties and web 2.0 in Britain // Journal of Information Technology & Politics. 2009. N 6. P. 232-250.

Для цитирования: Суслов С. И. Кластеры Петербургских политических онлайн-сообществ в «Вконтакте» // Вестник СПбГУ Серия 12. Социология. 2016. Вып. 4. С. 69-87. DOI: 10.21638/11701/spbu12.2016.405

References

1. Freeman L. C. The development of social network analysis: A study in the sociology of science. Vancouver, Empirical Press, 2004. 205 p.

2. Hummon N. P., Carley K. Social networks as normal science. Social Networks, 1993, no. 15, pp. 71-106.

3. Kuhn T. S. The Structure of Scientific Revolutions. Chicago, University of Chicago Press, 1962. 212 p.

4. Bonacich P. Power and Centrality: A Family of Measures. American Journal of Sociology, 1987, no. 92, pp. 1170-1182.

5. Newman M. E. J. Modularity and community structure in networks. In Proceedings of the National Academy of Sciences of the United States of America, 2006, no. 103 (23), pp. 8577-8696.

6. Jiang B., Claramunt C. Integration of space syntax into GIS: new perspectives for urban morphology. Transactions in GIS, 2002, no. 6 (3), pp. 295-309.

7. Lentz H. H. K., Koher A., Hovel P., Gethmann J., Sauter-Louis C., Selhorst T., Conraths F. J. Disease Spread through Animal Movements: A Static and Temporal Network Analysis of Pig Trade in Germany. PLoS ONE, 2016, no. 11 (5), pp. e0155196.

8. Hajek B. Communication Network Analysis, 2006. Available at: http://www.ifp.illinois.edu/~hajek/Pa-pers/networkanalysisDec06.pdf (accessed: 21.06.2016).

9. Brandes U., Pich C. Explorative Visualization of Citation Patterns in Social Network Research. Journal of Social Structure, 2011, vol. 12, pp. 1-19.

10. Etling B., Alexanyan K., Kelly J., Faris R., Palfrey J., Gasser U. Mapping RuNet Politics and Mobilization. Berkman Center Research Publication, 2010, no. 2010-11. Available at: http://cyber.law.harvard. edu/sites/cyber.law.harvard.edu/files/Public_Discourse_in_the_Russian_Blogosphere_2010.pdf (accessed: 21.06.2016).

11. Mapping Russian Twitter / Etling B., Faris R., Palfrey J., Gasser U., Kelly J., Alexanyan K., Barash V. Berkman Center Research Publication, 2012, no, 2012-3. Available at: http://ssrn.com/abstract=2028158 (accessed: 21.06.2016).

12. Grin S. A. Tvitter i rossiiskii protest. Memy, seti i mobilizatsiia [Twitter and the Russian protest: mems, networks and mobilization]. Rabochie materialy TsIIO, 2012. Available at: http://www.scribd.com/ doc/94393467/TBMTTep-M-poccMHCKMH-npoTecT-PM^MMO-2012-1 (accessed: 21.06.2016). (In Russian)

13. Marichal J. Political Facebook groups: Micro-activism and the digital front stage. First Monday, 2013. Available at: http://ojphi.org/ojs/index.php/fm/article/view/4653 (accessed: 21.06.2016).

14. Sherstobitov A. S., Brianov K. A. Tekhnologii politicheskoi mobilizatsii v sotsial'noi seti «VKontakte»: Setevoi analiz protestnogo i provlastnogo segmentov [Political mobilization technologies in social network "VKontakte": network analysis of protest and pro-regime segments]. Istoricheskie, filosofskie, politicheskie i iuridicheskie nauki, kul'turologiia i iskusstvovedenie. Voprosy teorii i praktiki, 2013, no. 10-1 (36), pp. 196202. (In Russian)

15. Gruzd A., Tsyganova K. Information Wars and Online Activism During the 2013/2014 Crisis in Ukraine: Examining the Social Structures of Pro- and Anti-Maidan Groups. Policy & Internet, 2015, vol. 7, issue 2, pp. 121-158.

16. Gradoselskaya G., Pilgin M. R. Kommunikativnye protsessy v setevoi srede: Mezhdistsiplinarnyi analiz politicheski aktivnykh soobshchestv v Feisbuke [Communicative Processes in the Network Environment: the Interdisciplinary Analysis of Politically Active Communities on Facebook]. Voprosy psikholingvis-tiki, 2015, pp. 44-57. (In Russian)

17. Kim J., Wilhelm T. What is a complex graph? Physica A: Statistical Mechanics and its Applications, 2008, vol. 387, issue 11, pp. 2637-2652.

18. Barabasi A., Bonabeau E. Scale-Free Networks. Scientific American, 2003, no. 288, pp. 50-59.

19. Biermann C. Chinese Whispers — an Efficient Graph Clustering Algorithm and its Applications to Natural Language Processing Problems, 2006. Available at: http://wortschatz.uni-leipzig.de/~cbiemann/ pub/2006/BiemannTextGraph06.pdf (accessed: 21.06.2016).

20. Cherven K. Mastering Gephi Network Visualization. Packt Publishing Ltd, 2015. 315 p.

21. Auditoriia VKontakte [VK Audience]. Available at: https://vk.com/page-47200925_44240810 (accessed: 21.06.2016). (In Russian)

22. Suvorov G. Kto byl na Bolotnoiploshchadi [Who were atBolotnaya square]. Available at: http://basi-lisklab.com/bolotoanalis-posetitelei.html (accessed: 21.06.2016). (In Russian)

23. Metod — users.get [VK API Method — users.get]. Available at: vk.com/dev/users.get (accessed: 21.06.2016). (In Russian)

24. Metod — groups.getById [VK API Method — groups.getById]. Available at: vk.com/dev/groups.get-ById (accessed: 21.06.2016). (In Russian)

25. Metod — groups.getMembers [VK API Method — groups.getMembers]. Available at: vk.com/dev/ groups.getMembers (accessed: 21.06.2016). (In Russian)

26. Metod — wall.get [VK API Method — wall.get]. Available at: vk.com/dev/wall.get (accessed: 21.06.2016). (In Russian)

27. Zhuravleva E. Iu. Sotsiologiia v setevoi srede: k tsifrovym sotsial'nym issledovaniiam [Sociology in network space: towards digital sociological researches]. Sotsiologicheskie issledovaniia [Sociological researches], 2015, no. 8, pp. 25-33. (In Russian).

28. Suslov S. I. Setevoi analiz smezhnosti auditorii politicheskikh onlain-soobshchestv Sankt-Peterburga v sotsial'noi seti «VKontakte» Social network analysis of audience adjacency of political Saint-Petersburg online-communities in social net "VKontakte"]. Sovremennaia nauka i innovatsii, 2016, no. 2 (14), pp. 196206. (In Russian)

29. McPherson M., Smith-Lovin L., Cook J. M. Birds of a Feather: Homophily in Social Networks. Annual Review of Sociology, 2001, no. 27, pp. 415-444.

30. Tsang A., Larson K. The Echo Chamber: Strategic Voting and Homophily in Social Networks. Proceedings of the 2016 International Conference on Autonomous Agents & Multiagent Systems. Singapore: International Foundation for Autonomous Agents and Multiagent Systems, 2016, pp. 368-375.

31. Mc.Gill R., Tukey J. W., Larsen W. A. Variation of Box Plots. The American Statistician American Statistical Association, 1978, vol. 32, no. 1, pp. 12-16.

32. Sunstein C. Echo chambers. Princeton, New Jersey, Princeton University Press, 2001. 108 p.

33. Newman M. E. J. Assortative mixing in networks. Physical review letters, 2002, vol. 89, no. 20, pp. 208701.

34. Newman M. E. J. Networks An Introduction. Oxford University Press, 2010, pp. 720.

35. Hansen D. L., Shneiderman B., Smith M. A. Analyzing social media networks with NodeXL: Insights from a Connected World. Morgan Kaufmann, 2010. 304 p.

36. Riabchenko N. A., Gnedash A. A. Online i offline sotsial'nye seti: k voprosu o matematicheskom obosnovanii stokhasticheskoi modeli funktsionirovaniia [Online and Offline Social Networks: on the Mathematical Justification of the Stochastic Modal]. Political expertise: POLITEX, 2014, no. 3, pp. 91-100. (In Russian)

37. Ferguson R. Word of mouth and viral marketing: Taking the temperature of the hottest trends in marketing. Journal of Consumer Marketing, 2008, no. 25 (3), pp. 179-182.

38. Jackson N., Lilleker D. G. Building an architecture of participation? Political parties and web 2.0 in Britain. Journal of Information Technology & Politics, 2009, no. 6, pp. 232-250.

For citation: Suslov S. I. Saint-Petersburg's political online communities clusters in "VKontakte". Vestnik SPbSU. Series 12. Sociology, 2016, issue 4, pp. 69-87. DOI: 10.21638/11701/spbu12.2016.405

Статья поступила в редакцию 8 сентября 2016 г.;

принята в печать 17 октября 2016 г.

Контактная информация:

Суслов Сергей Игоревич — аспирант; s.suslov@spbu.ru Suslov Sergey I. — Postgraduate; s.suslov@spbu.ru

87

i Надоели баннеры? Вы всегда можете отключить рекламу.