Научная статья на тему 'ИССЛЕДОВАНИЕ ИНФОРМАЦИОННОГО ПОЛЯ НА ОСНОВЕ ДИНАМИЧЕСКОГО ПОДХОДА К АНАЛИЗУ ДАННЫХ СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ" (КЕЙС Г. ТОМСК)'

ИССЛЕДОВАНИЕ ИНФОРМАЦИОННОГО ПОЛЯ НА ОСНОВЕ ДИНАМИЧЕСКОГО ПОДХОДА К АНАЛИЗУ ДАННЫХ СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ" (КЕЙС Г. ТОМСК) Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY
162
20
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ДИНАМИЧЕСКИЙ ПОДХОД / АНАЛИЗ ДАННЫХ / СОЦИАЛЬНЫЕ СЕТИ / РЕГИОНАЛЬНЫЕ СООБЩЕСТВА

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Александрова Юлия Константиновна, Лебедкина Надежда Сергеевна, Орлова Вера Вениаминовна

В статье рассматривается потенциал динамического подхода анализа данных в изучении поведения пользователей в социальных сетях. В настоящее время в социальных сетях появляется информация, которая позволяет дифференцировать группы пользователей по их активности в рамках технических возможностей той или иной социальной сети. Представлено описание, дан краткий анализ информационного поля в региональных сообществах Томской области, сформирована кластеризация постов - три сферы жизнедеятельности общества: социальная, экономическая и политическая. Методология: применен динамический подход к анализу данных социальных сетей; осуществлен анализ поведения пользователей, структуры узлов и связей социальных сетей, который позволяет выявить скорость роста или уменьшения размера сети, перераспределение связей между группами. После получения списка информативных и уникальных постов произведен семантический анализ текстов с помощью инструмента для текстовой аналитики PolyAnalyst. Результаты: простроены семантические связи между словами и представлены в виде графов. Выделены два «центра», связывающих все наиболее часто встречающие слова - Томск и Томская область. С помощью инструмента для текстовой аналитики PolyAnalyst выделены популярные персоны и организации. «Позитивный контент» зафиксирован в освещении программы «Безопасные и качественные дороги» в регионе в социальной сети для формирования положительного медиаобраза власти в области. Социально активные пользователи привлекают внимание к социальной тематике. Так, среди наиболее популярных постов наибольшее число посвящено социальной сфере, далее следуют политическая и экономическая. Вместе с тем социальные сети являются также и доступным в настоящее время инструментом манипуляции общественным мнением.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по СМИ (медиа) и массовым коммуникациям , автор научной работы — Александрова Юлия Константиновна, Лебедкина Надежда Сергеевна, Орлова Вера Вениаминовна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

STUDY OF THE INFORMATION FIELD BASED ON THE DYNAMIC APPROACH TO THE DATA ANALYSIS OF THE SOCIAL NETWORK "VKONTAKTE" (TOMSK CASE)

The paper considers the potential of a dynamic data analysis approach in studying user behavior in social networks. Currently, information appears on social networks that allows differentiating user groups by their activity within the technical capabilities of a particular social network. The paper introduces the description, a brief analysis of the information field in the regional communities of the Tomsk region; the clustering of posts into three spheres of the life of society: social, economic and political, is formed. Methodology. A dynamic approach was used to analyze social media data. The analysis of user behavior, the struc ture of nodes and connections of social networks is carried out, which makes it possible to identify the rate of growth or decrease in the size of the network, the redistribution of connections between groups. After receiving a list of informative and unique posts, a semantic analysis of the texts was performed using the PolyAnalyst text analytics tool. Results. The semantic connections between words were built and presented in the form of graphs. Two «centers» are highlighted that connect all the most frequently encountered words - Tomsk and Tomsk Oblast. Popular people and organizations are highlighted using the PolyAnalyst text analytics tool. The greatest positive content was recorded in the coverage of the Safe and High-Quality Roads program in the region in the social network to form a positive media image of the authorities in the region. Socially active users draw attention to social topics. So, among the most popular posts, the largest number is devoted to the social sphere, followed by the political and economic. At the same time, social networks are also a currently available tool for manipulating public opinion.

Текст научной работы на тему «ИССЛЕДОВАНИЕ ИНФОРМАЦИОННОГО ПОЛЯ НА ОСНОВЕ ДИНАМИЧЕСКОГО ПОДХОДА К АНАЛИЗУ ДАННЫХ СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ" (КЕЙС Г. ТОМСК)»

УДК 316.772.4:004.77

ИССЛЕДОВАНИЕ ИНФОРМАЦИОННОГО ПОЛЯ НА ОСНОВЕ ДИНАМИЧЕСКОГО ПОДХОДА К АНАЛИЗУ ДАННЫХ СОЦИАЛЬНОЙ СЕТИ

«ВКОНТАКТЕ» (КЕЙС Г. ТОМСК)

Александрова Юлия Константиновна1,

[email protected]

Лебедкина Надежда Сергеевна2,

[email protected]

Орлова Вера Вениаминовна2,

orlova_vv@ mail.ru

1 Национальный исследовательский Томский государственный университет, Россия, 634050, г. Томск, пр. Ленина, 36

2 Томский государственный университет систем управления и радиоэлектроники,

Россия, 634050, г. Томск, пр. Ленина, 40

Александрова Юлия Константиновна, младший научный сотрудник Лаборатории наук о больших данных и проблемах общества Национального исследовательского Томского государственного университета.

Лебедкина Надежда Сергеевна, старший преподаватель кафедры философии и социологии Томского государственного университета систем управления и радиоэлектроники.

Орлова Вера Вениаминовна, доктор социологических наук, профессор, заведующая кафедрой философии и социологии Томского государственного университета систем управления и радиоэлектроники.

В статье рассматривается потенциал динамического подхода анализа данных в изучении поведения пользователей в социальных сетях. В настоящее время в социальных сетях появляется информация, которая позволяет дифференцировать группы пользователей по их активности в рамках технических возможностей той или иной социальной сети. Представлено описание, дан краткий анализ информационного поля в региональных сообществах Томской области, сформирована кластеризация постов - три сферы жизнедеятельности общества: социальная, экономическая и политическая. Методология: применен динамический подход к анализу данных социальных сетей; осуществлен анализ поведения пользователей, структуры узлов и связей социальных сетей, который позволяет выявить скорость роста или уменьшения размера сети, перераспределение связей между группами. После получения списка информативных и уникальных постов произведен семантический анализ текстов с помощью инструмента для текстовой аналитики Ро1уАпа1уБ1 Результаты: простроены семантические связи между словами и представлены в виде графов. Выделены два «центра», связывающих все наиболее часто встречающие слова - Томск и Томская область. С помощью инструмента для текстовой аналитики Ро1уАпа1уБ1 выделены популярные персоны и организации. «Позитивный контент» зафиксирован в освещении программы «Безопасные и качественные дороги» в регионе в социальной сети для формирования положительного медиаобраза власти в области. Социально активные пользователи привлекают внимание к социальной тематике. Так, среди наиболее популярных постов наибольшее число посвящено социальной сфере, далее следуют политическая и экономическая. Вместе с тем социальные сети являются также и доступным в настоящее время инструментом манипуляции общественным мнением.

Ключевые слова: Динамический подход, анализ данных, социальные сети, региональные сообщества.

33

ЭО! 10.18799/ 26584956/2021/3(42)/1089

В интернет-сетях ежедневно публикуется огромное количество разнородных данных (текст, звук, изображения и т. п.), которые генерируются традиционными, почтовыми службами и социальными сетями через стационарные компьютеры, и мобильные устройства решают потребности в общении населения. Кроме того, передаваемая информация обеспечивает отличную возможность для глубокого анализа, составления прогнозов, аналитики методами искусственного интеллекта и больших данных. Технические усовершенствования сетей позволяют помимо текстовой информации передавать голосовую и видеоинформацию, а также оставлять формализованное мнение об открытой части переписки, оставлять текстовые комментарии.

Динамический анализ социальных сетей

В настоящее время динамика событий общества является достаточно высокой и в этом плане социальные сети позволяют события одной страны и даже человека превращать в информацию для всего мира. Это делает возможным использование этой информации не только в научных, но и коммерческих целях, что позволило достигнуть значительного прогресса в области, связанной с анализом социальных сетей. Однако большинство известных работ сосредоточено на изучении статических ситуаций в социальных сетях или оценке динамики в глобальном масштабе (например, примером является распространение заболевания СОУШ). За последние годы существенно выросла доступность больших динамических наборов данных социальных сетей, что подогревает интерес к разработке автоматических подходов анализа временных событий социальных сетей.

Динамический подход в изучении поведения пользователей, структуры узлов и связей социальных сетей позволяет выявить скорость роста или уменьшения размера сети, перераспределение связей между группами и т. д. Количественная мера оценки этих показателей позволяет определить закономерность изменений и соответственно строить прогнозные ситуации формирования тех или иных связей в социальных сетях. Понятно, что для выявления динамики изменений важным является оценка временных интервалов, определяющих четко обозначенное изменение. Разработка методик визуализации структуры сети в текущий момент времени и сравнение с прошлыми временными промежутками предоставляет возможность для более точного понимания тенденций.

Динамический анализ социальных сетей (ДАС) является новой областью, где имеется существенный потенциал для исследований и разработок аналитических программных приложений. ДАС направлен на анализ поведения социальных сетей в различных масштабах времени [1], обнаружение повторяющихся паттернов [2], структуру сообщества (формирование, развитие, существование или роспуск) [3].

Поскольку анализ социальных сетей сосредоточен на исследовании связей и их динамики, но и в определенной степени позволяет оценивать поведение пользователей. В анализе социальных сетей можно выделить четыре основных этапа: 1) сбор данных; 2) отбор данных для анализа; 3) выбор и применение метода анализа; 4) получение выводов. Чтобы идентифицировать и исследовать закономерности, возникающие в сети, сначала выбор групп людей должен производиться. Возможность анализа каждого узла сети (особенно для больших и разнородных сетей) существенно ограничена доступными вычислительными ресурсами и поэтому необходимо выбирать из общей выборки, на начальном этапе, только репрезентативную группу пользователей для дальнейшего анализа.

Следующим шагом в анализе социальных сетей является выбор наиболее подходящего метода анализ. Здесь есть три основных подхода:

1. Полные сетевые или методы, которые основаны на сборе и исследовании данных по всей сети (каждый пользователь и его сообщения). Этот подход дает наилучшие результаты анализа, но является наиболее трудоемким и сложным для сбора полных данных.

2. Методы снежного кома, когда работа начинается с одного локального пользователя или небольшой выборки пользователей. Для каждого пользователя сети некоторые или все их связи с другими участниками сети должны быть найдены и классифицированы, и процесс заканчивается, когда нет новых связей для классификации или после заканчивается число заданных итераций алгоритма. Этот подход хорошо работает для анализа тесно связанной группы пользователей в большой сети, но у него несколько слабых мест. Одно из них связано с выбором изолированного участника группы по каким-то параметрам (время общения, число сообщений, тип сообщений и т. д.), которого нельзя считать пассивным и отсеять на втором этапе анализа. Также необходимо искать наиболее активного по связям пользователя (или группы), который может быть с трудом найден этим методом. Второе - если первый актор не будет выбран должным образом, метод может привести к непредсказуемому результату. Если выбор пользователя сделать случайно, это даст неполное представление обо всей сети.

3. Эгоцентрический метод позволяет исследовать только одного пользователя и поток общения с его окружением. Этот метод обеспечивает полезную информацию только для локальной сети [4].

Информационное поле: Кейс г. Томск

В научной литературе существует несколько подходов к пониманию термина «информационное поле» (С.Э. Зуев, Г.Г. Почепцов, О.В. Кедровский, А.И. Ненашев). Остановимся на двух преобладающих - гуманитарном и техническом. Гуманитарный подход предполагает, что объектами информационного поля выступают люди и сообщества. С точки зрения технического подхода информационное поле представляет собой систему, которая обеспечивает передачу, обработку, хранение информации с использованием технических средств и ресурсов. В данном случае объектами информационного поля выступают информационные ресурсы, инфраструктура, а также средства информационного взаимодействия. Основой для изучения информационного поля могут служить географические единицы, сферы человеческой деятельности, интересы и убеждения. Таким образом, информационное поле имеет многокомпонентную структуру, в основе которой лежат каналы коммуникаций [5].

Для получения полной картины информационного поля Томской области из всех региональных сообществ выгружены посты за 2019 г. Все посты были классифицированы на основании обучающей выборки и специализированного алгоритма машинного обучения, которые были составлены и разработаны ранее для задач Центра прикладного анализа Больших данных в целях использования для анализа текстового контента социальных сетей. Одна из категорий - «мусор», которая включает в себя рекламу, спам, различные конкурсы и розыгрыши. Эти посты удалялись и не учитывались в выборке. Для дальнейшего анализа оставлены уникальные информативные посты. Был проанализирован массив данных в социальных сетях в 2019 г. (посты сообществ г. Томска). Уникальных и содержательных постов за 2019 г. выгружено 51553. С помощью машинного обучения также была проведена кластеризация постов на три сферы жизнедеятельности общества: социальная, экономическая и политическая [6, 7].

Больше всего в 2019 г. томичей интересовала социальная сфера (86 %), к двум отмечен значительно меньший интерес: 8 % - экономическая, 6 % - политическая. Отношение к событиям, освещаемым в постах, в подавляющем большинстве определялось как нейтральное (75 %). В негативном ключе отмечено 15 % постов, в позитивном - 10 %.

Респонденты демонстрирует распределение тональности по тематическим категориям, и мы видим, что для каждой из них характерно повторение общей структуры тональности. При этом отметим, что наибольшая доля негатива присуща политической сфере.

По тематикам постов уверенно лидирует тема «Безопасность». Второе и третье место заняли темы «Инфраструктура» и «ЖКХ» соответственно. Соединяя это с данными о том, что большинство постов имели нейтральный характер, можем сказать, что люди спокойно интересовались какими-то обыденными вопросами, связанными с повседневной жизнью в городе.

Рис. 1. Сумма комментариев, лайков и репостов на постах сообществ г. Томска Fig. 1. Sum of comments, likes and reposts on the posts of communities in Tomsk

Количество «мусорных» постов (контент, который включает в себя рекламу, спам, различные конкурсы и розыгрыши) в 2 раза меньше, чем информативных, что позволяет получить более подробную картину о том, что интересовало томичей в 2019 г. В региональных сообществах Томской области для дальнейшего исследования отобраны посты за 2019 г. Все посты были классифицированы на основании обучающей выборки и специализированного алгоритма машинного обучения, которые были составлены и разработаны ранее для задач Центра прикладного анализа Больших данных в целях использования для анализа текстового контента социальных сетей. Все посты данной категории удалялись и не участвовали в дальнейшем анализе. После получения списка информативных и уникальных постов произведен семантический анализ текстов с помощью инструмента для текстовой аналитики PolyAnalyst [8, 9]. Были выделены и извлечены ключевые понятия и отдельные ключевые слова. С помощью инструмента «Связь терминов» простроены семантические связи между словами и представлены в виде графов [10, 11].

Обсуждение результатов

Из графа связи между ключевыми словами видим два «центра», связывающих все наиболее часто встречающие слова - Томск и Томская область: Томск и Томская область «объединяются» общим для них термином «источник», который, однако, здесь употребляется в самых разных смыслах и как, например, «источник власти», и как «источник пожара».

На графе связей наиболее часто употребляемых слов отчетливо видны слова «мужчина» и «женщина». Здесь отметим, что мужчина упоминается 3654 раза, а женщина - 2485. При детальном рассмотрении этих кластеров видим, что в постах с упоминанием слова «мужчина» часто встречаются слова: «полиция», «сотрудники полиции», «совершение преступления», «региональное УМВД», «суд»; из положительных ассоциаций - «настоящий (мужчина)».

Также с помощью инструмента для текстовой аналитики PolyAnalyst выделены так называемые «сущности» - персоны и организации [12]. При детальном рассмотрении постов с упоминанием губернатора Томской области С. Жвачкина, кроме очевидных связей с администрацией Томской области, мэром г. Томска И. Кляйном, можем отметить его прямую аффиляцию в текстах с А.Б. Миллером (ПАО «Газпром»), ГК «Росатом», ОАО «ТДСК».

У мэра г. Томска И. Кляйна встретились только ожидаемые связи с региональными администрациями и их представителями. Можно отметить только аналогичное с губернатором пересечение Кляйна с главой ТДСК А.К. Шпетером. Учитывая факт присутствия в Томске сильного строительного лобби, выделяются несколько постов «о недовольстве» строителей мэром по поводу условий городской застройки. А также опубликована информация, что Кляйн препятствовал дальнейшей застройке некоторых микрорайонов в связи транспортной ситуацией в этих микрорайонах.

Отметим, что президент В. Путин упоминался в региональных группах Томской области, как правило, в контексте федеральных событий, в частности обсуждения президентских выборов.

Следующий граф демонстрирует наибольший позитив в освещении программы «Безопасные и качественные дороги» в регионе в социальной сети для формирования положительного медиаобраза власти в области (рис. 2).

Safe and quality roads безопасный качестве...

Рис. 2. Граф связи в освещении программы «Безопасные и качественные дороги» Fig. 2. Communication graph in the coverage of the Safe and High-Quality Roads program

Отметим, что вывоз мусора, ЖКХ и здоровье у томичей вызывает только негативный отклик, что напрямую связывается со словом «проблема».

Для определения тем, получивших максимальный отклик у жителей Томска, были выделены топ-100 постов с наиболее высоким индексом вовлеченности, который рассчитывался по формуле [13]:

I =

likes + к х reposts + к х comments кол-во просмотров

Среди наиболее популярных постов наибольшее число посвящено социальной сфере (90 постов), далее следуют политическая (7 постов) и экономическая (3 поста).

Несмотря на количественное превосходство постов социальной сферы, среднее значение индекса вовлеченности не на много выше, чем у экономической и политической тематик.

Социальная сфера / Social sphere Политическая сфера / Political sphere Экономическая сфера / Economic sphere

Рис. 3. Топ-100 постов Fig. 3. Top 100 of the posts

Среди топ-100 постов выделяется тема вывоза леса представителей КНР из региона, причем данный вопрос поднимался как самостоятельный, например, «Суд запретил китайской компании лесозаготовку в 3 районах Томской области», так и в контексте других событий: «В Томской области, где китайцы ежедневно вывозят тысячи кубометров леса, оштрафовали на 15 тысяч рублей рабочего электротехнического завода, который тащил домой ёлочку детям». Жители области публикуют фотоотчеты о местах вырубки леса, снятые с помощью квадрокоптера, поднимается вопрос о лесных пожарах, которые «невыгодно» тушить чиновникам и т. д. На тему вырубки леса есть публикации с критикой региональной власти: «Жириновский раскритиковал Жвачкина за продажу томского леса китайцам». Встречаются посты со стихотворениями на злободневную тему:

«Прощай тайга! Великая! Святая!

Тебя от зла людей не сберегли.

Легко отдали вырубки Китаю

И в благодарность всю тебя сожгли...»

Таким образом, социально активные пользователи стараются привлечь внимание к данной тематике. Однако стоит отметить и факт вбросов ложной информации - публикация фотографий вырубки и лесных пожаров, выдаваемых за Томскую область, ведь социальные сети являются также и доступным в настоящее время инструментом манипуляции общественным мнением.

В большом количестве материалов пользователей социальной сети «Вконтакте» присутствуют жалобы на оказание медицинской помощи (скорые, больницы). Томичи отмечают некомпетентность медперсонала, нежелание оказывать помощь, грубое отношение и т. д.

Среди публикаций на политическую тему наибольший резонанс вызвали сообщения о митинге в Томске «Он нам не царь», о поведении томичей на выборах президента, посты с критикой существующей власти. Экономическая тематика в материалах определяется достаточно условно, т. к. переплетена с другими категориями, например с экономическими последствиями вывоза леса из региона.

Одной из проблем традиционного анализа социальных сетей является то, что часто рассматриваются только отношения между участниками, а не то, о чем они на самом деле отправляют друг другу сообщения [14, 15]. При этом не учитывается частота передачи сообщений (например, несколько раз в день, в неделю или другой промежуток времени). Часто подходы игнорируют информацию о направлении сообщений, т. е. сколько сообщений отправлено участником A для участника Б и сколько раз, участник Б ответил A. Однако заметим, что вся эта информация требуется для разных направлений исследований, например выделения тем сообщений: семейные, научные, технические и т. д. К тому же потоки сообщений могут совмещать несколько тем для одних и тех же участников. Сложной является проблема, когда, например, два человека не являются друзьями в социальной сети, но у них есть общие друзья, поэтому они могут узнать друг друга после некоторого времени общения, а могут и не узнать, если список претендентов достаточно большой.

Современная телекоммуникационная среда построена таким образом, что подробно протоколирует действия своих пользователей. Эта информация является пространственно-временной и избыточной по своему содержанию. Использование этой информации становится все более активной во множестве приложений туризма, ретей-ла, интернет-магазинов и др. Поэтому актуальной задачей является разработка новых информационно-программных технологий эффективного извлечения полезной информации из значительного объема данных, возникающих в ходе нахождения пользователей в социальных сетях.

Работа выполнена при финансовой поддержке РФФИ 20-011-31154 опн.

СПИСОК ЛИТЕРАТУРЫ

1. Girvan M., Newman M. Community structure in social and biological networks // Proceedings of the National Academy of Sciences. - 2002. - V. 99 (12). - P. 7821-7826.

2. Гусарова Н.Ф. Aranm социальных сетей. Основные понятия и метрики. - СПб.: Ун-т ИТМО, 2016. -67 с.

3. Фролов Ю.Н., Габышева Л.К. Социальные сети: теория и практика. - Тюмень: ТюмГНГУ, 2012. -140 c.

4. Катаев М.Ю., Орлова В.В. Aнализ данных событий социальных сетей // Доклады ТУСУР. - 2020. -Т. 23. - № 4. - C. 71-77.

5. Van der Linden M., Hooghe M., De Vroome Th. Extending trust to immigrants: generalized trust, cross-group friendship and anti-immigrant sentiments in 21 European societies. URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0177369 (дата обращения 10.01.2021).

6. McCallum A., Wang X., Corrada-Emmanuel A. Topic and role discovery in social networks with experiments on Enron and academic email // Journal of Artificial Intelligence Research. - 2007. - № 30. - P. 249-272.

7. Шваб К. Четвертая промышленная революция - M.: Эксмо, 2016. - 127 с.

8. Орлова В.В. Репрезентация Цифровой экономики в условиях научно-образовательного комплекса II Наука Красноярья. - 2017. - Т. 6. - № 4-2. - С. 167-169.

9. Прототип коммуникационно-когнитивной платформы для формирования метакоманд I В.В. Орлова, С.В. Глухарева, Ю.О. Лобода, О.В. Кочетков, Д.О. Ноздреватых, О.И. Рекундаль II Вторая международная научная конференция ведущих научных школ в области радиолокации, радионавигации и радиоэлектронных систем передачи информации «Шарыгинские чтения». URL: https://storage.tusur.ru/files/143221/Sharyginskie_chteniya_2020-3.pdf (дата обращения 20.12.2021).

10. Gereke J., Schaub M., Baldassarri D. Ethnic diversity, poverty and social trust in Germany: evidence from a behavioral measure of trust. 2018. URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone. 0199834 (дата обращения 10.11.2020).

11. Коломейченко М.И., Чеповский A.A., Чеповский A.M. Aлгоритм выделения сообществ в социальных сетях II Фундаментальная и прикладная математика. - 2015. - Т. 19. - Вып. 1. - С. 21-32.

12. Базенков Н.И., Губанов ДА. Обзор информационных систем анализа социальных сетей II Управление большими системами: сборник трудов. - 2016. - Вып. 41. - С. 357-394.

13. Безбогова М.С., Ионцева М.В. Социально-психологические аспекты взаимодействия пользователей в виртуальных социальных сетях II Мир науки. Серия «Педагогика и психология». URL: https://mir-nauki.com/PDF/43PSMN516.pdf (дата обращения 25.11.2020).

14. Aниканова A.A., Бикен Н.С. Роль виртуальных социальных сетей в организации социальных движений в современной России II Aктуальные проблемы гуманитарных и естественных наук. URL: https://cyberleninka.ru/article/n/rol-virtualnyh-sotsialnyh-setey-v-organizatsii-sotsialnyh-dvizheniy-v-sovre-mennoy-rossii/viewer (дата обращения 25.11.2020).

15. Щекотин Е.В. Цифровые технологии в социальных науках: предмет и метод цифровой социологии II Социология и право. - 2020. - № 1. - С. 49-59.

Поступила 23.12.2020 г.

UDC 316.772.4:004.77

STUDY OF THE INFORMATION FIELD BASED ON THE DYNAMIC APPROACH TO THE DATA ANALYSIS OF THE SOCIAL NETWORK «VKONTAKTE» (TOMSK CASE)

Yulia K. Alexandrova1,

[email protected]

Nadezhda S. Lebedkina2,

[email protected]

Vera V. Orlova2,

orlova_vv@ mail.ru

1 National research Tomsk State University, 36, Lenin avenue, Tomsk, 634050, Russia

2 Tomsk State University of Control Systems and Radioelectronics, 40, Lenin avenue, Tomsk, 634050, Russia

Yulia K. Alexandrova, associate scientist, National research Tomsk State University.

Lebedkina Nadezhda Sergeevna, senior lecturer, Tomsk State University of Control Systems and Radioe-lectronics.

Vera V. Orlova, Dr. Sc, professor, head of the Philosophy and Sociology Department, Tomsk State University of Control Systems and Radioelectronics.

The paper considers the potential of a dynamic data analysis approach in studying user behavior in social networks. Currently, information appears on social networks that allows differentiating user groups by their activity within the technical capabilities of a particular social network. The paper introduces the description, a brief analysis of the information field in the regional communities of the Tomsk region; the clustering of posts into three spheres of the life of society: social, economic and political, is formed. Methodology. A dynamic approach was used to analyze social media data. The analysis of user behavior, the structure of nodes and connections of social networks is carried out, which makes it possible to identify the rate of growth or decrease in the size of the network, the redistribution of connections between groups. After receiving a list of informative and unique posts, a semantic analysis of the texts was performed using the PolyAnalyst text analytics tool. Results. The semantic connections between words were built and presented in the form of graphs. Two «centers» are highlighted that connect all the most frequently encountered words - Tomsk and Tomsk Oblast. Popular people and organizations are highlighted using the PolyAnalyst text analytics tool. The greatest positive content was recorded in the coverage of the Safe and High-Quality Roads program in the region in the social network to form a positive media image of the authorities in the region. Socially active users draw attention to social topics. So, among the most popular posts, the largest number is devoted to the social sphere, followed by the political and economic. At the same time, social networks are also a currently available tool for manipulating public opinion.

Key words: Dynamic approach, data analysis, social networks, regional communities.

This work was supported by the Russian Foundation for Basic Research 20-011-31154 opn.

REFERENCES

1. Girvan M., Newman M. Community structure in social and biological networks. Proceedings of the National Academy of Sciences, 2002, vol. 99 (12), pp. 7821-7826.

2. Gusarova N.F. Analiz sotsialnykh setey. Osnovnye ponyatiya i metriki [Social media analysis. Basic concepts and metrics]. St. Petersburg, ITMO Publ., 2016. 67 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

3. Frolov Yu.N., Gabysheva L.K. Sotsialnye seti: teoriya i praktika [Social networks: theory and practice]. Tyumen, TyumGNGU Publ., 2012. 140 p.

4. Kataev M.Yu., Orlova V.V. Analiz dannykh sobytiy sotsialnykh setey [Analysis of data from events of social networks]. Doklady TUSUR, 2020, vol. 23, no. 4. pp. 71-77.

5. Van der Linden M., Hooghe M., De Vroome Th. Extending trust to immigrants: generalized trust, cross-group friendship and anti-immigrant sentiments in 21 European societies. Available at: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0177369 (accessed: 10 January 2021).

6. McCallum A., Wang X., Corrada-Emmanuel A. Topic and role discovery in social networks with experiments on Enron and academic email. Journal of Artificial Intelligence Research, 2007, no. 30, pp. 249-272.

7. Schvab K. Chetvertaya promyshlennaya revolyutsiya [The fourth industrial revolution]. Moscow, Eksmo Publ., 2016. 127 p.

8. Orlova V.V. Reprezentatsiya tsifrovoy ekonomiki v usloviyakh nauchno-obrazovatelnogo kompleksa [Representation of the digital economy in the conditions of the scientific and educational complex]. Nauka Kras-noyarya, 2017, vol. 6, no. 4-2, pp. 167-169.

9. Orlova V.V., Glukhareva S.V., Loboda Yu.O., Kochetkov O.V., Nozdrevatykh D.O., Rekundal O.I. Prototip kommunikatsionno-kognitivnoy platformy dlya formirovaniya metakomand [The prototype of the communication and cognitive platform for the formation of meta-teams]. Vtoraya mezhdunarodnaya nauchnaya konferentsiya vedushchikh nauchnykh shkol v oblasti radiolokatsii, radionavigatsii i radioelektronnykh sis-tem peredachi informatsii «Sharyginskiye chteniya» [The second international scientific conference of leading scientific schools in the field of radar, radio navigation and radio-electronic systems of information transmission «Sharygin Readings»]. Available at: https://storage.tusur.ru/files/143221/Sharyginskie_ cht-eniya_2020-3.pdf (accessed 20 December 2020).

10. Gereke J., Schaub M., Baldassarri D. Ethnic diversity, poverty and social trust in Germany: evidence from a behavioral measure of trust. 2018. Available at: https://journals.plos.org/plosone/article?id=10.1371/journal. pone.0199834 (accessed 10 November 2020).

11. Kolomeichenko M.I., Chepovsky A.A., Chepovsky A.M. Algoritm vydeleniya soobshchestv v sotsialnykh setyakh [Algorithm for identifying communities in social networks]. Fundamentalnaya i prikladnaya ma-tematika, 2015, vol. 19, Iss. 1, pp. 21-32. Available at: http://mech.math.msu.su/~fpm/ps/ k14/k141/k14103.pdf (accessed 20 December 2020).

12. Bazenkov N.I., Gubanov D.A. Obzor informatsionnykh sistem analiza sotsialnykh setey [Review of information systems for analyzing social networks]. Upravlenie bolshimi sistemami: sbornik trudov, 2016, Iss. 41, pp. 357-394.

13. Bezbogova M.S., Iontseva M.V. Sotsialno-psikhologicheskie aspekty vzaimodeystviya polzovateley v virtu-alnykh sotsialnykh setyakh [Socio-psychological aspects of user interaction in virtual social networks]. Mir nauki. Seriya «Pedagogika i psikhologiya». Available at: https://mir-nauki.com/PDF/43PSMN516.pdf (accessed 25 November 2020).

14. Anikanova A.A., Biken N.S. Rol virtualnykh sotsialnykh setey v organizatsii sotsialnykh dvizheniy v sov-remennoy Rossii [The role of virtual social networks in the organization of social movements in modern Russia]. Aktualnye problemy gumanitarnykh i estestvennykh nauk. Available at: https://cyberleninka.ru/article/n/rol-virtualnyh-sotsialnyh-setey-v-organizatsii-sotsialnyh-dvizheniy-v-sovre-mennoy-rossii/viewer (accessed 25 November 2020).

15. Shchekotin E.V. Tsifrovye tekhnologii v sotsialnykh naukakh: predmet i metod tsifrovoy sotsiologii [Digital technologies in social sciences: subject and method of digital sociology]. Sotsiologiya i parvo, 2020, no. 1, pp. 49-59.

Received: 23 December 2020.

i Надоели баннеры? Вы всегда можете отключить рекламу.