Научная статья на тему 'АНАЛИЗ ДАННЫХ СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ" О МЕСТАХ ПРОЖИВАНИЯ ПОЛЬЗОВАТЕЛЕЙ НЕКОТОРЫХ ТЕМАТИЧЕСКИХ ГРУПП ВОЛГОГРАДСКОЙ ОБЛАСТИ'

АНАЛИЗ ДАННЫХ СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ" О МЕСТАХ ПРОЖИВАНИЯ ПОЛЬЗОВАТЕЛЕЙ НЕКОТОРЫХ ТЕМАТИЧЕСКИХ ГРУПП ВОЛГОГРАДСКОЙ ОБЛАСТИ Текст научной статьи по специальности «Компьютерные и информационные науки»

CC BY
187
50
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ВКОНТАКТЕ / СОЦИАЛЬНАЯ СЕТЬ / ПАРСИНГ / ВОЛГОГРАДСКАЯ ОБЛАСТЬ / АНАЛИЗ ДАННЫХ / ГЕОДАННЫЕ / ПРОФИЛЬ / ПОЛЬЗОВАТЕЛЬ / ПРОЦЕСС / VKONTAKTE / SOCIAL NETWORK / PARSING / VOLGOGRAD REGION / DATA ANALYSIS / GEODATA / PROFILE / USER / PROCESS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Марков Андрей Константинович, Кравец Алла Григорьевна

Описан метод сбора и анализа данных о местах проживания пользователей, интересующихся социальной жизнью Волгоградской области. Данные анализируются на основе исследования открытых профилей пользователей тематических групп Волгоградской области в социальной сети «ВКонтакте». Полученные данные позволяют провести исследование собранной статистики, а также построить карту городов проживания пользователей тематических групп Волгоградской области. Для проведения исследования была разработана программа на языке Python с использованием библиотек vk_api, requests, folium, plotly, time, БД sqlite3 для резервного хранения данных. В результате исследования получена подробная географическая картина проживания пользователей, состоящих в волгоградских сообществах социальной сети «ВКонтакте». Графическое представление результатов исследования выполнено в виде круговой диаграммы и на карте OpenStreetMap.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Марков Андрей Константинович, Кравец Алла Григорьевна

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

ANALYSIS OF DATA OF THE SOCIAL NETWORK VKONTAKTE ABOUT PLACES OF RESIDENCE OF USERS OF SOME THEMATIC GROUPS OF THE VOLGOGRAD REGION

The article describes a method for collecting and analyzing data on the places of residence of users interested in the social life of the Volgograd region. The data is analyzed based on a study of open profiles of users of thematic groups of the Volgograd region in the social network «VKontakte». The data obtained allows you to conduct research on the collected statistics, as well as display it on the map, in other words, to build a map of the cities where users of the region's theme groups live. As a result of the study, a detailed geographical picture of the residence of users who are members of the Volgograd communities of the social network «VKontakte» was obtained. For research, a program was developed in Python using the libraries vk_api, requests, folium, plotly, time, sqlite3 database for backup data storage. A graphical representation of the research results is made in the form of a pie chart and on an OpenStreetMap.

Текст научной работы на тему «АНАЛИЗ ДАННЫХ СОЦИАЛЬНОЙ СЕТИ "ВКОНТАКТЕ" О МЕСТАХ ПРОЖИВАНИЯ ПОЛЬЗОВАТЕЛЕЙ НЕКОТОРЫХ ТЕМАТИЧЕСКИХ ГРУПП ВОЛГОГРАДСКОЙ ОБЛАСТИ»

УДК 004.042

АНАЛИЗ ДАННЫХ СОЦИАЛЬНОЙ СЕТИ «ВКОНТАКТЕ» О МЕСТАХ ПРОЖИВАНИЯ ПОЛЬЗОВАТЕЛЕЙ НЕКОТОРЫХ ТЕМАТИЧЕСКИХ ГРУПП ВОЛГОГРАДСКОЙ ОБЛАСТИ

Статья получена редакцией 03.03.2020, в окончательном варианте - 05.05.2020

Марков Андрей Константинович, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. им. В.И. Ленина, 28,

магистрант, e-mail: anmark@list.ru

Кравец Алла Григорьевна, Волгоградский государственный технический университет, 400005, Российская Федерация, г. Волгоград, пр. Ленина, 28,

доктор технических наук, профессор, e-mail: agk@gde.ru

Описан метод сбора и анализа данных о местах проживания пользователей, интересующихся социальной жизнью Волгоградской области. Данные анализируются на основе исследования открытых профилей пользователей тематических групп Волгоградской области в социальной сети «ВКонтакте». Полученные данные позволяют провести исследование собранной статистики, а также построить карту городов проживания пользователей тематических групп Волгоградской области. Для проведения исследования была разработана программа на языке Python с использованием библиотек vk_api, requests, folium, plotly, time, БД sqlite3 для резервного хранения данных. В результате исследования получена подробная географическая картина проживания пользователей, состоящих в волгоградских сообществах социальной сети «ВКонтакте». Графическое представление результатов исследования выполнено в виде круговой диаграммы и на карте OpenStreetMap.

Ключевые слова: ВКонтакте, социальная сеть, парсинг, Волгоградская область, анализ данных, геоданные, профиль, пользователь, процесс

Графическая аннотация (Graphical annotation)

»

%

Интерес к социальной жизни региона за его пределами. Interest of region social life outside this region

»

k Социальная жизнь региона. ¿^Social life of the region.

»

Выявление регионов, где наиболее интересуются социальной жизнью г. Волгограда. Identification regions where most interested in social live the city of Volgograd.

P

»

Анализ геоидентификации

социально-активного населения

сети "ВКонтакте".

Analysis of geo-ideniification of

socially active population Vkontakte network.

Карта пользователей. Users map.

ANALYSIS OF DATA OF THE SOCIAL NETWORK VKONTAKTE ABOUT PLACES OF RESIDENCE OF USERS OF SOME THEMATIC GROUPS OF THE VOLGOGRAD REGION

The article was received by the editorial board on 03.03.2020, in the final version — 05.05.2020.

Markov Andrey K., Volgograd State Technical University, 28 Lenin Ave Russian Federation,

master student, e-mail: anmark@list.ru

Kravets Alla G., Volgograd State Technical University, 28 Lenin Ave. Russian Federation,

Doct. Sci. (Engineering), Professor, e-mail: agk@gde.ru

The article describes a method for collecting and analyzing data on the places of residence of users interested in the social life of the Volgograd region. The data is analyzed based on a study of open profiles of users of thematic groups of the Volgograd region in the social network «VKontakte». The data obtained allows you to conduct research on the collected statistics, as well as display it on the map, in other words, to build a map of the cities where users of the region's theme groups live. As a result of the study, a detailed geographical picture of the residence of users who are members of the Volgograd communities of the social network «VKontakte» was obtained. For research, a program was developed in Python using the libraries vk_api, requests, folium, plotly, time, sqlite3 database for backup data storage. A graphical representation of the research results is made in the form of a pie chart and on an OpenStreetMap.

Keywords: VKontakte, social network, parsing, Volgograd Region, data analysis, geodata, profile, user, process

., Volgograd, 400005, , Volgograd, 400005,

Введение. В современном мире интернет как система образует огромное виртуальное пространство. Значительная часть этого пространства - социальные сети. На сегодняшний день они являются одними из самых посещаемых/используемых ресурсов в интернете. Благодаря социальным сетям можно найти работу, новых друзей, сторонников своих идей и мыслей, а также общаться без каких-либо условностей [1]. В России социальные сети также имеют большую популярность, причем общение в них происходит на русском языке. По данным портала Mediascope [10], 58 % населения России хотя бы раз в сутки заходят в социальные сети. Наиболее популярной социальной сетью в России является «ВКонтакте» (ВК) [20]. В ней зарегистрировано около 70 миллионов пользователей из России, что составляет 48 % населения страны. В своем профиле ВК пользователь может указать контактную информацию, например, дату рождения, место учебы и место проживания. В данной статье анализируются города проживания пользователей тематических сообществ Волгоградской области ВК. Результаты исследования отображаются в виде нанесения отметок на карту, таблицы и круговой диаграммы.

Общая характеристика использования социальных сетей в Волгоградской области. Волгоградская область является 31-м регионом России по площади и 19-м по численности населения. Площадь территории области - 112 877 км2.

На 01.01.2020 в Волгоградской области проживают 2300 тыс. чел, в том числе в Волгограде 1075 тыс. чел. [2]. Доля городского населения в области 58 %.

Валовой внутренний продукт на душу населения 305,1 тыс. руб., что является 26-м показателем в России [9].

Насыщенность населения компьютерами составляет 779 единиц (включая ноутбуки) на 1000 жителей. Количество смартфонов - 960 на 1000 жителей [8].

Жители Волгоградской области (ВО) активно пользуются не только интернетом, но и социальными сетями (рис. 1). Наиболее популярной является социальная сеть ВК [20].

Социальные процессы региона отображаются в его тематических сообществах в социальных сетях. Всего в ВК 48 559 тематических сообществ ВО. Количество пользователей из ВО в ВК составляет 1 239 039 профилей (данные на 15.03.2020). В среднем на один регион России приходится около 823,5 тысяч пользователей ВК. Таким образом, количество пользователей ВК в ВО выше среднего количества по стране.

Однако, только ли жителям ВО интересна социально-экономическая жизнь города?

В данной статье проводится анализ населенных пунктов (НП) пользователей, состоящих в тематических сообществах ВО, и выявляются те НП России и стран СНГ, жители которых больше всего интересуются жизнью региона.

п^а^гапп ТинНег РаыЬоок Ьпк£<Лг> РзгеК^иаге

Рисунок 1 - Статистика популярности социальных сетей в Волгоградской области

Причинами такого интереса могут быть следующие:

• наличие родственников и знакомых ВО;

• наличие деловых интересов в ВО;

• сохранение интереса к региону после переезда в другой НП;

• изучение ВО как целесообразного места переезда на временное или постоянное место жительства;

• другие причины.

В дальнейшем эта информация будет использована для анализа НП России и стран СНГ, пользователи которых проявляют наибольший интерес к социально-экономическим процессам в ВО, а также причин их интереса [4].

Описание метода сбора и анализа данных о географии пользователей тематических сообществ ВО. Сделать предположение о текущем месте жительства пользователя можно на основании данных в графе «Город» в профиле пользователя в социальной сети ВК. Это предположение подтверждает тот факт, что количество пользователей из городов пропорционально их населению [21] со средним коэффициентом 1,25. Причина - некоторые люди имеют несколько страниц в ВК из-за следующего: утеря данных от предыдущей страницы, создание общей страницы после замужества, создание страниц домашнему питомцу и т.д., а также тем, что многие жители региона, проживающие в области, указывают в графе «Город» не тот НП, в котором они проживают, а областной центр.

В таблице 1 рассмотрены самые крупные по количеству пользователей сообщества ВО с указанием того, посвящены ли обсуждения в группе определенной тематике или носят общедискуссионный характер.

Таблица 1 - Самые крупные по количеству пользователей сообщества ВО с указанием того, посвящены ли обсуждения в группе определенной тематике или носят общедискуссионный характер

Количество

Название группы Ссылка участников (данные на 15.03.2020) Тематическая группа

Типичный Волгоград https://vk.com/tipich Volgograd 266 002 НЕТ

Работа в Волгограде https://vk.com/public109276824 96 015 ДА

Торговый центр / ТРЦ Акварель Волгоград https://vk.com/aquarele 72 517 ДА

V1.RU | Новости Волгограда https://vk.com/newsv1 51 541 ДА

Сейчас | Волгоград https://vk.com/orm34 45 550 НЕТ

ЧЕРНЫЙ СПИСОК | Волгоград https://vk.com/public86743168 28 141 НЕТ

Спортивный Волгоград https://vk.com/sportivnaia_russia 27 960 ДА

На основе исследования тематических сообществ Волгоградской области были отобраны четыре группы с наибольшим количеством пользователей. В данных сообществах обсуждаются вопросы жизни не только города Волгограда, но и всего региона. Поэтому они интересны всем жителям ВО:

• V1.RU | Новости Волгограда [19];

• Спортивный Волгоград [11];

• Торговый центр / ТРЦ Акварель Волгоград [14];

• РАБОТА в Волгограде [6].

Сообщества «Типичный Волгоград», «Сейчас | Волгоград», «ЧЕРНЫЙ СПИСОК Волгоград» в исследовании не рассматривались, так как они имеют нетематический характер.

Метод, реализованный в данном исследовании, (рис. 2) состоит в получении информации о городе пользователя, установленном на его странице в социальной сети ВКонтакте, путем request -запросов. Информация берется только из открытых профилей пользователей. Название города проходит валидацию, алгоритм которой приведен далее в статье. Затем создается единая база из городов и количества пользователей из этих городов. По данным из этой базы составляется карта пользователей, интересующихся социальной жизнью региона.

Анализ тематических сообществ. Подготовка данных для программного модуля. V

> г

( > Получение результатов при помощи разработанной программы V V

> г

( N Визуализация результатов исследования на карте и в виде круговой диаграммы V V

> г

с Анализ результатов исследования V

Рисунок 2 - Концепт метода анализа данных

Приведем краткий обзор аналогов.

PepperNinja [18] - система, производящая сбор данных, в том числе и о местоположении, о пользователях с сообществ в Facebook и ВК. С помощью Pepper.ninja можно собирать информацию о подписчиках других пользователей, пользователях, обсуждающих посты и публикующих тематические записи на стенах. Также сервис позволяет получить данные о посетителях сайтов, которые оставляют комментарии с помощью формы ВК

Полученные данные заносятся в текстовый файл и архивируются. Однако визуализировать эти данные невозможно. Также в программе не происходит сравнения данных между источниками. Минимальная стоимость - 490 руб./месяц (данные на 23.03.2020).

Content Downloader [16] - программа, позволяющая сканировать интернет-сайты. Имеет очень широкую область применения, в том числе и социальные сети. Высокая скорость работы благодаря многопоточности процессов. Преимуществом программы является то, что она позволяет доставать скрытую информацию (доступную только после регистрации на сайте). В политике Content Downloader предусмотрено несколько версий программы, которые отличаются по возможному количеству потоков (от 5 до 50) и, соответственно, по цене.

Однако система имеет ряд недостатков. Основной из них заключается в том, что продукт предназначен не только для социальных сетей. Как следствие, во время сбора и анализа данных с социальных сетей случаются программные сбои и ошибки. Графической визуализации данных также не предусмотрено.

Научная новизна данного исследования заключается в разработке и программной реализации метода, позволяющего собирать, анализировать и визуализировать данные о местах проживания пользователей групп в социальной сети ВК. Обзор аналогов показал, что на данный момент такой системы нет.

Для проведения исследования была разработана программа на языке Python с использованием библиотек vk_api, requests, folium, plotly, time, БД sqlite3 для резервного хранения данных. Программа позволяет составить таблицу из городов, указанных в профилях пользователей тематических

групп ВО в социальной сети ВКонтакте, а также графически визуализировать полученные данные в виде круговой диаграммы и карты с отметками.

Объем разработанной программы без графического интерфейса составил около 500 строк.

В данной статье рассматривается территориальное распределение пользователей, проживающих только вне ВО - в различных регионах России и стран СНГ. Количество лиц, проживающих в других странах, невелико. Потому в данной статье они не рассматриваются.

Общее описание алгоритма метода сбора и анализа данных о миграционных потоках. Для реализации возможности настройки на различные группы социальной сети и регионы входом разработанного алгоритма (рис. 3) является txt-файл (1), содержащий список групп ВК, из которых нам необходимо получить информацию о пользователях. Затем путем request - запросов производится сбор информации из шапки страницы каждого пользователя при помощи метода get_info из API ВК (2) [3]. Далее из строки с информацией о пользователе извлекается название города, который указан в его профиле. Это осуществляется путем среза строки по тегу city. После этого происходит проверка на корректность названия НП - оно должно состоять только из символов русского алфавита. Также отсеиваются НП, находящиеся в ВО [5]. Те НП, которые прошли вали-дацию, заносятся в список citieslist (4), а в списке с количеством пользователей userslist (3) счетчик количества пользователей, проживающих в данном городе, увеличивается на «1».

Рисунок 3 - Схема работы программы

После того как все профили обработаны, происходит составление из списков единого словаря (5), в котором ключом является название НП, а значением - количество пользователей, проживающих в этом НП. По данным из словаря составляется круговая диаграмма (6) из 25 городов с наибольшим количеством пользователей. Затем происходит визуализация данных путем нанесения отметок по координатам НП пользователей на карту OpenStreetMap (7).

Программная реализация алгоритма. В начале работы программы происходит авторизация пользователя в ВК для создания сессии и подключения к библиотеке vk_api [20]. После этого происходит создание базы данных SQLite, состоящей из таблицы, хранящей названия НП и количества пользователей из этих НП, для резервного копирования полученных данных с обработанных страниц. Далее осуществляется считывание списка групп, выбранных для анализа (из txt-файла). Считанные названия групп заносятся в список. Он выводится на экране, как промежуточный результат.

Далее начинается составление списка из идентификаторов пользователей этих групп при помощи метода API VK groups.get_members [3]. После того как список идентификаторов получен, из него удаляются одинаковые идентификаторы. Таким образом, на выходе программы получается список из уникальных идентификаторов пользователей. Общее количество уникальных пользователей также визуализируется и выводится на экран как промежуточный результат.

После этого с использованием цикла происходит перебор списка с идентификаторами пользователей. Если профиль пользователя закрыт, то данные с него получить невозможно, он пропускается

grcups.txt

7

и происходит переход к следующему профилю. В случае если страница (профиль пользователя) открыта, то происходит счшывание следующих данных из «шапки» пользователя:

• ГО пользователя;

• имя пользователя;

• фамилия пользователя;

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

• ГО города;

• название города.

После этого из списка с данными пользователя извлекается название города, и начинается его валидация. Первый этап валидации - это проверка на местонахождение НП вне ВО. Для этого перед запуском программы был получен список НП ВО, состоящий из 1507 НП [5]. В случае если название полученного НП совпадает с одним из НП ВО, то валидация прерывается с отрицательным результатом и происходит переход к странице следующего пользователя. Если НП находится не в ВО, то осуществляется следующий этап валидации - проверка на корректность названия. Если в названии НП присутствуют символы иностранных алфавитов, то валидация также прерывается и происходит переход к следующему профилю (следующему пользователю).

Если название НП полностью прошло валидацию, то происходит добавление этого НП в словарь. В случае если такого НП в словаре нет, то происходит добавление названия НП в качестве ключа, а в качестве значения, добавляется количество профилей пользователей из этого НП (в данном случае 1).

Если этот НП уже имеется в словаре, то счетчик количества пользователей для этого НП увеличивается на единицу. Также на каждом шаге алгоритма происходит сохранение словаря в базу данных - в связи с возможностью аварийного прерывания работы программы (рис. 4). На случай отключения доступа к интернету предусмотрена дополнительная защита в виде приостановки выполнения программы, до тех пор, пока соединение не будет восстановлено.

Таким образом, в состав отобранных данных включаются только пользователи, проживающие в России, но не в ВО.

Структура Данные Ограничения Индексы Триггеры ОЭЬ

Табличный вид Форма

В О - В О □ О □ 1 □ Q 4 S )в£ 3* |отфильт... Тг ▼ Всего загружено строк: 4

user_city value

1 Астрахань 1

2 Москва 5

з Санкт-Петербург 2

4 Знаменск 1

Рисунок 4 - Фрагмент содержания базы данных (БД) для резервного копирования

После того как все данные обработаны и составлен словарь, происходит его разбиение на два списка. В первый список заносятся названия НП, а во второй список - количество пользователей из этого населённого пункта. После этого происходит сортировка списков в порядке убывания. Списки загружаются из базы данных, так как в случае хранения словаря в локальном виде внутри программы имеется риск потери данных из-за перегрузки памяти или отключения компьютера, на котором выполняется программа, от интернета. Извлечение данных из БД SQLite происходит путем INSERT-запросов. Таким образом, на выходе мы получаем отсортированные по количеству жителей списки НП.

Далее на основании этих списков составляется круговая диаграмма на основании НП, процент пользователей которых более 0,5 - для графической визуализации результатов исследования. После этого происходит нанесение отметок на карту OpenStreetMap [17]. Для этого сначала загружается карта OpenStreetMap и при помощи библиотеки folium, устанавливаются ее стартовые координаты и масштаб.

Далее происходит получение списка координат НП из списка названий НП при помощи запросов к Яндекс-геокодеру [15]. Ответом на запрос к геокодеру является строка, содержащая информацию об объекте. Путем извлечения среза из строки получаются координаты начала и конца объекта по ширине и долготе, а затем вычисляется их среднее арифметическое. На выходе мы получаем двумерный список координат (широта, долгота) для НП. После этого происходит перебор списка координат и нанесение отметок на карту OpenStreetMap в координатах, указанных в списке. Размер отметки зависит от количества пользователей из данного НП и может быть трех видов: маленькая, средняя и большая. (В случае если из данного НП менее 20 пользователей - ставится маленькая отметка, для НП с количеством пользователей от 20 до 70 ставится средняя отметка, а для НП с количество пользователей более 70 ставится большая отметка

После нанесения отметок карта сохраняется в html-файл. Графически этот алгоритм представлен на рисунке 5 в виде UML-диаграммы.

Рисунок 5 - Схема алгоритма программы

Результаты исследования. Исследование состоит в анализе территориальной принадлежности НП, указанных как город проживания пользователя на его персональной странице «ВКонтак-те», и производится на выборке из 50000 случайных профилей пользователей, интересующихся социально-экономической жизнью ВО, но проживающих вне ВО (табл. 2).

Таблица 2 - Список НП

Название города Количество пользователей из выборки в 50000 человек % от общего количества пользователей не из Волгоградской области

Москва 1710 43,2

Санкт-Петербург 701 17,7

Краснодар 290 7,32

Ростов-на-Дону 185 4,67

Сочи 108 2,73

Екатеринбург 94 2,37

Саратов 77 1,94

Астрахань 62 1,57

Воронеж 53 1,34

Самара 53 1,34

Челябинск 48 1,21

Пермь 46 1,16

Уфа 45 1,14

Владивосток 45 1,14

Нижний Новгород 42 1,06

Казань 39 0,98

Знаменск 31 0,78

Новосибирск 30 0,76

Киев 29 0,73

Ахтубинск 28 0,7

Калининград 27 0,68

Севастополь 26 0,66

Ставрополь 26 0,66

Омск 25 0,63

Хабаровск 25 0,63

Мурманск 24 0,6

Симферополь 23 0,58

Новороссийск 23 0,58

Сургут 23 0,58

Донецк 23 0,58

Всего 3940 100 %

Более удобной формой для оценки результатов анализа является представление их в виде круговой диаграммы (рис. 6).

Графическое представление результатов исследования на выборке 50000 страниц пользователей ВК на карте Оре^йееЖар приведено на рисунке 7.

Как можно видеть на рисунке 7, круги в его левой части накладываются друг на друга, что затрудняет возможности анализа.

Поэтому для более подробного отображения результатов исследования были получены графические представления на участке европейской части России и на участке Южного и СевероКавказского федерального округов на карте Оре^йееЖар (рис. 8, 9).

Рисунок 6 - Результаты исследования, представленные в виде круговой диаграммы

Рисунок 7 - Результаты исследования, представленные в виде отметок на карте Ореп81гее1Мар

Рисунок 8 - Результаты исследования, представленные в виде отметок на карте Оре^1тее1Мар (европейская часть России)

Астраханская

Республике Калмыкия

ЭЛШа

Ставропольский крайА

^^^^^^мЖи^^ НевиЖ/ч

I'A' i^rae

\

ВладЛРбвказ

Рисунок 9 - Результаты исследования, представленные в виде отметок на карте Оре^1хее1Мар (Южный и Северо-Кавказский федеральные округа)

Из рисунков видно, что наибольший интерес к социальной жизни ВО проявляют жители Москвы, Санкт-Петербурга и крупных городов Южного Федерального округа. Также высокие показатели у крупных городов европейской части России.

Результаты расчетов относительных показателей для пользователей. Был также проведен расчёт уровня интереса к Волгоградской тематике по городам с использованием формулы:

/ '\qjXs. (1)

где N - численность населения города; q - выборка, на которой проводилось исследование; 5 -количество интересующихся пользователей в выборке q.

Суть формулы в пересчете количества интересующихся социальной жизнью ВО пользователей на общую численность населения города. Например, если на 50 000 профилей количество интересующихся пользователей равно 100, то на миллион профилей количество интересующихся пользователей равно 2000.

Таблица 3 - Уровни интереса в 10 городах пользователей ВК, наиболее интересующихся социально-экономической жизнью ВО

Город Население города (на 01.01.2019) [19] Оценка количества интересующегося населения (считается по формуле 1) Оценка процента интересующегося населения от общего населения Количество пользователей ВК в городе (на 23.03.2020) Процент интересующегося населения от количества пользователей ВК в городе

Москва 12 615 882 431 463 3,42 16 878 475 2,56

Санкт-Петербург 5 383 890 75 482 1,4 8 527 755 0,89

Краснодар 918 145 5 325 0,58 1 766 037 0,3

Ростов-на-Дону 1 133 307 4 193 0,37 1 436 933 0,29

Сочи 438 726 948 0,21 360 750 0,26

Екатеринбург 1 483 119 2788 0,19 2 291 371 0,12

Саратов 841 902 1296 0,15 797 417 0,16

Астрахань 534 241 662 0,12 405 375 0,16

Воронеж 1 054 111 1117 0,1 1 018 055 0,1

Самара 1 156 608 1226 0,09 1 596 204 0,07

По результатам исследования можно сделать вывод, что больше всего интересуются социальной жизнью ВО пользователи из Москвы и Санкт-Петербурга (два самых крупных города России). В этих населенных пунктах наибольшие значения не только абсолютных показателей, но и относительных (последняя колонка таблицы 3).

Также в первой пятерке (табл. 3) находятся города Краснодар, Ростов-на-Дону и Сочи. Это может быть обусловлено в первую очередь территориальной близостью этих городов к Волгограду [7], а также большим количеством миграций [12] в эти города жителей из Волгоградской области [13].

Библиографический список

1. Викторова А. С. Социальные сети и молодежь / А. С. Викторова, И. А. Свертков // Территория науки. - 2013. - № 3. - С. 5-8.

2. Волгоградская область. - 2020. - Режим доступа: https://ru.wikipedia.org/wiki/Волгоградская _область, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 22.04.2020).

3. Документация | Разработчикам. - 2019. - Режим доступа: https://vk.com/dev/manuals, свободный. -Заглавие с экрана. - Яз. рус. (дата обращения: 12.11.2019).

4. Кравец А. Г. Геоинформационный подход к управлению развитием территории на основе анализа данных социальных сетей / А. Г. Кравец, Я. Г. Мильчук, А. С. Мильчук // Прикаспийский журнал: управление и высокие технологии. - 2017. - № 3 (39). - С. 69-79.

5. Населенные пункты, входящие в состав муниципальных образований Волгоградской области. Общероссийский классификатор территорий муниципальных образований. - 2019. - Режим доступа: http://www.oktmo.ru/locality_registry/?code=18000000000, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 13.11.2019).

6. РАБОТА в Волгограде. - 2019. - Режим доступа: https://vk.com/public109276824, свободный. -Заглавие с экрана. - Яз. рус. (дата обращения: 01.11.2019).

7. Расстояние между городами России. Автодиспетчер. - 2019. - Режим доступа: https://www.avtodispetcher.ru/distance/table/c60189-rossiya/, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 27.11.2019).

8. Смартфоны (Мировой рынок). - 2020. - Режим доступа: www.tadviser.ru/index.php /Статья:Смартфоны_(мировой_рынок), свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 04.05.2020).

9. Список субъектов Российской Федерации по валовому продукту. - 2020. - Режим доступа: https://ru.wikipedia.org/wiki/Список_субъектов_Российской_Федерации_по_валовому_продукту, свободный. -Заглавие с экрана. - Яз. рус. (дата обращения: 04.05.2020).

10. Социальные сети в цифрах. - 2020 - Режим доступа: https://mediascope.net /upload/iblock/f97/18.04.2019, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 17.03.2020).

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

11. Спортивный Волгоград. - 2019. - Режим доступа: https://vk.com/sportivnaia_russia, свободный. -Заглавие с экрана. - Яз. рус. (дата обращения: 01.11.2019).

12. Территориальный орган Федеральной службы государственной статистики по Волгоградской области. - 2019. - Режим доступа: https://volgastat.gks.ru, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 20.10.2019).

13. Территориальный орган Федеральной службы государственной статистики по Волгоградской области. Миграция. - 2019. - Режим доступа: https://volgastat.gks.ru/storage/mediabank/, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 20.10.2019).

14. Торговый центр / ТРЦ Акварель Волгоград. - 2019. - Режим доступа: https://vk.com/aquarele, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 01.11.2019).

15. Яндекс геокодер. - 2019. - Режим доступа: https://tech.yandex.ru/maps/geocoder/, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 18.12.2019).

16. Content Downloader Х1 - универсальный парсер контента. - 2020 - Режим доступа: http://sbfactory.ru/?p=600, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 22.03.2020).

17. OpenStreetMap. - 2020. - Режим доступа: https://openstreetmap.org, свободный. - Заглавие с экрана. -Яз. рус. (дата обращения: 04.01.2020).

18. Pepper.Ninja | Парсер групп ВКонтакте. - 2020 - Режим доступа: https://pepper.ninja/?p=89188&gclid=CjwKCAjwvOHzBRBoEiwA48i6ArCIdREzlW7XkxgAvT5kkHf-9Ssnshoe6 ByLaNqi4pzuNKdJQExqWBoC1qoQAvD_BwE, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 22.03.2020).

19. V1.RU | Новости Волгограда. - 2019. - Режим доступа: https://vk.com/newsv1, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 01.11.2019).

20. Vk_api. - 2020. - Режим доступа: https://github.com/python273/vk_api, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 23.12.2019).

21. 100 Крупнейших городов России по населению 2019 список РФ. - 2019. - Режим доступа: http://www.statdata.ru/largest_cities_russia, свободный. - Заглавие с экрана. - Яз. рус. (дата обращения: 17.03.2020).

References

1. Viktorova A. S., Svertkov I. A. Socialnye seti i molodezh [Social networks and young people]. Territoriya nauki [Territory of Science]. 2013, no. 3, pp. 5-8.

2. Volgogradskaya oblast [Volgograd region]. 2020. Available at: https://ru.wikipedia.org/wiki/Volgogradskaya_oblast' (accessed 22.04.2020).

3. Dokumentaciya | Razrabotchikam [Documentation | For developers]. 2019. Available at: https://vk.com/dev/manuals (accessed 12.11.2019).

4. Kravets A. G., Milchuk Ya. G., Milchuk A. S. Geoinformatsionnyy podkhod k upravleniyu razvitiyem terri-torii na osnove analiza dannykh sotsialnykh setey [Geoinformational approach to managing the development of a territory based on analysis of data from social networks]. Prikaspiyskiy zhurnal: upravleniye i vysokiye tekhnologii [Caspian Journal: Control and High Technologies], 2017, no. 3 (39), pp. 69-79.

5. Naselennye punkty, vkhodyashchie v sostav municipalnykh obrazovaniy Volgogradskoy oblasti. Obshcherossiyskiy klassifikator territory municipalnykh obrazovaniy [Settlements that are part of the municipalities of the Volgograd region. All-Russian Classifier of Municipal Territories]. 2019. Available at: http://www.oktmo.ru/locality_registry/?code= 18000000000 (accessed 13.11.2019).

6. RABOTA v Volgograde [Job in Volgograd], 2019. Available at: https://vk.com/public109276824 (accessed 01.11.2019).

7. Rasstoyanie mezhdu gorodami Rossii. Avtodispetcher [Distance between cities of Russia. Car dispatcher]. 2019. Available at: https://www.avtodispetcher.ru/distance/table/c60189-rossiya/ (accessed 27.11.2019).

8. Smartfony (Mirovoy rynok) [Smartphones (World market)]. 2020. Available at: www.tadviser.ru/index.php/Stat'ya:Smartfony_(mirovoj_rynok) (accessed 04.05.2020).

9. Spisok subektov Rossiyskoy Federatsii po valovomu produktu [List of constituent entities of the Russian Federation by gross product]. 2020. Available at: https://ru.wikipedia.org/wiki/Spisok_ sub"ektov_Rossijskoj_Federacii_po_valovomu_produktu (accessed 04.05.2020).

10. Socialnye seti v tsifrakh [Social media in numbers], 2020. Available at: https://mediascope.net/upload/iblock/f97/18.04.2019 (accessed 17.03.2020).

11. Sportivnyi Volgograd [Sports Volgograd]. - 2019. - Available at: https://vk.com/sportivniya_russia (accessed 01.11.2019).

12. Territorialnyy organ Federalnoy sluzhby gosudarstvennoy statistiki po Volgogradskoy oblasti [Territorial body of the Federal State Statistics Service for the Volgograd Region]. 2019. Available at: https://volgastat.gks.ru (accessed 20.10.2019).

13. Territorialnyy organ Federalnoy sluzhby gosudarstvennoy statistiki po Volgogradskoy oblasti. Migratsiya [Territorial body of the Federal State Statistics Service for the Volgograd Region. Migration]. 2019. Available at: https://volgastat. gks.ru/storage/mediabank/ (accessed 20.10.2019).

14. Torgovyy centr / TRC Akvarel Volgograd [Shopping center / SEC Akvarel Volgograd]. 2019. Available at: https://vk.com/aquarele (accessed 01.11.2019).

15. Yandeks geokoder [Yandeks geocoder]. 2019. Available at: https://tech.yandex.ru/maps/geocoder/ (accessed 18.12.2019).

16. Content Downloader X1 - universalnyy parser kontenta [Content Downloader X1 - universal content parser]. 2020. Available at: http://sbfactory.ru/?p=600 (accessed 22.03.2020).

17. OpenStreetMap. - 2020. - Available at: https://openstreetmap.org (accessed 04.01.2020).

18. Pepper.Ninja | Parser grupp VKontakte [Pepper.Ninja | Parser for VKontakte groups]. 2020. Available at: https://pepper.ninja/?p=89188&gclid=CjwKCAjwvOHzBRBoEiwA48i6ArCIdREzlW7XkxgAvT5kkHf-9Ssnshoe6 ByLaNqi4pzuNKdJQExqWBoC1qoQAvD_BwE (accessed 22.03.2020).

19. V1.RU | Novosti Volgograda [V1.RU | Volgograd News]. 2019. Available at: https://vk.com/newsv1. (accessed 01.11.2019).

20. Vk api. 2020. Available at: https://github.com/python273/vk_api. (accessed 23.12.2019).

21. 100 Krupneyshchikh gorodov Rossii po naseleniyu 2019 spisok RF [100 Largest cities in Russia by population 2019 list of the Russian Federation]. 2019. Available at: http://www.statdata.ru/largest_cities_russia (accessed 17.03.2020).

i Надоели баннеры? Вы всегда можете отключить рекламу.