Научная статья на тему 'ЦИФРОВЫЕ СЛЕДЫ НАСЕЛЕНИЯ КАК ИСТОЧНИК ДАННЫХ О МИГРАЦИОННЫХ ПОТОКАХ В РОССИЙСКОЙ АРКТИКЕ'

ЦИФРОВЫЕ СЛЕДЫ НАСЕЛЕНИЯ КАК ИСТОЧНИК ДАННЫХ О МИГРАЦИОННЫХ ПОТОКАХ В РОССИЙСКОЙ АРКТИКЕ Текст научной статьи по специальности «СМИ (медиа) и массовые коммуникации»

CC BY-NC-ND
66
32
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
ЦИФРОВИЗАЦИЯ / ЦИФРОВЫЕ СЛЕДЫ / СОЦИАЛЬНЫЕ СЕТИ / МИГРАЦИЯ / МИГРАЦИОННЫЕ ПОТОКИ / ТРАНСПОРТНАЯ СЕТЬ / РОССИЙСКАЯ АРКТИКА

Аннотация научной статьи по СМИ (медиа) и массовым коммуникациям, автор научной работы — Смирнов Андрей Владимирович

Благодаря цифровизации экономики и общественной жизни расширяются возможности изучения населения с использованием цифровых следов - информации, которая накапливается в цифровой среде. В статье с помощью цифровых следов исследуется миграция населения российской Арктики - огромного макрорегиона, который на протяжении последних десятилетий испытывает значительный отток населения. Обобщен опыт применения цифровых следов в демографических исследованиях, названы их преимущества и ограничения. Для изучения населения российской Арктики использовали данные нескольких цифровых платформ. Анализ профилей пользователей социальной сети «ВКонтакте» позволил изучить миграционное движение, а данные сервиса по продаже билетов Туту.ру дали сведения об авиационных и железнодорожных перемещениях. С применением методов сетевого анализа изучены миграционные и транспортные потоки в российской Арктике на муниципальном уровне, выявлены хабы и кластеры в сетях перемещений. Определены особенности миграционных и транспортных сетей Арктики: низкая плотность, большие расстояния между узлами, высокая относительная подвижность при малом числе перемещений в абсолютном выражении, высокий удельный вес хабов в миграционном обмене. Миграционные потоки классифицированы по направлениям перемещений и типам муниципальных образований. Показано, что связность арктических территорий остается низкой, а положительный миграционный баланс имеют в основном региональные столицы, либо города за пределами Арктики. Полученные результаты позволят улучшить понимание миграционных процессов на Севере и в Арктике, повысить качество демографических прогнозов благодаря более точному моделированию миграционных потоков.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

DIGITAL TRACES OF THE POPULATION AS A DATA SOURCE ON MIGRATION FLOWS IN THE RUSSIAN ARCTIC

The digitalization of the economy and public life has expanded the possibilities of studying the population using digital traces - information that accumulates in the digital environment. Using digital traces, the article explores the migration of the population of the Russian Arctic, a huge macro-region that has experienced a significant outflow of population over the past decades. The text summarizes the experience of using digital traces in demographic research and formulates their strengths and limitations. Data from several digital platforms were used to study the population of the Russian Arctic. An analysis of the profiles of users of the social network VK.com made it possible to study the migration movements of the population of the Russian Arctic, and the data of the ticket service Tutu.ru provided information on air and rail movements. Using network analysis methods, the author studied migration and transport flows in the Russian Arctic at the municipal level. The article defines the features of migration and transport networks in the Arctic: low density, large distances between nodes, high relative mobility with small volumes of movements in absolute terms, a high proportion of hubs in migration exchange. The author identifies migration hubs and clusters, and migration flows are classified according to the directions of movement and types of municipalities. The text shows that the connectivity of the Arctic territories among themselves remains low, and the positive migration balance is mainly in regional capitals or cities outside the Arctic. The results of the study will improve the understanding of migration processes in the North and the Arctic, as well as the quality of demographic forecasts through more accurate modeling of migration flows.

Текст научной работы на тему «ЦИФРОВЫЕ СЛЕДЫ НАСЕЛЕНИЯ КАК ИСТОЧНИК ДАННЫХ О МИГРАЦИОННЫХ ПОТОКАХ В РОССИЙСКОЙ АРКТИКЕ»

Демографическое обозрение / Demographic Review 2022;9(2)42-64 DOI: https://doi. org/10.17323/demreview. v9i2.16205

Цифровые следы населения как источник данных о миграционных потоках в российской Арктике

Андрей Владимирович Смирнов (av.smirnov.ru@gmail.com), Институт социально-экономических и энергетических проблем Севера ФИЦ Коми НЦ УрО РАН, Россия.

Digital traces of the population as a data source on migration flows In the Russian Arctic

Andrey V. Smirnov (av.smirnov.ru@gmail.com), Institute for Socio-Economic and Energy Problems of the North, Komi Science Centre of the Ural Branch of the Russian Academy of Sciences, Russia.

Резюме: Благодаря цифровизации экономики и общественной жизни расширяются возможности изучения населения с использованием цифровых следов - информации, которая накапливается в цифровой среде. В статье с помощью цифровых следов исследуется миграция населения российской Арктики - огромного макрорегиона, который на протяжении последних десятилетий испытывает значительный отток населения. Обобщен опыт применения цифровых следов в демографических исследованиях, названы их преимущества и ограничения. Для изучения населения российской Арктики использовали данные нескольких цифровых платформ. Анализ профилей пользователей социальной сети «ВКонтакте» позволил изучить миграционное движение, а данные сервиса по продаже билетов Туту.ру дали сведения об авиационных и железнодорожных перемещениях. С применением методов сетевого анализа изучены миграционные и транспортные потоки в российской Арктике на муниципальном уровне, выявлены хабы и кластеры в сетях перемещений. Определены особенности миграционных и транспортных сетей Арктики: низкая плотность, большие расстояния между узлами, высокая относительная подвижность при малом числе перемещений в абсолютном выражении, высокий удельный вес хабов в миграционном обмене. Миграционные потоки классифицированы по направлениям перемещений и типам муниципальных образований. Показано, что связность арктических территорий остается низкой, а положительный миграционный баланс имеют в основном региональные столицы, либо города за пределами Арктики. Полученные результаты позволят улучшить понимание миграционных процессов на Севере и в Арктике, повысить качество демографических прогнозов благодаря более точному моделированию миграционных потоков.

Ключевые слова: цифровизация, цифровые следы, социальные сети, миграция, миграционные потоки, транспортная сеть, российская Арктика.

Финансирование: Исследование выполнено за счет гранта Российского научного фонда, проект № 21-78-00081 «Разработка инструментария для изучения демографических процессов в условиях цифровизации общества (на примере российской Арктики)».

Для цитирования: Смирнов А. В. (2022). Цифровые следы населения как источник данных о миграционных потоках в российской Арктике. Демографическое обозрение, 9(2), 42-64. https://doi.org/10.17323/demreview.v9i2.16205

Abstract: The digitalization of the economy and public life has expanded the possibilities of studying the population using digital traces - information that accumulates in the digital environment. Using digital traces, the article explores the migration of the population of the Russian Arctic, a huge macro-region that has experienced a significant outflow of population over the past decades. The text summarizes the experience of using digital traces in demographic research and formulates their strengths and limitations. Data from several digital platforms were used to study the population of the Russian Arctic. An analysis of the profiles of users of the social network VK.com made it possible to study the migration movements of the population of the Russian Arctic, and the data of the ticket service Tutu.ru provided information on air and rail movements. Using network analysis methods, the author studied migration and transport flows in the Russian Arctic at the municipal level. The article defines the features of migration and transport networks in the Arctic: low density, large distances between nodes, high relative mobility with small volumes of movements in absolute terms, a high proportion of hubs in migration exchange. The author identifies migration hubs and clusters, and migration flows are classified according to the directions of movement and types

of municipalities. The text shows that the connectivity of the Arctic territories among themselves remains low, and the positive migration balance is mainly in regional capitals or cities outside the Arctic. The results of the study will improve the understanding of migration processes in the North and the Arctic, as well as the quality of demographic forecasts through more accurate modeling of migration flows.

Keywords: digitalization, digital traces, social networks, migration, transport network, migration flows, the Russian Arctic.

Funding: The article has been prepared with the support of the Russian Science Foundation,

the project No 21-78-00081 "Development of tools for studying demographic processes in the context of the digitalization of society (in the case of the Russian Arctic)".

For citation: Smirnov A. (2022). Digital traces of the population as a data source on migration flows In the Russian Arctic. Demographic Review, 9(2), 42-64. https://doi.org/10.17323/demreview.v9i2.16205

Введение

В современном мире практически все виды человеческой деятельности имеют свое отражение в интернет-пространстве. Поэтому цифровые источники данных, сохраняющие историю взаимодействия человека с интернет-средой, все чаще становятся предметом осмысления социальных наук (Katzenbach, Bächle 2019). Ученые анализируют «цифровые следы» - отпечатки активности человека в цифровом пространстве, такие как поисковые запросы, профили и сообщения в социальных сетях, информация о покупках, данные систем глобального позиционирования (Дудина 2021: 5). Новые источники данных дают информацию об обществе в «огромных и микроскопических» масштабах одновременно (Golder, Macy 2014: 131). При изучении миграции населения они позволяют с высокой степенью детализации изучать огромное число миграционных потоков, выявлять скрытые в них закономерности (Смирнов 2022).

В данной статье объектом изучения является пространственная мобильность населения Арктической зоны Российской Федерации, макрорегиона на севере страны,

W А

который за последние 3 десятилетия потерял уже треть населения, прежде всего в результате межрегионального миграционного оттока (Фаузер, Смирнов 2020). Убыль населения сохраняется и сегодня, а ее изучение затрудняется крайней неравномерностью и мозаичностью демографических явлений в Арктике. Цель исследования состоит в выявлении пространственных закономерностей миграции населения российской Арктики при помощи анализа цифровых следов. Одновременно с миграцией будут рассмотрены транспортные пассажирские потоки, которые характеризуют связность арктических территорий друг с другом и с городами за пределами Арктической зоны. Информационную базу исследования помимо официальной статистики составляют данные цифровых платформ: поисковых систем, социальных медиа и сервисов по продаже билетов. Для обработки этих данных использованы методы сетевого анализа - инструмента изучения взаимосвязей между объектами любой природы (Danchev, Porter 2021), в случае миграции - между территориями выбытия и прибытия людей.

В начале статьи систематизирован опыт применения цифровых следов в демографических исследованиях, обобщены их преимущества и недостатки. Затем с использованием новых цифровых источников данных миграция населения российской Арктики рассмотрена на региональном и муниципальном уровнях. Путем анализа миграционных и транспортных сетей выявлены закономерности в перемещениях населения. В заключении статьи сделаны выводы о перераспределения человеческого потенциала российской Арктики и сформулированы некоторые нерешенные научные проблемы.

Цифровые следы как источник демографических данных

Цифровые следы — результаты социального взаимодействия с помощью цифровых инструментов и пространств, а также цифровые записи других культурно значимых материалов (Cesare et al. 2018: 1980). Революция в использовании наукой цифровых следов произошла благодаря переходу от малых данных к большим. В результате этого перехода «производство данных становится непрерывным, обеспечивает полное покрытие в рамках одной системы, характеризуется высоким разрешением, связностью и подвижностью и охватывает различные сферы» (Китчин 2021: 61). Большие данные накапливаются как в государственных информационных системах, так и на частных цифровых платформах.

Государством собираются данные, связанные с регистрацией по месту жительства, трудоустройством, уплатой налогов, посещением медицинских учреждений, получением различных государственных услуг. Транспорт и коммунальные службы превратились в цифровую сеть, снабженную множеством цифровых датчиков, фиксирующих поведение людей. Данные из разных источников аккумулируются в рамках крупных цифровых экосистем, охватывающих многие сферы жизни. Яркий пример - Единый портал государственных услуг Российской Федерации, пользователями которого уже стали более 100 млн человек (Смирнов 2021: 148). В результате реализации национального проекта «Цифровая экономика» в России можно ожидать еще большего углубления цифровизации общества и государственного управления. В частности, уже к 2024 г. в единую облачную платформу планируется перенести 70% информационных систем и ресурсов федеральных органов власти1.

Помимо государственных информационных систем, большие данные генерируются коммерческими компаниями, такими как операторы мобильной связи (местоположение пользователей, статистика использования приложений), сайтами о путешествиях и гостиницах (заказы и отзывы), социальными медиа (мнения, фотографии, персональные данные, местоположение), поставщиками транспортных услуг (маршруты, пассажиропотоки), владельцами сайтов (история действий пользователей), финансовыми учреждениями и сетями розничной торговли (покупки), частными системами наблюдения и охранными предприятиями (местоположение, поведение) (Китчин 2021: 62). Накопление данных позволяет технологическим компаниям извлекать большую прибыль за счет вертикальной и горизонтальной интеграции цифровых платформ. «Развитый капитализм двадцать первого столетия постепенно выстроился вокруг задачи извлечения и использования особого типа сырья - данных... Подобно нефти, данные есть сырье, которое извлекают, очищают и используют самым различным образом. Чем больше у кого-то данных, тем больше различных возможностей их использования» (Срничек 2020: 37).

Большие данные генерируются также с помощью краудсорсинга и в рамках научно-исследовательских проектов. В России следует отметить проект «Инфраструктура научно-исследовательских данных» (ИНИД, data-in.ru), в рамках которого подготовлено множество ценных датасетов, например, о численности избирателей по участковым избирательным комиссиям с привязкой к географическим координатам в 2020 г. Продемонстрируем этот набор данных на примере российской Арктики (рисунок 1). Карты показывают, что аккумулированные с интернет-страниц избирательных комиссий данные в целом достаточно точно отражают систему расселения. Более того, они оценивают размещение населения внутри городов более детально - по избирательным участкам.

К преимуществам цифровых источников данных можно отнести большой географический охват, непрерывную генерацию, быстроту сбора и обработки. Они позволяют получать данные по противоречивым темам, поскольку меньше подвержены искажениям от выбора респондентами социально-одобряемых ответов, чем традиционные опросы (Cesare et al. 2018: 1981). Д. Лейзер и Дж. Рэдфорд выделяют 3 типа цифровых данных по источникам и характеру их получения: цифровая жизнь (фиксация социального поведения, опосредованного цифровыми технологиями), цифровые следы (записи о предпринятых действиях, а не сами действия) и оцифрованная жизнь (переход

1 Паспорт федерального проекта «Информационная инфраструктура». https://files.data-economy.ru/Docs/Pass lnfrastructure.pdf

«аналогового» поведения в цифровую форму). Благодаря развитию методов анализа в исследованиях все чаще применяются не только численные и текстовые данные, полученные из цифрового пространства, но и изображения, аудио и видео (Lazer, Radford 2017: 21-22, 33).

Рисунок 1.

Расселение в российской Арктике по данным Росстата, медицинских информационно-аналитических центров (сверху) и участковых избирательных комиссий (снизу)

Источник: Составлено автором по наборам данных ИНИД (http://data-in.ru/data-catalog/datasets/160; http://data-in.ru/data-catalog/datasets/203) с использованием геоданных Natural Earth (https://www.naturalearthdata.com/).

К недостаткам новых цифровых источников данных относят низкую репрезентативность, фрагментарность, уязвимость к изменениям, возможность ошибок в работе алгоритмов, наличие ложных сведений, ботов и спам-аккаунтов, низкую достоверность, дублирование информации и ограниченность доступа к данным (Golder, Macy 2014; Lazer, Radford 2017). Цифровые данные сложно интерпретировать, когда они генерировались не в исследовательских целях, а цифровые концепты и термины могут

отличаться от теоретических. Проблему недостаточной репрезентативности можно частично решить с помощью постстратификации или других методов исправления смещений (Hughes et al. 2016). Часто исследовательские вопросы сформулированы так, что исправление данных вообще не требуется, например, когда объектом изучения является виртуальное, а не реальное население. Разрабатываются методы по согласованию данных из цифровых следов с другими источниками данных, в том числе микроданными переписей (Alburez-Gutierrez et al. 2019). Цифровые исследования сталкиваются и с большим числом этических проблем (Taylor, Floridi, van der Sloot 2017). Для обеспечения конфиденциальности данных, защиты пользователей от возможной дискриминации и достижения воспроизводимости исследований разрабатываются специальные открытые алгоритмы сбора и обработки цифровых данных (Cesare et al. 2018: 1985).

Развитие методических возможностей исследований в связи с внедрением цифровых данных вызывает попытки разработать для социальных наук подходящую новым инструментам теоретическую оптику. Цифровые следы предлагается превратить в самостоятельный объект изучения, а проблемы связи микро- и макроуровней переосмыслить на основе теории репликаций Д. Булье, восходящей к работам Г. Тарда (Дудина 2021). Применяя монадологию Г. Лейбница к социальным явлениям, Г. Тард утверждает, что «всякий феномен есть не что иное, как туманность, которая распадается на действия, исходящие от множества деятелей» (Тард 2016: 32). По Г. Тарду эти деятели не имеют координирующего центра. Д. Булье выделяет 3 этапа развития социологических методов: на первом источником данных были статистика и переписи, на втором - опросы общественного мнения, а на третьем ими становятся цифровые следы. По Булье в цифровых следах отражаются репликации (повторения, копирования) действий, идей и практик (Boullier 2017). При этом цифровые платформы воспринимаются как своего рода «реплицирующие машины», «позволяющие распространять цифровые следы и делающие их доступными исследованию» (Дудина 2021: 5). Таким образом постулируется самостоятельная исследовательская ценность цифровых следов. К похожим ценным с практической точки зрения выводам приходит и Г. Игнатоу, размышляя о теоретических основах анализа цифровых текстов. Он предлагает рассматривать дискурсы как реальные возникающие социальные явления, что позволяет анализировать их строгими формальными методами (Igntatow 2016: 108).

Влияние новых цифровых источников данных на социальные науки оценивается многими учеными как революционное (Kitchin 2014; Ledford 2020). В демографии цифровые следы начали использовать относительно недавно, но они уже применяются для решения широкого круга задач. Так, изображения автомобилей с панорам улиц используются для оценки социально-демографических характеристик районов (Gebru et al. 2017). Ценные сведения извлекаются из поисковых систем и социальных медиа (McCormick et al. 2017; Zagheni, Weber, Gummadi 2017). Тексты, опубликованные пользователями в сети, используются для анализа репродуктивного, самосохранительного, матримониального и миграционного поведения. Они могут изучаться как частотными методами, по ключевым словам, так и методами машинного обучения, способными классифицировать тексты, выделять их смысловое содержание и эмоциональную окраску. Например, с помощью автоматического извлечения и анализа мнений пользователей социальных сетей можно исследовать различные аспекты репродуктивного поведения населения (Калабихина и др. 2021).

Цифровые платформы особенно полезны в тех случаях, когда национальная статистика относительно каких-либо процессов ненадежна (Cesare et al. 2018) или изучаются группы населения, доступ к которым затруднен или требует огромных финансовых затрат (Edelmann et al. 2020). Данные мобильных телефонов и геотеги сообщений используются для отслеживания пространственной мобильности населения (Hughes et al. 2016). Например, с их помощью изучалось соблюдение мер самоизоляции в различных регионах в период пандемии COVID-19 (Petrov et al. 2021: 9). Перемещения специалистов и ученых могут анализироваться по содержаниям резюме и аффилиациям научных публикаций (Судакова 2020). Показано, что данные поисковых запросов можно использовать для краткосрочных прогнозов тенденций рождаемости (Billari, D'Amuri, Marcucci 2013), вспышек заболеваемости и смертности во время пандемии (Ahmad, Flanagan, Staller 2020). Цифровые следы часто применяются совместно с официальной статистикой и результатами социологических исследований, дополняя друг друга.

Характеристика российской Арктики. Методы и данные

Арктическая зона Российской Федерации на 2022 г. включает 75 городских округов и муниципальных районов2 в 9 северных регионах России (рисунок 1). На начало 2022 г. в российской Арктике проживали 2592,9 тыс. человек (без учета итогов переписи населения 2021 г.). На Арктическую зону приходится около 30% площади, 1,8% населения и 6% валового регионального продукта России. Ключевая отрасль экономики - добыча полезных ископаемых. В Арктике добывают около 90% природного газа России, существенную долю нефти, коксующегося угля, цветных металлов. Экономическая специализация, пространственная удаленность и дискомфортные климатические условия оказывают влияние на демографические структуры (Heleniak, Bogoyavlenskiy 2014; Фаузер, Лыткина 2017; Zamyatina, Yashunsky 2017). Поскольку население Арктики относительно молодое и живет преимущественно в городах, для него характерны высокие значения показателей цифровизации. Более 90% населения от 15 до 74 лет являются активными пользователями Интернета3, что соответствует уровню наиболее развитых стран мира. Поэтому цифровые следы могут быть довольно репрезентативным источником данных о населении Арктики.

Официальные статистические данные о численности и миграции населения арктических территорий получены из Единой межведомственной информационно-статистической системы4 (ЕМИСС) и Базы данных показателей муниципальных образований5 (БДПМО) Росстата. Цифровые следы населения анализировали с использованием трех источников данных: сервиса Яндекса «Подбор слов», проекта «Виртуальное население России» и набора данных сервиса Туту.ру. Рассмотрим их возможности и ограничения.

2 Федеральный закон от 13 июля 2020 г. № 193-ФЗ «О государственной поддержке предпринимательской деятельности в Арктической зоне Российской Федерации».

3 Статистическая информация о социально-экономическом развитии Арктической зоны Российской Федерации. Росстат. https://rosstat.gov.ru/storage/mediabank/arc_zona.html

4 Единая межведомственная информационно-статистическая система. Росстат и Минцифры России. https://www.fedstat.ru/

5 База данных показателей муниципальных образований. Росстат. https://www.gks.ru/dbscripts/munst/

«Подбор слов» Яндекса6 - сервис для оценки пользовательского интереса к тематикам. Он позволяет в разрезе регионов получать информацию о популярности того или иного запроса в поисковой системе. В качестве запросов вводили названия регионов Арктики, что позволило оценить интерес пользователей Яндекса, находящихся в одних регионах, к другим регионам. Наличие поисковых запросов не гарантирует, что пользователи планируют переехать в регион или посетить его. Тем не менее интерес к региону может характеризовать интенсивность культурных, социальных или экономических взаимодействий.

Проект «Виртуальное население России»7 реализован при поддержке Русского географического общества и Института прикладной математики им. М.В. Келдыша РАН. Он содержит географически привязанные данные за январь-март 2015 г. из профилей пользователей самой популярной в России на тот момент социальной сети «ВКонтакте». Данные проекта позволяют анализировать миграционные перемещения на региональном и муниципальном уровнях по возрастным группам, а также дружеские связи людей. Из 88 млн учетных записей, в которых указано место жительства или место учебы, в 9 млн указано более одного места жительства, что позволяет анализировать миграционные потоки. В наборе данных о миграции учитывается только хронологически последняя смена места пребывания каждого пользователя. К ограничениям набора можно отнести наличие данных только на один момент времени, а также то, что люди склонны указывать не тот муниципалитет, где они в действительности проживают, а ближайший к нему крупный город (Замятина, Яшунский 2018). Кроме того, пользователи реже отражают в профилях краткосрочные и возвратные миграции.

Набор данных сервиса по продаже билетов Туту.ру8 о путешествиях по стране создан для прогнозирования распространения коронавирусной инфекции COVID-199. Он содержит информацию о количестве перемещений между городами на самолетах, поездах и автобусах10 в апреле 2019 г. Число пассажиров не ограничивается количеством проданных через сервис Туту.ру билетов, а восстановлено до 100%. По сообщениям разработчиков набора данных, автобусы - самая неточная часть набора ввиду наличия «серых» перевозчиков. Для арктических поселений там содержится всего 11 маршрутов (в основном из Архангельска и Петрозаводска). Поэтому в данном исследовании ограничимся данными о самолетах (558 маршрутов) и поездах (712 маршрутов). Авиа- и железнодорожные данные тоже имеют ограничения. В восточной части страны покрытие рынка хуже. Это касается, в частности, вертолетных маршрутов между городами Дальнего Востока и винтомоторной авиация Якутии.

Миграционные и транспортные потоки изучались методами сетевого анализа (Danchev, Porter 2021). Инструментарий науки о сетях применяется для исследования миграций как на межрегиональном (Maier, Vyborny 2008), так и на межстрановом (Danchev, Porter 2018) уровнях. Сеть представляет собой множество узлов и множество связей между

6 Подбор слов. Яндекс. https://wordstat.yandex.ru/

7 Виртуальное население России. http://webcensus.ru/

8 Датасет Туту.ру и данные модели Open Data Science. https://story.tutu.ru/dataset-tutu-ru-i-dannye-modeli-open-data-science/

9 Сценарии заражения в конкретных городах на основе датасета передвижения людей по России. Habr. https://habr.com/ru/company/tuturu/blog/494700/

10 Covid19-tutu. GitHub. https://github.com/ods-ai-ml4sg/covid19-tutu/blob/master/data/raw_data.csv

ними. Миграционные и транспортные сети удобнее всего представлять направленными и взвешенными. Направления связей соответствуют направлениям перемещений - от места выбытия к месту прибытия, а веса - количеству переместившихся людей. Были построены 6 сетей. Три из них включают только связи, хотя бы один узел которых расположен в Арктике: миграционная, авиационных и железнодорожных пассажиропотоков. Еще три аналогичные сети построены по данным для всей России и использованы для сравнительного анализа.

К ограничениям исследования можно отнести то, что используемые источники данных не во всех случаях являются синхронными. Они относятся к периоду с 2015 по 2022 г. Следует также отметить, что миграционные и транспортные потоки характеризуют разные типы миграций: официальные данные Росстата - долговременную, а данные сервисов по продаже билетов - любые перемещения, в том числе краткосрочные для отдыха, лечения, обучения, работы или по семейным обстоятельствам. Оценка вахтовой миграции, важной для Арктики, осложнена тем, что вахтовиков трудно отделить от других пассажиров, а перемещения к месту вахты могут осуществляться не регулярными, а чартерными рейсами, данные о которых менее доступны.

С помощью пакета NetworkX на языке программирования Python были реализованы алгоритмы расчета основных характеристик миграционных и транспортных сетей. Для кластеризации сетей использовали алгоритм асинхронного распространения меток (Raghavan, Albert, Kumara 2007), основанный на идее о том, что связанные узлы обычно принадлежат одному и тому же кластеру. Визуализация сетей реализована с помощью пакетов GraphPlot.jl и Graphs.jl на языке Julia. Алгоритмы визуализации сетей стремятся к размещению узлов таким образом, чтобы соединенные узлы располагались близко друг к другу, а число пересечений связей минимизировалось. Для сетей, имеющих более одного кластера, использовали модифицированный алгоритм компоновки сети по направлению силы Фрухтермана-Рейнгольда (Fruchterman, Reingold 1991). Для сети авиационных пассажиропотоков, в которой сложно выделить кластеры, применяли алгоритм мажорирования стресса (Gansner, Koren, North 2004). Для создания карт-схем использовали пакет VegaLite.jl, а для построения хордовой диаграммы - пакет chorddiag на языке программирования R.

Связность арктических территорий: цифровые данные и официальная статистика

Под связностью (или связанностью) будем понимать степень связи (соединенности) городов или территорий, выражаемую через наличие и количество миграционных, транспортных перемещений, либо иных взаимодействий между ними. Прежде всего рассмотрим связность арктических территорий друг с другом на региональном уровне (рисунок 2). Проанализируем 4 показателя; 3 из них основаны на цифровых следах населения, а последний - на официальной статистике:

W л

• число дружеских связей на 1 человека виртуального населения региона с жителями другого региона по данным социальной сети «ВКонтакте» в январе-марте 2015 г. Показатель не является симметричным. Хотя между двумя регионами существует одинаковое число дружеских связей в обоих направлениях, различается численность их виртуального населения. Поэтому, например, на одного виртуального жителя

Карелии приходится больше дружеских связей с жителями Мурманской области, чем наоборот;

число миграционных перемещений на 1000 человек виртуального населения по данным социальной сети «ВКонтакте». Учитывается хронологически последняя смена места жительства согласно учетным записям пользователей на январь-март 2015 г.; региональная популярность среди жителей региона поискового запроса с названием другого региона в поисковой системе Яндекс. Региональная популярность - это доля, которую занимает регион в показах по данному запросу, деленная на долю всех показов результатов поиска, пришедшихся на этот регион. Если региональная популярность превосходит 1, в данном регионе существует повышенный интерес к

л "

этому запросу, если меньше 1 - пониженный;

число миграционных перемещений на 1000 человек реального населения в разрезе регионов выбытия и прибытия по данным ЕМИСС. Рассматривается среднегодовое значение за 2015-2021 гг.

Рисунок 2. Некоторые показатели связности арктических регионов

а) Число дружеских связен на 1 человека

виртуального населения региона (Виртуальное население России. 2015 г.)

связанный регион

№ (1) (2) (3) (4) (5) (6) (7) (8) (9)

анализируемый регион Мурманская обл. 0) 0,55 0,51 0.01 0,12 0.02 0,14 0.04 0.00

Респ. Карелия (2) 0.77 0.31 0.00 0.10 0.02 0,13 0.01 0.00

Архангельская обл. (3) 0.42 0,18 0,16 0,36 0.03 0,15 0,08 0.00

Ненеикнй АО (4) 0.21 0,09 6.50 1.38 0,17 0,13 0.02 0.00

Респ. Коми (5) 0,13 0,08 0,51 0.05 0.04 0,13 0,01 0.00

Ямало-Ненецкий АО (6) 0.05 0,03 0.09 0.01 0.10 0,16 0.02 0.00

Красноярский край (7) 0,05 0,04 0,07 0.00 0.04 0.02 0,07 0.00

Респ. Саха (Якутия) (8) 0,06 0,01 0.15 0.00 0,02 0.01 0,30 0.00

Чукотский АО (9) 0,07 0,03 0,08 0.00 0,03 0.02 0,16 0,13

в) Региональная популярность поискового запроса с названием другого региона (Подбор слов Яндекса. 13.04.2022 г.)

запрашиваемый регион

№ (1) (2) (3) (4) (5) (6) (7) (8) (9)

анализируемый регион Мурманская обл. О) 2.64 1.11 0,99 0.68 0,72 0,13 0.50 0.68

Респ. Карелия (2) 3,35 0,78 0,75 0,63 0,55 0.08 0.57 0,88

Архангельская обл. (3) 1,20 1.09 4.79 1.43 0,87 0.10 0,54 0,84

Ненецкий АО (4) 1.08 0,71 11.1 8.92 4.95 0,13 1.19 1.85

Респ. Коми (5) 0,52 0,57 1.35 2.25 1.38 0.10 0.68 0,75

Ямало-Ненецкий АО (6) 0.27 0,43 0.37 1.08 0,87 0,23 0.94 2.13

Красноярский край С7) 0.13 0,29 0.19 1.27 0.43 0,74 1.03 0,88

Респ. Саха (Якутия) (8) 0.27 0,35 0,21 0,80 0,89 0.68 0,36 2.46

Чукотский АО С9) 0.62 0,69 0.45 3,26 0.49 3,38 0,57 6.41

б) Число миграционных перемещений на 1000 человек виртуального населения (Виртуальное население России. 2015 г.)

регион прибытия

СО (2) (3) (4) (5) (6) (7) (8) О) №

регион выбытия 1.54 0,84 0.01 0,17 0.04 0,30 0,10 0.01 (1)

2,09 0,34 0,01 0.09 0.03 0,11 0.02 0.00 (2)

1.30 0.48 0,30 1.15 0.08 0,19 0.04 0.00 (3)

0,97 0.44 24.6 3.30 1.31 0.24 0.05 0.00 (4)

0,31 0,16 0,87 0,10 0,19 0,19 0.03 0.00 (5)

0,09 0.03 0,10 0.02 0,27 0,29 0.01 0.00 (6)

0,16 0,05 0.08 0.00 0.05 0.06 0,11 0.01 (7)

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

0,22 0.07 0.45 0.01 0.09 0,11 1.79 0,02 (8)

0,77 0,51 0,84 0.00 0,51 0.64 3,02 1.22 (9)

г) Число миграционных перемещений на 1000 человек реального населения региона выбытия (Росстат. в среднем за 2015-2021 гг.)

регион прибытия

(1) (2) (3) (4) (5) (6) (7) (8) (9) №

регион выбытия 1,50 1.22 0,02 0,17 0.04 0,17 0.03 0.02 (1)

1.72 0,27 0.01 0.07 0,02 0,05 0.00 0,01 (2)

1.04 0.19 0,35 0,55 0.05 0.05 0.01 0.01 (3)

0,40 0.06 9.49 2.13 0,16 0,16 0,04 0.00 (4)

0,24 0.08 0,82 0,12 0,17 0,07 0.02 0.01 (5)

0,07 0,03 0,10 0.01 0,22 0,25 0,04 0.01 (6)

0,05 0.01 0.02 0.00 0.02 0.05 0,16 0.02 (7)

0,02 0,01 0.01 0.00 0.01 0,03 0.56 0.02 (8)

0,31 0.18 0,11 0.00 0,16 0,17 0,85 0.40 (9)

Источник: Составлено автором по данных проекта «Виртуальное население России», Яндекса (от 13.04.2022) и Росстата.

В целом географически близкие друг другу регионы обладают большей связностью, о чем свидетельствует зеленые цвета многих клеток, расположенных возле диагонали таблиц. Все показатели связности достигают наивысшего значения между

Ненецким автономным округом и Архангельской областью, в которую он входит. Низкие значения связности фиксируются в Якутии, где преобладает сельское население, отсутствуют крупные города (исключение - связи Якутии с Красноярским краем). Линейная корреляция между миграцией по данным официальной статистики и по данным социальной сети составляет 0,851 (п = 71, связи из Ненецкого автономного округа в Архангельскую область исключены как статистические выбросы). Высокое значение имеет корреляция между миграцией по данным статистики и дружескими связями - 0,789. Существенно ниже корреляция миграции с интенсивностью поисковых запросов - 0,542.

Можно сделать вывод, что, хотя по абсолютной величине показатели миграции, полученные из официальных статистических баз данных и цифровых следов населения, различаются, они демонстрируют схожие закономерности. Связность территорий в цифровой среде обычно означает, что и в реальности между ними существует высокая связность (миграционная, социальная, культурная). Перейдем на следующий уровень детализации - рассмотрим сети межмуниципальных перемещений и их основные характеристики (таблица 1).

Таблица 1. Сети миграционных и пассажирских перемещений населения российской Арктики и России

Миграция Авиационный Железнодорожный

Показатель транспорт транспорт

АЗРФ Россия АЗРФ Россия АЗРФ Россия

Размер сети (число узлов) 2112 2201 85 173 160 574

Число связей 32199 334529 558 2951 712 12125

Является сильно связной нет нет нет нет нет нет

Является слабо связной да да да да да нет

Взаимность связей сети 0,421 0,419 0,828 0,855 0,775 0,760

Средний вес связи 6,1 11,0 978,1 2071,6 384,2 689,9

Среднее расстояние перемещения, км 1707,7 1632,9 956,3 601,3

Средняя степень 30,5 304,0 13,1 34,1 8,9 42,2

Средняя сила 186,9 3319,1 12842,1 70674,0 3419,8 29146,4

Плотность сети 0,007 0,069 0,078 0,099 0,028 0,037

Средняя длина пути 1,875 1,936 1,925 2,246 2,489 2,236 *

Диаметр сети ** 4 3 5 5 6 5 *

Параметр гетерогенности 14,675 2,475 3,157 2,581 3,934 3,409

Коэффициент степенной ассортативности -0,519 -0,202 -0,635 -0,364 -0,644 -0,213

Коэффициент кластеризации 0,525 0,468 0,302 0,507 0,398 0,640

Число кластеров при разбиении методом 2 1 1 1 4 6

распространения меток

Источник: Составлено автором по данным webcensus.ru и Туту.ру.

Примечание: * - чтобы рассчитать значение сеть была преобразована в слабо связную путем удаления 5 узлов, относящихся к изолированному участку железной дороги на Сахалине; ** - для расчета диаметра все сети были преобразованы в ненаправленные. АЗРФ -Арктическая зона Российской Федерации.

По размеру и количеству связей лидируют миграционные сети, так как они не ограничены возможностями транспортной инфраструктуры и могут связывать любые населенные пункты. Из транспортных сетей железнодорожные крупнее авиационных, поскольку аэропорты есть в меньшем числе населенных пунктов, чем железнодорожные вокзалы. Однако в Арктике, ввиду ее удаленности, доля городов с аэропортами выше, чем по стране в целом. Железнодорожная сеть России не является связной, так как она

включает изолированную железную дорогу на острове Сахалин. При расчете некоторых показателей эту дорогу не учитывали. В транспортных сетях выше показатель взаимности, т. е. перемещения чаще осуществляются в обоих направлениях.

Средний вес связи (среднее число перемещений на один поток) выше в авиационных сетях из-за меньшего числа возможных маршрутов. В авиации также выше среднее расстояние перемещения, чем на железной дороге, для Арктики - почти вдвое (1707,8 против 956,3 км). Средняя степень узла показывает среднее по всей сети число связей или соседей узлов. В сети арктической миграции средняя степень на порядок ниже, чем в сети миграции России. В транспортных сетях отставание Арктики тоже велико ввиду удаленности от основных центров расселения. Об этом же говорят и более низкие значения показателей плотности арктических сетей. Поскольку транспортные и миграционные сети взвешенные, для них можно рассчитать взвешенную степень - силу узла. Закономерности там похожие и еще более выраженные.

Кратчайший путь - это минимальное число связей, которое необходимо пройти по пути, соединяющему 2 узла. Средняя длина пути рассчитывается путем усреднения длин кратчайших путей по всем парам узлов. Самые низкие значения средней длины пути наблюдаются в миграционных сетях из-за большого числа связей. В арктических сетях диаметр (длина самого длинного кратчайшего пути) выше или равен значению по всей России. Самый большой диаметр (6 перемещений) - в железнодорожной сети, самый малый (4) - в миграционной.

Чем больше в сети хабов (узлов с более высокой степенью), тем выше параметр гетерогенности. В Арктике гетерогенность выше и наиболее высока в миграционных сетях. Хабами выступают Москва, Санкт-Петербург и административные центры регионов. Однако и в других сетях параметр гетерогенности довольно высок. Хабы есть во всех шести сетях, более подробно они будут рассмотрены далее. Во всех сетях коэффициент ассортативности отрицательный. Это говорит о том, что высокостепенные узлы (хабы) чаще соединены с низкостепенными. Причем более явно эта зависимость проявляется именно в арктических сетях.

Коэффициент кластеризации показывает долю пар соседей узла, соединенных друг с другом. В Арктике он самый высокий в миграционных сетях. Как правило более связными являются либо хабы, либо расположенные близко друг к другу населенные пункты. В авиационном транспорте коэффициент кластеризации сети относительно низкий. Максимальное число кластеров выделено в железнодорожных сетях (4 в Арктике и 6 по России). Состав кластеров будет рассмотрен ниже.

Сетевой анализ показал различия в закономерностях миграций и транспортных перемещений между Россией и ее арктической частью почти по всем показателям. Основная причина различий - низкая плотность связей, обусловленная пространственной удаленностью макрорегиона, а также высокое влияние хабов - наиболее значимых узлов сети. Сосредоточим на них свое внимание.

Миграционные потоки и хабы в российской Арктике

Кластеры (сообщества) - это множества узлов с более высокой плотностью соединений внутри, чем между множествами. В сети миграционных перемещений выделено 2 кластера (рисунок 3). Первый включает некоторые сельские районы Якутии (расположены в нижней

левой части рисунка), второй - остальные муниципалитеты. Рисунок 3. Сеть межмуниципальных миграций в российской Арктике

• •

Источник: Составлено автором по данным проекта «Виртуальное население России».

Примечание: Отражены только потоки величиной от 50 человек. Синим цветом отмечены муниципальные образования Арктической зоны, зеленым - Крайнего Севера России (кроме Арктики), красным - остальных регионов России. Толщина и яркость линии пропорциональна размеру потока, размер кружка - численности населения муниципального образования.

Крупнейший хаб в сети арктических миграций - Мурманск (таблица 2). На него приходится 17,3% перемещений. За ним следуют Архангельск (12,9%), Санкт-Петербург (12,7%), Москва (8,9%) и Норильск (8,0%). Причем миграционный баланс намного лучше у федеральных столиц - в Санкт-Петербурге и Москве входящие потоки сильно превышают исходящие. В большинстве арктических городов по данным цифровых следов сохраняется

отрицательный миграционный баланс. Особенно выделяются Воркута (-7,5 тыс. перемещений) и Норильск (-7,3 тыс.).

Таблица 2. Характеристика крупнейших узлов сети миграционных перемещений российской Арктики

№ Городской округ / муниципальный район Исходящие потоки Входящие потоки Баланс

количество, единиц размер, человек количество, единиц размер, человек количество, единиц размер, человек

1 Мурманск 810 16 235 1 421 18 109 611 1 874

2 Архангельск 611 11 167 853 14 473 242 3 306

3 Санкт-Петербург 64 2 945 74 22 287 10 19 342

4 Москва 68 3 308 75 14 483 7 11 175

5 Норильск 753 11 655 985 4 349 232 -7 306

6 Северодвинск 488 6 292 668 5 122 180 -1 170

7 Воркута 749 9 283 603 1 734 -146 -7 549

8 Новый Уренгой 396 3 971 911 3 706 515 -265

9 Североморск 374 4 671 723 2 636 349 -2 035

10 Ноябрьск 340 3 288 801 2 901 461 -387

11 Апатиты 378 3 199 397 1 880 19 -1 319

12 Надымский район 362 3 408 601 1 644 239 -1 764

13 Александровск 362 3 234 617 1 728 255 -1 506

14 Красноярск 35 745 60 3 492 25 2 747

15 Мончегорск 308 2 650 418 1 264 110 -1 386

16 Инта 416 3 249 237 555 -179 -2 694

17 Петрозаводск 36 1 130 48 2 607 12 1 477

18 Тюмень 26 485 49 3 239 23 2 754

19 Печенгский район 345 2 693 404 937 59 -1 756

20 Усинск 334 2 113 477 1 515 143 -598

21 Салехард 231 1 553 490 1 993 259 440

Всего 32 199 199 052 32 199 199 052 0 0

Источник: Составлено автором по данным проекта «Виртуальное население России».

Примечание: Ранжировано в порядке убывания общего числа перемещений.

Из 20 крупнейших потоков только 5 связывают муниципальные образования, оба из которых расположены в Арктике: из Кольского района и Североморска в Мурманск, из Северодвинска в Архангельск и обратно, из Пинежского района в Архангельск. Еще 1 связывает Арктику с муниципалитетом Крайнего Севера - из Холмогоровского района в Архангельск (рисунок 4). Остальные связывают арктические городские округа с Москвой, Санкт-Петербургом и Красноярском. Жители европейской части Арктики чаще переезжают в Санкт-Петербург, а азиатской - в Москву (исключения - Норильск, Усинск и Новая Земля). Жители городских округов более склонны переезжать в Москву и Санкт-Петербург, а муниципальных районов - в региональные столицы (рисунок 5). Это может быть связано с наличием ресурсов для переезда у жителей городов и поселков городского типа, специализирующихся чаще всего на добывающей промышленности или транспортировке природных ресурсов. Административные центры регионов, находящиеся в Арктике (Архангельск, Мурманск, Салехард, Нарьян-Мар и Анадырь), отдают примерно столько же людей, сколько получают. Но если население прибывает в основном из северных и арктических муниципалитетов, то выбывает - в города за пределами Арктики.

Рисунок 4. Крупнейшие миграционные потоки российской Арктики

Источник: Составлено автором по данным проекта «Виртуальное население России» с использованием геоданных Natural Earth (https://www.naturalearthdata.com/).

Рисунок 5.

Миграционные потоки российской Арктики по группам муниципальных образований, %

Источник: Составлено автором по данным проекта «Виртуальное население России». Примечание: ГО - городской округ, МР - муниципальный район.

Цифровые данные подтверждают основные миграционные тенденции в Арктике, фиксируемые официальной статистикой (Фаузер, Смирнов 2020), и позволяют раскрыть их с высокой степенью детализации. Население концентрируется в небольшом числе крупных городов и их окрестностях. Сохраняется высокая убыль населения из ресурсных городов раннего освоения и сельской местности.

Транспортные потоки и мобильность арктического населения

В сети авиационных перемещений явных кластеров выделить не удалось. Практически во всех частях Арктики действуют похожие модели перемещений с высоким удельным весом потоков в Москву и обратно (рисунок 6).

Рисунок 6. Сеть авиационных пассажиропотоков в российской Арктике

Источник: Составлено автором по данным сервиса Туту.ру.

Примечание: Синим цветом отмечены населенные пункты Арктической зоны, зеленым - Крайнего Севера России (кроме Арктики), красным - остальных регионов России.

В сети железнодорожных перемещений выделяются кластеры, примерно соответствующие филиалам Российских железных дорог (РЖД): Октябрьской, Северной,

Свердловской (рисунок 7). Причем Северная железная дорога разделена на 2 кластера, соответствующих веткам на Архангельск и Воркуту. Промежуточное положение между ядрами кластеров занимают Москва, Санкт-Петербург и Киров, железные дороги которых не входят в перечисленные филиалы РЖД и используются как пересадочные узлы.

Рисунок 7. Сеть железнодорожных пассажиропотоков в российской Арктике

Источник: Составлено автором по данным сервиса Туту.ру.

Примечание: Синим цветом отмечены населенные пункты Арктической зоны, зеленым - Крайнего Севера России (кроме Арктики), красным - остальных регионов России.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

В авиационной сети 15,1% перелетов совершаются из Москвы, а еще 17,7% - в Москву (таблица 3). Таким образом, на столицу приходится треть от всех перемещений. Помимо Москвы, есть еще несколько крупных хабов: Мурманск (25,4% перелетов), Новый Уренгой (22,8%), Санкт-Петербург (17,4%), Архангельск (16,9%) и Салехард (12,8%). В железнодорожной сети доля крупных хабов ниже. На Новый Уренгой приходится 19,6% перемещений, на Москву и Архангельск - по 16,5%, на Санкт-Петербург - 16,0%.

Высок удельный вес Мурманска (12,9%), Усинска (11,6%) и Ноябрьска (11,1%). Большой пассажирооборот Нового Уренгоя связан в том числе с вахтовыми миграциями.

Таблица 3. Характеристика крупнейших узлов сетей авиационных и

железнодорожных пассажиропотоков российской Арктики

Исходящие потоки Входящие потоки Баланс

№ Город количество, размер, количество, размер, количество, размер,

единиц человек единиц человек единиц человек

Авиационный транспорт

1 Москва 13 82 372 13 96 451 0 14 079

2 Мурманск 52 76 607 47 62 057 -5 -14 550

3 Новый Уренгой 45 68 159 48 56 435 3 -11 724

4 Санкт-Петербург 12 47 251 12 47 531 0 280

5 Архангельск 40 43 975 40 48 169 0 4 194

6 Салехард 42 37 810 33 32 313 -9 -5 497

7 Тюмень 7 21 830 8 24 302 1 2 472

8 Ноябрьск 26 18 952 27 18 001 1 -951

9 Надым 22 18 444 16 13 590 -6 -4 854

10 Норильск 34 13 306 24 9 954 -10 -3 352

Всего 558 545 791 558 545 791 0 0

Железнодорожный транспорт

1 Новый Уренгой 56 29 643 49 23 982 -7 -5 661

2 Москва 18 21 960 18 23 280 0 1 320

3 Архангельск 38 22 898 35 22 156 -3 -742

4 Санкт-Петербург 15 22 047 15 21 630 0 -417

5 Мурманск 33 20 642 28 14 747 -5 -5 895

6 Усинск 29 17 022 22 14 798 -7 -2 224

7 Ноябрьск 36 15 356 33 15 013 -3 -343

8 Тюмень 3 10 581 3 12 987 0 2 406

9 Губкинский 33 11 983 31 8 835 -2 -3 148

10 Апатиты 25 10 604 22 9 922 -3 -682

Всего 712 273 581 712 273 581 0 0

Источник: Составлено автором по данным сервиса Туту.ру на апрель 2019 г.

Примечание: Ранжировано в порядке убывания общего числа перемещений.

Разница в количестве входящих и исходящих потоков из одних и тех же узлов объясняется небольшим временным периодом анализа (1 месяц), что могло привести к недоучету редких рейсов; отсутствием данных о малых потоках (менее 10 человек для железнодорожного транспорта и менее 50 для авиационного); наличием составных маршрутов, включающих более 1 перемещения с пересадками. Если билеты куплены разными заказами или у разных компаний, выявить составные маршруты очень тяжело. Это приводит к переоценке удельного веса хабов в транспортных потоках.

Крупнейшие потоки в авиатранспорте - между Мурманском и Москвой, в железнодорожном - между Архангельском и Москвой. Ни один из 20 крупнейших авиационных потоков не связывает 2 арктических города. В железнодорожном транспорте ситуация аналогичная, но есть 5 потоков, которые связывают арктические города с городами, находящимися в неарктической части Крайнего Севера. Это потоки из Усинска в Сыктывкар и обратно, из Нового Уренгоя в Сургут и обратно, из Ноябрьска в Сургут. Основное число крупнейших потоков связывает арктические муниципальные образования со столичными городами и административными центрами регионов в центральной и южной частях страны. Чтобы рассмотреть связность арктических территорий более

детально, объединим все виды рассмотренных миграционных и транспортных потоков в одну схему (рисунок 8).

Рисунок 8. Распределение миграционных и транспортных потоков по направлениям, % от общего числа потоков/перемещений

Источник: Составлено автором по данным проекта «Виртуальное население России» и сервиса Туту.ру.

Хотя в Арктике проживает всего 1,8% населения России, на них приходится 5,3% миграционных перемещений, 3,3% - железнодорожных и 8,9% - авиационных. Следовательно, арктическое население более подвижно, особое значение приобретает авиационный транспорт, связывающий удаленные поселения с федеральными центрами. Внутри Арктики осуществляется очень незначительное число перемещений (0,68% миграций, 0,33% - авиационных и 0,24% - железнодорожных), что говорит о низкой связности арктических территорий друг с другом. Гораздо большая доля приходится на перемещения между арктическими и неарктическими поселениями (4,6; 3,0 и 8,6% от всех перемещений в стране соответственно). В этой связи следует отметить важность завершения строительства таких крупных инфраструктурных проектов, как Северный широтный ход, Белкомур и Баренцкомур. Одновременно с этим для обеспечения связности территорий в Арктике необходимо расширять использование региональной и местной авиации.

Заключение

Исследование показало, что новые источники данных, возникшие благодаря развитию цифровых технологий, позволяют получать детальные и оперативные данные о

миграционных процессах, а сетевой анализ дает подходящий инструментарий для систематизации и осмысления этой информации. В территориальном разрезе цифровые следы могут достигать уровня населенных пунктов или даже содержать координаты отдельных мест. В них отражаются различные виды миграций по продолжительности, направлениям и причинам. Данные, полученные из социальных медиа, могут содержать очень подробные социально-демографические характеристики населения, а поисковые запросы и цифровые тексты позволяют анализировать миграционные намерения и предпочтения жителей без больших временных и материальных затрат. Цифровые следы дают возможность охватывать исследованиями миллионы людей, пользующихся Интернетом, и в то же время получать сведения на микроуровне, в том числе из отдаленных и труднодоступных территорий. Методы обработки, подходы к интерпретации и этические аспекты использования цифровых данных о перемещениях людей еще разрабатываются, и в дальнейшем можно ожидать расширения их объяснительного и прогностического потенциала.

Изучение цифровых следов населения российской Арктики позволило выявить ключевые миграционные и пассажирские потоки в макрорегионе. Подтверждено, что связность территорий Арктики друг с другом достаточно низкая, а основная часть перемещений приходится на потоки с городами за пределами Арктики. Показано, что существует различия в моделях демографического поведения жителей арктических столиц - административных центров регионов, других городских округов и муниципальных районов; а также между европейскими и азиатскими территориями. Определены миграционные и транспортные хабы российской Арктики. На Москву и Санкт-Петербург приходится более пятой части миграционных, трети железнодорожных и половины авиационных перемещений. Причем в федеральных столицах входящие миграционные потоки по величине значительно превышают исходящие. Выделение кластеров в сетях миграций показало высокую степень изолированности территорий на севере Якутии, а в железнодорожных сетях - разделение сети на 4 части из-за ограничений существующих путей сообщения. В совокупности со слабым развитием сети автомобильных дорог на большей части российской Арктики это мешает развитию горизонтального сотрудничества между жителями и организациями Арктической зоны.

Поскольку демографическая динамика в Арктике определяется прежде всего миграционными потоками, учет их особенностей на районном и поселенческом уровнях позволит строить более точные прогнозы численности и состава населения. В кризисных ситуациях имеет большое значение скорость генерации цифровых следов. Так, цифровые источники данных о миграции населения и заболеваемости позволяют, не дожидаясь публикации официальной статистики, разрабатывать прогнозы развития пандемии коронавирусной инфекции и принимать на их основе управленческие решения. В исследовании продемонстрированы закономерности миграционных перемещений в статике без учета фактора времени. Для проведения подобного исследования в динамике может применяться инструментарий темпоральных сетей. Особое внимание в будущем изучении проблемы следует уделить сезонным колебаниям миграций, существенным для отдаленных сырьевых территорий. Кроме того, с помощью цифровых следов могут быть изучены международные и вахтовые миграции, имеющие особое значение для рынков труда Арктики в условиях сокращения численности постоянного населения.

Литература

Дудина В.И. (2021). «Пересборка социологии»: цифровой поворот и поиски новой теоретической оптики. Социологические исследования, 11, 3-11. https://doi.org/10.31857/S013216250016829-4.

Замятина Н.Ю., Яшунский А.Д. (2018.). Виртуальная география виртуального населения. Мониторинг общественного мнения. Экономические и социальные перемены, 1, 117137. https://doi.Org/10.14515/monitoring.2018.1.07.

Калабихина И.Е., Лукашевпич Н.В., Банин Е.П., Алибаева К.В., Реблей С.М. (2021).

Автоматическое извлечение мнений пользователей социальных сетей по вопросам репродуктивного поведения. Программные системы: теория и приложения, 12:4(51), 33-63. https://doi.org/10.25209/2079-3316-2021-12-4-33-63.

Китчин Р. (2021). Сетевой урбанизм, основанный на данных. В Е. Лапина-Кратасюк, О. Запорожец, А. Возьянов (Ред.), Сети города: Люди. Технологии. Власти (сс. 58-80). Москва: Новое литературное обозрение.

Смирнов А.В. (2021). Цифровое общество: теоретическая модель и российская

действительность. Мониторинг общественного мнения: экономические и социальные перемены, 1(161), 129-153. https://doi.org/10.14515/monitoring.2021.1.1790.

Смирнов А.В. (2022). Прогнозирование миграционных процессов методами цифровой демографии. Экономика региона, 18(1), 133-145. https://doi.org/10.17059/ekon.reg.2022-1-10.

Срничек Н. (2020). Капитализм платформ. Москва: Издательский дом Высшей школы экономики.

Судакова А.Е. (2020). Миграция ученых: цифровой след и наукометрия. Перспективы науки и образования, 3(45), 544-557. https://doi.org/10.32744/pse.2020.3.39.

Тард Г. (2016). Монадология и социология. Пермь: Гиле Пресс.

Фаузер В.В., Лыткина Т.С. (2017). Миграционные процессы на российском Севере

Социальная политика и социология. 16:1 (120), 141-149. https://doi.org/10.17922/2071-3665-2017-16-1-141-149.

Фаузер В.В., Смирнов А.В. (2020). Миграции населения российской Арктики: модели, маршруты, результаты. Арктика: экология и экономика, 4(40), 4-18. https://doi.org/10.25283/2223-4594-2020-4-4-18.

Ahmad I., Flanagan R., Staller K. (2020). Increased internet search interest for GI symptoms may predict COVID-19 cases in US hotspots. Clinical Gastroenterology and Hepatology, 18(12), 2833-2834. https://doi.org/10.1016Zj.cgh.2020.06.058.

Alburez-Gutierrez D., Aref S., Gil-Clavel S., Grow A., Negraia D.V., Zagheni E. (2019).

Demography in the Digital Era: New data sources for population research. In: SIS2019. Smart statistics for smart applications. Milano: Pearson. https://doi.org/10.31235/osf.io/24jp7.

Billari F.C., D'Amuri F., Marcucci J. (2013). Forecasting births using Google. Population

Association of America Annual Meeting. https://paa2013.princeton.edu/papers/131393.

Boullier D. (2017). Big data challenges for the social sciences: from society and opinion to replications. In eSymposium, 7(2), 1-17. https://www.boullier.bzh/wp-content/uploads/EBul-Boullier-Jul2017.pdf

Cesare N., Lee H., McCormick T., Spiro E., Zagheni E. (2018). Promises and pitfalls of using digital traces for demographic research. Demography, 55, 1979-99. https://doi.org/10.1007/s13524-018-0715-2.

Danchev V., Porter M.A. (2018). Neither global nor local: Heterogeneous connectivity in spatial network structures of World migration. Social Networks, 53, 4-19. https://doi.org/10.1016/j~.socnet.2017.06.003

Danchev V., Porter M.A. (2021). Migration networks: applications of network analysis to

macroscale migration patterns. In M. McAuliffe (Ed.), Research handbook on international migration and digital technology (pp. 70-90). Cheltenham: Edward Elgar Publishing. https://doi.org/10.4337/9781839100611.

Gansner E., Koren Y., North S. (2004). Graph Drawing by Stress Majorization. Lecture Notes in Computer Science, 3383, 239-250. https://doi.org/10.1007/978-3-540-31843-9_25.

Gebru R., Krause J., Wang Y., Chen D., Deng J. Aiden E.L., Fei-Fei L. (2017). Using deep learning and Google street view to estimate the demographic makeup of neighborhoods across the United States. PNAS, 114(50), 13108-13113. https://doi.org/10.1073/pnas.1700035114.

Golder S.A., Macy M.W. (2014). Digital footprints: opportunities and challenges for online social research. Annual Review of Sociology, 40(1), 129-152. https://doi.org/10.1146/annurev-soc-071913-043145.

Edelmann A., Wolff T., Montagne D., Bail C. (2020). Computational Social Science and Sociology. Annual Review of Sociology, 46, 61-81. https://doi.org/10.1146/annurev-soc-121919-054621.

Fruchterman T.M.J., Reingold E.M. (1991). Graph drawing by force-directed placement. Software: Practice and Experience, 21(11), 1129-1164. https://doi.org/10.1002/spe.4380211102.

Heleniak T., Bogoyavlenskiy D. (2014). Arctic Populations and Migration. In Larsen J.N., Fondahl G., Rasmussen H. (Eds.), Arctic Human Development Report. Regional Processes and Global Linkages (pp. 53-104). Copenhagen: Nordic Council of Ministers. https://doi.org/10.6027/TN2014-567.

Hughes C., Zagheni E., Abel G., Wi'sniowski A., Sorichetta A., Weber I., Tatem A.J. (2016). Inferring migrations: Traditional methods and new approaches based on mobile phone, social media, and other big data. Luxembourg: Publications Office of the European Union. https://doi.org/10.2767/61617.

Igntatow G. (2016). Theoretical foundations for digital text analysis. Journal for the Theory of Social Behaviour, 46(1), 104-120. https://doi.org/10.1111/jtsb.12086.

Katzenbach C., Bachle T.C. (2019). Defining concepts of the digital society. Internet Policy Review, 8(4). https://doi.org/10.14763/2019A1430.

Kitchin R. (2014). Big Data, New Epistemologies and Paradigm Shifts. Big Data & Society, 1(1), 112. https://doi.org/10.1177/2053951714528481.

Lazer D., Radford J. (2017). Data ex Machina: introduction to big data. Annual Review of Sociology, 43(1), 19-39. https://doi.org/10.1146/annurev-soc-060116-053457.

Ledford H. (2020). How Facebook, Twitter and other data troves are revolutionizing social science. Nature, 582, 328-330. https://doi.org/10.1038/d41586-020-01747-1.

Maier G., Vyborny M. (2008). Internal migration between US States: A social network analysis. In J. Poot, B. Waldorf, L.W. Wissen (Eds.), Migration and Human Capital. Cheltenham, UK: Edward Elgar Publishing. URL: https://www.econstor.eu/handle/10419/117573.

McCormick T.H., Lee H., Cesare N., Shojaie A., Spiro E.S. (2017). Using Twitter for demographic and social science research: tools for data collection and processing. Sociological Methods & Research, 46(3), 390-421. https://doi.org/10.1177/0049124115605339.

Petrov A.N., Welford M., Golosov N., DeGroote J., Degai T., Savelyev A. (2021). The "second wave" of the COVID-19 pandemic in the Arctic: regional and temporal dynamics. International Journal of Circumpolar Health, 80(1). https://doi.org/10.1080/22423982.2021.19254461.

Raghavan U.N., Albert R., Kumara S. (2007). Near linear time algorithm to detect community structures in large-scale networks. Physical Review E, 76(3). https://doi.org/10.1103/physreve.76.036106.

Taylor L., Floridi L., van der Sloot L. (Eds.). (2017). Group privacy: New challenges of data technologies. Cham, Switzerland: Springer. https://doi.org/10.1007/978-3-319-46608-8.

Zagheni E., Weber I., Gummadi K. (2017). Leveraging Facebook's advertising platform to monitor stocks of migrants. Population and Development Review, 43(6178), 721-734. https://doi.org/10.1111/padr.12102.

Zamyatina N., Yashunsky A. (2017). Migration cycles, social capital and networks. A new way to look at Arctic mobility. In M. Laruelle (Ed.), New Mobilities and Social Changes in Russia's Arctic Regions (pp. 59-84). London and New York, Routledge.

i Надоели баннеры? Вы всегда можете отключить рекламу.