Сервис Google Trends как источник данных для исследования ментальных связей между регионами России_
1МГУ имени М.В. Ломоносова, г. Москва e-mail: [email protected]
2 ФГБУН «Карадагская научная станция им. Т.И. Вяземского -природный заповедник РАН», Республика Крым
Аннотация. В статье рассматриваются данные о территориальном распределении поисковых запросов Google по названиям субъектов РФ, исходящих от жителей России. На основе анализа отчётов о поисковой активности, предоставленных сервисом Google Trends, выявлены особенности поискового интереса жителей субъектов РФ по отношению к другим регионам страны. Этот показатель рассматривается в качестве индикатора уровня ментальных связей между субъектами РФ.
Ключевые слова: Google Trends, поисковая активность, поисковые запросы, межрегиональные связи, регионы России, Интернет
Введение
Данные о поисковой активности пользователей сети Интернет в последние годы активно внедряются в разнообразные научные исследования. Уровень интереса пользователей из разных стран к информации по разным темам рассматривается в качестве индикаторов характеристик каких-либо социальных или экономических процессов (например, туристских потоков [1] или уровня безработицы [2]). При этом, как отмечает Н. Аскитас [3], если рассматривать совокупность интернет-пользователей как выборку из всего населения мира, с каждым годом репрезентативность этой выборки растёт, т.к. уровень проникновения Интернета увеличивается. Так, по данным сайта internetworldstats.com, в 2019 году уровень проникновения интернета в среднем по миру составляет около 57% (в 2 раза больше, чем 10 лет назад), в Европе - 87%. В России проникновение Интернета оценивается в 76% по данным за 2018 год.
Удобным инструментом для исследований поисковой активности пользователей является сервис Google Trends. Если ввести в его строку поиска какой-либо запрос, сервис создает отчёт о поисковой активности в Google по этому запросу и визуализирует следующие изображения и данные: 1) график динамики популярности данного запроса в мире или любой выбранной стране за выбранный промежуток времени, начиная с 2004 г.; 2) картограмма и перечень стран или регионов выбранной страны с наибольшим уровнем популярности данного запроса. Популярность запроса в Google Trends - относительная величина, которая характеризует долю данного запроса среди всех поисковых запросов за выбранный период и не зависит от численности населения. Все показатели нормированы: за 100% принимается максимальный уровень популярности запроса, а остальные величины пересчитываются в проценты относительно этой отметки.
В настоящее время опубликованы научные работы, где с использованием Google Trends исследуется общественный интерес к различным социально-
УДК 910.26 Грибок М. В.1, Горбунова Т. Ю.2
значимым темам (например, охрана окружающей среды [4]) или новым мировым трендам (например, криптовалюты [5]). Кроме того, данный сервис используется для составления разнообразных прогнозов: от распространения эпидемий [6] до итогов президентских выборов [7].
По нашему мнению, сервис Google Trends также может использоваться в качестве источника данных для социально-географических исследований. Одна из перспективных тем — изучение горизонтальных связей между субъектами Российской Федерации, а точнее, уровня интереса жителей каждого региона страны к другим регионам. Многие исследователи указывают на слабую развитость межрегиональных связей в России и недостаточность информационного обменам между субъектами РФ [8, 9]. Статистика поисковых запросов по названиям регионов даст возможность более подробно проанализировать степень тесноты связей между ними и выявить, в каких субъектах РФ жители больше интересуются другими регионами, и какими именно, и наоборот, - где доминирует интерес только к своему региону. Эти связи логично назвать ментальными, т.к. они отражают интерес людей к территориям, проявляющийся в повышенном спросе на информацию о них.
Материалы и методы
Некоторые запросы, в т.ч. названия российских регионов, распознаются системой Google Trends как темы (topics). Согласно описанию службы поддержки сервиса (https://support.google.com/trends/), это группы тематически близких запросов на всех языках. Материалом для исследования послужили статистические данные Google Trends о поисковых запросах по темам - названиям субъектов РФ, исходящих с территории России за 10 лет: с начала 2009 года до конца 2018 года. Пример отчёта по теме «Краснодарский край» представлен на рис. 1. (язык отчёта зависит от пользовательских установок интерфейса Google, в данном случае английский).
В верхней части экрана представлен график поисковой активности по данной теме. Мы видим ярко-выраженную сезонность: повышение интереса к региону в летний период и спад зимой. Максимум поисковой активности, принятый за 100%, приходится на июль 2012 года, когда в Краснодарском крае произошло разрушительное наводнение, в результате которого больше всего пострадал город Крымск. Примечательно, что Олимпиада в Сочи не оказала существенного влияния на поисковую активность пользователей по названию региона.
В нижней части экрана показан список субъектов РФ с наибольшей поисковой активностью по данной теме. Логично, что на первом месте оказался, собственно, Краснодарский край. Но наибольший интерес для данного исследования представляют следующие строки рейтинга, характеризующего уровень интереса других регионов к Краснодарскому краю, относительно интереса его жителей. Как мы видим, очень высокий уровень интереса наблюдается у жителей Адыгеи. Уровень интереса в 10% и более (относительно местных жителей) наблюдается в трёх регионах: Ростовской области, Карачаево-Черкеской Республике и Ставропольском крае. 5-9% - ещё в восьми субъектах РФ.
Для сравнения рассмотрим отчёт Google Trends по теме «Республика Татарстан», представленный на рис. 2. Здесь нет выраженной сезонности запросов
Рис. 1. Отчёт сервиса Google Trends о поисковых запросах в Google по теме «Краснодарский край», исходящих с территории России за период 2009-2018 гг.
Составлено автором
и нет ни одного субъекта РФ, где наблюдается поисковый интерес, сравнимый по уровню с интересом жителей Республики Татарстан к своему региону.
Аналогичные отчёты получены по всем субъектам РФ, кроме Республики Крым и г. Севастополя. По этим регионам, к сожалению, нет данных, т.к. Google Trends относит их к Украине, и они не участвуют в статистике поисковых запросов из России.
Помимо отсутствия статистики по Крыму и Севастополю, важно учитывать и другие недостатки Google Trends как источника данных. Прежде всего, тот факт, что данный сервис не раскрывает данные об абсолютном числе запросов, не даёт доступа к алгоритму объединения запросов в темы и другим метаданным и алгоритмам, на основе которых производятся отчёты. Все данные доступны только в обработанном и обобщённом виде [3]. Также следует иметь в виду, что отчётные показатели Google Trends вычисляются с использованием метода выборки каждый раз заново, и поэтому результаты могут незначительно меняться изо дня в день [10]. Тем не менее, подобного рода большие данные, образующиеся стихийно благодаря повседневным действиям множества людей, могут быть даже более показательными, чем полученные традиционными методами обследований, такими как социологические опросы, т.к. лишены какой-либо предвзятости [3].
• Tatarstan
Russian republic
Russia -Г 1/1/09 -12/31/1В All categories -r Web
Interest over time
+ Compare
± <> <
Jar 1,2009 Jan 1,2012 Jan1.2015 Janl.2018
Interest by subregion Subregion ▼ i < > *C
1 Tatarstan
2 Republic of Bashkortostan j |
3 Tuva - I
4 Samara Oblast t |
5 Mari El Republic I
Рис. 2. Отчёт сервиса Google Trends о поисковых запросах в Google по теме «Республика Татарстан», исходящих с территории России. за период 2009-2018 гг. Составлено автором
Результаты и обсуждение
По результатам полученных отчётов Google Trends выявлены случаи наиболее высокого поискового интереса жителей регионов по отношению к другим субъектам РФ - от 25% относительно интереса к региону его жителей. Они представлены в таблице 1. Почти все они представляют собой интерес к соседним регионам и в большинстве случаев объект интереса - более крупный соседний субъект РФ.
Также по результатам анализа отчётов Google Trends субъекты РФ разделены на 3 группы: с низким, средним и высоким уровнем поискового интереса со стороны других регионов. Полученная классификация отображена на карте, представленной на рис. 3. В группу с низким уровнем вошли субъекты РФ, поисковый интерес к которым сосредоточен только внутри самого региона, а поисковая активность со стороны любого другого субъекта РФ составляет менее 5% от внутреннего интереса местных жителей. Среди таких регионов оказались «оторванные» от остальной территории страны Калининградская и Сахалинская области, а также довольно много национальных автономий: Республики Марий Эл, Мордовия, Тыва, Удмуртия, Ингушетия, Калмыкия.
К группе с высоким уровнем внешнего интереса отнесены те субъекты РФ, по отношению к которым наблюдается повышенная поисковая активность не
Таблица 1
Случаи наиболее высокого поискового интереса жителей субъектов РФ к _другим регионам России _
Регион-субъект Регион-объект поискового интереса (на который направлена поисковая активность) Уровень поискового
поискового интереса (откуда исходит поисковая активность) интереса региона-субъекта к региону-объекту
1. Респ. Адыгея Краснодарский край 86%
2. Московская обл. Москва 72%
3. Ленинградская обл. Санкт-Петербург 71%
4. Еврейская АО Хабаровский край 48%
5. Респ. Алтай Алтайский край 37%
6. Москва Московская обл. 36%
7. Респ. Ингушетия Чеченская Респ. 33%
8. Карачаево-Черкесская Респ. Ставропольский край 33%
9. Калужская обл. Москва 31%
10 Ненецкий АО Архангельская обл. 28%
11 Санкт-Петербург Ленинградская обл. 27%
12 Тверская обл. Москва 27%
13 Владимирская обл. Москва 26%
14 Респ. Хакасия Красноярский край 25%
Примечание: Составлено по данным Google Trends за период 2009-2018 гг. Уровень поискового интереса выражен в % от поисковой активности жителей региона-объекта по отношению к своему региону.
менее чем из трёх других регионов и хотя бы из одного из них она превышает 10%. В основном эти регионы характеризуются большей, по сравнению с соседями, численностью населения и притягивают внимание жителей окружающих менее населённых регионов.
Внутри федеральных округов наибольшая степень интереса к соседям наблюдается в регионах Южного и Северо-Кавказского ФО. В Центральном ФО поисковый интерес направлен в основном на Москву и Московскую область. В Северо-Западном ФО оказалось больше всего «регионов-интровертов», которыми практически не интересуются жители других субъектов РФ и местные жители также не проявляют интереса к другим территориям.
Выводы
Сервис Google Trends - перспективный источник данных для социально-географических исследований, объектом которых является территориальная изменчивость интереса (а значит и уровня осведомлённости) пользователей к каким-либо темам. Поисковый интерес жителей одних территорий к другим
территориям может рассматриваться в качестве индикатора ментальных взаимосвязей между этими территориями.
В ходе исследования выявлены основные закономерности поисковой активности пользователей Google - жителей разных субъектов РФ - по
Рис. 3. Карта уровня поискового интереса в Google к субъектам РФ со стороны
жителей других регионов. Составлено автором по данным Google Trends
отношению к другим регионам России. Определены регионы с наиболее высоким уровнем поискового интереса жителей к другим регионам, а также субъекты РФ, вызывающие наибольший и наименьший интерес у жителей других регионов. Низкий уровень поисковой активности по отношению к региону даже со стороны соседей указывает на его обособленность, «оторванность» от остальной территории страны.
Результаты исследования могут быть полезны при разработке информационной политики России, направленной на укрепление горизонтальных связей между субъектами РФ и повышение интереса жителей страны к отдельным регионам.
Исследование выполнено при поддержке РФФИ, проект №18-35-00160.
Литература
1. Charalampopoulos I., Nastos P., Didaskalou E. Human Thermal Conditions and North Europeans' Web Searching Behavior (Google Trends) on Mediterranean Touristic Destinations // Urban Science, 1, 4, (8), 2017.
2. Simionescu M., Zimmermann K.F. Big Data and Unemployment Analysis // GLO Discussion Paper Series 81, Global Labor Organization (GLO), 2017.
3. Askitas N. Google search activity data and breaking trends. IZA World of Labor,
Institute for the Study of Labor (IZA), 2015. Issue 206. D01:10.15185/izawol.206
4. McCallum M.L, Bury G.W. Public interest in the environment is falling: a response to Ficetola (2013) // Biodivers Conserv, 2014. No23. P. 1057-1062.
5. Kristoufek L. Bitcoin meets Google Trends and Wikipedia: quantifying the realtionship between phenomena of the Internet era. Sci Rep, 2013. 3. P. 3415.
6. Seifter A., Schwarzwalder A., Geis K., Aucott J. The utility of Google Trends for epidemiological research: Lyme disease as an example // Geospatial Health, 2010. No4. P. 135-137.
7. Granka, L. Using online search traffic to predict US presidential elections. PS: Political Science & Politics, 2013. 46 (2), P. 271-279.
8. Димитрова Ю. Б. Отношения между центром и регионами в России: проблема эффективности // Власть. 2010. №5. C. 88-91
9. Туровский Р. Ф. Региональные особенности русского национального самосознания // Гуманитарная география: Научный и культурно-просветительский альманах. Вып. 3. М.: Институт Наследия, 2006. С. 287-313.
10. Choi H., Varian, H., 2012. Predicting the present with Google Trends // Economic Record, 88, P. 2-9.
Gribok М. V.
Google Trends service as a source of data for research of mental relations between Russian regions_
Lomonosov Moscow State University, Russian Federation, Moscow
e-mail: [email protected]
Abstract. The article deals with the data on the territorial distribution of Google search queries by the names of Russian regions coming from the territory of Russia. Based on the analysis of reports on search activity provided by Google Trends, the features of search interest of residents of Russian regions in relation to other regions of the country are revealed. This indicator is considered as an indicator of the level of mental relations between the subjects of the Russian Federation.
Keywords: Google Trends, search activity, search queries, interregional relations, Russian regions, Internet
References
1. Charalampopoulos I., Nastos P., Didaskalou E. Human Thermal Conditions and North Europeans' Web Searching Behavior (Google Trends) on Mediterranean Touristic Destinations // Urban Science, 1, 4, (8), 2017. (in English)
2. Simionescu M., Zimmermann K.F. Big Data and Unemployment Analysis // GLO Discussion Paper Series 81, Global Labor Organization (GLO), 2017. (in English)
3. Askitas N. Google search activity data and breaking trends. IZA World of Labor, Institute for the Study of Labor (IZA), 2015. Issue 206. D01:10.15185/izawol.206. (in English)
4. McCallum M.L, Bury G.W. Public interest in the environment is falling: a response to Ficetola (2013) // Biodivers Conserv, 2014. No23. P. 1057-1062. (in English)
5. Kristoufek L. Bitcoin meets Google Trends and Wikipedia: quantifying the realtionship between phenomena of the Internet era. Sci Rep, 2013. 3. P. 3415. (in English)
6. Seifter A., Schwarzwalder A., Geis K., Aucott J. The utility of Google Trends for epidemiological research: Lyme disease as an example // Geospatial Health, 2010. No4. P. 135-137. (in English)
7. Granka, L. Using online search traffic to predict US presidential elections. PS: Political Science & Politics, 2013. 46 (2), P. 271-279. (in English)
8. Dimitrova Yu.B. Otnosheniya mezhdu centrom i regionami v Rossii: problema effektivnosti // Vlast'. 2010. №5. S. 88-91. (in Russian)
9. Turovskij R. F. Regional'nye osobennosti russkogo nacional'nogo samosoznaniya // Gumanitarnaya geografiya: Nauchnyj i kul'turno-prosvetitel'skij al'manah. Vyp.3. M.: Institut Naslediya, 2006. S. 287-313. (in Russian)
10. Choi H., Varian, H., 2012. Predicting the present with Google Trends // Economic Record, 88, P. 2-9. (in English)
Поступила в редакцию 20.07.2019 г.