Пространственная Экономика 2020. Том 16. № 2. С. 70-100
JEL: C21, C31, R5 https://dx.doi.Org/10.14530/se.2020.2.070-100
УДК 332
Пространственное моделирование электоральных предпочтений в Российской Федерации
Е.А. Подколзина, О.А. Демидова, Л.Е. Кулецкая
Подколзина Елена Анатольевна кандидат экономических наук
доцент факультета экономических наук, заместитель директора Института институциональных исследований
Национальный исследовательский университет «Высшая школа экономики», ул. Мясницкая, 20, Москва, 101000, Российская Федерация E-mail: [email protected] ORCID: 0000-0002-8363-6711
Демидова Ольга Анатольевна кандидат физико-математических наук доцент факультета экономических наук
Национальный исследовательский университет «Высшая школа экономики», ул. Мясницкая, 20, Москва, 101000, Российская Федерация E-mail: [email protected] ORCID: 0000-0001-5201-3207
Кулецкая Лада Евгеньевна аспирантка
Аспирантская школа по экономике (департамент прикладной экономики), Национальный исследовательский университет «Высшая школа экономики», ул. Мясницкая, 20, Москва, 101000, Российская Федерация E-mail: [email protected] ORCID: 0000-0003-2069-9800
Аннотация. Основной задачей данной работы является оценка влияния индивидов, проживающих в соседних территориальных областях, друг на друга в принятии решений на примере выборов Президента России в 2018 r. c использованием данных по 2718 территориальным избирательным комиссиям (ТИКам). Рассчитанные авторами локальные и глобальные показатели пространственной автокорреляции (индексы Морана, Гири, Гетиса - Орда) дают эмпирическое подтверждение глобальной положительной автокорреляции (т. е. в целом по стране избиратели в каждом ТИКе голосуют сходным образом с соседями). Были выявлены ТИКи, входящие в локальные кластеры (где избиратели голосуют аналогично), и ТИКи - выбросы (outlier), т. е. окруженные ТИКами, где голосуют противоположным образом. На примере Татарстана, региона, где встречалось больше всего и ТИКов, образующих локаль-
© Подколзина Е.А., Демидова О.А., Кулецкая Л.Е., 2020
ный кластер, и ТИКов-выбросов, мы проанализировали, какие экономические показатели вкупе с пространственными оказывают влияние на поддержку основного и оппозиционного кандидатов. Было показано, что готовность голосовать за основного кандидата объясняется ростом заработной платы в районе, но в то же время показатели экономической активности в районе и потенциальной мобильности граждан отрицательно влияют на поддержку основного кандидата. На голоса в пользу оппозиционных кандидатов изменение заработной платы не оказывает влияние, а остальные показатели демонстрируют обратную зависимость. Также мы показали, что модели с учетом пространственных эффектов предпочтительнее МНК моделей для анализа итогов голосований.
Ключевые слова: пространственная автокорреляция, электоральные предпочтения, глобальные и локальные индексы пространственной автокорреляции
Благодарности. Исследование проведено при поддержке Программы фундаментальных исследований Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ) в 2020 г., а также факультета экономических наук НИУ ВШЭ.
Для цитирования: Подколзина Е.А., Демидова О.А., Кулецкая Л.Е. Пространственное моделирование электоральных предпочтений в Российской Федерации // Пространственная экономика. 2020. Т. 16. № 2. С. 70-100. https://dx.doi.org/10.14530/se.2020.2.070-100
Spatial Modeling of Voting Preferences in Russian Federation
E.A. Podkolzina, O.A. Demidova, L.E. Kuletskaya
Elena Anatol'evna Podkolzina Candidate of Sciences (Economics)
Assistant Professor: Faculty of Economic Sciences and Department of Applied Economics, Deputy Director in Center for Institutional Studies
National Research University Higher School of Economics, 20 Myasnitskaya St., Moscow, 101000, Russian Federation E-mail: [email protected] ORCID: 0000-0002-8363-6711
Olga Anatol'evna Demidova
Candidate of Science (Physics and Mathematics)
Associate Professor Faculty of Economic Science
National Research University Higher School of Economics, 20 Myasnitskaya St., Moscow, 101000, Russian Federation E-mail: [email protected] ORCID: 0000-0001-5201-3207
Lada Evgen'evna Kuletskaya Postgraduate Student
National Research University Higher School of Economics, 20 Myasnitskaya St., Moscow, 101000, Russian Federation E-mail: [email protected] ORCID: 0000-0003-2069-9800
Abstract. The main objective of this work is to assess the influence of individuals living in neighboring territorial areas on each other in decision-making on the example of presidential election in Russia in 2018 using data on 2718 territorial election commissions (TECs). Local and global indicators of spatial autocorrelation (Moran, Geary, Getis-Ord indices) calculated by the authors provide empirical evidence of global positive autocorrelation (i.e. in the country as a whole voters in each TEC vote similar to their neighbors). We identify TECs that can be included in local clusters (where voters vote similar) or in local outliers (surrounded by such TECs where voters vote opposite. Using the example of Tatarstan, the region where both local cluster and outlier TECs were most common we analyzed which economic indicators together with spatial ones influence the support of the main and opposition candidates. It was shown that the willingness to vote for the main candidate is explained by the increase in salaries in the area, but at the same time the indicators of economic activity in that area and the potential mobility of citizens have a negative impact on the support of the main candidate. Salary changes have no effect on votes in favour of opposition candidates, while other indicators show an inverse correlation. We have also shown that spatial effect models are preferable to OLS models for analyzing voting results.
Keywords: spatial autocorrelation, electoral preferences, global and local indices of spatial autocorrelation
Acknowledgements. The survey was sponsored by the Basic Research Program of Higher School of Economics (NRU HSE) in 2020 and by the Faculty of Economic Sciences.
For citation: Podkolzina E.A., Demidova O.A., Kuletskaya L.E. Spatial Modeling оf Voting Preferences in Russian Federation. Prostranstvennaya Ekonomika = Spatial Economics, 2020, vol. 16, no. 2, pp. 70-100. https://dx.doi.org/10.14530/se.2020.2.070-100 (In Russian).
ВВЕДЕНИЕ
В настоящее время все более популярным становится моделирование многих важных макроэкономических показателей, таких как темпы экономического роста, уровень безработицы и т. п. по данным для регионов. При этом очень важно учитывать в моделях такой фактор, как взаимное влияние регионов друг на друга. Например, если в одном из регионов начинают происходить какие-то изменения, то произойдут ли аналогичные изменения в соседних регионах? Неучет такого фактора может привести к смещениям в оценках коэффициентов модели. Введение слишком большого числа дополнительных переменных (больше числа наблюдений) сделает невозможной оценку параметров классическими методами. Компромиссным вариантом является применение пространственно-эконометрических моделей, где влияние регионов друг на друга отражается с помощью пространственных лагов - описание таких моделей можно найти в (АшеНп, 1995; ЕШоге^ 2010). Но подходят ли эти модели для используемых данных? Для ответа на этот вопрос обычно проводят предварительный анализ с вычислением глобальных и локальных индексов пространственной автокорреляции, на основе
которых определяются пространственные и локальные территориальные кластеры и выбросы.
В данном исследовании мы демонстрируем возможности использования обозначенных индексов на примере оценки влияния предпочтений индивидов из соседствующих населенных пунктов друг на друга, используя данные с выборов Президента России в 2018 г. Нас интересует, как предпочтения в голосовании и выбор гражданами конкретных кандидатов в некоторых областях повлияли на голосование в соседних областях и, следовательно, на общие результаты голосования в целом по стране. Таким образом, в данной работе мы оцениваем пространственные эффекты от влияния предпочтений индивидов из соседних территориальных областей друг на друга.
В работе предложено разделение территорий на локальные кластеры и выбросы в зависимости от сходства в результатах голосования в соседних населенных пунктах. Кроме того, результаты этого исследования могут помочь в дальнейшем при анализе факторов, влияющих на уровень поддержки политических партий, кандидатов на выборах в России или в дальнейшем анализе кластеризации регионов в России.
В то время как имеется немало работ, посвященных анализу результатов выборов в США, Европе с помощью пространственно-эконометрических моделей (Burnett, & Lacombe, 2012; Cutts et al., 2014; Dow, 2001; Kim et al., 2003; Poole, Rosenthal, 1984; Sutter, 2005), для России подобных работ довольно мало (Clem & Craumer, 1995a, 1995b, 2000; Coleman, 2018; Moraski, Reisinger, 2014; Moraski, Reisinger, 2010; O'Loughlin et al., 1996). В то же время представляется, что российский случай является интересным вследствие большого размера страны и ее неоднородности. На основе расчета пространственных статистик для всех рассматриваемых региональных единиц наблюдения и оценки пространственно-эконометрических моделей для одного из регионов (Татарстана) мы показываем наличие значимого влияния соседних территорий на поведение избирателей.
Статья построена следующим образом. В разделе 2 дается обзор наиболее значимых исследований поведения избирателей с учетом пространственных эффектов. В разделе 3 описаны используемые в исследовании данные о президентских выборах 2018 г. В четвертом разделе описаны результаты, полученные после анализа данных при помощи глобальных и локальных индексов пространственной автокорреляции, а также в разделе 5 проанализированы результаты для региона, где встречалось больше всего и ТИКов, образующих локальный кластер, и ТИКов-outliers. Заключительный раздел 6 содержит краткие выводы и предложения для дальнейшего исследования.
ОБЗОР ЛИТЕРАТУРЫ
В научной литературе существует немало работ на тему предпочтений в голосовании и анализа результатов выборов с использованием пространственного подхода. В большинстве работ используются данные по США. Для результатов выборов президента 2004 г (Burnett, Lacombe, 2012) подчеркивается, что обычные подходы к оценке результатов голосования на выборах, как, например, метод наименьших квадратов, потенциально игнорируют пространственную зависимость (или автокорреляцию) в данных, что может привести к смещенным оценкам. В связи с этим в данной статье предлагается пространственная эконометрическая модель для оценки результатов голосования на президентских выборах в США 2004 г, а также набор тестов, позволяющий определить наиболее корректную и правильную пространственную спецификацию, в данной статье лучшей спецификацией стала пространственная модель Дарбина (spatial Durbin model).
Модель Дарбина стала лучшей и в исследовании (Jensen et al., 2013). Авторы анализировали результаты выборов в Великобритании 2010 г, применяя байесовские пространственные эконометрические методы. Авторы показали, что существует пространственная зависимость между разными регионами страны при голосовании. В качестве объясняющих переменных используется ряд экономических, социально-экономических и политических факторов. Таким образом, например, политические действия главы какого-либо округа, представляющего определенную политическую партию, влияют и на другие округа, а именно на решение их избирателей голосовать за кандидатов данной партии на следующих выборах.
Авторы исследования (Mur et al., 2012) разработали стратегию для анализа гипотезы об устойчивости параметров пространственной экономе-трической модели. В частности, они представили ряд тестов для проверки гипотезы об устойчивости основных элементов пространственной экономе-трической модели и проверили их на результатах региональных выборов в Испании.
В настоящей статье мы также проводим сравнение результатов модели МНК и пространственных моделей (пространственного лага и пространственной ошибки), показывая, что последние дают более реалистичные результаты.
В ряде статей рассматриваются не только пространственные спецификации, но и взаимосвязь с экономическими показателями (эффект «наказания» за плохую политику). Статья (Kim et al., 2003) посвящена проверке гипотезы о том, что голоса за находящуюся в данный момент у власти партию положительно связаны с ростом доходов и негативно связаны с ростом уровня
безработицы. В статье рассматриваются данные итогов в выборы президента США с 1988 по 2000 г., за единицу наблюдения берется округ. Модель строится следующим образом: за зависимую переменную берется процент голосов за ту или иную партию, в качестве объясняющих - уровень дохода на душу населения и уровень безработицы. В результате авторы получили, что чем больше уровень безработицы в регионе (при заданном уровне дохода), тем больше жители данного региона поддерживают демократов, чем республиканцев. При этом противоположный вывод получился относительно уровня дохода: чем выше уровень дохода населения в регионе (при заданном уровне безработицы), тем больше избиратели в данном регионе поддерживают республиканцев.
В работе (Sutter, 2005) исследуется зависимость между результатами голосования на уровне округов на президентских выборах США 2000 г., автор использует следующие объясняющие переменные: показатели прошлого голосования, показатели социально-экономического демографического статуса населения и экономические переменные, отражающие экономические условия округов. В итоге автор делает выводы о том, какие объясняющие переменные важны для объяснения результатов голосования.
В статье (Cutts et al., 2014) описывается новый подход к изучению результатов выборов на примере выборов политической партии 2010 г. в Великобритании. В частности, рассматриваются эффекты перелива (spillover effects) от финансирования политической кампании в одном регионе на результаты выборов в соседних регионах. То есть, предполагается, что чем больше денег политическая партия тратит на агитацию в некотором регионе, тем больше голосов ей отдадут жители не только этого региона, но и соседних. Авторы связывают это с тем, что жители соседних округов не только прослушивают одни и те же средства массовой информации, но свободно перемещаются между округами как в повседневной жизни, так и во время активной политической кампании и, как следствие, знают о политической деятельности, происходящей в соседних округах. В статье авторы применили пространствен-но-эконометрическое моделирование к анализу данных, так как, согласно выдвинутой гипотезе, нужно учитывать пространственную неоднородность для правильной оценки масштабов и значимости факторов, влияющих на эффективность выборов. В итоге авторы подтвердили изначально выдвинутую гипотезу о существовании пространственной зависимости регионов: если финансирование политической кампании проходит в некотором регионе i, это позволяет привлечь большое число избирателей в соседних с i регионах.
Также к нашему исследованию близка статья (Coleman, 2018), в которой анализируются результаты российских думских выборов с 1993 по 2016 г. Авторы рассматривают психологическую теорию о том, что люди в своих
предпочтениях и действиях подчиняются общественному мнению, или мнению большинства, то есть люди стараются поступать так, как это принято в их окружении (social conformity). Для анализа данной теории авторы используют данные по российским выборам в период с 1993 по 2016 г., оценивают математическую модель массового эффекта от общественного мнения на голосование людей на каждых парламентских выборах регионального уровня с использованием пространственного подхода. В итоге авторы получили результат, свидетельствующий о том, что «social conformity» с течением времени все сильнее влияет на результаты голосования, причем не только на парламентских, но и на президентских выборах.
В данной работе мы отталкиваемся от идеи (Coleman, 2018) о том, что для людей важно мнение их окружения, и выдвигаем аналогичную (Kim et al., 2003) гипотезу о том, что экономические результаты деятельности в предыдущей период правления текущего кандидата, баллотирующегося на второй срок, оказывают влияние на готовность людей голосовать за него. Мы также используем показатели безработицы, заработной платы и индикаторы экономического развития территорий.
МЕТОДОЛОГИЯ И РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ
Используемые данные и подход к их корректировке
Данные для этого исследования были собраны с сайта Центральной избирательной комиссии (http://www.cikrf.ru, http://www.vybory.izbirkom.ru) о результатах президентских выборов в России в 2018 г. В них содержится информация о доле проголосовавших избирателей за выдвинутых кандидатов и явке на уровне территориальных избирательных комиссий (ТИКов). Мы использовали данные на уровне ТИКов, а не на региональном уровне, так как полагаем, что такой микроуровень может значительно расширить практическое применение пространственного моделирования и позволит качественнее выделить корректные направления возможных пространственных эффектов.
Ряд исследований (Статистика..., 2018; Исследователь..., 2018) показывают, что нельзя полагаться на статистику с официальных сайтов, так как имеют место ошибочно завышенные данные по явке / доле проголосовавших в некоторых территориальных комиссиях для основного кандидата, и, следовательно, наши исходные данные могут не в полной мере отражать предпочтения избирателей. Во избежание подобного рода критики мы дополнительно скорректировали исходные данные с помощью методов, предложенных в работах (Kobak et al., 2016; Шень, 2018) об оценке уровня возможных фальсификаций на выборах в некоторых областях России. Итоговые расчеты данной работы были проведены как по исходным, так и по
скорректированным данным для основного кандидата. Для остальных кандидатов коррекция данных не проводилась.
Коррекция исходных данных о голосовании за основного кандидата (так как основная масса голосов была отдана именно ему) была проведена следующим образом: мы сравнили общее количество бюллетеней по заданным значениям явки для каждого кандидата и каждого региона, где исследователи предполагают некоторое количество ошибок в подсчете голосов на выборах (Республика Мордовия, Республика Башкортостан, Республика Татарстан, Саратовская область, Белгородская область, Краснодарский край, Ставропольский край, Кемеровская область, Ямало-Ненецкий АО, Республика Северная Осетия - Алания, Карачаево-Черкесская республика), построив графики для всех кандидатов следующим образом: по оси X откладывается явка на участках, а по оси Y - количество голосов за кандидата при той или иной явке. Затем мы оценили различия в правой части графиков между всеми кандидатами, в некоторых регионах увидели большие различия в пропорциях количества голосов между основным и другими кандидатами и скорректировали значения в правой части графика для основного кандидата в соответствии со значениями других кандидатов.
Глобальные показатели пространственной зависимости
Для того чтобы оценить, как именно голосовали жители соседних ТИКов в России в целом (схожим или различным образом), мы вычислили глобальные индексы пространственной автокорреляции, а именно, индексы Морана, Гири, Гетиса - Орда. В настоящем исследовании в качестве матрицы соседства используется граничная нормированная матрица Ж для ТИКов (матрица соседства), диагональные элементы которой равны нулю. Элемент матрицы Ж равен 1/т (где т - количество ТИКов, с которыми ТИК I имеет общую сухопутную границу), если ТИКи с номерами I и] имеют общую сухопутную границу, и 0 - в противном случае. С помощью этой матрицы мы оценили пространственный лаг зависимой переменной ЖУ. Приведем пример построения пространственного лага для трех граничащих друг с другом ТИКов Чукотского автономного округа: Певекская ТИК, Анадырская ТИК, Билибинская ТИК с использованием граничной нормированной матрицы соседства Ж1 для данных ТИКов:
и вектора У 1 - % голосов за К. Собчак = (0,94; 1,09; 1,45)'. Пространственный лаг, таким образом, будет выглядеть следующим образом:
W Y 1 = (0,5 1,09 + 0,5 1,45; 0,5 0,94 + 0,5 1,45; 0,5 0,94 + 0,5 1,09)' =
= (1,27; 1,195; 1,015)'.
Мы оценили коэффициенты корреляции Спирмена между Y и WY (Y - % голосов за конкретного кандидата), чтобы понять, есть ли какие-то взаимозависимости в предпочтениях голосования за кандидатов или нет. В таблице 1 представлены коэффициенты корреляции Спирмена между Y и WY. Мы получили сильные линейные зависимости в голосовании для всех кандидатов между соседними территориальными избирательными комиссиями, поскольку полученные коэффициенты корреляции Спирмена значимы на любом адекватном уровне значимости. Мы предполагаем, что коэффициент корреляции Спирмена для основного кандидата ниже, чем для остальных кандидатов, из-за более высокого стандартного отклонения, то есть большая дисперсия в голосовании способствует более низкому коэффициенту корреляции Спирмена. Более подробная описательная статистика результатов голосования представлена в таблице 2.
Таблица 1
Коэффициенты корреляции Спирмена между результатами голосования в соседних ТИКах для выборов 2018 г.
Table 1
Connection between election results in neighboring TECs (Spearman correlation coefficient), 2018
Показатель Spearman's rho, p-value
Результаты голосования за В. Путина 0,566 (p-value = 0,0000)
Результаты голосования за П. Грудинина 0,687 (p-value = 0,0000)
Результаты голосования за К. Собчак 0,799 (p-value = 0,0000)
Результаты голосования за В. Жириновского 0,824 (p-value = 0,0000)
Источник: расчеты авторов.
Таблица 2
Описательные статистики результатов голосования за первых четырех кандидатов
Table 2
Ballot descriptive statistics for top four candidates
Кандидат Кол-во наблюдений Среднее Ст. откл. Медиана
В. Путин 2718 0,741 0,117 0,757
П. Грудинин 2718 0,121 0,05 0,119
К. Собчак 2718 0,013 0,01 0,064
В. Жириновский 2718 0,063 0,027 0,0093
Источник: расчеты авторов на основе данных с сайта Центральной избирательной комиссии (http://www.cikrf.ru, http://www.vybory.izbirkom.ru) о результатах президентских выборов в России в 2018 г.; для основного кандидата использовались скорректированные данные.
Для России характерно доминирование одной партии на выборах, при этом также параллельно существуют оппозиционные движения во многих регионах, особенно в крупных городах, таких как Москва и Санкт-Петербург. Мы полагаем, что большая дисперсия в голосовании за основного кандидата обуславливается в первую очередь влиянием от очагов возникновения оппозиции в крупных городах, что влечет за собой возникновение пространственных эффектов от этих движений на соседние регионы. Так как основной кандидат на момент выборов в 2018 г. являлся и действующим президентом, влияние от таких эффектов было значимым на результаты голосования.
Для того чтобы подтвердить обозначенную нами выше гипотезу о влиянии результатов голосования в соседних ТИКах на результаты голосования, мы рассчитали глобальные и локальные индексы пространственной автокорреляции - индексы Морана, Гири и Гетиса - Орда. Гипотеза о значимости индексов как на глобальном, так и на локальном уровне проверяется традиционным способом с использованием z-статистики. Индексы Морана и Гири позволяют измерить степень схожести результатов голосования из соседних территорий, то время как индекс Гетиса - Орда позволяет оценить, насколько ту или иную территорию можно отнести либо I/ кластеру высоких значений результатов голосования за кандидата, либо к кластеру низких значений. Таким обр азом, использование вс ех трех ивдексов имее т смысл не только для проверкистабильности(робастности) результатов, но и для полного и широкого анализа результатов голосования и выявления пространственных эффектов.
Глобальный индекс Морана для результетовколосования риогф еделен-ного кандидата (показатель х) рассчитывается по формуле 1:
где N - число территорий, то е-ть чиело ТИКов = 2718; ча - элементыгра-ничной нормированной матрицы соседства для ТИКот/ и] (при этом диагональные элементы матрицы равны нулю, то есть w.. = 0); /л - среднее значение показателя х (результатов големованияаа кандидата).
Нулевая гипотеза состоит в случайном гооосовании,ао еатмиет никакой зависимости в голосовании электората из соседних территорий, альтернативная же гипотеза говорит о схожж (или противоположных) результатах голосования электората ез тоседних херртторий.
Тестируемая z-статистика рассчитывается следующим образом:
2 = /ертт£е/т ~ мем от (2)
В случае, если z-статистика попадает в интервал от -1,96 до +1,96, нулевая гипотеза не отвергается на 5% уровне значимости. Если z-статистика превышает значение 1,96, говорят о положительной автокорреляции, если z-статистика меньше -1,96, говорят об отрицательной автокорреляции.
На рисунке 1 представлены пространственные диаграммы рассеяния Морана для основного кандидата и главного оппозиционера на данных выборах - К. Собчак. Для получения более детальной информации о связи результатов выборов в рассматриваемом и соседних регионах мы используем пространственную диаграмму рассеяния Морана, где по оси X откладывается центрированная и нормированная зависимая переменная, а по оси Y -центрированный и нормированный пространственный лаг WY. Тогда точка ноль соответствует средним значениям переменной, а остальные точки на диаграмме соответствуют каждой исследуемой территории (координатами которых являются центрированные и нормированные Y и WY). Точки, обозначающие территории, могут находиться в одном из четырех квадрантов диаграммы (Handbook., 2010)1.
Для В. Путина мы получили почти все значения в правой верхней части диаграммы Морана - в квадранте «high-high» графика, то есть в общем, почти все территории в России имеют относительно высокие значения процентов голосов за данного кандидата, и окрестные территории также имеют аналогичные высокие значения. Для К. Собчак, напротив, получили почти все значения в левой нижней части диаграммы - в квадранте «low-low» графика, то есть в общем, почти все территории в России имеют относительно низкие значения голосования за данного кандидата, и окрестные территории имеют аналогичные низкие значения.
Таким образом, мы получили характерную картину для действующего кандидата из доминирующей партии: в основном электорат предпочитает голосовать за такого кандидата, а количество голосов за основного оппозиционера достаточно мало.
1 Верхний правый квадрант (квадрант high-high) отражает те территории, в которых значения исследуемого показателя выше среднего, и в соседних с ними территориях средние значения показателя также выше среднего (аналогичные высокие значения в соседних территориях); нижний левый квадрант (квадрант low-low) отражает те территории, в которых значения исследуемого показателя ниже среднего, и в соседних с ними территориях средние значения показателя также ниже среднего (аналогичные низкие значения в соседних территориях); нижний правый квадрант (квадрант high-low) отражает те территории, в которых значения исследуемого показателя выше среднего, а в соседних с ними территориях средние значения показателя ниже среднего (разные значения в соседних территориях); верхний левый квадрант (квадрант low-high) отражает те территории, в которых значения исследуемого показателя ниже среднего, а в соседних с ними территориях средние значения показателя выше среднего (разные значения в соседних территориях).
Moran scatterplot (Moran's I = 0.487) Putin
j_l_1_1_1
Рис. 1. Пространственные диаграммы рассеяния (на основе индексов Морана) для результатов голосования за В. Путина и К. Собчак (выборы 2018 г., переменные центрированы и нормированы, числа на диаграмме - номера ТИКов) Fig. 1. Ballot spatial scatter plots (based on Moran indices) for number of votes for V. Putin and K. Sobchak (2018 election, сentered and normalized variables, numbers on the plots equaling to TEC numbers)
Глобальный индекс Гири, так же как и индекс Морана, показывает наличие положительной или отрицательной автокорреляции. Данный индекс рассчитывается по формуле 3:
_ (W-l)Sfs7wi;■(xi-x;■)2 (3)
С _ гл^-^)2 ' (3)
где N - число территорий, то есть число ТИКов = 2718; w.. - элементы гра-
У
ничной нормированной матрицы соседства для ТИКов . и. (при этом диагональные элементы матрицы равны нулю, то есть w = 0); /л - среднее значение показателя х (результатов голосования за кандидата).
Нулевая гипотеза состоит в случайном голосовании, то есть нет никакой зависимости в голосовании электората из соседних территорий, альтернативная же гипотеза говорит о схожих (или противоположных) результатах голосования электората из соседних территорий; z-статистика рассчитывается и интерпретируется такимжеобразом, как и для индекса Морана.
Возможные значения индекса Гири лежат между 0 и 2. Значения, значительно меньшие 1, показывают положительную пространственную автокорреляцию в данных, в то время как значения индекса, значительно превышающие 1, указывают на отрицательную пространственную автокорреляцию.
Индекс Гетиса - Орда, в отличие от индексов Морана и Гири, позволяет измерить не положителы^ю или отрикательную автокорр еляцию, а клас те-ризацию регионов с высокими или низкими значениями результатов голосования за определенного кандидатаи рассчитывается по формуле 4:
„ Т1=1Т0=1Т1]1К1К] , .4
(4)
где N - число территорий, тоесть число ТИКов = 2718; w.1 - элементы симметричной нестандартизированной граничной матрицы для территорий . и . (при этом диагональные элементы матрицы равны нулю, то есть ^Ц = 0), в нашем случае мы используем маткицу соседств а, элементы который равны единице, если регионыимеют общую сухопутную границу, и нулю в противном случае.
Нулевая гипотеза доя индекса Гетиса - Орда состоит в отсутствии кластеризации высоких или низких значесссй результатов голосования за того или иного кандидата в соседниз хезрсссориях, z-cтaтиcтикa индекса вычисляется по формуле 5:
^тГШг^1). <5>
В случае, если z-статистика попадает в интервал от -1,96 до +1,96, нулевая гипотеза не отвергается на 5% уровне значимости. Если z-статистика
превышает значение 1,96, говорят о кластеризации регионов с высокими значениями исследуемого показателя, если z-статистика меньше -1,96, говорят о кластеризации регионов с низкими значениями исследуемого показателя.
В таблице 3 приведены индексы глобальной пространственной автокорреляции (индексы Морана, Гири, Гетиса - Орда) для всех кандидатов на выборах 2018 г. (использовались скорректированные данные для основного кандидата).
Таблица 3
Глобальные индексы пространственной автокорреляции для кандидатов на президентских выборах 2018 г.
Table 3
Global spatial autocorrelation indices for candidates in the 2018 presidential election
Глобальные индексы
Getis & Ord's (G)
G z p-value
В. Путин 0,002 4,297 0
К. Собчак 0,003 26,025 0
П. Грудинин 0,002 8,796 0
В. Жириновский 0,002 16,061 0
Moran's (I)
I z p-value
В. Путин 0,488 39,252 0
К. Собчак 0,75 60,291 0
П. Грудинин 0,606 48,667 0
В. Жириновский 0,739 59,313 0
Geary's (c)
c z p-value
В. Путин 0,555 -19,948 0
К. Собчак 0,227 -35,863 0
П. Грудинин 0,392 -35,111 0
В. Жириновский 0,268 -49,547 0
Источник: расчеты авторов.
Мы получили положительную пространственную автокорреляцию для результатов голосования по всем кандидатам - глобальные индексы Морана являются статистически значимыми и положительными для всех кандидатов (на любом адекватном уровне значимости), индексы Гетиса - Орда положительны и значимы, а индекс Гири для всех кандидатов меньше единицы. В целом по стране проценты голосов за кандидатов в соседних населенных пунктах схожи, причем для всех кандидатов кластеризация происходит преимущественно на высоких значениях. Мы также построили индексы для нескорректированной выборки, так как коррекция могла исказить простран-
ственный эффект (мы не беремся объяснять природу слишком высоких процентов голосов за действующего кандидата, однако этот факт является широко обсуждаемым и общедоступным для населения, что может оказать влияние на голосование). Все значения индексов в случае использования исходных данных по своему знаку и значимости совпадают с указанными в таблице 3. В целом, можно сказать, что у нас есть сильная положительная пространственная автокорреляция данных, то есть мы видим сильное влияние территорий друг на друга.
В рамках рассмотрения результатов подсчета индексов автокорреляции мы отталкиваемся от анализа, представленного в статье (Coleman, 2018): в России электорат очень сильно подвержен влиянию эффекта от «мнения большинства» (social conformity), то есть избиратели интуитивно (иногда даже не осознавая этого) голосуют так, как считает их ближайшее окружение. Мы полагаем, что эффект от «social conformity» обуславливает наш результат о положительной пространственной автокорреляции: в целом в стране избиратели из соседних территорий ориентируются друг на друга в принятии решений: голосовать за основного кандидата или за оппозиционного.
Локальные показатели пространственной зависимости
В то время как глобальные индексы пространственной автокорреляции позволяют оценить наличие автокорреляции и / или кластеризации низких / высоких значений в целом по стране, локальные индексы пространственной автокорреляции позволят нам определить территории-кластеры или территории-выбросы внутри страны.
Таким образом, локальные индексы позволяют провести классификацию всех территорий согласно анализу выборов 2018 г. по разным кандидатам: мы определяем, насколько территории гомогенны в том, как они голосуют за кандидатов (схожим / противоположным образом, либо же нельзя определить однозначную взаимосвязь и можно говорить лишь о разнородном голосовании на территориях).
Как показано в работе (Anselin, 1995), проверка значимости локальных индексов проводится несколько отлично от традиционной процедуры, а именно, мы должны дополнительно рассчитать индивидуальный уровень значимости для каждой территории: так как общий уровень значимости обычно принимается как 5% (или 0,05), индивидуальный уровень рассчитывается как 0,05/N, где N - число территорий. В нашем случае имеем 2718 ТИКов, то есть индивидуальный уровень значимости будет равняться 0,0000184, что соответствует z-статистике, равной 4,288. Таким образом, значимыми будут те статистики, которые по модулю будут больше указанной (4,288).
Локальный индекс Морана вычисляется по формуле 6:
1"= . (6)
Нулевая гипотеза говорит о случайном голосовании вокруг определенной территории, альтернативнпяже грпоаеза говорит о существовании зависимости в результатах голосоватия для отределенной территории.
Тестируемая z-статиcтика рассчитываетсяследующим образом:
гл^^М ~Л(0,1). (7)
^гаагОТ,;) 4
В случае, если z-статистика поп ад ает в интервалот -4,288 до +4,288, нулевая гипотеза не отвергается на 5% уровне значимости. Если 2-статистика превышает значение 4,288, говортт о том, ето тмрритория . окружена территориями, имеющими похожие значенио результатов голосования за определенного кандидата (то есть наблюдается положительная пространственная автокорреляция), если z-стaаиcтиее меньшр -°,°88 говорят том, что территория . окружена территориями, имеитщими отличные значения результатов голосования за определенного кандидатт (то есть наблюдается отрицательная пространственная автокорреияцмя).
Локальный индекс Гири вычисляет). по формуле 8:
ЕХ^-х,)2. (8)
При этом интерпретация индекса торно такая же, как и у локального индекса Морана.
Локальный индекс Гетиса р Орда, так жекж иего глобальный аналог, позволяет определить, входит ли территория в кластер высоких или низких значений результатов голосов аню зв ощэеаел енного кандидата, и расчитывается по формуле 9:
с,-ов'с; 'сс ^¿оо. (9)
Тестируемая z-статистика рассчитывается следующим образом:
ри ЛямЩг^г ■ <10>
В случае, если z-статистика индекса попадает в интервал от -4,288 до +4,288, нулевая гипотеза не отвергается на 5% уровне значимости. Если z-статистика превышает значение 4,288, говорят о том, что соответствующая территория входит в состав кластера с высокими значениями результатов голосования за кандидата, если z-статистика меньше -4,288, говорят о том, что соответствующая территория входит в состав кластера с низкими значениями результатов голосования за кандидата.
В основе классификации лежат локальные индексы (LISA - Морана, Гири, Гетиса - Орда), если для региона все локальные индексы были значимы, то он попадал в одну из категорий (табл. 4), если хотя бы один индекс был незначим, то мы регион классифицировали как разнородный, то есть в нем не было единства в голосовании в разных ТИКах . Большинство регионов попадают в смешанную категорию и не вошли в таблицу 4, в ней представлены только гомогенные регионы.
Таблица 4
Регионы, представляющие ТИКи со статистически значимыми локальными индексами LISA для кандидатов на президентских выборах 2018 г. в России
Table 4
Regions representing TECs with statistically significant local LISA indices for candidates in the 2018 Russian presidential election
Классификация регионов
Голосование за В. Путина
Схожие проценты голосов в ТИКах Противоположные проценты голосов в ТИКах
Высокие проценты голосов в ТИКах Республика Тыва, Кабардино-Балкарская Республика -
Низкие проценты голосов в ТИКах Республика Дагестан, Республика Татарстан*, Республика Мордовия, Чеченская Республика, Кемеровская область Республика Татарстан*
Голосование за К. Собчак
Схожие проценты голосов в ТИКах Противоположные проценты голосов в ТИКах
Высокие проценты голосов в ТИКах Москва, Санкт-Петербург, Пермский край, Московская область -
Низкие проценты голосов в ТИКах - -
Голосование за П. Грудинина
Схожие проценты голосов в ТИКах Противоположные проценты голосов в ТИКах
Высокие проценты голосов в ТИКах Республика Саха (Якутия), Алтайский край, Приморский край -
Низкие проценты голосов в ТИКах Республика Тыва, Кабардино-Балкарская Республика Республика Дагестан
Голосование за В. Жириновского
Схожие проценты голосов в ТИКах Противоположные проценты голосов в ТИКах
Высокие проценты голосов в ТИКах Амурская область, Вологодская область, Костромская область, Кировская область -
Низкие проценты голосов в ТИКах Республика Тыва, Карачаево-Черкесская Республика, Кабардино-Балкарская Республика, Чеченская Республика -
Примечание. * В Республике Татарстан в голосовании за В. Путина выявлены ТИКи, которые содержат и схожие проценты, и противоположные. Источник: расчеты авторов.
С одной стороны, мы проанализировали статистически значимые локальные индексы Морана, для которых положительное значение указывает на пространственную кластеризацию аналогичных значений (либо высоких, либо низких), а отрицательные значения представляют кластеризацию противоположных значений (например, территорию с высокими значениями, окруженную соседями с низкими значениями) (Anselin, 1995). С другой стороны, мы также рассмотрели статистически значимые локальные индексы Гетиса и Орда: положительное значение индекса указывает на пространственную кластеризацию высоких значений, а отрицательное значение -пространственную кластеризацию низких значений (Anselin, 1995). ТИКи со схожими значениями голосования образовывают территории-кластеры (clusters), а ТИКи с противоположными значениями голосования - территории-выбросы. Регионы, не включенные в таблицу 4, представляют собой ТИКи с разнородными процентами голосов за того или иного кандидата согласно индексам Морана и Гири.
Согласно полученным результатам, представленным в таблице 4, мы наблюдаем всего два региона-выброса: Республика Татарстан для В. Путина и Республика Дагестан для П. Грудинина. Намного больше регионов, ТИКи которых образуют кластеры (находятся в столбцах «Схожие проценты голосов в регионе»). Для К. Собчак эти регионы - Москва и Санкт-Петербург, для П. Грудинина - регионы Дальнего Востока, для В. Жириновского - южные регионы с низкими процентами голосов за данного кандидата. Такой результат соответствует основным политическим кампаниям и движениям для каждого из кандидатов: движения против действующей партии проходили именно в Москве и Санкт-Петербурге; южные регионы в основном являются дотационными и сильно зависят от действующей партии, руководство регионов возглавляют губернаторы, состоящие в действующей партии. На Дальнем же Востоке активность действующей партии довольно низкая, в губернаторы иногда избираются кандидаты из либеральных партий, в то время как действующая партия направляет основные силы и средства в центр страны.
Так как данные о голосовании в некоторых регионах были скорректированы, мы получили довольно интересные результаты: южные регионы (и некоторые другие регионы с возможными фальсификациями на выборах) сформировали кластеры с низким уровнем голосования, однако Республика Тыва и Кабардино-Балкарская Республика остались в регионах со схожими и высокими результатами голосования.
Мы также рассчитали локальные индексы и для исходных данных для основного кандидата: почти все регионы переходят из кластеров с низким уровнем голосования в кластеры с высоким уровнем голосования; Респу-
блика Татарстан, так же как в случае со скорректированными данными, имеет ТИКи, входящие и в группу схожих процентов голосов с соседями, и в группу противоположных голосов с соседями, что делает анализ этого региона особенно интересным.
ПРОСТРАНСТВЕННО-ЭКОНОМЕТРИЧЕСКОЕ МОДЕЛИРОВАНИЕ НА ПРИМЕРЕ РЕСПУБЛИКИ ТАТАРСТАН
Гипотезы и исследуемые данные
В нашем исследовании мы проверяем гипотезу о том, что экономические факторы в соседних территориях влияют друг на друга на примере голосования за основного и оппозиционного кандидатов в Республике Татарстан на выборах президента в 2018 г Случай Татарстана нам представляется интересным, так как ТИКи данного региона вошли как в локальные кластеры схожих значений в голосовании за основного кандидата, так и в локальные выбросы, согласно индексу Морана. В своих дальнейших исследованиях мы планируем проверить данную гипотезу для всех регионов России, однако в данной работе остановились только на Республике Татарстан.
Для получения экономических данных региона мы обратились к сайту Ассоциации «Совет муниципальных образований Республики Татарстан»1, где представлены данные на уровне муниципалитетов и имеют временной интервал 2016-2017 гг. Всего было собрано восемь экономических показателей за каждый год: средний уровень заработной платы, деленный на минимальный потребительский бюджет; уровень безработицы (в %); добавленная стоимость на душу населения (тыс. руб.); инвестиции в основной капитал на душу населения (тыс. руб.); общая площадь жилых домов на душу населения (м2); налоговые и неналоговые доходы на душу населения (руб.); объем отгруженных товаров собственного производства на душу населения (тыс. руб.); валовая продукция сельского хозяйства на одного работающего в сельском хозяйстве (тыс. руб.). В таблице 5 мы представили подробное описание использованных в финальных моделях переменных.
Так как результаты голосования были получены нами на уровне ТИКов, то мы дополнительно рассчитали результаты голосования в регионе на уровне муниципалитетов (всего в Татарстане 64 ТИКа и 45 муниципалитетов) на основании имевшихся данных о количестве бюллетеней за каждого кандидата и общего числа проголосовавших.
1 Ассоциация «Совет муниципальных образований Республики Татарстан». URL: http:// sovmo.tatarstan.ru/rus/rating.htm (дата обращения: февраль 2020).
Таблица 5
Объясняющие переменные
Table 5
Explanatory variables
Обозначение Описание
Addedval_ percap2017 Добавленная стоимость на душу населения за 2017 г.
Ownproduct_ percap2017 Отгружено товаров собственного производства по чистым видам экономической деятельности на душу населения, январь - декабрь 2017 г.
Wage17_16 Средний уровень заработной платы к МПБ (минимальному потребительскому бюджету) за 2017 г. - Средний уровень заработной платы к МПБ (минимальному потребительскому бюджету) за 2016 г.
Un_17_16 Уровень безработицы на 01.01.2018 (%) - Уровень безработицы на 01.01.2017 (%)
RoadtoMoscow = 1, если через муниципалитет проходит скоростная трасса Москва - Казань, =0 в обратном случае
HighVotes = 1, если процент голосов в муниципалитете за основного кандидата >96%, =0 в обратном случае
Udmurtia = 1, если муниципалитет граничит с Удмуртской Республикой, = 0 в обратном случае
Bashkortostan = 1, если муниципалитет граничит с Республикой Башкортостан, = 0 в обратном случае
Orenburgskaya = 1, если муниципалитет граничит с Оренбургской областью, = 0 в обратном случае
Samarskaya = 1, если муниципалитет граничит с Самарской областью, = 0 в обратном случае
Ulyanovskaya = 1, если муниципалитет граничит с Ульяновской областью, = 0 в обратном случае
Chuvashia = 1, если муниципалитет граничит с Республикой Чувашия, = 0 в обратном случае
Mariyel = 1, если муниципалитет граничит с Республикой Марий Эл, = 0 в обратном случае
Kirovskaya = 1, если муниципалитет граничит с Кировской областью, = 0 в обратном случае
Источник: расчеты авторов на основе данных Ассоциации «Совет муниципальных образований Республики Татарстан». URL: http://sovmo.tatarstan.ru/rus/rating.htm (дата обращения: февраль 2020).
Республика Татарстан граничит со многими регионами: с республиками Удмуртия, Башкортостан, Чувашия, Марий Эл, а также с Оренбургской, Самарской, Ульяновской, Кировской областями. В связи с этим дополнительно в спецификацию моделей мы добавили дамми-переменные, равные единице, если муниципалитет Татарстана граничит с тем или иным регионом, и ноль в обратном случае. Кроме того, мы также добавили дамми-перемен-ную, равную единице, если муниципалитет Татарстана соседствует со скоростной трассой Москва - Казань, ноль - в обратном случае. Мы полагаем, что дамми-переменные на соседство с регионами позволит нам «отловить»
пространственные эффекты от соседства, а дамми-переменная на скоростную трассу позволит оценить эффект от связи муниципалитетов Татарстана со столицей России.
Таблица 6 отражает основные описательные статистики результатов голосования за основного кандидата для: всех муниципалитетов Татарстана; муниципалитетов, не имеющих границ с соседними регионами; муниципалитетов, имеющих границу как минимум с одним соседним регионом. При этом для описательных статистик и последующих расчетов мы использовали нескорректированные (исходные) результаты голосования за основного кандидата, так как ввиду того, что муниципалитетов всего 45, использование грубой коррекции на таком маленьком числе наблюдений сильно искажает результаты. Вместо коррекции в расчетах моделей мы используем дамми-переменную на подозрительно высокие результаты голосования (более 96%).
Таблица 6
Описательные статистики результатов голосования за основного кандидата для муниципалитетов Республики Татарстан
Table 6
Ballot descriptive statistics for the main candidate for municipalities of the Republic of Tatarstan
Муниципалитеты Кол-во наблюдений Мин. Макс. Среднее Медиана Ст. откл.
Все муниципалитеты Татарстана 45 0,734 0,972 0,89 0,91 0,062
Муниципалитеты Татарстана, не имеющие границ с соседними регионами 19 0,734 0,96 0,89 0,92 0,074
Муниципалитеты Татарстана, имеющие границу как минимум с одним соседним регионом 26 0,767 0,972 0,88 0,88 0,053
Моделирование и результаты
Мы предполагаем, что готовность населения голосовать за основного кандидата должна определяться экономической ситуацией в регионе, в частности, состоянием экономики района и состоянием рынка труда. Кроме того, так как основной кандидат одновременно является действующим президентом, население будет оценивать свою готовность проголосовать за него на основании того, что кандидатом было сделано ранее, как успешно он следил за экономической ситуацией в стране и в регионе потенциального избирателя. Исходя из собранных данных, мы полагаем, что избиратели в своем выборе опираются в том числе на следующие показатели.
• Рост заработной платы в 2016-2017 гг.: избиратель может самостоятельно оценить, насколько его доход увеличивался за последние два года,
а также как увеличивался в целом доход его семьи и близких. Если избиратель понимает, что доходы увеличивались за время, предшествующее выборам, то он скорее будет поддерживать основного, действующего кандидата.
• Рост безработицы в 2016-2017 гг.: избиратель может ориентироваться на свою занятость и занятость семьи и близких, общую ситуацию в регионе избиратель может получать из СМИ. Если избиратель понимает, что он и его семья не теряли работу за время, предшествующее выборам, то он скорее будет поддерживать основного, действующего кандидата.
• Показатели «Добавленная стоимость на душу населения за 2017 год» и «Отгружено товаров собственного производства в 2017 году» избиратели не могут оценить самостоятельно, но они косвенным образом влияют на инфраструктуру и богатство района, его экономическое благополучие.
• Наличие скоростной трассы Москва - Казань: так как выше мы получили результат о том, что Москва входит в кластер высоких и схожих значений в голосовании за К. Собчак, мы полагаем, что связь со столицей будет побуждать избирателей меньше голосовать за основного кандидата и больше - за оппозицию.
Кроме того, как уже ранее было обозначено, мы включили в модель дам-ми-переменные для муниципалитетов, граничащих с другими регионами. Собранные показатели взаимосвязаны между собой, поэтому, чтобы избежать проблемы мультиколлинеарности, первоначально мы включили в модель все факторы, собранные нами, а затем проверяли гипотезу о совместной незначимости коэффициентов при группе некоторых переменных. Если гипотеза не отвергалась, мы удаляли соответствующие переменные. Для проверки влияния экономических факторов на результаты голосования 2018 г мы в первую очередь оценили модель линейной регрессии методом наименьших квадратов (без учета пространственных эффектов).
Результаты оценки финальной спецификации МНК-модели для основного кандидата и К. Собчак представлены в таблице 7.
Далее мы провели тест (Diagnostic tests for spatial dependence in OLS regression) для оценки того, насколько пространственная модель окажется лучше обычной МНК-модели, при помощи пакета sg162 в STATA. Результаты представлены в таблице 8.
Согласно результатам, представленным в таблице 8, мы получили, что в модели необходимо учитывать пространственные эффекты. Как уже отмечалось, игнорирование пространственных эффектов может привести к проблеме смещения вследствие пропущенных переменных.
Далее в нашем исследовании мы будем использовать две классические пространственно-эконометрические модели: модель пространственного
лага (spatial lag model) и модель пространственной ошибки (spatial error model). Описание моделей было взято из статьи (Elhorst, 2010).
Таблица 7
Результаты спецификации МНК-модели
Table 7
The results of OLS model specification
Независимые Зависимые переменные
переменные Голосование за В. Путина Голосование за К. Собчак
Addedval_percap2017 -0,0000306 -0,0000116
(-0,0000612) (0,0000161)
Ownproduct_percap2017 -0,0000382 0,0000109*
(0,0000206) (0,0000052)
Wage17_16 0,2278458 -0,0477223
(0,129946) (0,0342347)
Un_17_16 0,0404057 0,0061618
(0,0479675) (0,0126369)
RoadtoMoscow -0,1025807* 0,0246718*
(0,0312531) (0,0082335)
HighVotes 0,0685209* -0,0165783
(0,0355438) (0,0093639)
Udmurtia -0,122257 0,0021556
(0,0214128) (0,0056411)
Bashkortostan -0,0140652 -0,0049238
(0,0276575) (0,0072863)
Orenburgskaya -0,0536647 0,0123892
(0,0319235) (0,0084101)
Samarskaya 0,0387699 0,0004356
(0,0350648) (0,0092377)
Ulyanovskaya 0,0029476 -0,0027053
(0,0247023) (0,0065078)
Chuvashia 0,0020397 0,0002739
(0,0447253) (0,0117827)
Mariyel -0,0265929 0,0016489
(0,0587026) (0,015465)
Kirovskaya -0,0033404 -0,0062203
(0,0248928) (0,0065579)
_cons 0,8968304*** 0,0226416***
(0,0193382) (0,0050946)
N 45 45
R2 0,65 0,535
R adjusted 0,488 0,318
Примечание. В скобках приведены стандартные ошибки: * p < 0,05, ** p < 0,01, *** p < 0,001.
Таблица 8
Результаты Diagnostic tests for spatial dep en dence in OL S regre ssion
Table 8
Diagnostic tests for spatialdependenceinOLS regression
Зав исимая переменная -голосеванренарсеовногокандидата
TPs t Statistic p-value
Spatial error:
Lagrange multiplier 6,221 0,012
Robust Lagrange multiplier 2,449 0,115
Spatial lag:
Lagrange multiplier 3,5 70 0,059
Robust Lagrang multiplier 0,0028 0,867
Зависимая перпм-нгоя -еорнрованре 3d К. Собчек
Tnrt Statistic p-value
Spatial error:
Lagrange multiplier 3/771 0,380
Robust Lagrange multiplier П,688
Spatial lag:
Lagrange multiplier 0,004 0,948
Robust Lagrange multiplier 2,921 0,087
Источник: расчеты авторов.
Модель пространственного лага гфедполагает,чтозавнснмая переменная, наблюдаемая нн анвоторой территории0 апгасвн яг даннойлеремтеной, наблюдаемой на соседеих территориях, амакжеотнаборанаблюдаемых локальных характеристик и представлена формулой 11:
У и о Р М:Н=1 Щ' У) -О- РцР + НН £ц , (И)
где N - число территорий (в нгшем случае их число равно числу муниципалитетов, то есть 45); г и] - некоторые террнторни из числа N; I - инд екс для измерения времени (периодов времен и); мл." - эл ементы матри цы средства для территорий г и ] (при это1 дпааннелрнееерлеменаымгврица1ег педотва равны нулю, то есть тн "е0);нй -набеюдепие переменнойпрп
некоторых г и хй-вектон-стрете незовлгимых п^-^е соопвет-
ствующий вектор нлгное эоэХфиниенгов; е ~ N(0, а2),вл.р., в тавмемякап А. обозначает фиксировфнные эффнкты.
В модели проатранственнгй отибфи,нфрнвеик,предполагееегя, чтотO) висимая переменная зависит он ^г^е^ое^^ нтТлюдаемых ноюмепыххареепф-ристик и что членефпшибне коррерированывгфндтранстае.Ндкдямодель представлена формулой 1Т:
Рн = сиР + Рт +
где <ри отражает пространственно-автокоррелированный член ошибки, а под X подразумевают пространственный коэффициент автокорреляции.
В наших расчетах зависимой переменной yit являются результаты голосования на президентских выборах 2018 г. в Республике Татарстан на уровне муниципалитетов (использовались результаты голосования за основного кандидата и главного оппозиционера на данных выборах - К. Собчак, для проверки робастности результатов), w.." - матрица соседства муниципалитетов, x.t - экономические показатели региона, использованные в финальной модели без пространственных эффектов.
Оценка параметров моделей были проведена методом максимального правдоподобия с помощью пакета spatreg в программе STATA.
Результаты расчетов моделей пространственного лага и пространственной ошибки представлены в таблице 9.
Исходя из результатов, представленных в таблице 9, можно сделать несколько выводов.
1. И в спецификации модели пространственного лага, и в спецификации модели пространственной ошибки параметры при факторах пространственных эффектов (rho, lambda) являются значимыми на 5% уровне значимости для основного кандидата. Для К. Собчак наблюдаем значимость только модели пространственной ошибки. Это означает, что в целом наши спецификации разумны и действительно существуют пространственные эффекты от результатов голосования в соседних муниципалитетах.
2. Для основного кандидата значимыми (на 5% уровне значимости) переменными являются:
• объем отгруженных товаров собственного производства, в тыс. руб. на душу населения за 2017 г.: чем больше товаров собственного производства отгружали в муниципалитете, тем меньше голосов отдавали за основного кандидата. Мы полагаем, это связано с тем, что товары собственного производства поставляют микропредприятия, поддержку которым программа основного кандидата не предполагает;
• разница в уровне средней заработной платы между 2017 и 2016 гг.: чем выше был рост заработной платы, тем больше голосов отдавали за основного кандидата.
Также мы наблюдаем значимые отличия в результатах голосования за основного кандидата между муниципалитетами, через которые проходит трасса Москва - Казань: в муниципалитетах, расположенных у трассы, наблюдался более низкий уровень поддержки основного кандидата. Мы предполагаем, что в данных муниципалитетах выше мобильность граждан, что делает их более восприимчивыми к оппозиционным движениям.
Таблица 9
Результаты спецификаций моделей пространственного лага (модели 1 и 3) и пространственной ошибки (модели 2 и 4)
Table 9
Spatial lag (Model 1, Model 3) and spatial error (Model 2, Model 4) model specifications results
Независимые переменные Модель 1 Модель 2 Модель 3 Модель 4
Зависимые переменные
Голосование за В. Путина Голосование за К. Собчак
Addedval_percap2017 -0,0000394 -0,0000266 0,0000117 0,0000148
(0,0000476) (0,0000351) (0,0000132) (0,0000116)
0wnproduct_percap2017 -0,0000431** -0,0000560*** 0,0000108* 0,0000160***
(0,0000161) (0,0000138) (0,00000454) (0,00000479)
Wage17_16 0,249* 0,237** 0,0478 0,0358
(0,101) (0,0849) (0,0280) (0,0279)
Un_17_16 -0,0503 -0,0228 0,00607 0,00885
(0,0375) (0,0305) (0,0104) (0,00956)
RoadtoMoscow -0,112*** _0 114*** 0,0246*** 0,0274***
(0,0246) (0,0156) (0,00684) (0,00554)
HighVotes 0,0706** 0,0707** -0,0165** -0,0191**
(0,0275) (0,0250) (0,00766) (0,00777)
Udmurtia -0,0147 -0,0324** 0,00208 0,00994*
(0,0166) (0,0107) (0,00476) (0,00415)
Bashkortostan -0,0164 -0,0240 0,00494 0,000937
(0,0214) (0,0171) (0,00595) (0,00584)
Orenburgskaya -0,0665** -0,0511** 0,0123 0,0118*
(0,0255) (0,0158) (0,00698) (0,00535)
Samarskaya 0,0381 0,0699** 0,000436 0,00495
(0,0272) (0,0226) (0,00754) (0,00739)
Ulyanovskaya 0,00853 -0,0175 0,00267 0,00134
(0,0193) (0,0178) (0,00535) (0,00638)
Chuvashia -0,00453 -0,0147 0,000147 0,00843
(0,0348) (0,0238) (0,00981) (0,00853)
Mariyel 0,0155 0,0252 0,00177 0,0140
(0,0458) (0,0364) (0,0128) (0,0144)
Kirovskaya -0,00381 -0,0197 0,00620 0,00477
(0,0193) (0,0133) (0,00537) (0,00456)
_cons 1,180*** 0 911*** 0,0224*** 0,0194***
(0,142) (0,0140) (0,00538) (0,00451)
rho -0,317* 0,0121
(0,159) (0,186)
sigma 0,0345*** 0,0258*** 0,00957*** 0,00849***
(0,00365) (0,00309) (0,00101) (0,00101)
lambda -1,102*** -0,799**
(0,174) (0,294)
N 45 45 45 45
Примечание. В скобках приведены стандартные ошибки: * p < 0,05, ** p < 0,01, *** p < 0,001. Источник: расчеты авторов.
Следует обратить особое внимание на значимые отличия в результатах голосования за основного кандидата между муниципалитетами, являющимися соседями Оренбургской области, и остальными муниципалитетами Татарстана: соседи Оренбургской области отдали меньше голосов за основного кандидата, чем жители остальных муниципалитетов Татарстана. В среднем в Оренбургской области за основного кандидата голосовали реже, чем в Татарстане (82% по региону Татарстан против 73% по Оренбургской области), что и объясняет значимость границы с Оренбургской областью.
3. Для голосования за Собчак мы получили обратный эффект для товаров собственного производства и для муниципалитетов вдоль трассы, что объясняется тем, что более мобильные граждане и частные предприниматели больше поддерживают оппозицию. Изменение зарплат не влияет на готовность голосовать за оппозицию.
Таким образом, наша гипотеза подтвердилась: факторы в соседних территориях Республики Татарстан влияют на результаты голосования за основного и оппозиционного кандидатов в них.
Для того чтобы оценить разницу неучета пространственных эффектов, сравним результаты оценивания МНК-модели и пространственных моделей (для основного кандидата): 1) в МНК-модели пропадает значимость коэффициента при переменной wage17_16 (разница в уровне средних заработных плат между 2017 и 2016 гг.); 2) в МНК-модели пропадает значимость коэффициента при переменной ownproduct_percap2017 (сколько товаров собственного производства отгружено, в тыс. руб. на душу населения, 2017 г.); 3) переменная RoadtoMoscow (дамми-переменная на ТИКи у трассы) уменьшает свою значимость в МНК-модели, знак такой же; 4) переменная HighVotes (дамми-переменная на ТИКи с % голосов более 96) уменьшает свою значимость в МНК-модели, знак такой же.
Согласно результатам (см. табл. 8, 9), можно утверждать, что игнорирование в модели пространственных эффектов, может привести к проблеме смещения оценок вследствие пропущенных переменных.
ВЫВОДЫ
Настоящим исследованием мы показали важность учета пространственных эффектов при анализе или рассмотрении какого-либо социального или экономического процесса, на примере результатов голосования на выборах Президента России в 2018 г. Нельзя недооценивать влияние различных факторов из соседних территорий друг на друга.
В результате нашей работы мы получили значимые пространственные взаимозависимости в голосовании между всеми территориальными избира-
тельными комиссиями в России и положительную пространственную автокорреляцию в данных, то есть в целом в стране проценты голосов за кандидатов в соседних населенных пунктах схожи. Мы объясняем это эффектом от «мнения большинства», представленного в работе (Coleman, 2018): в целом в стране избиратели из соседних территорий ориентируются друг на друга в принятии решений о голосовании за того или иного кандидата.
На основании локальных индексов LISA мы определили локальные территории-кластеры (где жители соседних территорий голосуют одинаково) и территории-выбросы (где жители соседних территорий голосуют отличным образом). Мы предполагаем, что выделенные территории-кластеры и территории-выбросы соответствуют политическим кампаниям во время выборов: например, в Москве и Санкт-Петербурге активно агитировалась поддержка К. Собчак перед выборами 2018 г. Южные регионы в основном дотационно зависят от действующей партии, что обуславливает активность действующих губернаторов, и, следовательно, это побуждает избирателей голосовать за основного кандидата. Дальний Восток включает в себя регионы с меньшей активностью действующей партии, поэтому избиратели там готовы голосовать за альтернативных основному кандидатов.
Нами также был проведен глубокий анализ региона - Республики Татарстан, где встречалось больше всего и территорий-кластеров, и территорий-выбросов: мы попытались установить, какие факторы обуславливают поддержку основного и оппозиционного кандидатов. В результате мы получили следующие зависимости: рост заработной платы увеличивает долю голосов за основного кандидата, а проживание на территории возле трассы Москва -Казань, а также соседство с Оренбургской областью отрицательно влияют на долю голосов за основного кандидата.
Таким образом, в данной работе мы подтвердили наши гипотезы о том, что, во-первых, существуют значимые пространственные эффекты от влияния предпочтений индивидов из соседних территориальных областей друг на друга, а также о том, что экономические результаты деятельности в предыдущей период кандидата, баллотирующегося на второй срок, оказывают влияние на готовность людей голосовать за него.
Поскольку нам удалось проанализировать только один регион, дальнейшая работа в этом направлении будет основана на анализе регионов всей России, учитывая пространственные эффекты, политические аспекты и экономические факторы.
БЛАГОДАРНОСТИ
Авторы выражают благодарность участникам и организаторам мероприятий, где была представлена работа: Workshop on Cross-Regional Studies
11.04.2019 (на базе НИУ ВШЭ); Russian Summer School on Institutional Analysis 2019 (июль 2019); Научно-исследовательский семинар Аспирантской школы по экономике НИУ ВШЭ 27.03.2020.
СПИСОК ЛИТЕРАТУРЫ
Исследователь из Стэнфорда считает, что фальсификаций на выборах президента России было очень мало. Как он это вычислил? // Meduza. 2018. 7 мая. URL: https:// meduza.io/featoe/2018/05/07/issledovatel-iz-stenforda-schitaet-chto-falsifikatsiy-na-vyborah-prezidenta-rossii-bylo-ochen-malo-kak-on-eto-vychislil (дата обращения: апрель 2020).
Статистика показывает: за Путина вброшено 10 миллионов бюллетеней // Радио «Свобода». 2018. 20 марта URL: https://www.svoboda.org/a/29111031.html (дата обращения: апрель 2020). Шень A. Выборы и статистика: казус Единой России (2009-2018). 2018. Июль. URL:
arXiv preprint arXiv:1204.0307 (дата обращения: апрель 2020). Anselin L. Local Indicators of Spatial Association-LISA // Geographical Analysis. 1995.
Vol. 27. No. 2. Pp. 93-115. https://doi.org/10.1111/j.1538-4632.1995.tb00338.x Burnett W., Lacombe D.J. Accounting for Spatial Autocorrelation in the 2004 Presidential Popular Vote: A Reassessment of the Evidence // The Review of Regional Studies. 2012. Vol. 42. Issue 1. Pp. 75-89. Clem R.S., Craumer P.R. Spatial Patterns of Political Choice in the Post-Yel'tsin Era: The Electoral Geography of Russia's 2000 Presidential Election // Post-Soviet Geography and Economics. 2000. Vol. 41. Issue 7. Pp. 465-482. https://doi.org/10.1080/1088938 8.2000.10641153
Clem R.S., Craumer P.R. The Geography of the Russian 1995 Parliamentary Election: Continuity, Change, and Correlates // Post-Soviet Geography. 1995a. Vol. 36. Issue 10. Pp. 587-616. https://doi.org/10.1080/10605851.1995.10641008 Clem R.S., Craumer P.R. The Politics of Russia's Regions: A Geographical Analysis of the Russian Election and Constitutional Plebiscite of December 1993 // Post-Soviet Geography. 1995b. Vol. 36. Issue 2. Pp. 67-86. https://doi.org/10.1080/10605851.199 5.10640980
Coleman S. Voting and Conformity: Russia, 1993-2016 // Mathematical Social Sciences.
2018. Vol. 94. Pp. 87-95. https://doi.org/10.1016/j.mathsocsci.2017.10.005 Cutts D., Webber D., Widdop P., Johnston R., Pattie C. With a Little Help from my Neighbours: A Spatial Analysis of the Impact of Local Campaigns at the 2010 British General Election // Electoral Studies. 2014. Vol. 34. Pp. 216-231. https://doi. org/10.1016/j.electstud.2013.12.001 Dow J.K. A Comparative Spatial Analysis of Majoritarian and Proportional Elections // Electoral Studies. 2001. Vol. 20. Issue 1. Pp. 109-125. https://doi.org/10.1016/S0261-3794(99)00041-4
Elhorst J.P. Spatial Panel Data Models // Handbook of Applied Spatial Analysis: Software Tools, Methods and Applications. Springer-Verlag Berlin Heidelberg, 2010. Pp. 377-407. Handbook of Applied Spatial Analysis: Software Tools, Methods and Applications / Edited by M.M. Fischer, A. Getis. Springer-Verlag Berlin Heidelberg, 2010. 812 p. https://doi. org/10.1007/978-3-642-03647-7 Jensen C.D., Lacombe D.J., McIntyre S.G. A Bayesian Spatial Econometric Analysis of the 2010 UK General Election // Papers in Regional Science. 2013. Vol. 92. Issue 3. Pp. 651-666. https://doi.org/10.1111/j.1435-5957.2012.00415.x
Kim J., Elliott E., Wang D. A Spatial Analysis of County-Level Outcomes in US Presidential Elections: 1988-2000 // Electoral Studies. 2003. Vol. 22. Issue 4. Pp. 741-761. https:// doi.org/10.1016/S0261-3794(02)00008-2 Kobak D., Shpilkin S., Pshenichnikov M. Statistical Fingerprints of Electoral Fraud? // Significance. 2016. Vol. 13. Issue 4. Pp. 20-23. https://doi.org/10.1111/j.1740-9713.2016.00936.x
Moraski B., Reisinger W.M. Spatial Contagion in Regional Machine Strength: Evidence from Voting in Russia's Federal Elections / APSA. Annual Meeting Paper. 2010. 48 p. Moraski B.J., Reisinger W.M. The Diffusion of Deference: Regional Machine Strength and Federal Election Results in Russia. 2014. 50 р. URL: https://pdfs.semanticscholar.org/0507/ fc78f18388c3f9c1be704b210f8e78f359e5.pdf (дата обращения: апрель 2020). Mur J., Angulo A., Lopez F. Looking for the Causes of Instability in Spatial Econometric Models: An Application to 2008 Spanish General Elections / International Regional Science Review. 2012. Vol. 35. Issue 3. Pp. 303-228. https://doi. org/10.1177/0160017611415265 O'Loughlin J., Shin M., Talbot P. Political Geographies and Cleavages in the Russian Parliamentary Elections // Post-Soviet Geography and Economics. 1996. Vol. 37. Issue 6. Pp. 355-385. https://doi.org/10.1080/10889388.1996.10641023 Poole K.T., Rosenthal H. US Presidential Elections 1968-80: A Spatial Analysis // American Journal of Political Science. 1984. Vol. 28. No. 2. Pp. 282-312. https://doi. org/10.2307/2110874
Sutter R.C. Spatial Econometric Modeling of Presidential Voting Outcomes. Doctoral Dissertation / University of Toledo. 2005. URL: https://www.semanticscholar.org/ paper/Spatial-Econometric-Modeling-of-Presidential-Voting-Sutter/215f5f7643627bb 1a50df9dcc1449665ad7c688d (дата обращения: апрель 2020).
REFERENCES
Anselin L. Local Indicators of Spatial Association-LISA. Geographical Analysis, 1995,
vol. 27, no. 2, pp. 93-115. https://doi.org/10.1111/j.1538-4632.1995.tb00338.x Burnett W., Lacombe D.J. Accounting for Spatial Autocorrelation in the 2004 Presidential Popular Vote: A Reassessment of the Evidence. The Review of Regional Studies, 2012, vol. 42, issue 1, pp. 75-89. Clem R.S., Craumer P.R. Spatial Patterns of Political Choice in the Post-Yel'tsin Era: The Electoral Geography of Russia's 2000 Presidential Election. Post-Soviet Geography and Economics, 2000, vol. 41, issue 7, pp. 465-482. https://doi.org/10.1080/10889388. 2000.10641153
Clem R.S., Craumer P.R. The Geography of the Russian 1995 Parliamentary Election: Continuity, Change, and Correlates. Post-Soviet Geography, 1995a, vol. 36, issue 10, pp. 587-616. https://doi.org/10.1080/10605851.1995.10641008 Clem R.S., Craumer P.R. The Politics of Russia's Regions: A Geographical Analysis of the Russian Election and Constitutional Plebiscite of December 1993. Post-Soviet Geography, 1995b, vol. 36, issue 2, pp. 67-86. https://doi.org/10.1080/10605851.1995.10640980 Coleman S. Voting and Conformity: Russia, 1993-2016. Mathematical Social Sciences,
2018, vol. 94, pp. 87-95. https://doi.org/10.1016/j.mathsocsci.2017.10.005 Cutts D., Webber D., Widdop P., Johnston R., Pattie C. With a Little Help from my Neighbours: A Spatial Analysis of the Impact of Local Campaigns at the 2010 British General Election. Electoral Studies, 2014, vol. 34, pp. 216-231. https://doi.org/10.1016/j.elect-stud.2013.12.001
Dow J.K. A Comparative Spatial Analysis of Majoritarian and Proportional Elections.
Electoral Studies, 2001, vol. 20, issue 1, pp. 109-125. https://doi.org/10.1016/S0261-3794(99)00041-4
Elhorst J.P. Spatial Panel Data Models. Handbook of Applied Spatial Analysis: Software Tools, Methods and Applications. Springer-Verlag Berlin Heidelberg, 2010, pp. 377407.
Handbook of Applied Spatial Analysis: Software Tools, Methods and Applications. Edited by M.M. Fischer, A. Getis. Springer-Verlag Berlin Heidelberg, 2010, 812 p. https://doi. org/10.1007/978-3-642-03647-7
Jensen C.D., Lacombe D.J., McIntyre S.G. A Bayesian Spatial Econometric Analysis of the 2010 UK General Election. Papers in Regional Science, 2013, vol. 92, issue 3, pp. 651-666. https://doi.org/10.1111/j.1435-5957.2012.00415.x
Kim J., Elliott E., Wang D. A Spatial Analysis of County-Level Outcomes in US Presidential Elections: 1988-2000. Electoral Studies, 2003, vol. 22, issue 4, pp. 741-761. https://doi.org/10.1016/S0261-3794(02)00008-2
Kobak D., Shpilkin S., Pshenichnikov M. Statistical Fingerprints of Electoral Fraud? Significance, 2016, vol. 13, issue 4, pp. 20-23. https://doi.org/10.1111/j.1740-9713.2016.00936.x
Moraski B., Reisinger W.M. Spatial Contagion in Regional Machine Strength: Evidence from Voting in Russia's Federal Elections. APSA. Annual Meeting Paper, 2010, 48 p.
Moraski B.J., Reisinger W.M. The Diffusion of Deference: Regional Machine Strength and Federal Election Results in Russia, 2014, 50 р. Available at: https://pdfs.semanticschol-ar.org/0507/fc78f18388c3f9c1be704b210f8e78f359e5.pdf (accessed April 2020).
Mur J., Angulo A., Lopez F. Looking for the Causes oflnstability in Spatial Econometric Models: An Application to 2008 Spanish General Elections. International Regional Science Review, 2012, vol. 35, issue 3, pp. 303-228. https://doi.org/10.1177/0160017611415265
O'Loughlin J., Shin M., Talbot P. Political Geographies and Cleavages in the Russian Parliamentary Elections. Post-Soviet Geography and Economics, 1996, vol. 37, issue 6, pp. 355-385. https://doi.org/10.1080/10889388.1996.10641023
Poole K.T., Rosenthal H. US Presidential Elections 1968-80: A Spatial Analysis. American Journal of Political Science, 1984, vol. 28, no. 2, pp. 282-312. https://doi. org/10.2307/2110874
Shen A. Elections and Statistics: The Case of 'United Russia', 2009-2018, 2018, July. Available at: https://arxiv.org/pdf/1204.0307.pdf (accessed April 2020). (In Russian).
Stanford Researcher Believes that there was Very Little Falsifications in the Russian Presidential Election. How did He Figure it out? Meduza [Medusa], 2018, 7 May. Available at: https://meduza.io/feature/2018/05/07/issledovatel-iz-stenforda-schitaet-chto-falsi-fikatsiy-na-vyborah-prezidenta-rossii-bylo-ochen-malo-kak-on-eto-vychislil (accessed April 2020). (In Russian).
Statistics Shows that 10 Million Ballots were Stuff for Putin. Radio 'Svoboda' [Radio 'Liberty'], 2018, 20 March. Available at: https://www.svoboda.org/a/29111031.html (accessed April 2020). (In Russian).
Sutter R.C. Spatial Econometric Modeling of Presidential Voting Outcomes. Doctoral Dissertation. University of Toledo, 2005. Available at: https://www.semanticscholar.org/ paper/Spatial-Econometric-Modeling-of-Presidential-Voting-Sutter/215f5f7643627bb 1a50df9dcc1449665ad7c688d (accessed April 2020).
Поступила в редакцию / Submitted: 15.04.2020 Принята к публикации / Revised: 22.05.2020 Опубликована online / Published online: 30.06.2020