Зернова Ю.А., Петрунин Ю.Ю. Прогнозирование президентских выборов во Франции 2007 г.
Существует несколько различных подходов к прогнозированию результатов политических выборов. Первый - самый распространенный - можно назвать опросным. При этом используется как метод опроса электората, так и различные методы извлечения оценок экспертов1. Примерами использования таких методов являются аналитические заключения избирательных комиссий, а также других аналитических институтов, таких как ВЦИОМ2 и ФОМ3. Однако все чаще исследователи ставят под сомнение точность таких прогнозов. Экспертные оценки в силу ряда причин, прежде всего - их субъективности, порой не дают адекватной картины, надежность экспертизы далеко не всегда оправдывает ожидания исследователей, чем этот вид прогноза и вызывает скептическое, даже критичное отношение многих ученых4. Второй подход к прогнозированию исхода политических выборов можно назвать математическим. Чаще всего при этом используются как простые индексные модели5, так и более сложные методы регрессионного анализа и временных рядов6. Математические модели более прозрачны и показывают причинно-следственные связи между политикой, экономикой, демографией, социальной сферой. В этом их несомненное преимущество. К их недостаткам следует отнести сложность выявления глубоких неочевидных закономерностей, объясняемую ограничениями традиционного
статистического анализа.
Третий подход - стремительно становящийся одним из самых популярных - базируется на предсказании выборов на основе биографии претендентов7. Наконец, в прогнозировании
1 Antonakis J. & Dalgas O. Predicting Elections: Child's Play! // Science. 323. 1183. 2009; Fair R.C. Predicting Presidential Elections and Other Things. Stanford University, 2002; Jones R.J., Armstrong J.S., Cuzan A.G. Forecasting Elections Using Expert Surveys: An Application to the U. S. Presidential Election // Prepared for presentation at the annual meeting of the American Political Science Association. Chicago. August 30 - September 2, 2007; Ослон А.А. Выборы-2003: предвыборные опросы и прогнозы на фоне исхода выборов. Работа над ошибками (точный прогноз с двумя большими неточностями) // Социология власти. № 1. 2004. С. 25-38.
2 http ://wciom.ru/novosti/v-centre-vnimanij a/publikacij a/single/8424.html
3 http://bd/fom/report/cat/prognoz261107
4Armstrong J.S. The Seer-Sucker Theory: The Value of Experts in Forecasting // Technology Review. June/July. 1980. Р. 16-24.
5 Fair R.C. Predicting Presidential Elections and Other Things. Stanford, CA: Stanford University Press, 2001.
6 Петрунин Ю.Ю., Зернова Ю.А. Статистические и нейросетевые методы исследования политической ситуации во Франции на примере региональных выборов 1998 и 2004 годов // Государственное управление. Электронный вестник. Выпуск 14. Март 2008. http://e-journal.spa.msu.ru/14_2008Petrunin_Zernova.html; Nadeaua R., Lewis-Beckb M.S., ' B'elangerc E. Electoral forecasting in France: A multi-equation solution // International Journal of Forecasting. № 26. 2010. Р. 11-18; Arzheimer K., Evans J. Bread and butter 'a la frangaise: Multiparty forecasts of the French legislative vote (1981-2007) // International Journal of Forecasting. № 26. 2010. Р. 19-31; Lemennicier B., Katir-Lescieux H. Testing the accuracy of the Downs’ spatial voter model on forecasting the winners of the French parliamentary elections in May-June 2007 // International Journal of Forecasting. № 26. 2010. Р. 32-41.
7 Armstrong J. S. & Graefe A. Predicting elections from biographical information about candidates // MPRA working paper, Presented at the Symposium on Leadership and Individual Differences. Lausanne. November 2009; Armstrong J.S., Green K.C., Jones, R.J. & WrightM. Predicting elections from politicians’ faces // Available at http://mpra.ub.uni-muenchen.de/9150/. 2009; McCann S.J. Alternative formulas to predict the greatness of U.S. presidents: Personological, situational, and Zeitgeist factors // Journal of Personality and Social Psychology. № 62. 1992. P. 469479; Simonton D.K. Presidential greatness and performance: Can we predict leadership in the White House? // Journal of Personality. № 49. 1981. Р. 306-322; Simonton D.K. Presidential IQ, Openness, Intellectual Brilliance, and Leadership: Estimates and Correlations for 42 U.S. Chief Executives // Political Psychology. № 27. 2006. Р. 511-526; Armstrong J.S., Graefe A. Predicting Elections from Biographical Information about Candidates // MPRA working paper, Presented at the Symposium on Leadership and Individual Differences. Lausanne. November 2009.
выборов встречаются комбинированные модели, подобные методу исследовательской группы Армстронга, базирующемуся на сочетании разнообразных опроса избирателей, метода Дельфи и различных количественных методов, таких как регрессионный анализ8. Такой комплексный подход дает возможность значительно повысить надежность прогноза.
В данной работе развивается метод прогнозирования на основе регрессионного анализа, который дополняется более мощными методами поиска логических закономерностей (правил) и нейронных сетей. В результате модель включает в себя большее количество связанных переменных и имеет лучшую предсказательную силу.
В работе за основу принимается гипотеза о том, что во время выборов на политическом рынке встречается «предложение» в виде политических взглядов, программ кандидатов и «спрос» в виде предпочтений и потребностей избирателей. Таким образом, фактически проводится аналогия с конкурентным механизмом рынка в экономике, рассуждая, что избиратели голосуют, прежде всего, за программу кандидата. Таким образом, возможно, несколько обесценивается личность самого кандидата, рассматриваемая лишь как носитель определенных политических взглядов. Разумеется, у данного подхода имеется значительный изъян: он не учитывает человеческий фактор и априори рассматривает выбор избирателя как рациональный акт. Тем не менее, такое допущение позволяет оперировать в анализе электорального поведения экономическими, демографическими и другими измеряемыми величинами. Исходные данные для модели взяты по результатам президентских выборов
2007 года во Франции.
Описание данных. Для начала обозначим набор переменных, с которыми нам предстоит работать. Поскольку кандидатов много и большая часть из них набрали незначительный процент, мы возьмем только основных претендентов на президентское кресло. Безусловно, это будут Саркози и Руаяль, вышедшие во второй тур, а также Ле Пен и Байру, набравшие от 10% голосов. Таким образом, мы получаем 4 переменные, изменение которых мы желаем систематизировать и предсказать, выражаясь языком статистики, -зависимые переменные. Данные об итогах выборов взяты с французского портала, посвященного президентским выборам9.
Что же касается независимых переменных, то есть факторов, чье влияние предопределяет в той или иной мере, исход выборов, мы перечислим их и дадим краткую характеристику. Для каждого из 26 регионов мы отобрали ряд показателей, по которым и будет производиться анализ. Здесь возникает одна проблема. Как бывшая колониальная держава, Франция до сих пор имеет в своем составе 4 весьма отдаленных региона: Мартинику, Гвиану, Реюньон и Гваделупу. Традиционно, для этих областей, в виду их географической удаленности и других отличий от континентальной части Франции, все исследования проводятся отдельно. С другой стороны, как граждане Франции, жители этих провинций принимали участие в выборах и внесли свой вклад в общий результат. Причем, что примечательно, в 2 из 4 удаленных регионов победу одержала Руаяль. Теперь встает вопрос: включать ли их в исследование, или сосредоточиться на континентальной части Франции? В силу резких различий в экономике, инфраструктуре, культуре, менталитете и т.д., по всем проанализированным переменным, эти 4 региона являются выбросами и размывают общие закономерности. Также они провоцируют ложные корреляции, которые исчезают при удалении этих территорий из выборки. И, наконец, не вся статистика по ним доступна в том же объеме, что для материковой части Франции. Таким образом, предварительно включив Мартинику, Реюньон, Гвиану и Гваделупу в исследование, мы
8 Jones R.J., Armstrong J.S., Cuzan A.G. Combining Methods to Forecast the 2008 Presidential Election: The Pollyvote // Foresight. № 12. 2008. Р. 41-42.
9 http://www.electionpresidentielle.com/
пришли к выводу, что эти регионы необходимо рассматривать отдельно, и в дальнейшем мы будем опираться на данные по основным 22 континентальным регионам.
Итак, перечислим независимые переменные.
1) Процент населения региона, занятый в сельском хозяйстве, производстве, строительстве и сфере услуг. Эти переменные важны нам, поскольку отражают инфраструктуру региона и основные сферы деятельности населения. Естественно, в зависимости от того, является ли регион промышленным или аграрным, будут различаться ценности и интересы, свойственные его жителям. Данные по инфраструктуре взяты с сайта Национального института статистики и экономических исследований ШБЕЕ10.
2) Переменная «вероятность ограбления» в качестве показателя уровня криминализации региона. Мы подсчитали по статистике ограблений, опираясь на количество ограблений и численность населения, показатель, смысл которого можно резюмировать как «насколько вероятно, что именно вас сегодня ограбят», по каждому региону, и приняли это за критерий девиантности. Данные по преступности взяты с национального портала, посвященного преступности министерства внутренних дел Франции11.
3) Переменная «Рожденные за границей». Нужно заметить, что особое значение приобретает национальный фактор. Франция давно столкнулась с проблемой иммигрантов, и это всегда сказывалось на политическом климате в стране. Конечно, когда мы говорим о «проблемной» эмиграции, мы подразумеваем массовую эмиграцию в страну жителей арабских стран. У многих французов арабы вызывают опасения за счет своего агрессивного поведения, низкой образованности и своеобразного отношения ко всему, что не принадлежит к исламскому миру. Именно в связи с этими особенностями своего менталитета жители так называемого Магриба практически не ассимилируются во французское общество. Даже в России несколько лет назад мы наблюдали в новостях конфликт на национальной почве, разразившийся во Франции. В силу наличия большого количества выходцев из Магриба, во Франции только усиливается ксенофобия, и набирают силу крайние правые движения, которые обещают, придя к власти, разрешить эту проблему быстро и жестко. Данные по национальному составу взяты с официального сайта переписи населения Франции12.
Разумеется, взятая нами переменная не отражает в полной мере количество именно арабов в регионе, ведь многие из них родились уже во Франции и имеют соответствующее гражданство. К тому же факт рождения не во Франции не означает принадлежность к мусульманским странам. С другой стороны, данных по этому вопросу найти не удается, поскольку составление статистики по религиозному и этническому составу населения во Франции считается неполиткорректным, а неполиткорректное для французов - это настоящее табу.
4) Переменная «Средняя заработная плата» - классический показатель,
характеризующий разницу уровня жизни по регионам. Здесь и далее данные взяты с сайта Национального института статистики и экономических исследований ШБЕЕ13.
5) Далее следуют 3 переменные, отражающие процент населения, принадлежащий к возрастной группе 20-39, 40-59, 60 и старше. Эти показатели позволят нам выяснить, влияет ли возрастная структура на политические взгляды. В случае с Россией, например, такая зависимость присутствует, или присутствовала, когда население пенсионного возраста постоянно голосовало за коммунистов.
6) Переменные, отражающие количество неженатых/незамужних и разведенных.
7) Переменная «Без диплома о высшем образовании»
10 http://inflation.free.fr/
11 http://www.obs-delasecurite.com
12 http://www.recensement.insee.fr
13 http://www.insee.fr
8) «Уровень экономической активности», «Уровень безработицы»
9) Переменная, показывающая количество семей, проживающих на съемных квартирах, не менявших место жительства на протяжении последних 5 лет, а также среднее количество людей в семье.
Итак, мы перечислили факторы, которые, возможно, отразились на политических взглядах населения. Теперь нам предстоит проверить, существует ли между ними связь, а также исследовать каждую переменную в отдельности.
Дескриптивная статистика, корреляция и регрессия
По данным нашего предыдущего исследования, бравшего за основу результаты региональных выборов 1998 и 2004 гг.14, мы помним, что показатели левых, львиную долю которых составляют социалисты, были не слишком благоприятными из-за большой отрицательной асимметрии, которая указывала на предпосылки к ослаблению левого крыла. Причиной такому ослаблению послужила разобщенность в рядах социалистов. На тот момент внутри партии стали формироваться неформальные блоки со своими лидерами в силу отсутствия общей программы и общего лидера. В это же время от социалистической партии стали отделяться мелкие группировки, образовывая новые партии. Такая внутренняя нестабильность могла обернуться потерей голосов, но, к счастью для социалистов, с выходом на политическую арену Сеголен Руаяль ситуация изменилась в лучшую сторону, и за короткий срок партия смогла объединиться, мобилизоваться и выйти на президентские выборы «в полной красе».
Показателям социалистов в 2007 году можно позавидовать: исчезла асимметрия, стандартное отклонение невелико: всего 3.4%, среднее составляет чуть меньше 25%15.
Что касается Саркози, его показатели также неплохи: 3% отклонение, высокое среднее, составившее приблизительно 35%.
В отличие от результатов Руаяль, здесь мы видим некоторую правую асимметрию, составляющую 0.77, отраженную неравномерностью распределения на графике. В данном случае показатель не очень велик, и, к тому же, такая асимметрия только на руку кандидату, поскольку свидетельствует о том, что процент голосов имеет потенциал к росту, которым можно воспользоваться на следующих выборах.
Теперь перейдем к результатам Байру и Ле Пена. У первого при среднем в 18.2 % отклонение составляет всего 2%, при этом ни асимметрия, ни эксцесс не превышают нормы, распределение близко к нормальному, проще говоря, стабильный результат. Что же касается Ле Пена, здесь ситуация немного иная. При среднем в 11.5%, отклонении 3% и отсутствии асимметрии, чрезвычайно велик эксцесс: -1.6, а это говорит о том, что, хотя в целом результат достаточно неплохой, но величине стандартного отклонения мы доверять не можем, что вносит элемент неопределенности в результаты кандидата и партии.
14 Петрунин Ю.Ю., Зернова Ю.А. Статистические и нейросетевые методы исследования политической ситуации во Франции на примере региональных выборов 1998 и 2004 годов // Государственное управление. Электронный вестник. Выпуск 14. Март 2008. http://e-joumal.spa.msu.ru/14_2008Petrunin_Zemova.html
15 Все статистические вычисления и графики осуществлены в программе Statistica.
Histogram: Le реп
S 7 8 9 10 11 12 13 14 1Б 16
Рис. 1. Распределение процента голосов за Ле Пена по регионам Франции
И действительно, график, иллюстрирующий показатели Ле Пена выглядит очень странно: в нем наметились 2 вершины, а значит, и два средних значения (рис. 1). Получается, что все регионы разделились на 2 категории: в первой за кандидата отдают 13-14% голосов, а во второй - только 7-9%. Безусловно, партии следовало бы выяснить, что стало причиной такого расслоения электората. Существует скорее философская, нежели математическая аксиома: все в мире стремится к нормальному распределению. Если верить этому утверждению, то и результаты Национального Фронта будут к нему стремиться, а значит на лицо 2 альтернативы: либо показатели сгруппируются вокруг математического среднего, либо вокруг одного из фактических средних. В интересах партии работать над тем, чтобы группировка произошла вокруг правого среднего, для чего понадобится «дотянуть» часть электората до более высоких показателей, и ни в коем случае не допускать группировки вокруг меньшего среднего, которая возможна в результате потери части голосов.
Говоря об инфраструктуре, прежде всего, следует отметить, что для переменной «% населения, занятой в сельском хозяйстве» величина эксцесса составляет -1, и при взгляде на график, можно обнаружить ситуацию, подобную переменной Ле Пен. Здесь при среднем арифметическом в 5,4 и отклонении 2,3, выкристаллизовываются 2 вершины, одна на отметке 2-3, вторая - на отметке 6-8. Что касается занятых в производстве, здесь существенна асимметрия: -0.94, при этом значения медианы и среднего арифметического ощутимо различаются, составляя 21.5 и 19.5, соответственно. График показывает правый сдвиг самого популярного значения, которое составляет 20-25. Для сферы строительства велика асимметрия (1.1) и эксцесс (5.6). Таким образом, мы не можем доверять ни величине среднего, ни стандартному отклонению. В сфере услуг похожая ситуация с положительной асимметрией, которая составляет 1.2.
2 з
О -■---------------------------------
-1 01 23456739
Рис. 2. Распределение процента населения, занятого в сельском хозяйстве, по регионам Франции
На практике эти цифры означают, что инфраструктура по регионам Франции на данный момент, по-видимому, находится в состоянии изменения и нестабильности. Налицо тенденция к расширению сферы услуг и строительства, а также к снижению доли производственного сектора. При этом аграрный сектор, очевидно, находится «на распутье» и в ближайшие годы, в зависимости от политики в этой сфере, сформируется один центр и выделится доминирующее значение.
Также тенденция к росту, возможно, намечается в отношении вероятности ограбления. Существенная правая асимметрия свидетельствует о скосе графика в сторону увеличения. Возможно, если государство не примет меры к предотвращению роста преступности, эта тенденция реализуется, и среднее сместится вправо, тем самым указывая на рост количества ограблений.
Ехрей&й Ногппа!
3 4 5 6 7 0 9
Рис. 3. Распределение вероятности ограбления по регионам Франции
Интересная ситуация складывается с заработной платой. В 21 регионе она варьируется в пределах 18-21 тыс. Евро, и только в одном составляет 28-30 тыс. На графике возникает существенный разрыв. В данном случае нельзя сказать, что большая асимметрия означает положительную тенденцию. Как правило, это нормальное явление для большинства стран, когда в столице зарплаты выше, чем в других регионах.
Другая тенденция к увеличению, возможно, наметилась для переменной неженатые/незамужние. Следует понимать, что здесь нам важно не столько фактическое семейное положение, сколько образ жизни и ценности, которые свойственны населению. Близится к значительному и показатель асимметрии переменной Разведенные, что наглядно подтверждается графиком.
Expect&d Normal
Б.О 5,5 6J0 6,5 7,0 7,5 8J0 8,5 9,0
Рис. 4. Распределения процента разведенных по регионам Франции
Что касается экономической активности населения, то коэффициент распределен с негативным скосом. В условиях положительной асимметрии переменной Уровень безработицы, эти цифры представляют тревожный сигнал, свидетельствующий о том, что необходимо менять государственную политику в сфере занятости.
Рассмотрев по отдельности выбранные нами переменные, мы можем переходить к поиску зависимостей между ними. Поскольку, как было показано выше, распределение не всех переменных близко к нормальному кроме линейной корреляции Пирсона для этих целей использовалась и корреляция Спирмена (табл. 1 и 2).
Табл.1. Корреляции между переменными
Variable Correlations (Выборы Франция 2007) Marked correlations are significant at p < ,05000 N=22 (Casewise deletion of missing data)
Аграрный сектор оизводственный сектор оительн сектор Сфера услуг Вероятность ограбления Средняя з\п Население 20-39 лет Население 40-59 лет Население 60 и старше Холостяки ’азведенные Рожденные за границей
Аграрный сектор 1,00 -0,08 0,37 -0,40 -0,54 -0,67 -0,79 0,52 0,75 -0,55 -0,11 -0,53
Производственный сектс -0,08 1,00 -0,45 -0,88 -0,34 -0,19 0,18 0,03 -0,41 -0,27 -0,69 -0,64
Строительный сектор 0,37 -0,45 1,00 0,15 -0,22 -0,53 -0,56 0,34 0,61 -0,40 0,20 0,01
Сфера услуг -0,40 -0,88 0,15 1,00 0,59 0,54 0,24 -0,30 -0,00 0,56 0,69 0,85
Вероятность ограбления -0,54 -0,34 -0,22 0,59 1,00 0,49 0,37 -0,55 -0,30 0,33 0,55 0,67
Средняя з\п -0,67 -0,19 -0,53 0,54 0,49 1,00 0,80 -0,41 -0,58 0,87 0,18 0,65
Население 20-39 лет -0,79 0,18 -0,56 0,24 0,37 0,80 1,00 -0,56 -0,92 0,78 -0,17 0,38
Население 40-59 лет 0,52 0,03 0,34 -0,30 -0,55 -0,41 -0,56 1,00 0,55 -0,44 0,04 -0,25
Население 60 и старше 0,75 -0,41 0,61 -0,00 -0,30 -0,58 -0,92 0,55 1,00 -0,61 0,33 -0,1'
Холостяки -0,55 -0,27 -0,40 0,56 0,33 0,87 0,78 -0,44 -0,61 1,00 0,09 0,54
Разведенные -0,11 -0,69 0,20 0,69 0,55 0,18 -0,17 0,04 0,33 0,09 1,00 0,76
Рожденные за границей -0,53 -0,64 0,01 0,85 0,67 0,65 0,38 -0,25 -0,11 0,54 0,76 1,0С
Не переезжали последни 0,01 0,20 0,20 -0,22 -0,40 -0,36 -0,17 0,52 0,07 -0,29 -0,27 -0,3(
Без диплома о ВО -0,22 -0,10 0,27 0,15 0,07 -0,15 0,02 0,14 -0,20 -0,02 0,16 0,08
Индекс экономической а1 -0,08 0,56 -0,51 -0,44 -0,05 0,41 0,39 -0,01 -0,35 0,17 -0,43 -0,16
Индекс безработицы -0,29 -0,46 0,01 0,57 0,46 0,04 0,10 -0,35 -0,17 0,17 0,50 0,38
Кол-во человек в д\х -0,60 0,20 -0,10 0,08 0,20 0,13 0,52 -0,31 -0,70 0,29 -0,17 0,02
Снимают жилье -0,71 -0,15 -0,39 0,50 0,51 0,79 0,72 -0,46 -0,64 0,74 0,24 0,58
Имеют мин. 1 личный ав 0,68 0,26 0,53 -0,61 -0,46 -0,85 -0,69 0,39 0,56 -0,80 -0,19 -0,58
Давность владения недв 0,39 0,52 0,04 -0,67 -0,62 -0,56 -0,30 0,51 0,24 -0,56 -0,43 -0,57
Руаяль 0,45 -0,21 -0,09 0,02 -0,29 0,04 -0,23 0,06 0,37 0,10 -0,05 -0,18
Саркози -0,52 -0,28 0,18 0,47 0,53 0,34 0,29 -0,15 -0,22 0,23 0,42 0,64
Байру 0,12 0,33 -0,22 -0,34 -0,16 0,19 0,20 -0,06 -0,12 0,05 -0,45 -0,22
Ле Пен -0,36 0,04 0,07 0,10 0,22 -0,20 0,05 0,04 -0,21 -0,13 0,29 0,20
Табл. 2. (Продолжение) Корреляции между переменными
Variable Correlations (Выборы Франция 2007) Marked correlations are significant at p < ,05000 N=22 (Casewise deletion of missing data)
Не !реезжал1 оследние 5 лет Без диплома о ВО Индекс номическо ктивности Индекс езработицы Кол-во человек в д\х Снимают жилье Имеют мин. 1 личный втомобиль на д\х Давность владения недвиж. Имуществом Руаяль Саркози Байру Ле Пен
Аграрный сектор 0,01 -0,22 -0,08 -0,29 -0,60 -0,71 0,68 0,39 0,45 -0,52 0,12 -0,36
Производственный сектор 0,20 -0,10 0,56 -0,46 0,20 -0,15 0,26 0,52 -0,21 -0,28 0,33 0,04
Строительный сектор 0,20 0,27 -0,51 0,01 -0,10 -0,39 0,53 0,04 -0,09 0,18 -0,22 0,07
Сфера услуг -0,22 0,15 -0,44 0,57 0,08 0,50 -0,61 -0,67 0,02 0,47 -0,34 0,10
Вероятность ограбления -0,40 0,07 -0,05 0,46 0,20 0,51 -0,46 -0,62 -0,29 0,53 -0,16 0,22
Средняя з\п -0,36 -0,15 0,41 0,04 0,13 0,79 -0,85 -0,56 0,04 0,34 0,19 -0,20
Население 20-39 лет -0,17 0,02 0,39 0,10 0,52 0,72 -0,69 -0,30 -0,23 0,29 0,20 0,05
Население 40-59 лет 0,52 0,14 -0,01 -0,35 -0,31 -0,46 0,39 0,51 0,06 -0,15 -0,06 0,04
Население 60 и старше 0,07 -0,20 -0,35 -0,17 -0,70 -0,64 0,56 0,24 0,37 -0,22 -0,12 -0,21
Холостяки -0,29 -0,02 0,17 0,17 0,29 0,74 -0,80 -0,56 0,10 0,23 0,05 -0,13
Разведенные -0,27 0,16 -0,43 0,50 -0,17 0,24 -0,19 -0,43 -0,05 0,42 -0,45 0,29
Рожденные за границей -0,30 0,08 -0,16 0,38 0,02 0,58 -0,58 -0,57 -0,18 0,64 -0,22 0,20
Не переезжали последние 5 1,00 0,47 -0,31 -0,02 0,40 -0,26 0,05 0,56 -0,32 0,07 -0,42 0,47
Без диплома о ВО 0,47 1,00 -0,46 0,54 0,70 0,26 -0,12 -0,09 -0,64 0,50 -0,71 0,79
Индекс экономической актиЕ -0,31 -0,46 1,00 -0,72 -0,19 0,14 -0,02 0,06 0,11 -0,13 0,74 -0,54
Индекс безработицы -0,02 0,54 -0,72 1,00 0,44 0,32 -0,38 -0,37 -0,24 0,24 -0,68 0,62
Кол-во человек в д\х 0,40 0,70 -0,19 0,44 1,00 0,40 -0,32 -0,14 -0,63 0,42 -0,41 0,62
Снимают жилье -0,26 0,26 0,14 0,32 0,40 1,00 -0,81 -0,57 -0,36 0,57 -0,07 0,18
Имеют мин. 1 личный автом о 0,05 -0,12 -0,02 -0,38 -0,32 -0,81 1,00 0,48 0,08 -0,35 0,19 -0,13
Давность владения недвиж. 0,56 -0,09 0,06 -0,37 -0,14 -0,57 0,48 1,00 0,07 -0,43 0,07 0,08
Руаяль -0,32 -0,64 0,11 -0,24 -0,63 -0,36 0,08 0,07 1,00 -0,77 0,26 -0,72
Саркози 0,07 0,50 -0,13 0,24 0,42 0,57 -0,35 -0,43 -0,77 1,00 -0,31 0,49
Байру -0,42 -0,71 0,74 -0,68 -0,41 -0,07 0,19 0,07 0,26 -0,31 1,00 -0,75
Корреляция демонстрирует, что по мере возрастания доли аграрного сектора в регионах снижается вероятность ограбления, то есть уровень преступности, средняя заработная плата, количество иммигрантов, а также падают показатели количества молодежи и незамужних (неженатых). Похожим образом, чем больше в регионе фермеров, тем меньше количество человек в домохозяйстве, тем меньше сдается и снимается жилья. Вместе с этой переменной растет количество людей среднего и пожилого возраста, а также процент голосов, отданных за Сеголен Руаяль. При этом количество сторонников Саркози снижается.
Проще говоря, мы наблюдаем картину постепенного вымирания французской деревни. Стимулов развития здесь нет, как нет и особого финансирования, оплата труда не высока, и не привлекает молодежь, которая бежит в другие регионы в погоне за перспективами. На фоне такого постепенного затухания, деревня не привлекает иммигрантов, которые ищут быстрых заработков, что автоматически снижает угрозу конфликтов, а также уровень бытовых ограблений. Жизнь здесь как бы законсервирована: притока людей нет, работают и живут здесь в основном пожилые фермеры. Такая картина свидетельствует о необходимости государственного финансирования и других форм поддержки фермерства, в противном случае, с каждым годом все больше сельскохозяйственной продукции Франции придется закупать за границей.
Что касается производственного сектора, по мере его роста сильно уменьшается сфера услуг, количество разводов и численность приезжих, а также, что немаловажно, на фоне роста занятости, снижается количество безработных. По мере повышения доли строительства в инфраструктуре региона, снижается количество молодежи и уровень заработной платы, падает занятость. Что касается сферы услуг, по мере ее увеличения, растет вероятность ограбления, заработная плата, количество холостяков, количество разведенных и доля приезжего населения. При этом падает уровень занятости и увеличивается безработица, увеличивается количество съемного жилья. Получается, что при условии бурного роста в этой сфере, именно сюда направлен приток кадров из других отраслей, которые стремятся к новым перспективам и высокой оплате труда, сюда же стремятся и иммигранты, которые, получая гражданство, уходят с работы и живут на пособие. Второй фактор, определяющий увеличение безработицы заключается в том, что сфера услуг и так уже слишком «раздута», и близится тот момент, когда этот рынок станет перенасыщенным,
а, следовательно, такого притока финансовых ресурсов здесь больше не будет. Возможно, отдельные ниши здесь уже перенасыщены, и те, кто приехал сюда в погоне за легкими деньгами, не могут найти себе работу.
Что касается переменной Вероятность Ограбления, то она растет в тех регионах, где много приезжих, высокие доходы, высокая безработица, и люди не имеют в собственности жилья и транспортных средств.
Средняя зарплата выше в тех регионах, где много молодежи, не имеющей еще ни семьи, ни какого-либо состояния за душой. Как уже предполагалось, богатые регионы притягивают молодых и амбициозных, которые не хотят работать на ферме у родителей или оставаться в родном городе, где не видят перспектив богатства и роста.
Поразительно мало зависимостей выявилось с переменной «Без Диплома о Высшем Образовании». Получается, что чем выше процент необразованных, тем ниже занятость и выше безработица, а также больше количество человек, живущих под одной крышей. Зато выяснилось, что люди без образования не отдают свои голоса за Руаяль и Байру, а предпочитают Саркози и Ле Пена.
Кстати, обратим внимание, что корреляций с результатами кандидатов сравнительно немного. Особенно здесь выделяется Руаяль: известно лишь, что за нее голосуют аграрии, не голосуют не имеющие диплома и семьи с большим количеством детей. Создается впечатление, что мы взяли переменные, не оказывающие влияния на результаты
голосования. Однако почему-то для других кандидатов хоть какие-то закономерности прослеживаются. За Саркози в сельскохозяйственных регионах голосуют мало, также процент голосов отданных за него падает по мере увеличения срока владения недвижимым имуществом. Напротив, тем больше сторонников Саркози, чем больше сфера услуг, чем выше вероятность ограбления, доля приезжих и людей без высшего образования. Как мы определили ранее, такие регионы привлекают инвестиции, которые, в свою очередь, служат приманкой для молодежи, стремящейся сделать карьеру. Получается, что в таких условиях возрастает процент Саркози, иными словами, его контингент - заинтересованные в увеличении дохода налогоплательщики, которые тянут на себе все возможные категории льготников. Также следует ответить, что результаты Саркози и Руаяль противоположны: там, где один набирает много, там другой не дотягивает до среднего. Наоборот ситуация обстоит с Ле Пеном и Саркози. Они идут «рука об руку», и там, где силен один, силен и другой.
Что касается Байру, - за него не голосуют там, где много людей без образования, ни там, где высока безработица. Напротив, чем выше уровень занятости, тем выше его результат.
Итак, мы определили, какие переменные влияют на результаты кандидатов, и теперь наша задача более пристально рассмотреть эти зависимости. Для этого нам понадобится прибегнуть к регрессии. Мы исследуем, как каждая независимая переменная влияет на зависимую, и насколько надежно это влияние.
Начнем с Сеголен Руаяль. Мы выяснили, что процент ее голосов зависит от количества людей без диплома, от среднего количества человек в семье, а также от аграрного сектора того или иного региона. Наиболее существенное влияние оказывают первые две переменные, а также сильна связь с результатами, набранными Саркози. Результаты парного регрессионного анализа показывают, что для переменной Среднее количество человек в семье коэффициент детерминации равен 0.4, то есть зависимость распространяется на 40% случаев из начальной выборки. Для не имеющих диплома эта цифра составляет также около 40%, а выделенная связь с результатами Саркози имеет место быть в 60% случаев.
Коэффициент Ь при соответствующей независимой переменной показывает, что увеличение количества лиц без диплома на 1% влечет за собой снижение показателя Руаяль на 0.84%; Увеличение среднего количества человек в семье на одного на 21%, снижает процент кандидата и, наконец, при увеличении количества голосов, отданных за Саркози на 1%, Руаяль теряет 0.83% голосов.
Отметим, что зависимости, хотя и не охватывают всю выборку, но р-уровень в них менее 0.001, что указывает на тот факт, что им можно доверять.
Теперь проделаем те же вычисления для Саркози. Для примера рассмотрим переменные «Родившиеся за границей» и «Снимающие жилье».
Логика рассуждений здесь та же, что в предыдущем случае: при увеличении переменной Родившиеся за границей на 1%, показатель Саркози увеличивается на 0.44%; при увеличении на 1% количество семей, снимающих жилье, результат кандидата возрастает на 0.42%. Закономерности охватывают далеко не всю выборку, но 40% и 32%, соответственно, однако все они достаточно надежны - их р-уровень менее 0.001.
Для Байру мы возьмем самые высоко коррелированные переменные «Без диплома», «Уровень экономической активности» и «Уровень безработицы».
Коэффициент детерминации во всех случаях достаточно велик, и наша закономерность описывает 50%, 54% и 45% случаев из выборки, р-уровень мал. При этом сами тенденции таковы: при увеличении на 1% населения без диплома о высшем образовании, процент голосующих за Байру снижается на 0.72%. Вторая закономерность состоит в том, что по мере увеличения экономической активности в регионе на 1%, Байру получает на 0.8 %
голосов больше. И, наконец, по мере роста безработицы на 1% Байру теряет 1.02% голосов. Уровни статистической значимости для всех коэффициентов достаточно надежны.
И, в заключении, мы завершаем данный раздел показателями Ле Пена. Для него мы рассмотрим показатели «Без диплома», «Уровень безработицы» и «Среднее количество
человек в семье».
Зависимости объясняют 38%, 62% и 38% выборки, при этом р-уровень менее 0.001 во всех случаях. По мере увеличения уровня безработицы на 1% Ле Пен приобретает 1.04 % голосов, с увеличением количества людей без образования на 1%, результат Ле Пена улучшается на 0.9 %, а при увеличении среднего количества человек в семье, его показатель поднимается на 18 %.
Итак, при помощи регрессии и корреляции, мы рассмотрели несколько тенденций, одни - более приближенно, другие - в общем виде. В любом случае, пока картина получается несколько фрагментарной и создается впечатление, что по полученным данным невозможно предугадать исход выборов.
Поиск зависимостей методом построения логических правил. Некоторое внутреннее ограничение классической статистики состоит в том, что в ней сложнее построить адекватную модель реального процесса. Для того чтобы статистически смоделировать выборы во Франции нам пришлось бы оперировать гораздо большим количеством переменных, причем часть из них должны были бы каким-то образом отражать весьма зыбкие категории, такие как имидж, популярность, репутация кандидата и т. д., которые не измерены, но, несомненно, оказывают влияние. Разумеется, идя на выборы, мы будем голосовать за программу кандидата, но лишь при условии, что сам он будет нам симпатичен. Эта оговорка очень важна в нашем случае. Мы помним, что с результатами Сеголен Руаяль коррелирует достаточно мало переменных. И, тем не менее, за нее голосуют и те, кто попадает под эту зависимость, и те, кто ей противоречит. В чем же причина? Во-первых, социализм как политическое убеждение часто передается во Франции от отца к сыну, и самые ярые социалисты голос фактически отдают партии, а не кандидату. Во-вторых, конечно мы взяли далеко не все измеримые факторы, а факторов более тонких не учли вовсе. И, наконец, банальная, казалось бы, причина, которая, однако, определила отношение многих французов, а точнее француженок к Сеголен Руаяль. И причина эта проста: она - женщина. А с французским уровнем эмансипации и женской солидарности, уже одно это, как показывает практика, заставляет отдавать свой голос именно за Руаяль. Все это понимаем мы, но не понимает Біаіівііса. Именно поэтому мы не заканчиваем здесь наше исследование, а обратимся к методам менее прозрачным и понятным, но более гибким.
Также для традиционной статистики затруднение составляет малый объем выборки. Если его увеличить, то сразу нашлось бы больше зависимостей, и они были бы надежнее. Однако, к счастью или к сожалению, мы не компетентны менять количество регионов Франции, поэтому, пока стоит Пятая Республика, нам придется довольствоваться 22-мя наблюдениями в выборке.
Теперь, уже имея представление о некоторых закономерностях, выявленных классическими методами, мы попробуем обратиться к альтернативному методу: созданию логических правил. Данный вид анализа по сути своей близок к регрессионному анализу. При этом зависимости формулируются в виде логических правил вида «Если переменная Х больше или равна т, то переменная У больше или равна п с вероятностью р». В качестве программного пакета для поиска логических алгоритмов мы выбрали программу WizWhy. Входами у нас будут все те же переменные, а выходами - зависимые переменные Саркози, Руаяль, Байру, Ле Пен.
Сначала оговорим стартовые настройки программы. При вводе данных WizWhy автоматически подсчитывает среднее и предлагает взять его за основу создания правил.
Другими словами, вопрос, который мы ставим перед собой до анализа: «При каких условиях величина зависимой переменной Х будет больше (меньше) среднего?» Но на этот раз мы будем действовать несколько иначе. В принципе, нам ни к чему привязка к среднему, тем более, как мы помним, в случае с одним из кандидатов среднее фактически не репрезентативно, поскольку график имеет две вершины. Действовать мы будем следующим образом: в качестве опорной точки мы возьмем величину несколько больше среднего, таким образом, чтобы по всей выборке больше этой величины было бы приблизительно 20% значений. Тогда наш вопрос будет звучать немного иначе: «При каких условиях величина переменной будет большой?» Конечно, понятие «большой» очень относительно, но вполне укладывается в работу, так как мы можем определить его, опираясь на нечеткую логику. Графиков принадлежности мы рисовать не будем, но решим для себя, что для Руаяль «большой» процент голосов будет начинаться с 28% (при среднем значении 25), для Саркози - с 32% (при среднем 30,6), для Ле Пена - с 14% (при среднем 11,4), Байру - с 20% (при среднем 18).
Как правило, WizWhy выдает огромное количество правил. Причем, контролируя работу программы, нужно убедиться, что этих правил как не слишком много, так и не слишком мало. Если бы мы взяли среднее значение за основу, наши правила получились бы слишком общими и неопределенными, и их количество бы было более 200. В нашем случае их получается около 100, причем величина эта оптимальна. В тех ситуациях, когда правил получается мало, все они обычно обладают низкой вероятностью и высокой погрешностью.
Итак, вот список из некоторых логических правил, которые мы получили. Сразу заметно, что здесь фигурируют переменные, с которыми мы ранее не обнаружили корреляции. Попробуем резюмировать эти правила и определить, кто же голосует за Руаяль.
Первые два правила фактически означают, что во всех регионах, кроме Иль-Де-Франс при условии наличия малого количества иммигрантов (до 6%), Руаяль не наберет более 28% голосов. Также не наберет она их и в регионах, где средняя заработная плата выше среднего, в регионах с развитым производственным сектором, в регионах, где не развито сельское хозяйство.
Теперь перейдем к поиску регионов, где Руаяль будет ждать высокий результат. Успех уготован кандидату в регионах, где, в условиях низкого уровня преступности, высока образованность населения, а также много разводов, в «старых» регионах с низким уровнем преступности, в регионах, где велик аграрный сектор при условии, что количество людей без диплома ниже среднего, а так же там, где не сильно развито производство.
Мы помним, что Біаіівііса обозначила только 3 зависимости: от переменных «не имеющие диплома», «аграрный сектор» и «среднее количество человек в семье». Здесь фактически мы имеем дело совсем с другими переменными, сохраняется только значительное влияние переменной «без диплома». Конечно, две другие величины также фигурируют в полном списке правил, но большее значение приобретает зарплата, уровень преступности и т. д. Получается, что мы столкнулись с существенным расхождением в результатах двух разных алгоритмов. Возможно, причиной тому более гибкий математический аппарат WizWhy, который оказался способен уловить более сложные связи даже в условиях отсутствия всех необходимых данных. Этот недостаток информации, скорее всего и «сбил с толку» программу Біаіівііса, ведь, как мы уже оговаривали, она не «достраивает» недостающих частей модели, а анализирует только ту информацию, которую даем ей мы.
Теперь проделаем ту же самую работу для результатов Саркози. В данном случае мы столкнулись с ситуацией, когда выбраны не очень удачные начальные параметры: правил получилось много, и часть из них является частными случаями других правил, к тому же интервалы значений переменных слишком велики, чтобы однозначно сказать, о «большом»
или «маленьком» значении идет речь. Тем не менее, чтобы для всех кандидатов сохранялся один принцип, мы воспользуемся несколькими правилами, из полученных нами.
Итак, показатели Саркози будут высокими, если в регионе большое количество приезжих, что совпадает с нашими предшествующими расчетами.
Низкой эта величина будет в случаях, если низка вероятность быть ограбленным, при этом также низка доля сферы услуг в экономике региона, если при большой доле сельского хозяйства низка безработица, а также когда при малой доле сферы услуг, в регионе мало молодежи. Подтверждается в данном случае влияние переменных «вероятность ограбления», «сфера услуг», «аграрный сектор», а также вводится зависимость от количества «молодежи» от 20 до 39 лет и безработицы.
Следующим рассмотрим результаты Ле Пена. Согласно полученным правилам, Ле Пен наберет высокий процент голосов в регионах, где заработная плата немного ниже среднего, количество не имеющих диплома велико и занятость среди экономически активного населения низка. Похожая ситуация в регионах, где при низких зарплатах высокая безработица, где при высоком проценте холостяков низка занятость, а также там, где, в условиях низкой преступности, низка экономическая активность, и люди редко переезжают, а также где низка оплата труда и высока безработица.
Низкий процент грозит ему там, где высока концентрация пожилых людей и людей с высшим образованием.
Возвращаясь к результатам Біагівіїса, мы констатируем, что из выявленных ей зависимостей подтверждается корреляция с переменными «не имеющие диплома», «уровень экономической активности» и «безработица», а также вводятся новые зависимости, которые прежде не были обозначены: «средняя зарплата», «холостяки», «вероятность ограбления».
И, наконец, перейдем к правилам для Байру. В данном случае мы получаем в основном правила вида «если ..., то не...». При этом в основном правила базируются на переменных «количество разводов», «сфера услуг», «безработица», «не имеющие диплома». Приведем основные правила. Итак, в регионах, где высока безработица, где сфера услуг хорошо развита при большом количестве съемного жилья, где высок процент разводов и существенное количество людей без образования, Байру не популярен. Тем самым мы подтвердили отрицательные корреляции, которые обнаружили ранее: с переменными «не имеющие диплома», «процент разводов» и «безработица», а также обнаружили
закономерность, которую классический анализ не выявил: влияние переменной «сфера услуг».
Предсказание итогов выборов с помощью нейронной сети. Теперь, когда мы рассмотрели с разных сторон зависимости, связывающие наши данные в единую систему, пришло время устроить проверку правильности построенной нами модели.
Конечно, мы нашли множество различных закономерностей, соединяющих воедино все переменные, однако, наличие закономерности еще не означает правильность модели в целом. Известны случаи, когда связи обнаруживаются в самых неожиданных ситуациях, и носят случайный характер. Мы же старались воссоздать ситуацию во Франции до выборов и хотя бы отчасти определить, какие факторы повлияли на развитие событий. Другими словами, пришло время проверить, те ли переменные мы приняли за значимые факторы и правильно ли проанализировали ситуацию. Это можно сделать одним единственным способом: воссоздать картину выборов, по исходным данным спрогнозировать результаты голосования.
Силами традиционной статистики нам здесь не обойтись, поскольку существует множество аспектов, которые мы не учитываем, и прежде всего это пресловутый человеческий фактор, который мы всегда осознаем, но не можем выразить в цифрах. Именно поэтому мы выбрали как инструмент построения заключительной модели нейронную сеть. Если и есть в мире технология, способная, подобно человеку, учитывать такие тонкости, как
человеческую иррациональность, то это не что иное, как хорошо обученная нейронная сеть. Подходящим программным пакетом мы сочли Кеиго8Ье11, поскольку на сегодняшний день она дает наиболее широкий инструментарий для предсказания.
Как и ранее входами у нас будут переменные, описывающие социально-экономическую ситуацию в регионе, а выходами - результаты кандидатов. После определения входов и выходов, необходимо определить обучающую и тестовую выборку. Как правило, размер первой должен быть достаточно велик, чтобы сеть учла все закономерности, в то время как тестовая выборка может состоять всего из нескольких наблюдений. В нашем случае мы возьмем в качестве обеих выборок случайный набор наблюдений из общей совокупности исходных данных.
Далее следует определить архитектуру сети. Для данной задачи была выбрана сеть с обратным распространением ошибки, имеющую 3 скрытых блока нейронов, обладающих различными функциями активации. Преимущество такой сети в том, что к одному массиву данных она будет, в зависимости от значения, применять различные функции, а на выходной нейрон будет поступать 3 потока данных: оригинальные входы и две «точки зрения» из автономных скрытых блоков.
Затем нам необходимо установить число нейронов в каждом скрытом блоке. Обычно это число устанавливается автоматически, вычисленное по специальной формуле с учетом количества входов, выходов и количества наблюдений в общей и тренировочной выборках. Однако, в зависимости от конечной задачи, стоящей перед нами, это количество может быть скорректировано. Так, если мы установим большее число нейронов, сеть будет более скрупулезно анализировать данные и стремиться их запоминать, при этом могут возникнуть сложности в случае необходимости обобщений. Если же, наоборот, мы установим слишком мало нейронов, сеть будет хорошо обобщать данные, но «ума» на анализ ей не хватит. Сами разработчики программы констатируют, что подобрать оптимальное количество нейронов можно только методом проб и ошибок. Воспользовавшись этой рекомендацией, мы пришли к выводу, что число нейронов в блоках по умолчанию необходимо увеличить с 7 до 8. Также мы на 0.1 увеличили опцию «обучаемость сети». Этот параметр определяет величину корректировки значений. Снова и снова попадая в нейрон на обработку, один и тот же паттерн корректируется таким образом, чтобы приблизиться к оптимальному значению. «Обучаемость» показывает величину, на которую будет изменяться каждый паттерн, в очередной раз попадая в нейрон.
В итоге получилась архитектура, показанная на рис. 5.
Рис. 5. Архитектура использованной для прогнозирования нейронной сети
После того, как архитектура выбрана, и все параметры определены, можно приступать к обучению. Чтобы сеть не «переучилась», ставятся ограничения на обучение. В нашем случае выборка невелика, и мы остановим обучение, когда дойдем до конца чтения исходного файла.
Теперь ознакомимся с результатами обучения и тестирования. С момента запуска до окончания обучения произошло 31200 событий, и прошло 1733 эпохи, то есть сеть пропустила через себя 31200 сигналов, и все наблюдения выборки прошли через сеть 1733 раза. Минимальная ошибка при обучении совершенно незначительна, последняя ошибка, зафиксированная в памяти у сети, также очень мала. Что касается ошибки в тестовом блоке, она существенно больше, но вероятность ошибки 0,09 для нашей проблемы можно считать приемлемой. Иными словами, результат обучения нас устраивает, и все, что нам остается -это применить обученную сеть к исходным данным.
На этот раз выходы сети не будут приниматься в расчет, и прогноз будет осуществляться только по входным параметрам. Перед тем, как показать результаты, сеть всегда выдает описание полученного прогноза.
Коэффициенты детерминации и корреляции указывают нам на то, что выявленные закономерности охватывают 93% выборки для Руаяль, 95% - для Саркози, 83% - для Байру и 96% для Ле Пена. При этом корреляция реальных результатов и прогноза составляет для Руаяль 0.95, для Саркози 0.97, для Байру 0.85 и для Ле Пена 0,96. Значение средней абсолютной ошибки составляет 0,457%, 0,322%, 0,516% и 0,284% для Руаяль, Саркози, Байру и Ле Пена, соответственно. При этом максимальная абсолютная ошибка для каждого кандидата составляет 2,6%, 1,96%, 3,21% и 1,97%, соответственно.
Рис 6. Величины ошибок прогнозов по регионам для кандидатов на президентских выборах во
Франции 2007 г.
Нужно сказать, что, с учетом специфики проблемы, о которой мы упоминали ранее, прогноз получился на удивление точным. Наибольшие отклонения наблюдаются для Байру и составляют чуть более 3%. Причем в тех регионах, где абсолютное отклонение значительно для одной из переменных, там оно существенно и для других (см. рис. 6). Причина может крыться в особенностях самих регионов, однако наиболее вероятен другой вариант: небольшая величина выборка - всего 22 наблюдения, 15 из которых были использованы для обучения.
Как было вычислено выше, точность парных регрессионных моделей значительно меньше. При сравнении же с результатами множественных регрессионных моделей может наблюдаться парадокс: при увеличении коэффициента детерминации реальные значения ошибки прогноза возрастают. Это объясняется тем, что независимые переменные не являются взаимонезависимыми (проблема мультиколлинеарности), нормально
распределенными и т.д., как априорно предполагает регрессионный анализ.
Результаты анализа свидетельствуют в первую очередь о том, что, несмотря на тонкость «политической материи», выборы - процесс относительно предсказуемый и при определенных условиях их итоги могут быть спрогнозированы не только традиционными статистическими методами, но и с использованием более современных технологий анализа данных. Разумеется, каждая избирательная система имеет свои особенности, а, следовательно, для каждой системы модель будет отличаться. Модель, аналогичная нашей, подойдет для государств, где на политическом рынке господствует плюрализм, причем плюрализм не формальный, а фактический. Именно в таких условиях возникает конкуренция между партиями и кандидатами и наше исходное допущение реализуется. При этом, на наш взгляд, качество модели можно существенно улучшить, если рассмотреть более мелкие административные единицы и проанализировать по ним те же переменные.
Другой важный вывод нашей работы заключается в том, что, если результаты выборов можно так или иначе смоделировать, то и программы и кампании кандидатов можно корректировать таким образом, чтобы они собирали бы наибольший процент голосов. Использование такого механизма увеличило бы эффективность предвыборных кампаний, помогая проводить политический маркетинг.
Разумеется, на данный момент модель не проработана достаточно детально, чтобы служить инструментарием для построения политической кампании кандидата на пост президента, однако сам факт возможности статистического прогноза итога выборов открывает нам огромные перспективы для дальнейшего анализа. Также существует несколько технологий, которые позволят дополнить наш инструментарий. Очевидно, что и про использование в построении прогноза классических методов опросов нельзя забывать. Синтез этих подходов обещает дать интересные результаты.
Список литературы:
1. Ослон А.А. Выборы-2003: предвыборные опросы и прогнозы на фоне исхода выборов. Работа над ошибками (точный прогноз с двумя большими неточностями) // Социология власти. № 1. 2GG4. С. 25-38.
2. Петрунин Ю.Ю., Зернова Ю.А. Статистические и нейросетевые методы исследования политической ситуации во Франции на примере региональных выборов 1998 и 2GG4 годов // Государственное управление. Электронный вестник. Выпуск 14. Март 2GG8. http://e-journal.spa.msu.ru/14_2GG8Petrunin_Zernova.html
3. Antonakis J. & Dalgas O. Predicting Elections: Child's Play! // Science. 323. 1183. 2GG9.
4. Armstrong J. S. & Graefe A. Predicting elections from biographical information about candidates // MPRA working paper, Presented at the Symposium on Leadership and Individual Differences. Lausanne. November 2009.
5. Armstrong J.S. The Seer-Sucker Theory: The Value of Experts in Forecasting // Technology Review. June/July. 1980. Р. 16-24.
6. Armstrong J.S., Graefe A. Predicting Elections from Biographical Information about Candidates // MPRA working paper, Presented at the Symposium on Leadership and Individual Differences. Lausanne. November 2009.
7. Armstrong J.S., Green K.C., Jones, R.J. & WrightM. Predicting elections from politicians’ faces // Available at http://mpra.ub.uni-muenchen.de/9150/. 2009.
8. Arzheimer K., Evans J. Bread and butter 'a la fran9aise: Multiparty forecasts of the French legislative vote (1981-2007) // International Journal of Forecasting. № 26. 2010. Р. 19-31.
9. Europe. № 1. 29 октября 2006.
10. FairR.C. Predicting Presidential Elections and Other Things. Stanford University, 2002.
11. Fair R.C. Predicting Presidential Elections and Other Things. Stanford, CA: Stanford University Press, 2001.
12. Gelkai I. La gauche dont reve la droite. Le Monde. 07.04.2007.
13. Jones R.J. The state of presidential election forecasting: The 2004 experience //
International Journal of Forecasting. Volume 24. Issue 2. April-June. 2008. Р. 310-321.
14. Jones R.J., Armstrong J.S., Cuzan A.G. Combining Methods to Forecast the 2008 Presidential Election: The Pollyvote // Foresight. № 12. 2008. Р. 41-42.
15. Jones R.J., Armstrong J.S., Cuzan A.G. Forecasting Elections Using Expert Surveys: An
Application to the U. S. Presidential Election // Prepared for presentation at the annual meeting of
the American Political Science Association. Chicago. August 30 - September 2, 2007.
16. Lemennicier B., Katir-Lescieux H. Testing the accuracy of the Downs’ spatial voter model on forecasting the winners of the French parliamentary elections in May-June 2007 // International Journal of Forecasting. № 26. 2010. Р. 32-41.
17. McCann S.J. Alternative formulas to predict the greatness of U.S. presidents: Personological, situational, and Zeitgeist factors // Journal of Personality and Social Psychology. № 62. 1992. P. 469-479.
18. Nadeaua R., Lewis-Beckb M.S., ' B'elangerc E. Electoral forecasting in France: A multiequation solution // International Journal of Forecasting. № 26. 2010. Р. 11-18.
19. Sarkozy N. Ensemble tout deviens possible. 2007.
20. Simonton D.K. Presidential greatness and performance: Can we predict leadership in the White House? // Journal of Personality. № 49. 1981. Р. 306-322.
21. Simonton D.K. Presidential IQ, Openness, Intellectual Brilliance, and Leadership: Estimates and Correlations for 42 U.S. Chief Executives // Political Psychology. № 27. 2006. Р.511-526.
22. Todorov A., Mandisodza A.N., Goren A. & Hall C.C. Inferences of Competence from Faces Predict Election Outcomes // Science. № 308. 2005. Р. 1623-1626.
23. http://bd/fom/report/cat/prognoz261107
24. http://blog.voynet2007.fr/index.php
25. http://demo.auracom.fr/goov/2004/
26. http://francepolitique.free.fr/
27. http://inflation.free.fr/
28. http://wciom.ru/novosti/v-centre-vnimanija/publikacija/single/8424.html
29. http://www.alsapresse.com
30. http://www.bayrou.fr/
31. http://www.bayrou.fr/evenements/sortie-officielle-projet-despoir-080307.html
32. кйр://’^^^ёе81г8ёауешг.ог§/тёех.ркр?с=8тГогтег_седие]а1ё11
33. http://www.electionpresidentielle.com/
34. http://www.insee.fr
35. http://www.liberation.fr/transversales/portraits/244570.FR.php
36. http://www.marianne2.fr/Le-programme-de-Frederic-Nihous-CPNT-_a898.html
37. http://www.monchoix.net/article89.html
38. http://www.obs-delasecurite.com
39. http://www.pcf.fr
40. http://www.porlafrance.fr/charte.php
41. http://www.recensement.insee.fr
42. http://www.u-m-p.org