Трибуна аспиранта
УДК 324
Н. Е. Шалаев
РАСПРЕДЕЛЕНИЕ ЦИФР В МЛАДШИХ РАЗРЯДАХ ЧИСЕЛ И ВЫЯВЛЕНИЕ ИСКАЖЕННЫХ РЕЗУЛЬТАТОВ ГОЛОСОВАНИЯ
В статье анализируется опыт применения тестов, основанных на проверке частот появления различных цифр в младших разрядах чисел в массиве случайных данных, к данным электоральной статистики по парламентским выборам в странах Восточной Европы. Выявляется очевидное несоответствие между результатами тестов и ожиданиями относительно качественных характеристик выборов в рассматриваемых странах. По итогам эксперимента делается вывод о слабой применимости соответствующих тестов к массивам данных, отражающих результаты общенационального голосования на самом низком уровне агрегации.
Ключевые слова: распределение цифр в младших разрядах, искажение результатов голосования, парламентские выборы, Восточная Европа, статистика.
Привлечение наблюдателей для контроля за ходом голосования и отсутствием нарушений — стандартная практика, направленная на достижение честных и справедливых выборов. Однако, как показывают исследования, присутствие наблюдателей не означает ни отсутствия или снижения количества нарушений, ни признания результатов выборов справедливыми. Наблюдатели контролируют до 80 % выборов, проводящихся в мире, но количество сообщений о нарушениях только возрастает (Hyde, 2011, p. 356). Даже авторитарные режимы охотно приглашают наблюдателей, считая это вопросом престижа и жестом доброй воли, который будет зачтен в их пользу при любой оценке наблюдателями самих выборов (Ibid., p. 367). Вместе с тем развитие информационных технологий делает вопросом престижа и публикацию результатов голосования в детальном и общедоступном виде. Неудивительно, что в такой ситуации возникает интерес к разработке методов, которые будут способны выявить фальсификацию результатов выборов через анализ данных электоральной статистики: по сравнению с организацией непосредственного наблюдения за выборами, такой подход гораздо дешевле в реализации, требует привлечения куда меньшего количества квалифицированных специалистов и гораздо лучше защищен от влияния человеческого фактора.
Существующие методы выявления искаженных результатов голосования можно разделить на две основные группы.
Первую группу составляют методы, обращающиеся к зависимостям между различными переменными, отраженными в данных электоральной статистики, причем в качестве основного показателя, как правило, выступает уровень явки на выборах: распределение числа избирателей по участкам с различным уровнем
© Шалаев Н. Е., 2015
явки (Klimek et al., 2012), зависимость электорального успеха кандидатов от уровня явки (Myagkov et al., 2009, p. 32-34) и т. д. Данные методы опираются на ряд предположений о поведении электората, справедливость которых является дискуссионным вопросом. Например, предположение о независимости успеха кандидатов от уровня явки оспаривается в работах А. Лейпхарта (Lijphart, 1997) и В. Линдера (Linder, 2010) и находит подтверждение в ряде других (см., напр.: Ericsson, 1995; Fisher, 2007).
Вторая группа состоит из методов, которые основаны на анализе частотных характеристик самих данных электоральной статистики. Наиболее известным методом из этой группы является правило Бенфорда по второй цифре (Mebane, 2010; 2011), основанное на анализе отклонения наблюдаемой частоты появления различных цифр в качестве второй цифры числа от частоты, предписываемой законом Бенфорда для второго разряда. Закон Бенфорда, в свою очередь, гласит, что в численных результатах, описывающих реальный мир и полученных в результате взаимодействия различных стохастических факторов, вероятность встретить ту или иную цифру в том или ином разряде числа различна, а не одинакова, как может показаться на первый взгляд (Fewster, 2009). Например, в старшем разряде числа вероятность встретить единицу составляет 30,1%. В отличие от методов из первой группы методы из второй не полагаются на какие-либо дополнительные предположения о нормативном поведении избирателей и ходе электорального процесса. Тем не менее методы, основанные на законе Бенфорда, подвергались критике (Diekmann, Ben, 2010; Deckert et al., 2011) в силу слабой обоснованности предположения о том, что данные электоральной статистики, полученные естественным образом и лишенные искажений, обязаны следовать закону Бенфорда.
Настоящая статья посвящена анализу результатов применения менее известного метода из этой же группы, предложенного Берндом Бебером и Александрой Скакко (Beber, Scacco, 2012), к данным электоральной статистики из ряда новых европейских демократий. В отличие от методов, основанных на законе Бенфорда, который ориентируется на наиболее значимые, старшие разряды чисел, Б. Бебер и А. Скакко предложили обратиться к распределению цифр в наименее значимых, самых младших разрядах числа. Как показали психологические исследования, люди испытывают затруднения в построении рядов случайных чисел (Ibid., p. 218-220). В результате порождаемые ими последовательности якобы случайных чисел обладают свойствами, явно выдающими их искусственное происхождение. В частности, люди не склонны повторять одну и ту же цифру в соседних разрядах, предпочитают убывающие последовательности возрастающим и предпочитают сочетания близких цифр (например 54 или 12) далеким (71 или 39). В результате Б. Бебер и А. Скакко выделили два способа определить, являются ли данные электоральной статистики действительно случайными и полученными в результате простого подсчета результатов волеизъявления избирателей, или же они были фальсифицированы, и вид случайных чисел был придан им сознательно в результате целенаправленной деятельности человека. Первый способ сводится к анализу распределения цифр в последнем, самом младшем разряде чисел (единицы). В истинно случайных
данных ожидается, что все цифры будут встречаться в последнем разряде с равной вероятностью. Второй способ состоит в анализе частоты появления парных цифр (11, 22, 33 и т. д.) в младшем и предпоследнем разряде чисел. В истинно случайных данных такие сочетания должны встречаться в 10 % случаев, в то время как в данных, порожденных имитирующим случайность человеком, их доля должна существенно отличаться от 10 %, причем, как уже говорилось выше, скорее в меньшую сторону.
В рамках настоящего исследования были изучены парламентские выборы в шести странах постсоциалистического пространства (Эстония, Литва, Болгария, Молдавия, Албания, Армения). В каждом случае данные электоральной статистики представлены на минимальном уровне агрегации (избирательные участки) и охватывают всю страну в целом (в случае применения смешанных избирательных систем рассматривается только пропорциональная часть). В качестве отправной точки для выдвижения предварительных гипотез об уровне искажения результатов голосования были выбраны индекс «Свобода в мире» (Freedom House), «Индекс демократии» (The Economist Intelligence Unit) и данные проекта Polity IV. Все эти три индекса формируются во многом именно из оценки показателей, непосредственно связанных с электоральным процессом, и можно ожидать, что обнаружение признаков искажения результатов голосования будет сопутствовать негативным оценкам демократичности соответствующей страны, в то время как в странах, стабильно получающих достойные оценки, признаки фальсификации обнаружить не удастся.
Основную эмпирическую базу исследования составили 18 случаев парламентских выборов в Эстонии (2003, 2007, 2011 и 2015 гг.), Латвии (2006, 2010, 2011 и 2014 гг.), Молдавии (2010 и 2014 гг.), Албании (2009 и 2013 гг.), Болгарии (2005, 2009, 2013 и 2014 гг.) и Армении (2007 и 2012 гг.), данные о которых опубликованы центральными избирательными комиссиями соответствующих стран. Их позиции в рейтингах «Свобода в мире» (табл. 1) и «Индекс демократии» (табл. 2) хорошо согласуются друг с другом. К сожалению, данные «Индекса демократии» не покрывают весь интересующий нас период, однако несложно заметить, что для всех стран имеющиеся оценки имеют статичный характер, и хотя количество баллов может немного изменяться, положение стран в «Индексе демократии» относительно друг друга не меняется.
В то время как, по мнению Freedom House, Эстония, Латвия и Болгария относятся к категории «свободных» стран, а Албания, Молдавия и Армения — к категории «частично свободных» (табл. 1), «Индекс демократии» оценивает положение Молдавии более оптимистично. В соответствии с ним лишь Албания и Армения относятся к категории переходных режимов, «гибридных демократий», остальные страны — к категории «несовершенных демократий» (табл. 2).
В отличие от двух предыдущих индексов проект Polity IV оценивает страны более однообразно (табл. 3). Четыре из рассматриваемых стран получают оценку 9 баллов и относятся к демократиям, одна (Латвия) получает 8 баллов (что тоже соответствует демократическому режиму), и лишь Армения получает 5 баллов, что соответствует анократическому режиму.
Таблица 1. Результаты стран по версии рейтинга «Свобода в мире» (Freedom House)
Год Эстония Латвия Болгария Албания Молдавия Армения
Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл
2014 Своб.* 1,0 Своб. 2,0 Своб. 2,0 Част. своб.** 3,0 Част. своб. 3,0 Част. своб. 4,5
2013 Своб. 1,0 Своб. 2,0 Своб. 2,0 Част. своб. 3,0 Част. своб. 3,0 Част. своб. 4,5
2012 Своб. 1,0 Своб. 2,0 Своб. 2,0 Част. своб. 3,0 Част. своб. 3,0 Част. своб. 5,0
2011 Своб. 1,0 Своб. 2,0 Своб. 2,0 Част. своб. 3,0 Част. своб. 3,0 Част. своб. 5,0
2010 Своб. 1,0 Част. своб. 1,5 Своб. 2,0 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 5,0
2009 Своб. 1,0 Своб. 1,5 Своб. 2,0 Част. своб. 3,0 Част. своб. 4,0 Част. своб. 5,0
2008 Своб. 1,0 Своб. 1,5 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,5
2007 Своб. 1,0 Своб. 1,0 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,5
2006 Своб. 1,0 Своб. 1,0 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,5
2005 Своб. 1,0 Своб. 1,5 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,5
2004 Своб. 1,5 Своб. 1,5 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,0
2003 Своб. 1,5 Своб. 1,5 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,0
2002 Своб. 1,5 Своб. 1,5 Своб. 2,0 Част. своб. 3,5 Част. своб. 3,0 Част. своб. 4,0
2001 Своб. 1,5 Своб. 1,5 Своб. 2,5 Част. своб. 4,5 Част. своб. 3,0 Част. своб. 4,0
* Свободная страна.
** Частично свободная страна.
Таблица 2. Результаты стран по версии «Индекса демократии» (The Economist Intelligence Unit)
Год Эстония Латвия Болгария Албания Молдавия Армения
Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл
2013 Несов.* 7,61 Несов. 7,05 Несов. 6,83 Перех.** 5,67 Несов. 6,32 Перех. 4,02
2012 Несов. 7,61 Несов. 7,05 Несов. 6,72 Перех. 5,67 Несов. 6,32 Перех. 4,09
2011 Несов. 7,61 Несов. 7,05 Несов. 6,78 Перех. 5,81 Несов. 6,33 Перех. 4,09
2010 Несов. 7,68 Несов. 7,05 Несов. 6,84 Перех. 5,86 Несов. 6,33 Перех. 4,09
2008 Несов. 7,68 Несов. 7,23 Несов. 7,02 Перех. 5,91 Несов. 6,5 Перех. 4,09
2006 Несов. 7,74 Несов. 7,37 Несов. 7,1 Перех. 5,91 Несов. 6,5 Перех. 4,15
* Несовершенная демократия. ** Переходный режим.
Таблица 3. Результаты стран по данным проекта Polity IV
Год Эстония Латвия Болгария Албания Молдавия Армения
Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл
2013 Дем.* 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр.** 5
2012 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5
2011 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5
2010 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5
2009 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5
2008 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5
2007 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5
2006 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5
2005 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5
2004 Дем. 9 Дем. 8 Дем. 9 Дем. 7 Дем. 8 Анокр. 5
2003 Дем. 9 Дем. 8 Дем. 9 Дем. 7 Дем. 8 Анокр. 5
2002 Дем. 9 Дем. 8 Дем. 9 Дем. 7 Дем. 8 Анокр. 5
2001 Дем. 9 Дем. 8 Дем. 9 Анокр. 5 Дем. 8 Анокр. 5
* Демократия.
** Анократия.
Исходя из положения рассматриваемых стран в указанных индексах, можно сделать предварительный вывод о том, что из перечисленных стран Эстония является стабильным лидером, а Армения — аутсайдером. Соответственно, вероятность обнаружить признаки искажения результатов голосования в Эстонии будет наименьшей, а в Армении — наибольшей. Латвию и Болгарию можно условно отнести к категории «выше среднего», где мы скорее ожидаем не обнаружить следов искажения данных электоральной статистики, а Албанию и Молдавию — к категории «ниже среднего», где мы скорее будем ожидать наличия признаков фальсификации результатов голосования.
Для определения признаков искажения результатов голосования были выделены три критерия: частота совпадений цифр в младшем и предпоследнем разрядах числа, частоты появления цифр в младшем разряде числа и частоты появления цифр в числах с двумя и более разрядами. Для проверки отбирались только числа поданных за участников выборов действительных голосов, так как для ряда случаев иные данные электоральной статистики (например, число недействительных голосов или списочная численность избирателей на участке) не были опубликованы. Для определения статистической значимости наблюдаемого отклонения от ожидаемой пропорции использовался критерий согласия Пирсона (хи-квадрат)1. Для каждого случая парламентских выборов вычислялся критерий согласия хи-квадрат по совокупности результатов всех участвующих партий/кандидатов и для результатов каждого из участников выборов в отдельности. Результаты по выборам в целом приведены в табл. 4.
Таблица 4. Значения хи-квадрат для проведенных тестов (национальный уровень)
Страна Год Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде (для чисел > 10)
Албания 2009 0,0000 0,0000 0,0000
Албания 2013 0,0000 0,0000 0,0000
Армения 2007 0,0009 0,0000 0,0000
Армения 2012 0,2080 0,0000 0,0000
Болгария 2005 0,0000 0,0000 0,0000
Болгария 2009 0,0000 0,0000 0,0000
Болгария 2013 0,0000 0,0000 0,0000
Болгария 2014 0,0000 0,0000 0,0000
Латвия 2006 0,0014 0,0000 0,0000
1 Здесь и далее указывается итоговая вероятность нулевой гипотезы, учитывающая количество степеней свободы.
Продолжение табл. 4
Страна Год Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде (для чисел > 10)
Латвия 2010 0,0001 0,0000 0,0000
Латвия 2011 0,4164 0,0000 0,0005
Латвия 2014 0,3318 0,0000 0,0000
Молдавия 2010 0,0000 0,0000 0,0000
Молдавия 2014 0,0001 0,0000 0,0000
Эстония 2003 0,2902 0,0000 0,0031
Эстония 2007 0,4794 0,0000 0,5044
Эстония 2011 0,1408 0,0000 0,0503
Эстония 2015 0,8687 0,0000 0,1467
Как следует из табл. 4, большинство рассматриваемых случаев не прошли тест на пары чисел в младших разрядах, и если ожидания относительно Эстонии и (частично) Латвии реализовались (тест пройден в 4/4 и 2/4 случаев соответственно), то в остальных случаях наблюдается расхождение результатов с ожидаемыми: Армения в одном случае из двух показала приемлемый результат, а Болгария, Молдавия и Албания не прошли тест ни в одном случае. Хуже всего выглядят результаты теста по последней цифре: нет ни одного положительного случая. При отсечении малых чисел только Эстония проходит тест по последней цифре — в трех случаях из четырех.
Являются ли наблюдаемые результаты свидетельством масштабной фальсификации парламентских выборов в большинстве рассматриваемых стран? Для ответа на этот вопрос можно рассмотреть дополнительные случаи: Польша (парламентские выборы 2005 г., президентские 2005 и 2010 гг.), Швеция (парламентские выборы 2002 г.) и Нигерия (парламентские выборы 2003 г., штат Плато). Данные по Швеции и Нигерии почерпнуты в архиве данных для репликации результатов статьи Б. Бебера и А. Скакко2. Положение Польши в рассматриваемых рейтингах аналогично положению Эстонии или даже несколько выше; Швеция является бесспорно демократической страной, Нигерия — авторитарным государством. Для «Индекса демократии» за 2002, 2003 и 2005 гг. были взяты ближайшие значения (из отчета за 2006 г.) (табл. 5).
2 Материалы для репликации результатов (наборы данных, программный код) размещены на ресурсе Political Analysis Dataverse по адресу: http://thedata.harvard.edu/dvn/dv/pan/faces/ study/StudyPage.xhtml?globalId=hdl:1902.1/17151 (дата обращения: 25.03.2015).
Таблица 5. Положение дополнительных случаев в рейтингах демократии
Страна Год «Свобода в мире» «Индекс демократии» Polity IV
Статус Балл Статус Балл Статус Балл
Швеция 2002 Свободная 1,0 Полноценная демократия 9,88 Демократия 10
Польша 2005 Свободная 1,0 Несовершенная демократия 7,3 Демократия 10
Польша 2010 Свободная 1,0 Несовершенная демократия 7,05 Демократия 10
Нигерия 2003 Частично свободная 4,5 Авторитарный режим 3,52 Анократия 4
Из рассматриваемых случаев все три теста (при 5 % уровне значимости) прошли только вторые туры президентских выборов в Польше в 2005 и 2010 гг. При этом первые туры тех же выборов в Польше, наоборот, не смогли пройти ни один из трех тестов, как не смогли пройти их и парламентские выборы в 2005 г. Выборы в Швеции прошли два теста из трех3. Наконец, Нигерия неожиданно смогла пройти тест на парные цифры в младших разрядах (табл. 6).
Таблица 6. Значения хи-квадрат для дополнительных случаев
Страна Год Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде (для чисел > 10)
Нигерия 2003 0,3740 0,0000 0,0000
Польша 2005 0,0000 0,0000 0,0000
Польша 2005 I 0,0000 0,0000 0,0000
Польша 2005 II 0,3803 0,4422 0,0592
Польша 2010 I 0,0000 0,0000 0,0000
Польша 2010 II 0,2810 0,1788 0,0719
Швеция 2002 0,7631 0,4417 0,0009
Рассмотрим результаты по партиям и кандидатам в отдельности. Если предположить, что — даже несмотря на очевидное противоречие между ожидаемыми и наблюдаемыми показателями для дополнительных случаев (в особенности Нигерии) — используемые тесты действительно выявляют искажения результатов выборов, то логично будет ожидать некоторую закономерность в результатах индивидуальных участников выборов. Например, что наихудшие результаты
3 В данных для репликации результаты выборов в Швеции были представлены только восемью основными партиями, в то время как остальные наборы данных, упомянутые в настоящей статье, включают результаты всех участников за редким исключением (независимые кандидаты в Болгарии и Эстонии).
будут обнаружены у тех участников выборов, которые должны получить наибольшую выгоду от фальсификации результатов (учитывая, что основным способом исказить результаты голосования традиционно считаются методы, направленные на увеличение доли той или иной партии через подкуп или принуждение избирателей, вброс бюллетеней и т. п.). Вместе с тем в «образцовых» случаях мы не должны увидеть сомнительных индивидуальных результатов. Для начала обратимся к выборам 2015 г. в Эстонии, показавшим наилучший результат по критерию парных цифр в младших разрядах. Индивидуальные результаты партий-участниц представлены в табл. 7.
Таблица 7. Показатели партий на выборах 2015 г. в Эстонии
Партия Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( > 10)
ЕевИ Кеэкегаког^ 0,8061 0,0501 0,0530
ЕевИ Ре1Ьгт1егаког^ 0,6749 0,2079 0,1780
8о!в1ааМетокгаа!11к Егаког^ 0,2693 0,3409 0,3913
Егаког^ 1эатаа ja Яеэ РиЫюа и^ 0,4564 0,6115 0,5456
Ееэй Копвегуа!11упе ЯаИуаегаког^ 0,2440 0,1026 0,1435
Ееэй Vabaerakond 0,4566 0,8137 0,4703
Erakond Ееэйтаа Rohelised 0,0696 0,0000 0,0263
ЯаИуа Uhtsuse Erakond 0,4497 0,0000 0,2133
Eestimaa Uhendatud Vasakpartei 0,0095 0,0000 0,0487
Eesti Iseseisvuspartei — 0,0000 —
Как следует из табл. 7, только у одной партии можно найти результат, вызывающий сомнения с точки зрения критерия парных цифр. Вместе с тем четыре партии не проходят тест на последние цифры, и две — на последние для многоразрядных чисел (при 5-процентном уровне значимости). Таблица 7, как и последующие аналогичные, упорядочена по порядку возрастания количества одноразрядных чисел в массиве результатов партии (что близко соответствует и убыванию общего числа голосов, поданных за партию). Как будет видно далее, это является определяющим критерием для теста на последнюю цифру — партии, не проходящие этот тест, будут неизменно находиться внизу таблицы.
Выборы в Латвии и Армении предоставляют нам возможность сравнить случаи, проходящие тест по совокупности результатов в целом, со случаями, в которых обнаруживается значимое отклонение. В Латвии для этого имеет смысл использовать выборы 2010 и 2011 гг. как наиболее близкие хронологически. Кроме того, в 2010 г. наблюдается эпизодическое понижение статуса Латвии в рейтинге «Свобода в мире», что могло бы свидетельствовать об увеличении вероятности наблюдать фальсификацию результатов волеизъявления граждан. Тем не менее различия между этими случаями незначительны (табл. 8 и 9).
Таблица 8. Показатели партий на выборах 2010 г. в Латвии
Партия Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( * 10)
VIENOTÏBA 0,4517 0,7553 0,8178
Zalo un Zemnieku savienîba 0,4663 0,2967 0,2709
Politisko partiju apvienîba "Saskanas Centrs" 0,5827 0,2064 0,1023
Partiju apvienîba "Par Labu Latviju" 0,9649 0,0975 0,1119
Nacionâlâ apvienîba "Visu Latvijai!" — "Tëvzemei un Brîvîbai/LNNK" 0,9371 0,9327 0,9718
PCTVL — Par cilvëka tiesîbâm vienotâ Latvijâ 0,0305 0,0000 0,5297
Rafiots Latvijâ 0,0075 0,0000 0,0029
Pëdëjâ partija 0,0904 0,0000 0,0000
Par prezidentâlu republiku 0,0007 0,0000 0,0000
ATBILDÏBA — sociâldemokrâtiska politisko partiju apvienîba 0,0002 0,0000 0,0000
Tautas kontrole 0,0000 0,0000 0,0000
Kristîgi demokrâtiskâ savienîba 0,3588 0,0000 0,0000
Partija "Daugava — Latvijai" 0,7389 0,0000 0,0382
Таблица 9. Показатели партий на выборах 2011 г. в Латвии
Партия Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( > 10)
VIENOTIBA 0,9746 0,1114 0,1603
Zatlera Reformu partija 0,2779 0,0649 0,0520
Za|o un Zemnieku savienîba 0,7630 0,0963 0,1290
Politisko partiju apvienîba "Saskanas Centrs" 0,3994 0,5747 0,6183
Nacionâlâ apvienîba "Visu Latvijai!" — "Tëvzemei un Brîvîbai/LNNK" 0,8872 0,1234 0,1489
Slesera Reformu partija LPP/LC 0,4776 0,0000 0,1565
PCTVL-Par cilvëka tiesîbâm vienotâ Latvijâ 0,0004 0,0000 0,0036
Pëdëjâ partija 0,0440 0,0000 0,0000
Par prezidentâlu republiku 0,8840 0,0000 0,3662
"Brîvîba. Brîvs no bailëm, naida un dusmâm" 0,8788 0,0000 0,0151
Latvijas Sociâldemokrâtiskâ strâdnieku partija 0,7389 0,0000 0,0879
Tautas kontrole 0,3980 0,0000 0,0004
Kristîgi demokrâtiskâ savienîba 0,0000 0,0000 0,0005
В 2010 п в Латвии можно наблюдать ситуацию, похожую на картину в Эстонии: партии-лидеры проходят тесты, остальные показывают неудовлетворительные результаты; наименее удачно выступившие партии мопут показать неплохие результаты по данным тестов, учитывающих два последних разряда, из-за резкопо сокращения количества наблюдений. Аналогичная картина наблюдается и в 2011 п
На досрочных выборах 2011 п картина в целом не изменилась: результаты партий-лидеров проходят все тесты, партий со средними результатами и ниже — нет. При этом результаты партий со средними результатами несколько хуже как лидеров, так и аутсайдеров, поскольку аутсайдеры мопут получить лучшие результаты в первом и последнем тестах из-за крайне малопо числа подходящих результатов.
Аналопичную картину можно наблюдать и в Армении (табл. 10). За счет боль-шепо количества партий три «зоны» результатов выражены тут еще более четко. Вместе с тем в случае 2007 п лишь одна партия прошла тест на распределение цифр в младших разрядах.
Таблица 10. Результаты партий на выборах в 2007 г. в Армении
Партия Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( > 10)
ЯРА 0,9268 0,1090 0,1182
0,2667 0,0005 0,0010
РАР 0,5726 0,0033 0,0232
Р^ 0,1043 0,0000 0,0000
NUP 0,4267 0,0000 0,0045
NTP 0,5989 0,0000 0,0296
НР 0,9220 0,0000 0,6837
РР 0,8967 0,0000 0,0355
DP 0,1909 0,0000 0,0004
ULP 0,2170 0,0000 0,2427
РРА 0,0774 0,0000 0,0000
НапгР 0,0106 0,0000 0,0000
1А 0,8082 0,0000 0,0000
DWP 0,0322 0,0000 0,0000
NDP 0,0002 0,0000 0,0000
СРА 0,0000 0,0000 0,0000
NAP 0,0000 0,0000 0,0000
CDRP 0,0168 0,0000 0,0000
DPA 0,1824 0,0000 0,0035
ULNP 0,1372 0,0000 0,0025
МРА 0,2433 0,0000 0,0843
SDHP 0,1160 0,0000 0,0487
PYA 0,1779 0,0000 0,6371
Ситуация парламентских выборов 2012 г (табл. 11) отличается прежде всего вдвое меньшим количеством участников (9 против 23). В остальном схема сохраняется прежней; но тест на последнюю цифру проходят в этом случае всего две партии. При этом результаты голосования 2007 г. в целом по критерию парных цифр оказываются «фальсифицированными», а голосования 2012 г. — нет.
Таблица 11. Результаты партий на выборах 2012 г. в Армении
Партия Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( > 10)
RPA 0,9701 0,8945 0,9003
PAP 0,1327 0,3151 0,1990
ARFD 0,3638 0,0000 0,0025
ANCPA 0,1857 0,0000 0,0092
PCL 0,9459 0,0000 0,0016
Heritage party 0,7825 0,0000 0,0048
CPA 0,0000 0,0000 0,0000
DPA 0,0000 0,0000 0,0000
UAP 0,2482 0,0000 0,0602
В случае Молдавии (табл. 12) своеобразная граница проходит по Либеральной партии (Partidul Liberal) — для последующих участников более половины их результатов составляют одноразрядные числа; никто из них не проходит тест по последней цифре. В самом конце списка находятся участники, результаты которых являются почти полностью одноразрядными числами. Для них результаты тестов, учитывающих только многоразрядные числа, вновь начинают выглядеть оптимистично, но это не должно вводить нас в заблуждение: такой результат — лишь следствие предельно малого числа подходящих чисел в их результатах. За двух из участников ни разу не было подано более девяти голосов, что сделало соответствующие тесты невозможными даже технически (конечно, нужно иметь в виду, что результаты кандидатов с предельно малым количеством подходящих чисел являются не менее бессмысленными с точки зрения статистики, хотя с технической точки зрения к ним можно применить тест хи-квадрат). Что же касается партий-лидеров, то они и в этом случае показывают хорошие результаты по всем трем критериям.
Таблица 12. Результаты партий на выборах 2014 г. в Молдавии
Партия Хи-квадрат
Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( * 10)
Partidul Comunistilor din Republica Moldova 0,5590 0,5130 0,6242
Partidul Democrat din Moldova 0,7526 0,2306 0,3673
Partidul Liberal Democrat din Moldova 0,0596 0,0615 0,0188
Partidul Politic Partidul Socialistilor din Republica Moldova 0,7447 0,0563 0,0544
Partidul Politic Partidul Comunist Reformator din Moldova 0,9444 0,2004 0,0901
Partidul Liberal 0,4996 0,0000 0,2731
Blocul Electoral Alegerea Moldovei — Uniunea Vamala 0,1291 0,0000 0,0000
Partidul Politic Miscarea Populara Antimafie 0,6527 0,0000 0,0045
Partidul Politic Partidul Liberal Reformator 0,1408 0,0000 0,0000
Candidat independent Oleg Brega 0,1302 0,0000 0,0000
Partidul Popular Crestin Democrat 0,0396 0,0000 0,0000
Partidul Politic Partidul Forta Poporului 0,0000 0,0000 0,0000
Partidul Politic Partidul Popular din Republica Moldova 0,2632 0,0000 0,0000
Partidul National Liberal 0,0015 0,0000 0,0000
Partidul Politic Partidul Renastere 0,1573 0,0000 0,0000
Partidul Actiunea Democratica 0,0000 0,0000 0,0019
Candidat independent Oleg Cernei 0,9199 0,0000 0,2291
Partidul Politic Patriotii Moldovei 0,0196 0,0000 0,0272
Partidul Politic Democratia Acasa 0,4142 0,0000 0,6025
Candidat independent Plesca Valeriu 0,6374 0,0000 0,5341
Partidul Politic Pentru Neam si Tara 0,6374 0,0000 0,5341
Candidat independent Anatolie Doga 0,7389 0,0000 0,4373
Partidul Politic Uniunea Centrista 0,7389 0,0000 0,4373
Partidul Politic Patria — 0,0000 —
Partidul Politic Partidul Verde Ecologist — 0,0000 —
Аналопичные тенденции на уровне партий и кандидатов можно наблюдать во всех 23 полноценно обработанных случаях (основная пруппа из 18 случаев и дополнительные 5 случаев из Польши; без учета данных по Швеции и Ниперии в силу их неполноты). Вместе с несовпадением результатов с данными рейтинпов как для основной пруппы случаев, так и для дополнительных контрольных, эти результаты подталкивают к выводу об отсутствии связи между искажением результатов полосования и результатами проведенных тестов. Вместо этопо проявляется зависимость тестов от количественной составляющей каждопо случая: чем больше наблюдений составляют анализируемую по критерию хи-квадрат пропорцию,
тем строже требования к допустимому отклонению от ожидаемого распределения и тем «хуже» результаты выборов. В табл. 13 представлены количественные характеристики рассмотренных случаев. Из общего числа участников выборов были выделены основные (те, у которых большая часть полученных чисел голосов представлена минимум двузначными цифрами) и миноритарные (те, за которые более чем в половине случаев было подано менее 10 голосов). Кроме того, приведено количество избирательных участков в каждом случае и общее количество чисел, представляющих результаты голосования в протоколах (количество избирательных участков, умноженное на общее число участников выборов).
Таблица 13. Количественные характеристики рассмотренных случаев*
Страна Год Индексы Участники Участки Числа Хи-квадрат
FW DI PIV Осн. Минор. Всего Пары Младший разряд Младший разряд ( > 10)
Албания 2013 3,0 5,67 9 3 65 68 5513 374 884 0,0000 0,0000 0,0000
Албания 2009 3,0 6,00 9 2 32 34 4753 161 602 0,0000 0,0000 0,0000
Армения 2007 4,5 4,12 5 10 13 23 1923 44 229 0,0009 0,0000 0,0000
Армения 2012 5,0 4,09 5 6 3 9 1982 17 838 0,2080 0,0000 0,0000
Болгария 2013 2,0 6,83 9 4 32 36 11 675 420 300 0,0000 0,0000 0,0000
Болгария 2014 2,0 6,83 9 6 19 25 12 177 304 425 0,0000 0,0000 0,0000
Болгария 2005 1,5 7,10 9 6 16 22 11 985 263 670 0,0000 0,0000 0,0000
Болгария 2009 2,0 6,93 9 5 13 18 11 863 213 534 0,0000 0,0000 0,0000
Латвия 2006 1,0 7,37 8 8 11 19 1006 19 114 0,0014 0,0000 0,0000
Латвия 2014 2,0 7,05 8 6 7 13 1054 13 702 0,3318 0,0000 0,0000
Латвия 2011 2,0 7,05 8 6 7 13 1024 13 312 0,4164 0,0000 0,0005
Латвия 2010 1,5 7,05 8 5 8 13 1013 13 169 0,0001 0,0000 0,0000
Молдавия 2010 3,5 6,33 9 5 34 39 2040 79 560 0,0000 0,0000 0,0000
Молдавия 2014 3,0 6,32 9 7 18 25 2073 51 825 0,0001 0,0000 0,0000
Нигерия 2003 4,5 3,52 4 2 28 30 2576 77 280 0,3740 0,0000 0,0000
Польша 2005 1,0 7,3 10 7 15 22 25 165 553 630 0,0000 0,0000 0,0000
Польша I 2005 1,0 7,3 10 4 8 12 25 167 302 004 0,0000 0,0000 0,0000
Польша II 2005 1,0 7,3 10 2 0 2 25 166 50 332 0,3803 0,4422 0,0592
Польша I 2010 1,0 7,05 10 4 6 10 24 925 249 250 0,0000 0,0000 0,0000
Польша II 2010 1,0 7,05 10 2 0 2 24 925 49 850 0,2810 0,1788 0,0719
Швеция 2002 1,0 9,88 10 8 0 8 5976 47 808 0,7631 0,4417 0,0009
Эстония 2007 1,0 7,71 9 7 4 11 657 7227 0,4794 0,0000 0,5044
Эстония 2003 1,0 7,71 9 6 5 11 646 7106 0,2902 0,0000 0,0031
Эстония 2011 1,0 7,61 9 5 4 9 625 5625 0,1408 0,0000 0,0503
Эстония 2015 1,0 7,61 9 6 4 10 536 5360 0,8687 0,0000 0,1467
* Для отсутствующих в отчетах The Economist Intelligence Unit годов были взяты или значения за ближайший имеющийся год или среднее арифметическое двух ближайших.
Несмотря на небольшое число обработанных случаев, можно попробовать применить корреляционный анализ для выявления наиболее явно связанных параметров выборов. Очевидно, что в силу малопо разнообразия результатов по тестам по последней цифре (большая часть случаев не проходит этот тест) вычисление коэффициента корреляции Пирсона имеет смысл только для перво-по теста — по парным цифрам в младших разрядах. Результаты этой процедуры приведены в табл. 14.
Таблица 14. Корреляция параметров рассмотренных случаев и результатов теста
по парным младшим разрядам
Параметр Парные цифры
«Свобода в мире» -0,2261
«Индекс демократии» 0,3434
Polity IV -0,0036
Число основных участников 0,0792
Число миноритарных участников -0,4473
Общее число участников -0,4511
Число избирательных участков -0,2295
Число наблюдений -0,5086
Как следует из табл. 14, наибольшая связь (-0,51) выявляется между общим количеством наблюдений (т. е. числом избирательных участков, умноженным на число участвующих кандидатов). Как и ожидалось, зависимость обратная, т. е. большему числу наблюдений сопутствует меньшее значение хи-квадрат, что соответствует статистически более значимому отклонению от ожидаемого распределения. Поскольку число миноритарных участников в рассматриваемых случаях обычно существенно больше числа основных участников, то обнаруживается обратная зависимость результатов теста и от числа миноритарных участников, и от общего числа участников выборов. В эту схему укладываются и результаты репликации результатов по частичным данным Б. Бебера и А. Скакко по выборам в Сенегале, где выборы 2000 r. проходят тест по последней цифре (второй тур, 2 основных участника, 8436 участков, хи-квадрат 0,82), а выборы 2007 г — нет (3 основных участника, 11 512 участков, хи-квадрат менее 0,0000).
В табл. 15 представлены данные о корреляции показателей для теста на последние парные цифры для рассматриваемых выборов при учете только основных участников (отброшены все участники, за которых в половине и более случаев было подано менее 10 голосов). Как видно, в этом случае все показатели, описывающие численность участников, становятся незначимыми, зато возрастает связь общего числа наблюдений и количества избирательных участков. Одновременно возрастает и корреляции с данными проекта Polity IV, но это легко объяснить существенной корреляцией рейтинга с количеством участков (0,5217), что в данном случае скорее является случайным совпадением.
Таблица 15. Корреляция параметров рассмотренных случаев и результатов теста по парным младшим разрядам (только основные участники)
Параметр Парные цифры
«Свобода в мире» 0,3597
«Индекс демократии» -0,2514
Polity IV -0,4815
Число основных участников -0,0399
Число миноритарных участников -0,0021
Общее число участников -0,0080
Число избирательных участков -0,5021
Число наблюдений -0,5709
Таким образом, рассмотренные методы не подходят для обнаружения искажений результатов голосования. По меньшей мере в рассмотренной конфигурации их применения (результаты на национальном уровне по выборам в целом и по каждому из участников в отдельности) они откликаются прежде всего на размер анализируемого массива данных и едва ли могут что-то сказать о наличии или отсутствии в рассматриваемых данных признаков фальсификаций: они могут как забраковать результаты признанно демократических стран (например, Польши, Эстонии), так и реабилитировать, пусть и частично, результаты выборов в печально известных фальсификациями странах (Нигерия). Вместе с тем изменения условий применения рассмотренных тестов (например, анализ каждого протокола в отдельности или дополнительные правила отбора наблюдений) могут открыть конфигурации, в которых эти тесты дают ожидаемые результаты. Исследовательская работа в этом направлении по-прежнему представляется перспективной.
Литература
Beber B., Scacco A. What the Numbers Say: A Digit-Based Test for Election Fraud // Political Analysis. 2012. Vol. 20. P. 211-234.
Deckert J., MyagkovM., OrdeshookP. C. Benford's Law and the Detection of Election Fraud // Political Analysis. 2011. Vol. 19. P. 245-268.
Diekmann A., Ben J. Benford's Law and Fraud Detection: Facts and Legends // German Economic Review. 2010. Vol. 11 (3). P. 397-401.
Ericsson R. State Turnout and Presidential Voting: A Closer Look // American Politics Research. 1995. October. Vol. 23 (4). P. 387-396.
Fewster R. M. A Simple Explanation of Benford's Law // The American Statistician. 2009. February. Vol. 63, N 1. P. 26-32.
Fisher S. (Change in) Turnout and (Change in) the Left Share of the Vote // Electoral Studies. 2007. Vol. 26. P. 598-611.
Hyde S. D. Catch Us if You Can: Election Monitoring and International Norm Diffusion // American Journal of Political Science. 2011. April. Vol. 55, N 2. P. 356-369.
KlimekP., Yegorov Yu. etal. Statistical Detection of Systematic Election Irregularities // Proceedings of the National Academy of Sciences. 2012. Vol. 109 (41). P. 16469-16473.
Lijphart A. Unequal Participation: Democracy's Unresolved Dilemma // The American Political Science Review. Vol. 91, N 1 (Mar., 1997). P. 1-14.
Linder W. Swiss Democracy: Possible Solutions to Conflict in Multicultural Societies. 3rd ed. New York: Palgrave McMillan, 2010. 271 p.
Mebane W. R. Jr. Comment on "Benford's Law and the Detection of Election Fraud" // Political Analysis. 2011. Vol. 19. P. 269-272.
Mebane W. R. Jr. Fraud in the 2009 Presidential Election in Iran? // Chance. 2010. Vol. 23, N 1. 2010. P. 6-15.
Myagkov M., Ordeshook P. C., Shakin D. The Forensics of Election Fraud: Russia and Ukraine. New York: Cambridge University Press, 2009. 289 p.