Научная статья на тему 'Распределение цифр в младших разрядах чисел и выявление искаженных результатов голосования'

Распределение цифр в младших разрядах чисел и выявление искаженных результатов голосования Текст научной статьи по специальности «Математика»

CC BY
136
22
i Надоели баннеры? Вы всегда можете отключить рекламу.
Ключевые слова
РАСПРЕДЕЛЕНИЕ ЦИФР В МЛАДШИХ РАЗРЯДАХ / ИСКАЖЕНИЕ РЕЗУЛЬТАТОВ ГОЛОСОВАНИЯ / ПАРЛАМЕНТСКИЕ ВЫБОРЫ / ВОСТОЧНАЯ ЕВРОПА / СТАТИСТИКА / LAST DIGIT DISTRIBUTION / ELECTORAL FRAUD / PARLIAMENTARY ELECTIONS / EASTERN EUROPE / STATISTICS

Аннотация научной статьи по математике, автор научной работы — Шалаев Никита Евгеньевич

В статье анализируется опыт применения тестов, основанных на проверке частот появления различных цифр в младших разрядах чисел в массиве случайных данных, к данным электоральной статистики по парламентским выборам в странах Восточной Европы. Выявляется очевидное несоответствие между результатами тестов и ожиданиями относительно качественных характеристик выборов в рассматриваемых странах. По итогам эксперимента делается вывод о слабой применимости соответствующих тестов к массивам данных, отражающих результаты общенационального голосования на самом низком уровне агрегации.

i Надоели баннеры? Вы всегда можете отключить рекламу.
iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Last Digit Distribution and Detection of Distorted Election Results

The paper addresses the outcomes of applying last digit tests, which are based on detecting statistically significant deviations of last digit frequencies from values expected in a randomly generated data, to the electoral data covering parliamentary elections in Eastern European countries. The experiment reveals a striking contradiction between the obtained results and prior expectations. The final conclusion suggests that the tests under study are not fit to be applied to data covering national elections on the lowest level of aggregation, and react primarily to the size of the sample.

Текст научной работы на тему «Распределение цифр в младших разрядах чисел и выявление искаженных результатов голосования»

Трибуна аспиранта

УДК 324

Н. Е. Шалаев

РАСПРЕДЕЛЕНИЕ ЦИФР В МЛАДШИХ РАЗРЯДАХ ЧИСЕЛ И ВЫЯВЛЕНИЕ ИСКАЖЕННЫХ РЕЗУЛЬТАТОВ ГОЛОСОВАНИЯ

В статье анализируется опыт применения тестов, основанных на проверке частот появления различных цифр в младших разрядах чисел в массиве случайных данных, к данным электоральной статистики по парламентским выборам в странах Восточной Европы. Выявляется очевидное несоответствие между результатами тестов и ожиданиями относительно качественных характеристик выборов в рассматриваемых странах. По итогам эксперимента делается вывод о слабой применимости соответствующих тестов к массивам данных, отражающих результаты общенационального голосования на самом низком уровне агрегации.

Ключевые слова: распределение цифр в младших разрядах, искажение результатов голосования, парламентские выборы, Восточная Европа, статистика.

Привлечение наблюдателей для контроля за ходом голосования и отсутствием нарушений — стандартная практика, направленная на достижение честных и справедливых выборов. Однако, как показывают исследования, присутствие наблюдателей не означает ни отсутствия или снижения количества нарушений, ни признания результатов выборов справедливыми. Наблюдатели контролируют до 80 % выборов, проводящихся в мире, но количество сообщений о нарушениях только возрастает (Hyde, 2011, p. 356). Даже авторитарные режимы охотно приглашают наблюдателей, считая это вопросом престижа и жестом доброй воли, который будет зачтен в их пользу при любой оценке наблюдателями самих выборов (Ibid., p. 367). Вместе с тем развитие информационных технологий делает вопросом престижа и публикацию результатов голосования в детальном и общедоступном виде. Неудивительно, что в такой ситуации возникает интерес к разработке методов, которые будут способны выявить фальсификацию результатов выборов через анализ данных электоральной статистики: по сравнению с организацией непосредственного наблюдения за выборами, такой подход гораздо дешевле в реализации, требует привлечения куда меньшего количества квалифицированных специалистов и гораздо лучше защищен от влияния человеческого фактора.

Существующие методы выявления искаженных результатов голосования можно разделить на две основные группы.

Первую группу составляют методы, обращающиеся к зависимостям между различными переменными, отраженными в данных электоральной статистики, причем в качестве основного показателя, как правило, выступает уровень явки на выборах: распределение числа избирателей по участкам с различным уровнем

© Шалаев Н. Е., 2015

явки (Klimek et al., 2012), зависимость электорального успеха кандидатов от уровня явки (Myagkov et al., 2009, p. 32-34) и т. д. Данные методы опираются на ряд предположений о поведении электората, справедливость которых является дискуссионным вопросом. Например, предположение о независимости успеха кандидатов от уровня явки оспаривается в работах А. Лейпхарта (Lijphart, 1997) и В. Линдера (Linder, 2010) и находит подтверждение в ряде других (см., напр.: Ericsson, 1995; Fisher, 2007).

Вторая группа состоит из методов, которые основаны на анализе частотных характеристик самих данных электоральной статистики. Наиболее известным методом из этой группы является правило Бенфорда по второй цифре (Mebane, 2010; 2011), основанное на анализе отклонения наблюдаемой частоты появления различных цифр в качестве второй цифры числа от частоты, предписываемой законом Бенфорда для второго разряда. Закон Бенфорда, в свою очередь, гласит, что в численных результатах, описывающих реальный мир и полученных в результате взаимодействия различных стохастических факторов, вероятность встретить ту или иную цифру в том или ином разряде числа различна, а не одинакова, как может показаться на первый взгляд (Fewster, 2009). Например, в старшем разряде числа вероятность встретить единицу составляет 30,1%. В отличие от методов из первой группы методы из второй не полагаются на какие-либо дополнительные предположения о нормативном поведении избирателей и ходе электорального процесса. Тем не менее методы, основанные на законе Бенфорда, подвергались критике (Diekmann, Ben, 2010; Deckert et al., 2011) в силу слабой обоснованности предположения о том, что данные электоральной статистики, полученные естественным образом и лишенные искажений, обязаны следовать закону Бенфорда.

Настоящая статья посвящена анализу результатов применения менее известного метода из этой же группы, предложенного Берндом Бебером и Александрой Скакко (Beber, Scacco, 2012), к данным электоральной статистики из ряда новых европейских демократий. В отличие от методов, основанных на законе Бенфорда, который ориентируется на наиболее значимые, старшие разряды чисел, Б. Бебер и А. Скакко предложили обратиться к распределению цифр в наименее значимых, самых младших разрядах числа. Как показали психологические исследования, люди испытывают затруднения в построении рядов случайных чисел (Ibid., p. 218-220). В результате порождаемые ими последовательности якобы случайных чисел обладают свойствами, явно выдающими их искусственное происхождение. В частности, люди не склонны повторять одну и ту же цифру в соседних разрядах, предпочитают убывающие последовательности возрастающим и предпочитают сочетания близких цифр (например 54 или 12) далеким (71 или 39). В результате Б. Бебер и А. Скакко выделили два способа определить, являются ли данные электоральной статистики действительно случайными и полученными в результате простого подсчета результатов волеизъявления избирателей, или же они были фальсифицированы, и вид случайных чисел был придан им сознательно в результате целенаправленной деятельности человека. Первый способ сводится к анализу распределения цифр в последнем, самом младшем разряде чисел (единицы). В истинно случайных

данных ожидается, что все цифры будут встречаться в последнем разряде с равной вероятностью. Второй способ состоит в анализе частоты появления парных цифр (11, 22, 33 и т. д.) в младшем и предпоследнем разряде чисел. В истинно случайных данных такие сочетания должны встречаться в 10 % случаев, в то время как в данных, порожденных имитирующим случайность человеком, их доля должна существенно отличаться от 10 %, причем, как уже говорилось выше, скорее в меньшую сторону.

В рамках настоящего исследования были изучены парламентские выборы в шести странах постсоциалистического пространства (Эстония, Литва, Болгария, Молдавия, Албания, Армения). В каждом случае данные электоральной статистики представлены на минимальном уровне агрегации (избирательные участки) и охватывают всю страну в целом (в случае применения смешанных избирательных систем рассматривается только пропорциональная часть). В качестве отправной точки для выдвижения предварительных гипотез об уровне искажения результатов голосования были выбраны индекс «Свобода в мире» (Freedom House), «Индекс демократии» (The Economist Intelligence Unit) и данные проекта Polity IV. Все эти три индекса формируются во многом именно из оценки показателей, непосредственно связанных с электоральным процессом, и можно ожидать, что обнаружение признаков искажения результатов голосования будет сопутствовать негативным оценкам демократичности соответствующей страны, в то время как в странах, стабильно получающих достойные оценки, признаки фальсификации обнаружить не удастся.

Основную эмпирическую базу исследования составили 18 случаев парламентских выборов в Эстонии (2003, 2007, 2011 и 2015 гг.), Латвии (2006, 2010, 2011 и 2014 гг.), Молдавии (2010 и 2014 гг.), Албании (2009 и 2013 гг.), Болгарии (2005, 2009, 2013 и 2014 гг.) и Армении (2007 и 2012 гг.), данные о которых опубликованы центральными избирательными комиссиями соответствующих стран. Их позиции в рейтингах «Свобода в мире» (табл. 1) и «Индекс демократии» (табл. 2) хорошо согласуются друг с другом. К сожалению, данные «Индекса демократии» не покрывают весь интересующий нас период, однако несложно заметить, что для всех стран имеющиеся оценки имеют статичный характер, и хотя количество баллов может немного изменяться, положение стран в «Индексе демократии» относительно друг друга не меняется.

В то время как, по мнению Freedom House, Эстония, Латвия и Болгария относятся к категории «свободных» стран, а Албания, Молдавия и Армения — к категории «частично свободных» (табл. 1), «Индекс демократии» оценивает положение Молдавии более оптимистично. В соответствии с ним лишь Албания и Армения относятся к категории переходных режимов, «гибридных демократий», остальные страны — к категории «несовершенных демократий» (табл. 2).

В отличие от двух предыдущих индексов проект Polity IV оценивает страны более однообразно (табл. 3). Четыре из рассматриваемых стран получают оценку 9 баллов и относятся к демократиям, одна (Латвия) получает 8 баллов (что тоже соответствует демократическому режиму), и лишь Армения получает 5 баллов, что соответствует анократическому режиму.

Таблица 1. Результаты стран по версии рейтинга «Свобода в мире» (Freedom House)

Год Эстония Латвия Болгария Албания Молдавия Армения

Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл

2014 Своб.* 1,0 Своб. 2,0 Своб. 2,0 Част. своб.** 3,0 Част. своб. 3,0 Част. своб. 4,5

2013 Своб. 1,0 Своб. 2,0 Своб. 2,0 Част. своб. 3,0 Част. своб. 3,0 Част. своб. 4,5

2012 Своб. 1,0 Своб. 2,0 Своб. 2,0 Част. своб. 3,0 Част. своб. 3,0 Част. своб. 5,0

2011 Своб. 1,0 Своб. 2,0 Своб. 2,0 Част. своб. 3,0 Част. своб. 3,0 Част. своб. 5,0

2010 Своб. 1,0 Част. своб. 1,5 Своб. 2,0 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 5,0

2009 Своб. 1,0 Своб. 1,5 Своб. 2,0 Част. своб. 3,0 Част. своб. 4,0 Част. своб. 5,0

2008 Своб. 1,0 Своб. 1,5 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,5

2007 Своб. 1,0 Своб. 1,0 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,5

2006 Своб. 1,0 Своб. 1,0 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,5

2005 Своб. 1,0 Своб. 1,5 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,5

2004 Своб. 1,5 Своб. 1,5 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,0

2003 Своб. 1,5 Своб. 1,5 Своб. 1,5 Част. своб. 3,0 Част. своб. 3,5 Част. своб. 4,0

2002 Своб. 1,5 Своб. 1,5 Своб. 2,0 Част. своб. 3,5 Част. своб. 3,0 Част. своб. 4,0

2001 Своб. 1,5 Своб. 1,5 Своб. 2,5 Част. своб. 4,5 Част. своб. 3,0 Част. своб. 4,0

* Свободная страна.

** Частично свободная страна.

Таблица 2. Результаты стран по версии «Индекса демократии» (The Economist Intelligence Unit)

Год Эстония Латвия Болгария Албания Молдавия Армения

Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл

2013 Несов.* 7,61 Несов. 7,05 Несов. 6,83 Перех.** 5,67 Несов. 6,32 Перех. 4,02

2012 Несов. 7,61 Несов. 7,05 Несов. 6,72 Перех. 5,67 Несов. 6,32 Перех. 4,09

2011 Несов. 7,61 Несов. 7,05 Несов. 6,78 Перех. 5,81 Несов. 6,33 Перех. 4,09

2010 Несов. 7,68 Несов. 7,05 Несов. 6,84 Перех. 5,86 Несов. 6,33 Перех. 4,09

2008 Несов. 7,68 Несов. 7,23 Несов. 7,02 Перех. 5,91 Несов. 6,5 Перех. 4,09

2006 Несов. 7,74 Несов. 7,37 Несов. 7,1 Перех. 5,91 Несов. 6,5 Перех. 4,15

* Несовершенная демократия. ** Переходный режим.

Таблица 3. Результаты стран по данным проекта Polity IV

Год Эстония Латвия Болгария Албания Молдавия Армения

Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл Статус Балл

2013 Дем.* 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр.** 5

2012 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5

2011 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5

2010 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5

2009 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5

2008 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5

2007 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5

2006 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5

2005 Дем. 9 Дем. 8 Дем. 9 Дем. 9 Дем. 9 Анокр. 5

2004 Дем. 9 Дем. 8 Дем. 9 Дем. 7 Дем. 8 Анокр. 5

2003 Дем. 9 Дем. 8 Дем. 9 Дем. 7 Дем. 8 Анокр. 5

2002 Дем. 9 Дем. 8 Дем. 9 Дем. 7 Дем. 8 Анокр. 5

2001 Дем. 9 Дем. 8 Дем. 9 Анокр. 5 Дем. 8 Анокр. 5

* Демократия.

** Анократия.

Исходя из положения рассматриваемых стран в указанных индексах, можно сделать предварительный вывод о том, что из перечисленных стран Эстония является стабильным лидером, а Армения — аутсайдером. Соответственно, вероятность обнаружить признаки искажения результатов голосования в Эстонии будет наименьшей, а в Армении — наибольшей. Латвию и Болгарию можно условно отнести к категории «выше среднего», где мы скорее ожидаем не обнаружить следов искажения данных электоральной статистики, а Албанию и Молдавию — к категории «ниже среднего», где мы скорее будем ожидать наличия признаков фальсификации результатов голосования.

Для определения признаков искажения результатов голосования были выделены три критерия: частота совпадений цифр в младшем и предпоследнем разрядах числа, частоты появления цифр в младшем разряде числа и частоты появления цифр в числах с двумя и более разрядами. Для проверки отбирались только числа поданных за участников выборов действительных голосов, так как для ряда случаев иные данные электоральной статистики (например, число недействительных голосов или списочная численность избирателей на участке) не были опубликованы. Для определения статистической значимости наблюдаемого отклонения от ожидаемой пропорции использовался критерий согласия Пирсона (хи-квадрат)1. Для каждого случая парламентских выборов вычислялся критерий согласия хи-квадрат по совокупности результатов всех участвующих партий/кандидатов и для результатов каждого из участников выборов в отдельности. Результаты по выборам в целом приведены в табл. 4.

Таблица 4. Значения хи-квадрат для проведенных тестов (национальный уровень)

Страна Год Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде (для чисел > 10)

Албания 2009 0,0000 0,0000 0,0000

Албания 2013 0,0000 0,0000 0,0000

Армения 2007 0,0009 0,0000 0,0000

Армения 2012 0,2080 0,0000 0,0000

Болгария 2005 0,0000 0,0000 0,0000

Болгария 2009 0,0000 0,0000 0,0000

Болгария 2013 0,0000 0,0000 0,0000

Болгария 2014 0,0000 0,0000 0,0000

Латвия 2006 0,0014 0,0000 0,0000

1 Здесь и далее указывается итоговая вероятность нулевой гипотезы, учитывающая количество степеней свободы.

Продолжение табл. 4

Страна Год Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде (для чисел > 10)

Латвия 2010 0,0001 0,0000 0,0000

Латвия 2011 0,4164 0,0000 0,0005

Латвия 2014 0,3318 0,0000 0,0000

Молдавия 2010 0,0000 0,0000 0,0000

Молдавия 2014 0,0001 0,0000 0,0000

Эстония 2003 0,2902 0,0000 0,0031

Эстония 2007 0,4794 0,0000 0,5044

Эстония 2011 0,1408 0,0000 0,0503

Эстония 2015 0,8687 0,0000 0,1467

Как следует из табл. 4, большинство рассматриваемых случаев не прошли тест на пары чисел в младших разрядах, и если ожидания относительно Эстонии и (частично) Латвии реализовались (тест пройден в 4/4 и 2/4 случаев соответственно), то в остальных случаях наблюдается расхождение результатов с ожидаемыми: Армения в одном случае из двух показала приемлемый результат, а Болгария, Молдавия и Албания не прошли тест ни в одном случае. Хуже всего выглядят результаты теста по последней цифре: нет ни одного положительного случая. При отсечении малых чисел только Эстония проходит тест по последней цифре — в трех случаях из четырех.

Являются ли наблюдаемые результаты свидетельством масштабной фальсификации парламентских выборов в большинстве рассматриваемых стран? Для ответа на этот вопрос можно рассмотреть дополнительные случаи: Польша (парламентские выборы 2005 г., президентские 2005 и 2010 гг.), Швеция (парламентские выборы 2002 г.) и Нигерия (парламентские выборы 2003 г., штат Плато). Данные по Швеции и Нигерии почерпнуты в архиве данных для репликации результатов статьи Б. Бебера и А. Скакко2. Положение Польши в рассматриваемых рейтингах аналогично положению Эстонии или даже несколько выше; Швеция является бесспорно демократической страной, Нигерия — авторитарным государством. Для «Индекса демократии» за 2002, 2003 и 2005 гг. были взяты ближайшие значения (из отчета за 2006 г.) (табл. 5).

2 Материалы для репликации результатов (наборы данных, программный код) размещены на ресурсе Political Analysis Dataverse по адресу: http://thedata.harvard.edu/dvn/dv/pan/faces/ study/StudyPage.xhtml?globalId=hdl:1902.1/17151 (дата обращения: 25.03.2015).

Таблица 5. Положение дополнительных случаев в рейтингах демократии

Страна Год «Свобода в мире» «Индекс демократии» Polity IV

Статус Балл Статус Балл Статус Балл

Швеция 2002 Свободная 1,0 Полноценная демократия 9,88 Демократия 10

Польша 2005 Свободная 1,0 Несовершенная демократия 7,3 Демократия 10

Польша 2010 Свободная 1,0 Несовершенная демократия 7,05 Демократия 10

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Нигерия 2003 Частично свободная 4,5 Авторитарный режим 3,52 Анократия 4

Из рассматриваемых случаев все три теста (при 5 % уровне значимости) прошли только вторые туры президентских выборов в Польше в 2005 и 2010 гг. При этом первые туры тех же выборов в Польше, наоборот, не смогли пройти ни один из трех тестов, как не смогли пройти их и парламентские выборы в 2005 г. Выборы в Швеции прошли два теста из трех3. Наконец, Нигерия неожиданно смогла пройти тест на парные цифры в младших разрядах (табл. 6).

Таблица 6. Значения хи-квадрат для дополнительных случаев

Страна Год Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде (для чисел > 10)

Нигерия 2003 0,3740 0,0000 0,0000

Польша 2005 0,0000 0,0000 0,0000

Польша 2005 I 0,0000 0,0000 0,0000

Польша 2005 II 0,3803 0,4422 0,0592

Польша 2010 I 0,0000 0,0000 0,0000

Польша 2010 II 0,2810 0,1788 0,0719

Швеция 2002 0,7631 0,4417 0,0009

Рассмотрим результаты по партиям и кандидатам в отдельности. Если предположить, что — даже несмотря на очевидное противоречие между ожидаемыми и наблюдаемыми показателями для дополнительных случаев (в особенности Нигерии) — используемые тесты действительно выявляют искажения результатов выборов, то логично будет ожидать некоторую закономерность в результатах индивидуальных участников выборов. Например, что наихудшие результаты

3 В данных для репликации результаты выборов в Швеции были представлены только восемью основными партиями, в то время как остальные наборы данных, упомянутые в настоящей статье, включают результаты всех участников за редким исключением (независимые кандидаты в Болгарии и Эстонии).

будут обнаружены у тех участников выборов, которые должны получить наибольшую выгоду от фальсификации результатов (учитывая, что основным способом исказить результаты голосования традиционно считаются методы, направленные на увеличение доли той или иной партии через подкуп или принуждение избирателей, вброс бюллетеней и т. п.). Вместе с тем в «образцовых» случаях мы не должны увидеть сомнительных индивидуальных результатов. Для начала обратимся к выборам 2015 г. в Эстонии, показавшим наилучший результат по критерию парных цифр в младших разрядах. Индивидуальные результаты партий-участниц представлены в табл. 7.

Таблица 7. Показатели партий на выборах 2015 г. в Эстонии

Партия Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( > 10)

ЕевИ Кеэкегаког^ 0,8061 0,0501 0,0530

ЕевИ Ре1Ьгт1егаког^ 0,6749 0,2079 0,1780

8о!в1ааМетокгаа!11к Егаког^ 0,2693 0,3409 0,3913

Егаког^ 1эатаа ja Яеэ РиЫюа и^ 0,4564 0,6115 0,5456

Ееэй Копвегуа!11упе ЯаИуаегаког^ 0,2440 0,1026 0,1435

Ееэй Vabaerakond 0,4566 0,8137 0,4703

Erakond Ееэйтаа Rohelised 0,0696 0,0000 0,0263

ЯаИуа Uhtsuse Erakond 0,4497 0,0000 0,2133

Eestimaa Uhendatud Vasakpartei 0,0095 0,0000 0,0487

Eesti Iseseisvuspartei — 0,0000 —

Как следует из табл. 7, только у одной партии можно найти результат, вызывающий сомнения с точки зрения критерия парных цифр. Вместе с тем четыре партии не проходят тест на последние цифры, и две — на последние для многоразрядных чисел (при 5-процентном уровне значимости). Таблица 7, как и последующие аналогичные, упорядочена по порядку возрастания количества одноразрядных чисел в массиве результатов партии (что близко соответствует и убыванию общего числа голосов, поданных за партию). Как будет видно далее, это является определяющим критерием для теста на последнюю цифру — партии, не проходящие этот тест, будут неизменно находиться внизу таблицы.

Выборы в Латвии и Армении предоставляют нам возможность сравнить случаи, проходящие тест по совокупности результатов в целом, со случаями, в которых обнаруживается значимое отклонение. В Латвии для этого имеет смысл использовать выборы 2010 и 2011 гг. как наиболее близкие хронологически. Кроме того, в 2010 г. наблюдается эпизодическое понижение статуса Латвии в рейтинге «Свобода в мире», что могло бы свидетельствовать об увеличении вероятности наблюдать фальсификацию результатов волеизъявления граждан. Тем не менее различия между этими случаями незначительны (табл. 8 и 9).

Таблица 8. Показатели партий на выборах 2010 г. в Латвии

Партия Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( * 10)

VIENOTÏBA 0,4517 0,7553 0,8178

Zalo un Zemnieku savienîba 0,4663 0,2967 0,2709

Politisko partiju apvienîba "Saskanas Centrs" 0,5827 0,2064 0,1023

Partiju apvienîba "Par Labu Latviju" 0,9649 0,0975 0,1119

Nacionâlâ apvienîba "Visu Latvijai!" — "Tëvzemei un Brîvîbai/LNNK" 0,9371 0,9327 0,9718

PCTVL — Par cilvëka tiesîbâm vienotâ Latvijâ 0,0305 0,0000 0,5297

Rafiots Latvijâ 0,0075 0,0000 0,0029

Pëdëjâ partija 0,0904 0,0000 0,0000

Par prezidentâlu republiku 0,0007 0,0000 0,0000

ATBILDÏBA — sociâldemokrâtiska politisko partiju apvienîba 0,0002 0,0000 0,0000

Tautas kontrole 0,0000 0,0000 0,0000

Kristîgi demokrâtiskâ savienîba 0,3588 0,0000 0,0000

Partija "Daugava — Latvijai" 0,7389 0,0000 0,0382

Таблица 9. Показатели партий на выборах 2011 г. в Латвии

Партия Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( > 10)

VIENOTIBA 0,9746 0,1114 0,1603

Zatlera Reformu partija 0,2779 0,0649 0,0520

Za|o un Zemnieku savienîba 0,7630 0,0963 0,1290

Politisko partiju apvienîba "Saskanas Centrs" 0,3994 0,5747 0,6183

Nacionâlâ apvienîba "Visu Latvijai!" — "Tëvzemei un Brîvîbai/LNNK" 0,8872 0,1234 0,1489

Slesera Reformu partija LPP/LC 0,4776 0,0000 0,1565

PCTVL-Par cilvëka tiesîbâm vienotâ Latvijâ 0,0004 0,0000 0,0036

Pëdëjâ partija 0,0440 0,0000 0,0000

Par prezidentâlu republiku 0,8840 0,0000 0,3662

"Brîvîba. Brîvs no bailëm, naida un dusmâm" 0,8788 0,0000 0,0151

Latvijas Sociâldemokrâtiskâ strâdnieku partija 0,7389 0,0000 0,0879

Tautas kontrole 0,3980 0,0000 0,0004

Kristîgi demokrâtiskâ savienîba 0,0000 0,0000 0,0005

В 2010 п в Латвии можно наблюдать ситуацию, похожую на картину в Эстонии: партии-лидеры проходят тесты, остальные показывают неудовлетворительные результаты; наименее удачно выступившие партии мопут показать неплохие результаты по данным тестов, учитывающих два последних разряда, из-за резкопо сокращения количества наблюдений. Аналогичная картина наблюдается и в 2011 п

На досрочных выборах 2011 п картина в целом не изменилась: результаты партий-лидеров проходят все тесты, партий со средними результатами и ниже — нет. При этом результаты партий со средними результатами несколько хуже как лидеров, так и аутсайдеров, поскольку аутсайдеры мопут получить лучшие результаты в первом и последнем тестах из-за крайне малопо числа подходящих результатов.

Аналопичную картину можно наблюдать и в Армении (табл. 10). За счет боль-шепо количества партий три «зоны» результатов выражены тут еще более четко. Вместе с тем в случае 2007 п лишь одна партия прошла тест на распределение цифр в младших разрядах.

Таблица 10. Результаты партий на выборах в 2007 г. в Армении

Партия Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( > 10)

ЯРА 0,9268 0,1090 0,1182

0,2667 0,0005 0,0010

РАР 0,5726 0,0033 0,0232

Р^ 0,1043 0,0000 0,0000

NUP 0,4267 0,0000 0,0045

NTP 0,5989 0,0000 0,0296

НР 0,9220 0,0000 0,6837

РР 0,8967 0,0000 0,0355

DP 0,1909 0,0000 0,0004

ULP 0,2170 0,0000 0,2427

РРА 0,0774 0,0000 0,0000

НапгР 0,0106 0,0000 0,0000

1А 0,8082 0,0000 0,0000

DWP 0,0322 0,0000 0,0000

NDP 0,0002 0,0000 0,0000

СРА 0,0000 0,0000 0,0000

NAP 0,0000 0,0000 0,0000

CDRP 0,0168 0,0000 0,0000

DPA 0,1824 0,0000 0,0035

ULNP 0,1372 0,0000 0,0025

МРА 0,2433 0,0000 0,0843

SDHP 0,1160 0,0000 0,0487

PYA 0,1779 0,0000 0,6371

Ситуация парламентских выборов 2012 г (табл. 11) отличается прежде всего вдвое меньшим количеством участников (9 против 23). В остальном схема сохраняется прежней; но тест на последнюю цифру проходят в этом случае всего две партии. При этом результаты голосования 2007 г. в целом по критерию парных цифр оказываются «фальсифицированными», а голосования 2012 г. — нет.

Таблица 11. Результаты партий на выборах 2012 г. в Армении

Партия Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( > 10)

RPA 0,9701 0,8945 0,9003

PAP 0,1327 0,3151 0,1990

ARFD 0,3638 0,0000 0,0025

ANCPA 0,1857 0,0000 0,0092

PCL 0,9459 0,0000 0,0016

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Heritage party 0,7825 0,0000 0,0048

CPA 0,0000 0,0000 0,0000

DPA 0,0000 0,0000 0,0000

UAP 0,2482 0,0000 0,0602

В случае Молдавии (табл. 12) своеобразная граница проходит по Либеральной партии (Partidul Liberal) — для последующих участников более половины их результатов составляют одноразрядные числа; никто из них не проходит тест по последней цифре. В самом конце списка находятся участники, результаты которых являются почти полностью одноразрядными числами. Для них результаты тестов, учитывающих только многоразрядные числа, вновь начинают выглядеть оптимистично, но это не должно вводить нас в заблуждение: такой результат — лишь следствие предельно малого числа подходящих чисел в их результатах. За двух из участников ни разу не было подано более девяти голосов, что сделало соответствующие тесты невозможными даже технически (конечно, нужно иметь в виду, что результаты кандидатов с предельно малым количеством подходящих чисел являются не менее бессмысленными с точки зрения статистики, хотя с технической точки зрения к ним можно применить тест хи-квадрат). Что же касается партий-лидеров, то они и в этом случае показывают хорошие результаты по всем трем критериям.

Таблица 12. Результаты партий на выборах 2014 г. в Молдавии

Партия Хи-квадрат

Для цифр в двух младших разрядах Для цифр в младшем разряде (все числа) Для цифр в младшем разряде ( * 10)

Partidul Comunistilor din Republica Moldova 0,5590 0,5130 0,6242

Partidul Democrat din Moldova 0,7526 0,2306 0,3673

Partidul Liberal Democrat din Moldova 0,0596 0,0615 0,0188

Partidul Politic Partidul Socialistilor din Republica Moldova 0,7447 0,0563 0,0544

Partidul Politic Partidul Comunist Reformator din Moldova 0,9444 0,2004 0,0901

Partidul Liberal 0,4996 0,0000 0,2731

Blocul Electoral Alegerea Moldovei — Uniunea Vamala 0,1291 0,0000 0,0000

Partidul Politic Miscarea Populara Antimafie 0,6527 0,0000 0,0045

Partidul Politic Partidul Liberal Reformator 0,1408 0,0000 0,0000

Candidat independent Oleg Brega 0,1302 0,0000 0,0000

Partidul Popular Crestin Democrat 0,0396 0,0000 0,0000

Partidul Politic Partidul Forta Poporului 0,0000 0,0000 0,0000

Partidul Politic Partidul Popular din Republica Moldova 0,2632 0,0000 0,0000

Partidul National Liberal 0,0015 0,0000 0,0000

Partidul Politic Partidul Renastere 0,1573 0,0000 0,0000

Partidul Actiunea Democratica 0,0000 0,0000 0,0019

Candidat independent Oleg Cernei 0,9199 0,0000 0,2291

Partidul Politic Patriotii Moldovei 0,0196 0,0000 0,0272

Partidul Politic Democratia Acasa 0,4142 0,0000 0,6025

Candidat independent Plesca Valeriu 0,6374 0,0000 0,5341

Partidul Politic Pentru Neam si Tara 0,6374 0,0000 0,5341

Candidat independent Anatolie Doga 0,7389 0,0000 0,4373

Partidul Politic Uniunea Centrista 0,7389 0,0000 0,4373

Partidul Politic Patria — 0,0000 —

Partidul Politic Partidul Verde Ecologist — 0,0000 —

Аналопичные тенденции на уровне партий и кандидатов можно наблюдать во всех 23 полноценно обработанных случаях (основная пруппа из 18 случаев и дополнительные 5 случаев из Польши; без учета данных по Швеции и Ниперии в силу их неполноты). Вместе с несовпадением результатов с данными рейтинпов как для основной пруппы случаев, так и для дополнительных контрольных, эти результаты подталкивают к выводу об отсутствии связи между искажением результатов полосования и результатами проведенных тестов. Вместо этопо проявляется зависимость тестов от количественной составляющей каждопо случая: чем больше наблюдений составляют анализируемую по критерию хи-квадрат пропорцию,

тем строже требования к допустимому отклонению от ожидаемого распределения и тем «хуже» результаты выборов. В табл. 13 представлены количественные характеристики рассмотренных случаев. Из общего числа участников выборов были выделены основные (те, у которых большая часть полученных чисел голосов представлена минимум двузначными цифрами) и миноритарные (те, за которые более чем в половине случаев было подано менее 10 голосов). Кроме того, приведено количество избирательных участков в каждом случае и общее количество чисел, представляющих результаты голосования в протоколах (количество избирательных участков, умноженное на общее число участников выборов).

Таблица 13. Количественные характеристики рассмотренных случаев*

Страна Год Индексы Участники Участки Числа Хи-квадрат

FW DI PIV Осн. Минор. Всего Пары Младший разряд Младший разряд ( > 10)

Албания 2013 3,0 5,67 9 3 65 68 5513 374 884 0,0000 0,0000 0,0000

Албания 2009 3,0 6,00 9 2 32 34 4753 161 602 0,0000 0,0000 0,0000

Армения 2007 4,5 4,12 5 10 13 23 1923 44 229 0,0009 0,0000 0,0000

Армения 2012 5,0 4,09 5 6 3 9 1982 17 838 0,2080 0,0000 0,0000

Болгария 2013 2,0 6,83 9 4 32 36 11 675 420 300 0,0000 0,0000 0,0000

Болгария 2014 2,0 6,83 9 6 19 25 12 177 304 425 0,0000 0,0000 0,0000

Болгария 2005 1,5 7,10 9 6 16 22 11 985 263 670 0,0000 0,0000 0,0000

Болгария 2009 2,0 6,93 9 5 13 18 11 863 213 534 0,0000 0,0000 0,0000

Латвия 2006 1,0 7,37 8 8 11 19 1006 19 114 0,0014 0,0000 0,0000

Латвия 2014 2,0 7,05 8 6 7 13 1054 13 702 0,3318 0,0000 0,0000

Латвия 2011 2,0 7,05 8 6 7 13 1024 13 312 0,4164 0,0000 0,0005

Латвия 2010 1,5 7,05 8 5 8 13 1013 13 169 0,0001 0,0000 0,0000

Молдавия 2010 3,5 6,33 9 5 34 39 2040 79 560 0,0000 0,0000 0,0000

Молдавия 2014 3,0 6,32 9 7 18 25 2073 51 825 0,0001 0,0000 0,0000

Нигерия 2003 4,5 3,52 4 2 28 30 2576 77 280 0,3740 0,0000 0,0000

Польша 2005 1,0 7,3 10 7 15 22 25 165 553 630 0,0000 0,0000 0,0000

Польша I 2005 1,0 7,3 10 4 8 12 25 167 302 004 0,0000 0,0000 0,0000

Польша II 2005 1,0 7,3 10 2 0 2 25 166 50 332 0,3803 0,4422 0,0592

Польша I 2010 1,0 7,05 10 4 6 10 24 925 249 250 0,0000 0,0000 0,0000

Польша II 2010 1,0 7,05 10 2 0 2 24 925 49 850 0,2810 0,1788 0,0719

Швеция 2002 1,0 9,88 10 8 0 8 5976 47 808 0,7631 0,4417 0,0009

Эстония 2007 1,0 7,71 9 7 4 11 657 7227 0,4794 0,0000 0,5044

Эстония 2003 1,0 7,71 9 6 5 11 646 7106 0,2902 0,0000 0,0031

Эстония 2011 1,0 7,61 9 5 4 9 625 5625 0,1408 0,0000 0,0503

Эстония 2015 1,0 7,61 9 6 4 10 536 5360 0,8687 0,0000 0,1467

* Для отсутствующих в отчетах The Economist Intelligence Unit годов были взяты или значения за ближайший имеющийся год или среднее арифметическое двух ближайших.

Несмотря на небольшое число обработанных случаев, можно попробовать применить корреляционный анализ для выявления наиболее явно связанных параметров выборов. Очевидно, что в силу малопо разнообразия результатов по тестам по последней цифре (большая часть случаев не проходит этот тест) вычисление коэффициента корреляции Пирсона имеет смысл только для перво-по теста — по парным цифрам в младших разрядах. Результаты этой процедуры приведены в табл. 14.

Таблица 14. Корреляция параметров рассмотренных случаев и результатов теста

по парным младшим разрядам

Параметр Парные цифры

«Свобода в мире» -0,2261

«Индекс демократии» 0,3434

Polity IV -0,0036

Число основных участников 0,0792

Число миноритарных участников -0,4473

Общее число участников -0,4511

Число избирательных участков -0,2295

Число наблюдений -0,5086

Как следует из табл. 14, наибольшая связь (-0,51) выявляется между общим количеством наблюдений (т. е. числом избирательных участков, умноженным на число участвующих кандидатов). Как и ожидалось, зависимость обратная, т. е. большему числу наблюдений сопутствует меньшее значение хи-квадрат, что соответствует статистически более значимому отклонению от ожидаемого распределения. Поскольку число миноритарных участников в рассматриваемых случаях обычно существенно больше числа основных участников, то обнаруживается обратная зависимость результатов теста и от числа миноритарных участников, и от общего числа участников выборов. В эту схему укладываются и результаты репликации результатов по частичным данным Б. Бебера и А. Скакко по выборам в Сенегале, где выборы 2000 r. проходят тест по последней цифре (второй тур, 2 основных участника, 8436 участков, хи-квадрат 0,82), а выборы 2007 г — нет (3 основных участника, 11 512 участков, хи-квадрат менее 0,0000).

В табл. 15 представлены данные о корреляции показателей для теста на последние парные цифры для рассматриваемых выборов при учете только основных участников (отброшены все участники, за которых в половине и более случаев было подано менее 10 голосов). Как видно, в этом случае все показатели, описывающие численность участников, становятся незначимыми, зато возрастает связь общего числа наблюдений и количества избирательных участков. Одновременно возрастает и корреляции с данными проекта Polity IV, но это легко объяснить существенной корреляцией рейтинга с количеством участков (0,5217), что в данном случае скорее является случайным совпадением.

Таблица 15. Корреляция параметров рассмотренных случаев и результатов теста по парным младшим разрядам (только основные участники)

Параметр Парные цифры

«Свобода в мире» 0,3597

«Индекс демократии» -0,2514

Polity IV -0,4815

Число основных участников -0,0399

Число миноритарных участников -0,0021

Общее число участников -0,0080

Число избирательных участков -0,5021

Число наблюдений -0,5709

Таким образом, рассмотренные методы не подходят для обнаружения искажений результатов голосования. По меньшей мере в рассмотренной конфигурации их применения (результаты на национальном уровне по выборам в целом и по каждому из участников в отдельности) они откликаются прежде всего на размер анализируемого массива данных и едва ли могут что-то сказать о наличии или отсутствии в рассматриваемых данных признаков фальсификаций: они могут как забраковать результаты признанно демократических стран (например, Польши, Эстонии), так и реабилитировать, пусть и частично, результаты выборов в печально известных фальсификациями странах (Нигерия). Вместе с тем изменения условий применения рассмотренных тестов (например, анализ каждого протокола в отдельности или дополнительные правила отбора наблюдений) могут открыть конфигурации, в которых эти тесты дают ожидаемые результаты. Исследовательская работа в этом направлении по-прежнему представляется перспективной.

Литература

Beber B., Scacco A. What the Numbers Say: A Digit-Based Test for Election Fraud // Political Analysis. 2012. Vol. 20. P. 211-234.

Deckert J., MyagkovM., OrdeshookP. C. Benford's Law and the Detection of Election Fraud // Political Analysis. 2011. Vol. 19. P. 245-268.

Diekmann A., Ben J. Benford's Law and Fraud Detection: Facts and Legends // German Economic Review. 2010. Vol. 11 (3). P. 397-401.

Ericsson R. State Turnout and Presidential Voting: A Closer Look // American Politics Research. 1995. October. Vol. 23 (4). P. 387-396.

Fewster R. M. A Simple Explanation of Benford's Law // The American Statistician. 2009. February. Vol. 63, N 1. P. 26-32.

Fisher S. (Change in) Turnout and (Change in) the Left Share of the Vote // Electoral Studies. 2007. Vol. 26. P. 598-611.

Hyde S. D. Catch Us if You Can: Election Monitoring and International Norm Diffusion // American Journal of Political Science. 2011. April. Vol. 55, N 2. P. 356-369.

KlimekP., Yegorov Yu. etal. Statistical Detection of Systematic Election Irregularities // Proceedings of the National Academy of Sciences. 2012. Vol. 109 (41). P. 16469-16473.

Lijphart A. Unequal Participation: Democracy's Unresolved Dilemma // The American Political Science Review. Vol. 91, N 1 (Mar., 1997). P. 1-14.

Linder W. Swiss Democracy: Possible Solutions to Conflict in Multicultural Societies. 3rd ed. New York: Palgrave McMillan, 2010. 271 p.

iНе можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

Mebane W. R. Jr. Comment on "Benford's Law and the Detection of Election Fraud" // Political Analysis. 2011. Vol. 19. P. 269-272.

Mebane W. R. Jr. Fraud in the 2009 Presidential Election in Iran? // Chance. 2010. Vol. 23, N 1. 2010. P. 6-15.

Myagkov M., Ordeshook P. C., Shakin D. The Forensics of Election Fraud: Russia and Ukraine. New York: Cambridge University Press, 2009. 289 p.

i Надоели баннеры? Вы всегда можете отключить рекламу.