levrrr: (Default)
[personal profile] levrrr
Результаты голосования по разным избирательным участкам (קלפי) на выборах в Кнессет 2009 года дают материал для проведения статистического анализа, аналогичного тому, который был проведен по данным недавних российских выборов и выявил в них аномалии, вызывающие серьезные подозрения в фальсификации выборов.

Заранее предупреждаю, что никаких сенсаций по Израилю не будет, хотя некоторые графики весьма любопытны и могут быть интересны разбирающимся в статистике. Я исходил из предположения, что серьезных нарушений при подсчёте голосов в Израиле не было. Наблюдатели сообщали об отдельных случаях “вливания” в харедимном и арабском секторах. Такие вливания хотя и могли добавить по одному мандату (скорее всего меньше) соответствующим партиям, но в целом по стране их влияние ничтожно.

Сравнение статистических аномалий в данных израильских выборов (в моем предположении с незначительным количеством фальсификаций) и российских (о серьезных фальсификациях в которых имеются красочные свидетельства) позволяет лучше понять, какие аномалии однозначно указывают на фальсификацию, а какие нет.



Итак, в Израиле 9264 избирательных участков (в 10 раз меньше чем в России).

На графике 1 изображена гистограмма распределения числа избирательных участков по различным процентам голосов, полученных ведущими партиями. Видно, что распределения не очень сильно похожи на нормальные. Все они имеют два максимума. Первый - в районе 0%, отражающий наличие большого числа избирательных участков, в которых партия совсем не пользуется популярностью. Это мусульманские избирательные участки для Ликуда и НДИ; поселения для Кадимы. Больше всего не любят харедимные партии.

1.



Пока что - ничего удивительного. Интереснее со вторым максимумом.

У харедимных партий есть локальный максимум в районе 100%, но этот максимум весьма незначителен. Я специально объединил две харедимные партии вместе, чтобы максимум стал хоть сколько-нибудь заметным. У Кадимы второй максимум очень сильно размазан. У меня нет чёткого объяснения этому факту, но, по-видимому, чем более разнородна публика, голосующая за партию, тем меньше распределение похоже на нормальное. Чтобы как-то подтвердить это, рассмотрим гистограмму, аналогичную приведенной выше, но не для отдельных партий, а для партийных блоков: право-религиозного и лево-арабского. Распределение приведено на графике 2. Здесь уже вообще никакой связи с гауссовым (нормальным) распределением не видно.

2.



Для сравнения приведу аналогичную гистограмму для российских выборов (график 3). Распределение для партии Яблоко очень напоминает ШАС; ЛДПР и СР - НДИ, КПРФ - Ликуд, а ЕР – Кадиму :-).

3.



Единственным отличием (на зато каким !) является наличие для ЕР многочисленных локальных максимумов на процентах кратных 5, - явный признак фальсификации. Никакими естественными причинами любовь русских избирателей к круглым числам объяснить нельзя (точность построения графика - бин = 0.5). Сама же форма распределения, включая неожиданный рост числа избирательных участков в области свыше 90% голосов, поданных за ЕР, вряд ли дают основание для однозначного заключения о фальсификации выборов.

Рассмотрим теперь зависимость между общим процентом проголосовавших на участке избирателей (“явка”) и процентом голосов, поданных за партию (графики 4-8). Каждая точка на этих графиках изображает один избирательный участок: по горизонтали - процент явки на участке, по вертикали - процент голосов, поданных за партию на участке.

4.


5.


6.


7.


8.


Что мы видим. Явка колеблется от 40% до 90%. Узкая полоска внизу, с 0-7% проголосовавших за конкретную партию, соответствует первому максимуму на графике 1 (голосование в арабских населенных пунктах за сионистские партии и в поселениях за левые). Если же рассматривать оставшуюся часть, то для Ликуда процент набранных голосов не сильно зависит от явки (корреляция 0.01). Интуитивно так и должно быть. Процент проголосовавших за НДИ падает с ростом явки (корреляция -0.28), а процент проголосовавших за Кадиму - растёт (корреляция +0.30). Эффект роста процента голосов с ростом явки становится особенно наглядным, если объединить вместе голоса, поданные за три левые партии. Для голосующих за харедимные партии получается два кластера. Один большой - внизу, имеет форму, аналогичную НДИ: падение процента голосов с ростом явки. Второй маленький - вверху справа, соответствующий близкой к 100% явке и близкому к 100% голосованию. Форма распределения для Кадимы похожа на аналогичное распределение для ЕР. Так как отсутствуют свидетельства наблюдателей о серьезных нарушениях при голосовании на участках, где Кадима и левые партии получили высокий процент голосов, то я бы не стал однозначно связывать форму распределения с фальсификацией выборов путём вбросов. Избиратели левых партий живут в кибуцах, а также компактно проживают в престижных районах больших городов. И те и другие имеют традицию (кибуцы) или высокую мотивацию (элиты), чтобы принять участие в голосовании.

Рассмотрим теперь гистограмму явок избирателей (график 9). Для Израиля он имеет типичную колоколообразную форму

9.



Вопреки распространенному мнению о голосовании в харедимном и арабском секторах, только в 7 из 9264 (менее 0.1%) избирательных участков процент проголосовавших превысил 95%. В России же процент избирательных участков с близким к 100%-му голосованию - около 10% (см. график 10, на котором, правда, представлены данные выборов 2007 года). Это ещё один явный признак фальсификации российских выборов. Обратите внимание на локальные пики явки при значениях 60%, 70%, 80% 90%

10.




Update:
1. Корреляция между процентом проголосовавших за партию и явкой имеется и в других странах, в которых наличие серьезных фальсификаций не предполагается. Здесь есть данные про Великобританию, и здесь тоже, а здесь про Германию. Гипотеза о нормальности (или, по-крайней мере, колоколообразности) распределения голосов, поданных за партию в этих странах также не подтверждается. Так что, такие аномалии не являются статистическим обоснованием фальсификации выборов.

2. Резкий пик на 50% в распределении поданных голосов (график 3) является артефактом целочисленного распределения. Грубое объяснение такое. Если брать дроби m/n, где m - случайное число проголосовавших за партию, а n - случайная же явка (m<=n), то соотношение 1/2 будет встречаться чаще чем, скажем, 138/275, так как 1/2 может получиться из 2/4 и из 125/250 и т. д., а у 138/275 - гораздо меньше возможностей. Пики, меньшие чем для 1/2, могут появляться и для 1/3 и 2/3; ещё меньшие для 1/4 и 3/4 и т. д. Гистограмма потом сглаживает эти различия и если брать шаг гистограммы больше 1%, то артефактных пиков не видно. При шаге гистограммы в 0.1% (как на графике 3) эффект целочисленности может быть заметен. Так как на графиках 3 и 10 нет заметных пиков в области 66.7% (2/3), то можно считать, что этот красивый сам по себе эффект объясняет выброс в районе 50%, возможно как-то в области 75%, но значительные выбросы на 65%, 70%, 85% и 95% он объяснить не может

From:
Anonymous( )Anonymous This account has disabled anonymous posting.
OpenID( )OpenID You can comment on this post while signed in with an account from many other sites, once you have confirmed your email address. Sign in using OpenID.
User
Account name:
Password:
If you don't have an account you can create one now.
Subject:
HTML doesn't work in the subject.

Message:

 
Notice: This account is set to log the IP addresses of everyone who comments.
Links will be displayed as unclickable URLs to help prevent spam.

Profile

levrrr: (Default)
levrrr

Expand Cut Tags

No cut tags
Page generated Sep. 22nd, 2017 12:52 am
Powered by Dreamwidth Studios