Корреляция между ЕР и явкой

Считал корреляционные связи и обнаружил вот такое (ЦИКовские данные на сегодняшний день):

Корреляция между голосование за Единую Россию и явкой составляет 90%

Вот это круто. С одной стороны, политологическое объяснение: весь дополнительный электорат, привлечённый на выборы — проголосовал за ЕР. С другой конспирологическое: Явка и голосование за ЕР связаны настолько сильно, что математически доказуемо, что и то, и другое — результат фальсификаций.

UPD2: Правильный файл с корреляциями



LiveJournal

Comments

Что фальсификации имели место быть — кто бы спорил. Вопрос в их масштабе. К сожалению, данный анализ на этот вопрос ответить не позволяет. Он, собственно говоря, даже не доказывает корректно факт фальсификаций как таковых, в виду методической некорректности. Ведь параметры(% голосования за партии) в сумме равны 100% (с учётом недействительных) и, по определению, не являются независимыми. Этот эффект хорошо изучен, например, при химическом анализе элементов сложного вещества. В некоторых хороших книжках по методу главных компонент даются рецепты, как преобразовать подобные параметры для последующей обработки, с тем, чтобы сгладить данный эффект. Хотя даже после этого нет гарантий, что вывод не будет искажён за счёт ошибок агрегации. (см. Gary King). Помимо этого в данной выборке как бы содержатся две совершенно разнонаправленные выборки: выборка по ряду автономий с известным на протяжении многих выборов абсолютно управляемым голосованием(т. е. , по сути, не описываемым в категориях статистического разброса и т. п.), и выборка по остальным субъектам федерации, где , несмотря на возможные уровни фальсификации (где— какие), голосование полностью управляемым не является. В данном случае полностью управляемые субъекты получают как бы (в силу чрезвычайной скоординированности/ однообразности голосования) своеобразные повышающие коэффициенты: вклад их специфики деформирует общую картину. Как раз возникает предпосылка для одного из описываетых Кингом типов артефактов. Получается некая искусственная химера.

В любом случае следует взять отдельно выборку без этих регионов ( округов) и провести корреляционный анализ только по ним. Понятно, что он (см. выше) тоже не будет надёжным, но несовпадение результатов сразу укаажет на одну из причин искажений в анализе. Далее: следует, получив(по возможности) данные по районам, провести тот же аализ уже на этом материале и сравнить. А ещё лучше несколько раз перегруппировывать изучаемые выборки, конструируя искусственные территориальные образования (напр., сливая по два- три района как бы в один) и посмотреть, насколько такая перегруппировка меняет результаты. При разном разбиении они могут различаться существенно, и тогда корреляции грош цена.

Что же касается высокой корреляции явки с ЕР и отрицательной со всеми остальными партиями, это на данном материале естественно, если сделать всего два предположения: 1). За ЕР, действительно, проголосовало более половины избирателей (не обязательно 64%); 2). За ЕР как за партию власти в большей степени голосовал менее урбанизированный, менее образованный,(соответственно менее ориентированный на альтернативные основным каналам ТВ источники информации) и, возможно, более пожилой электорат. Известно, что именно подобным избирателям свойственна более высокая явка. Теперь посмотрите: какие округа в Вашей выборке дают самые значительные отрицательные "весовые коэффициенты" (пардон за упрощательство в объяснениях — оно здесь в целях наглядности для не обязательно знакомых с механизмом корреляционного анализа), а какие — самыев высокие положительные? Меньше всего за ЕР голосовали в Москве, СПб, в округах с преобладанием населения крупных городов. Там же и ниже явка. Но так было всегда! И, наоборот.

И понятно, что чем больший процент голосует за ЕР в том или ином округе, тем меньший остаётся на долю всех остальных!

А почему же Вы не комментируете факт довольно существенной положительной корреляции голосования за либеральные партии и голосования по открепительным талонам (0,61 для СПС и 0,68 для Яблока?. И, наоборот, умеренную отрицательную корреляцию голосования по открепительным талонам с голосованием за ЕР? (-0,45). Ведь использование открепительных талонов (удостоверений) — это по распространённому мнению один из основных путей фальсификации в пользу паритии власти. Казалось бы нонсес: что, большинство "открепившихся" за СПС и Яблоко голосовали? А на самом деле это чистой воды артефакт, обусловленный конструкцией выборки: через Москву, Подмосковье и СПб,идёт самый большой транзит, там больше всего оказавшихся на момент голосования вне дома. Поэтому-то по этим округам (см. таблицу) раза в два-три выше процент голосовавших по открепительным. Но в этих же округах и, по понятным причинам, несколько повышенный процент голосования за либералов. Вот и получается артефакт за счёт "весовых коэффициентов" этих округов (а в вашей выборке это каждый пятый округ).

Но это ясный сигнал того, что корреляция между другими параметрами: явкой и голосованием за партии тоже зависит от конструкции выборки!

posted by ixodus on 12.06.07 at 01:53

1. По поводу выборки со всем согласен. Поэтому и не настаиваю на конспирологической версии. Посчитали без регионов с контролируемым голосованием — получилось 64% — http://community.livejournal.com/ru_politics/1060

2. По поводу открепительных — можно интерпретировать и так: там где сильнее либералы — активнее привозили карусельшиков.

Огромное спасибо за комментарий!

Регион с "неконтролируемым" голосованием.
http://community.livejournal.com/namarsh_ru/11922

ixodus оставляет впечатление человека вдумчивого. Очень хотелось бы получить его комментарий по поводу данных Пресненского района г. Москвы.

posted by romanik on 12.06.07 at 19:11

А по другим районам нет аналогичных данных?

posted by red_ptero on 12.06.07 at 20:20

Со многим согласен. Но вот, смотрите, какая штука:

Берем водку и наливаем ее потихоньку в стакан. После каждого налитого грамма замеряем соотношение воды и спирта, заносим в таблицу. Величины тоже по определению не являются независимвыми, так как в сумме их 100%. А теперь берем и начиная с какого-то момента вместо водки начинаем доливать чистую воду. Потом посчитаем корреляцию, получим данные, сходные с вышеприведенной таблицей.

posted by gvozdeff on 12.07.07 at 20:40

[…] За идею и чистку данных низкий поклон блогу altzgamer Интернет, Интересное, Диаграммы, Статистика   […]

Leave a comment

Подписаться на ленту Профиль на Фейсбуке Русскоязычный Твиттер ЖЖешечка Наверх!