8 дек. 2011 г.

Статистика и российские выборы - 15

Думал, как подступиться с тем голосам, которые отнимают у всех остальных партий и меняют на голоса ЕР. Вероятно, по флуктуациям.

Смотри. В нормальном случае если на участке "просела" какая-то одна партия, то эта "недостача" должна равновероятно распределиться по остальным партиям. Кроме того, флуктуации должны быть сиимметричными, вроде бы. А у нас же отнимают голоса очень тупо - сравните протоколы наблюдателей и официальные данные - зачастую просто затирают первую цифру, например, превращая 159 голосов в 59. Такие тупые флуктуации можно отделить от нормальных квазигауссовских.

Можно как-то использовать зависимость флуктуаций от третьего параметра - явки, например.

Смотри, на вот этой картинке совершенно чётко видно, что облако "КПРФ" флуктуирует вниз гораздо сильнее, чем вверх. Объяснение напрашивается простое: на всех участках пытались "откромсать" кусок от истинных голосов КПРФ - пытались откромсать побольше, но получалось везде это с разной степенью успеха.



Наверняка можно действовать так:
1) Сначала аппроксимировать (функциями второго порядка) облака на графике "Явка за партии" - "Общая явка". 
2) Вычесть эти функции из соответствующих облаков, оставив только флуктуации.
3) Построить матрицу корреляций.
4) Офигеть.
5) Сравнить эту матрицу с нормальной. Как корректно посчитать нормальную аналитически, пока не соображу. Но можно это в два счёта сделать численно по Монте-Карло - 100 миллионов избирателей поделить на 1000 тысяч избирательных участков, и назначить каждому участку "вероятности проголосовать за разные партии", которым подчиняются жители. Вероятности распределить нормально вокруг среднероссийского значения.

Комментариев нет:

Отправить комментарий