15 дек. 2011 г.

Статистика и российские выборы - 47


1. Статистические "доказательства" по своей природе не могут быть абсолютными - но, тем не менее, статистика предоставляет различные средства перекрёстной проверки гипотез, если их формулировать отчётливо и осознавать их природу.

2. Различия в результатах голосования на разных участках, вообще говоря, могут быть связаны с разными факторами:

а) случайные колебания в отсутствие каких-то систематических причин расхождений (которые были бы, даже если разбить людей на произвольные группы размера участков)

б) различия в составе жителей участков (их профессиональное, социальное положение, уровень доходов и пр.)

в) различия, связанные с локальными событиями (погода, наличие информации о месте голосования, его доступность и пр.)

г) различия, связанные с фальсификацией результатов того или иного вида (вбросы, неправильный подсчёт и пр.)

2. Гипотезы эти различны, и возможны перекрёстные проверки, позволяющие оценить их правдоподобие. Эти проверки разные для разных видов гипотез. Чтобы оценить а, можно посчитать типичные случайные отклонения для данных размеров участка (и они окажутся существенно меньшими наблюдаемых). Чтобы оценить б, есть разные методы. Можно ожидать, что состав жителей и их предпочтения во многом остаются постоянными от одних выборов к другим, и сравнить результаты выборов разных лет в одном и том же месте. Можно сравнить результаты участков, находящихся географически близко (в большинстве случаев состав населения там не сильно отличается). Последний способ годится также и для в; важная разница между б и в состоит в том, что в случае в нет априорных причин для связи между явкой и голосованием за т.н. "единую россию". Наконец, гипотезу г можно проверять, наблюдая корреляцию с факторами, имеющими отношение непосредственно к подсчёту, типа наличия наблюдателей или КОИБ (автоматических сканеров для бюллетеней).

А вот рассуждение из комментов, которое мне нравится:

Я на 99% был априорно убежден, что они будут жульничать. И когда я вижу те данные, которые представлены, я убежден в этом уже на на 99.9%
И при этом я думаю: а не влияет ли на мое убеждение тот факт, что у меня было априорное мнение?
Поэтому и выступаю как адвокат дьявола кое-где.

И наконец:

То есть, если бы это дело пошло в суд (американский, да хоть и украинский), то сначала истец предъявил бы сотни фактов доказанных фальсификаций на участках. А на возражение, что доказательная база охватывает только малую часть участков, вы, может, выбрали тот 1 процент, на которых да, была фальсификация, но смотрите, в масштабе страны это меньше одного кресла в Думе - тут уже сгодилась бы генеральная статистическая модель.

И я так полагаю, что суд ее в этом качестве принял бы (т.е. факт фальсификации доказан индивидуальными случаями. а ее распостраненность и ВЛИЯНИЕ НА РЕЗУЛЬТАТ - моделью.

Статистика сама по себе не даёт никаких объяснений аномалиям. А сам по себе факт наличия аномалий не даёт оснований утверждать, что они имеют искусственное происхождение.
Дальнейшая линия рассуждений уже не опирается на статистику, а идёт примерно так:
- аномалии распределения голосов по участкам требуют объяснения;
- теория фальсификации итогов выборов в пользу ЕР объясняет все наблюдаемые аномалии;
- теории, объясняющей все аномалии естественными причинами, пока не предложено.
Ergo: теория фальсификации лучшая из теорий, имеющихся в нашем распоряжении. Этого вполне достаточно любому практическому уму, но, конечно, мало для того, чтобы опротестовывать выборы в судебном порядке.

Комментариев нет:

Отправить комментарий