trim_c (trim_c) wrote,
trim_c
trim_c

Categories:

Теория вероятностей применительно к Саратовской области (обновлено)


Сильно возбудилась дискуссия - а насколько вероятно, что вот на 100 участках из 1800 в Саратовской области (мне дали такие данные) результаты совпадут с точностью до одной десятой процента.

Точно подсчитать такую величину достаточно хлопотно, но в данном случае это вовсе не нужно. Согласно теории вероятностей если вероятность наступление события в результате каждого из ряда одинаковых испытаний равна р,а ненаступления соответственно q= (1-р)
то вероятность того, что в результате n испытаний наше событие наступит ровно k раз задается формулой Бернулли P_{k,n}=C_{n}^{k}\cdot p^{k}\cdot q^{n-k} где число сочетаний из n по k вычисляется по формуле

В нашем случае мы должны сделать некие предположения о том, какие допустимые значения, кроме злополучного 62,2% могут принимать реальные результаты голосования и как они распределены. Я сделаю простое, но достаточно жесткое предположение: что допустимые значения находятся вокруг центра 62,2% в интервале плюс/минус пять процентов т.е. от 57,2% и до 67,2%, но в этом интервале все значения равновероятны. Т.к. мы идем с шагом 0,1%, а ширина интервала 10%, то возможных значений у нас 100, а вероятность каждого из них одна сотая. Т.е. возвращаясь к формуле Бернулли р=0,01; q=0,99.
Для упрощения примем q=1, это первое упрощение увеличит искомую вероятность примерно в сто миллионов раз, но это в запас.


Теперь нам следует вычислить величину .(для тех, кто совсем школу забыл -знак "!" -факториал - означает произведение всех чисел от 1 и до отмеченного восклицательным знаком числа.

Основное затруднение тут вычисление сочетаний, и нашим вторым упрощением, заметно увеличивающим результат, будет замена всех чисел в числителе на максимальное значение 1800.

Теперь мы это число поделим на 100100 и просто сократим числитель и знаменатель сто раз на 100


Далее вычисляем 100! с помощью формулы Стерлинга и подставляем в знаменатель


Итог следует признать более нежели убедительным: при всех наших жестких допущениях (узкий диапазон значений, замены всегда в сторону увеличения) результат - вероятность такого случайного события равна нулю. Перед нами четкая фальшивка.
И тут не может быть сомнений



Замечание 1 Рассуждения о наблюдателях не следует вовсе принимать во внимание. Потому что результат получается невозможный, и следует искать дырки у людей, а не у математики. Потому что например при Януковиче в Украине могли очень четко проконтролировать голосование, но не проконтролировать подсчет, протокол с печатью могли подменить в ТИКе (были обнаружены десятки случаев, когда в райадминистрациях хранились дубли всех печатей участковых комиссий) результат мог быть фальсифицирован ТИКом и т.д. и т.п. Потому ссылки "а как же наблюдатели" - это уже для следователей,они должны искать механизмы фальсификаций

Замечание 2 Учет того, что участков не 1800 а 1886 легко компенсируется меньшей "щедростью" подсчета. Будем считать, что в числителе все числа равны не максимальному, а среднему из сомножителей - в нашем случае их сто и среднее будет равно 1886 -50 = 1836. Это предположение тоже увеличивает результат в числителе, но не так сильно, как замена максимумом. В итоге получим, что от заявленного результат отличается в два раза - что абсолютно не принципиально

Замечание 3 Что касается совпадении 25 результатов с точностью до одной десятой - это абсолютно другая история. В рамках той же модели -1800 участков, 100 допустимых результатов - и в предположении что все распределилось идеально равномерно, каждое допустимое значение встретится ровно 1800/100 = 18 раз.

Но т.к. идеально поровну распределить абсолютно невозможно, то конечно будут значения, которые встречаются 19, 20, 21 раз - как и 17,16, 15 ... И значения, которые встретились 25 раз вполне могут и даже обязаны получаться. А если распределение все-таки похож на колокол. пусть размазанный, то 25 и даже 30 совпадений в центральной зоне допустимых значений просто обязаны быть.

Если число допустимых значений станет не сто а двести (т.е. встречаются как участки с 52% явки, так и участки с 72% явки), картина ухудшится резко, однако достаточно узкая гауссиана сделает и 25 и даже 30 совпадений возможными.

Т.е. различие в реальности между 25тью и ста совпадениями - оно огромно, оно составляет десятки порядков, т.е. десятки нулей после запятой. И это нужно учитывать
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 305 comments
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →
Previous
← Ctrl ← Alt
Next
Ctrl → Alt →