Getallen die niet liegen?

Ster inactiefSter inactiefSter inactiefSter inactiefSter inactief
 

chanceVan veraf is moeilijk vast te stellen of er bij verkiezingen in Iran is geknoeid met de uitslagen.
Toch is het blijkbaar mogelijk om aan de hand van de precieze cijfers van de verkiezingsresultaten te berekenen of die cijfers 'kunstmatig' zijn. Deze 'kunstmatigheids-index' levert een maat op waarmee de kans berekent kan wordan dat die uitslagen 'natuurlijk' zijn!

Hoe dat werkt?

Wanneer besloten wordt om feitelijke uitslagen 'bij te stellen' dan zal dat door mensen 'met de hand' gebeuren. Mensen zijn niet goed in het maken van 'kans-gebaseerde' getallen: wanneer je iemand vraagt om tien 'willekeurige' getallen te noemen, dan zullen dat nooit 'echt-willekeurige' getallen zijn. In mijn studietijd waren er dan ook boekjes voorhanden met daarin reeksen van willekeurige getallen: alleen die waren willekeurig genoeg om in een experiment te gebruiken. Echt willekeurig is echt moeilijk. Dus zitten er nu in de Verenigde Staten diverse wetenschappers te rekenen op de uitslagen van de verkiezingen in Iran. Ze testen of de cijfers in al de gepresenteerde tabellen met uitslagen 'genoeg willekeurig' zijn! Want als ze trekjes van kunstmatigheid vertonen, dan zijn ze dus indicatie van verkiezingsfraude.

Zoals bij veel wetenschappelijke kwesties is er nog volop debat, of en in welke mate en met welke percentages van zekerheid er gemanipuleerd is. De meerderheid lijkt van mening dat dat wel degelijk zo lijkt te zijn. Dat blijkt uit de cijfers zelf: The devil is in the digits.
Een kort citaat uit een discussie tussen statistici over dit onderwerp:

As votes began coming in on Friday night, the clerics began to think they might lose. Someone in the Ministry of the Interior then fabricated the province level results. The pattern in the last digits suggests to us that some of those vote totals were made up wholesale (why bother fudging last digits? It's an inefficient way to shift votes around).

That still left the task of making sure the numbers in the county-level spreadsheet added up to the province-level vote counts. (And we checked -- the county numbers do in fact add up to the province numbers.) A province contains 12 counties on average, so it may have been necessary to shift votes in several counties per province in order to get the leading digits to line up. This could explain possibly suspicious patterns in the first or second digit. But once the leading digits match, it's easy to get the last and second-to-last digit to match by changing just one county per province, which isn't enough to be picked up by our tests.

An example might make this clearer. Suppose we make up vote counts for some province, but they differ from the sum of county vote counts in the Ministry's spreadsheet. Let's say we happened to give one candidate 124,561 more votes than he has in the spreadsheet and another candidate that many fewer votes. There are ten counties, and no more than 100,000 votes to go around in each county. So we'll shift 30,000 votes in one county, 20,000 in another, and so on, but we have to change first and perhaps second digits in more than one county until we have a rough match with our province-level result. But to get the numbers to add up in the trailing digits, we can change just a single county.

Combining findings at the Province and County Level from Iran's Election
  • Hits: 3120