Οι στατιστικολόγοι και οι πολιτικοί επιστήμονες έχουν μια μέρα πεδίου με τα αποτελέσματα των ιρανικών εκλογών νωρίτερα αυτό το μήνα. Ήταν η εκλογική επιλογή; Μπορεί να μην γνωρίζουμε ποτέ, αλλά υπάρχουν αρκετοί θάμνοι στο μάθημα για να μας κάνουν να σκεφτούμε ότι μπορεί να ήταν έτσι. Ακόμα και τότε, υπάρχει και αρκετό για να μας κάνει να πιστέψουμε ότι όλα είναι νόμιμα. Ακολουθούν μερικές αναλύσεις που μου φάνηκαν ιδιαίτερα ενδιαφέρουσες:
Καθαρίστε τα δεδομένα
Αμέσως μετά τις εκλογές, δημιουργήθηκαν αμφιβολίες σχετικά με τη νομιμότητα των δεδομένων, επειδή κάθε φορά που απελευθερώθηκε μια νέα παρτίδα των αποτελεσμάτων των ψηφοφοριών (εμφανίζονται σε κομμάτια στο Ιράν, όμοια με τις Ηνωμένες Πολιτείες), το ποσοστό των ψήφων θα μεταβεί στον Πρόεδρο Mahmoud Ahmadinejad ήταν το ίδιο: 67 τοις εκατό. Τα δεδομένα συνήθως δεν είναι καθαρές και κάποιοι άρχισαν να αναρωτιούνται εάν τα αποτελέσματα είχαν κατασκευαστεί.
Μια ανάλυση από τον καθηγητή μαθηματικών του πανεπιστημίου του Wisconsin, Jordan Ellenberg, στο Slate, όμως, διερευνά βαθύτερα τα δεδομένα για να δείξει ότι ήταν στην πραγματικότητα πιο καθαρή από ό, τι αναμενόταν. Τα αποτελέσματα δεν βγήκαν από πόλη σε πόλη αλλά σε μεγάλες παρτίδες που συνδύαζαν δεδομένα από αρκετές περιοχές, πράγμα που σημαίνει ότι τα σύνολα ψήφων του Αχμαντινετζάντ ήταν πραγματικά μέσοι όροι. Και ο νόμος των μεγάλων αριθμών υπαγορεύει, όπως έγραψε ο Ellenberg:
Οι μέσοι όροι των μεγάλων ποσοτήτων μπορούν, και συνήθως, να αποδώσουν αποτελέσματα που μοιάζουν σχεδόν απόλυτα ομοιόμορφα. Λαμβάνοντας υπόψη αρκετά δεδομένα, τα αποθέματα τείνουν να αλληλοαναιρούνται.
Ο Ellenberg συμπεραίνει ότι τα δεδομένα είναι "σίγουρα αρκετά ακατάστατα για να είναι αληθινά".
Ο νόμος του Μπένφορντ
Πολλές αναλύσεις εξέτασαν τα πρώτα ψηφία των αποτελεσμάτων των εκλογών στο Ιράν για να διαπιστωθεί εάν συμμορφώνονται με τον νόμο Benford, ο οποίος είναι:
Σε καταλόγους αριθμών από πολλές (αλλά όχι όλες) πηγές δεδομένων πραγματικού βίου, το κορυφαίο ψηφίο διανέμεται με συγκεκριμένο, μη ομοιόμορφο τρόπο. Σύμφωνα με τον νόμο αυτό, το πρώτο ψηφίο είναι 1 σχεδόν το ένα τρίτο του χρόνου και τα μεγαλύτερα ψηφία εμφανίζονται ως το κορυφαίο ψηφίο με χαμηλότερη και χαμηλότερη συχνότητα στο σημείο όπου το 9 ως πρώτο ψηφίο εμφανίζεται λιγότερο από μία φορά στις είκοσι. Αυτή η κατανομή των πρώτων ψηφίων προκύπτει λογικά κάθε φορά που ένα σύνολο τιμών κατανέμεται λογαριθμικά.
Μία ανάλυση που χρησιμοποίησε ο Boudewijn Roukema του Πανεπιστημίου Nicolaus Copernicus στην Πολωνία κατέληξε στο συμπέρασμα ότι σχεδόν το διπλάσιο του αριθμού των ψηφοφοριών ξεκινά με το νούμερο 7 για τον Mehdi Karroubi απ 'ό, τι θα περίμενε ο νόμος του Benford. Επιπλέον, ο Roukema υποψιάστηκε ότι τα αποτελέσματα για τον Ahmadinejad, στα οποία υπήρχαν λιγότερα 1s και 2s και 3s από το αναμενόμενο, θα ήταν πιθανό αν κάποιος επέλεγε να χειραγωγήσει τα αποτελέσματα αλλάζοντας το 1s στην αρχή της ψηφοφορίας ανέρχεται σε 2s και 3s. Θα είχε επίσης οδηγήσει σε υπερεκτίμηση των συνολικών ποσών του Αχμαντινετζάντ με αρκετά εκατομμύρια ψήφους.
Ο Walter Mebane, πολιτικός επιστήμονας και στατιστικός στο Πανεπιστήμιο του Μίτσιγκαν, χρησιμοποίησε επίσης τον νόμο Benford στην ανάλυσή του, όπου διαπιστώνει επίσης διάφορες παρατυπίες στα αποτελέσματα των εκλογών στο Ιράν. Αλλά ακόμη και παραδέχεται ότι αν και τα αποτελέσματά του είναι "συμβατά με την εκτεταμένη απάτη", είναι επίσης "συμβατά με τον Ahmadinejad που έχει κερδίσει πραγματικά".
Τα τελευταία δύο ψηφία
Δύο μεταπτυχιακοί φοιτητές στην πολιτική επιστήμη στο Πανεπιστήμιο της Κολούμπια έλαβαν ακόμη ένα τρίτο δείγμα δεδομένων. Σε μια ανάλυση που συνόψισε σε μια Washington Post op-ed, εξέτασαν τα δύο τελευταία ψηφία των αριθμών ψηφοφορίας από 29 επαρχίες για κάθε έναν από τους τέσσερις υποψήφιους (π.χ. εάν κάποιος έλαβε 14.579 ψήφους, μόνο οι 7 και 9 εξετάστηκαν στο η ΑΝΑΛΥΣΗ).
Τα τελευταία δύο ψηφία στα αποτελέσματα των εκλογών είναι τυχαίος θόρυβος και η κατανομή των ψηφίων πρέπει να είναι δίκαιη - κάθε ψηφίο πρέπει να εμφανίζεται περίπου στο 10% του χρόνου. Οι άνθρωποι, όμως, είναι κακές γεννήτριες τυχαίων αριθμών και όταν δημιουργούμε αριθμούς, έχουμε την τάση να επιλέγουμε ορισμένους αριθμούς πιο συχνά από τους άλλους. Στα αποτελέσματα του Ιράν, μόνο το 4 τοις εκατό των αριθμών τελειώνει στο ψηφίο 5 ενώ το ψηφίο 7 εμφανίζεται 17 τοις εκατό του χρόνου. Τα αποτελέσματα που αποκλίνουν τόσο πολύ θα αναμένονταν σε περίπου τέσσερις εκ των 100 εκλογών.
Οι άνθρωποι έχουν επίσης προβλήματα δημιουργίας αριθμών που έχουν μη γειτονικά ψηφία (δηλαδή, είναι λιγότερο πιθανό να βρεθείτε με 72 από ό, τι με 23), αλλά αυτοί οι αριθμοί θα πρέπει επίσης να ακολουθούν τυχαία σχέδια και περίπου το 70% των ζευγών θα πρέπει να αποτελείται από μη γειτονικά ψηφία. Ωστόσο, στα αποτελέσματα του Ιράν, μόνο το 62% το κάνει. Και πάλι, αυτά τα αποτελέσματα αναμένονται σε περίπου 4 στις 100 εκλογές. Αλλά ο συνδυασμός των δύο αποτελεσμάτων αναμένεται μόνο σε 1 στις 200 εκλογές. Μάλλον απίθανο, αλλά όχι αδύνατο.
Πού μας αφήνει αυτό; Μπορεί να μην γνωρίζουμε ποτέ εάν τα αναφερόμενα αποτελέσματα είναι πραγματικά ή όχι. Ωστόσο, τα προσωπικά αγαπημένα μου δεδομένα από όλα αυτά, δεν απαιτούν υπολογισμούς που να οδηγούν σε ερωτήματα νομιμότητας εκλογών. Αυτή η παραπομπή, από τον Abbas-Ali Kadkhodaei, εκπρόσωπο του Ιρανικού Συμβουλίου Φρουράς, θα έκανε σχεδόν οποιονδήποτε να σκεφτεί δύο φορές:
Οι στατιστικές που παρέχονται από τον Mohsen Resaei, όπου ισχυρίζεται ότι πάνω από το 100% των επιλέξιμων έχουν ψηφίσει σε 170 πόλεις δεν είναι ακριβείς - το περιστατικό συνέβη σε μόλις 50 πόλεις.
(Για περισσότερες πληροφορίες σχετικά με τις αναλύσεις των αποτελεσμάτων των εκλογών στο Ιράν, ελέγξτε το Nate Silver στο fivethirtyeight.com)