https://frosthead.com

Μπορεί ένα μοντέλο υπολογιστών να προβλέψει τον πρώτο γύρο της τρέχουσας τρέλας του τρέχοντος έτους;

"Να είστε προσεκτικοί στο Ides του Μαρτίου." Ναι, είναι τελικά και πάλι η εποχή του χρόνου: όταν οι αυτοκράτορες του μπάσκετ κολλεγίων πρέπει να παρακολουθήσουν την πλάτη τους, μήπως οι σπόροι των κατώτερων πυργίσκων του τουρνουά χτυπήσουν.

Πριν από τις 15 Μαρτίου, εκατομμύρια σε ολόκληρο τον κόσμο θα συμπληρώσουν τις αγκύλες του March Madness. Το 2017, το ESPN έλαβε ρεκόρ 18, 8 εκατομμυρίων αγκυλών.

Το πρώτο βήμα σε ένα τέλειο βραχίονα επιλέγει σωστά τον πρώτο γύρο. Δυστυχώς, οι περισσότεροι από εμάς δεν μπορούν να προβλέψουν το μέλλον. Πέρυσι, μόνο 164 από τα υποστυλώματα ήταν τέλεια στον πρώτο γύρο - λιγότερο από 0, 001 τοις εκατό.

18, 8 εκατομμύρια αγκύλες υποβλήθηκαν.

Τα 164 είναι τέλεια μετά τον Γύρο 1.

Εδώ είναι υπέρβαση. #perfectbracketwatch pic.twitter.com/TGwZNCzSnW

- ESPN Fantasy Sports (@ ESPFantasy) 18 Μαρτίου 2017

Πολλές αγκύλες σβήνουν όταν μια ομάδα με χαμηλότερη σπορά ανατρέπει τον προτιμώμενο ανώτερο σπόρο. Δεδομένου ότι το πεδίο επεκτάθηκε σε 64 ομάδες το 1985, εμφανίζονται τουλάχιστον οκτώ αναστάτωση κατά μέσο όρο κάθε χρόνο. Αν θέλετε να κερδίσετε την πισίνα του βραχίονα σας, καλύτερα να επιλέξετε τουλάχιστον μερικές ανατροπές.

Είμαστε δύο μαθηματικά Ph.D. υποψήφιους στο κρατικό πανεπιστήμιο του Οχάιο που έχουν πάθος για την επιστήμη των δεδομένων και το μπάσκετ. Φέτος, αποφασίσαμε ότι θα ήταν διασκεδαστικό να οικοδομήσουμε ένα πρόγραμμα ηλεκτρονικών υπολογιστών που χρησιμοποιεί μια μαθηματική προσέγγιση για την πρόβλεψη πρωτογενούς ανατροπής. Εάν έχουμε δίκιο, ένα βραχίονα που επιλέξαμε χρησιμοποιώντας το πρόγραμμά μας πρέπει να έχει καλύτερη απόδοση στον πρώτο γύρο από το μέσο όρο.

Παράνομοι άνθρωποι

Δεν είναι εύκολο να προσδιορίσετε ποιο από τα παιχνίδια του πρώτου γύρου θα έχει ως αποτέλεσμα μια αναστάτωση.

Πείτε ότι πρέπει να αποφασίσετε μεταξύ του σπόρου αριθ. 10 και του σπόρου αριθ. 7. Ο σπόρος αρ. 10 έχει απογοητεύσει τις τελευταίες τρεις εμφανίσεις του τουρνουά, κάποτε κάνοντας την τελική τετράδα. Ο σπόρος αριθ. 7 είναι μια ομάδα που έχει λάβει ελάχιστη ή καθόλου εθνική κάλυψη. ο περιστασιακός ανεμιστήρας μάλλον δεν έχει ακούσει ποτέ για αυτούς. Ποια θα επιλέγατε;

Αν επιλέξατε το σπόρο αρ. 10 το 2017, θα είχατε πάει με το Πανεπιστήμιο της Virginia Commonwealth πάνω από την Αγία Μαρία της Καλιφόρνιας - και θα κάνατε λάθος. Χάρη σε μια πλάνη λήψης αποφάσεων που ονομάζεται μεροληψία πρόσφατης συμπεριφοράς, ο άνθρωπος μπορεί να εξαπατηθεί να χρησιμοποιεί τις πιο πρόσφατες παρατηρήσεις του για να πάρει μια απόφαση.

Η σύγχρονη μεροληψία είναι μόνο ένας τύπος μεροληψίας που μπορεί να διεισδύσει στη διαδικασία επιλογής κάποιου, αλλά υπάρχουν και πολλοί άλλοι. Ίσως να είστε προκατειλημμένοι προς την ομάδα σας ή ίσως να ταυτιστείτε με έναν παίκτη και να τον επιζητήσετε απεγνωσμένα να πετύχει. Όλα αυτά επηρεάζουν την αγκαλιά σας με δυνητικά αρνητικό τρόπο. Ακόμα και έμπειροι επαγγελματίες εμπίπτουν σε αυτές τις παγίδες.

Μοντελοποίηση ανατροπών

Η μηχανική μάθηση μπορεί να υπερασπιστεί αυτές τις παγίδες.

Στη μηχανική μάθηση, οι στατιστικολόγοι, οι μαθηματικοί και οι επιστήμονες των υπολογιστών εκπαιδεύουν μια μηχανή για να κάνουν προβλέψεις, επιτρέποντάς της να "μαθευτεί" από προηγούμενα δεδομένα. Αυτή η προσέγγιση έχει χρησιμοποιηθεί σε πολλούς διαφορετικούς τομείς, συμπεριλαμβανομένου του μάρκετινγκ, της ιατρικής και του αθλητισμού.

Οι τεχνικές εκμάθησης μηχανών μπορούν να παρομοιαστούν με ένα μαύρο κουτί. Κατ 'αρχάς, τροφοδοτείτε τον αλγόριθμο πριν από τα δεδομένα, ορίζοντας ουσιαστικά τις κλήσεις στο μαύρο κουτί. Μόλις βαθμονομηθούν οι ρυθμίσεις, ο αλγόριθμος μπορεί να διαβάσει σε νέα δεδομένα, να τα συγκρίνει με δεδομένα του παρελθόντος και στη συνέχεια να ξεδιπλώσει τις προβλέψεις του.

Μια μαύρη απεικόνιση των αλγορίθμων μηχανικής μάθησης. Μια μαύρη απεικόνιση των αλγορίθμων μηχανικής μάθησης. (Matthew Osborne, CC BY-SA)

Στη μηχανική μάθηση, υπάρχει μια ποικιλία από μαύρα κουτιά διαθέσιμα. Για το έργο March Madness, αυτά που θέλαμε είναι γνωστά ως αλγόριθμοι ταξινόμησης. Αυτά μας βοηθούν να προσδιορίσουμε αν ένα παιχνίδι πρέπει να ταξινομηθεί ως αναστατωμένος, είτε παρέχοντας την πιθανότητα μιας αναστάτωσης είτε κατηγορηματικά χαρακτηρίζοντας ένα παιχνίδι ως ένα.

Το πρόγραμμά μας χρησιμοποιεί πολλούς δημοφιλείς αλγόριθμους ταξινόμησης, συμπεριλαμβανομένης της υλικοτεχνικής παλινδρόμησης, τυχαίων δασικών μοντέλων και των πιο κοντινών γειτόνων. Κάθε μέθοδος είναι σαν μια διαφορετική "μάρκα" της ίδιας μηχανής. λειτουργούν διαφορετικά κάτω από την κουκούλα ως Fords και Toyotas, αλλά εκτελούν την ίδια εργασία ταξινόμησης. Κάθε αλγόριθμος, ή κιβώτιο, έχει τις δικές του προβλέψεις σχετικά με την πιθανότητα μιας αναστάτωσης.

Χρησιμοποιήσαμε τα στατιστικά στοιχεία όλων των ομάδων πρώτου γύρου από το 2001 έως το 2017 για να ρυθμίσουμε τους πίνακες σε μαύρα κουτιά. Όταν δοκιμάσαμε έναν από τους αλγορίθμους μας με τα δεδομένα του πρώτου γύρου του 2017, είχε περίπου 75% ποσοστό επιτυχίας. Αυτό μας δίνει την πεποίθηση ότι η ανάλυση παλαιότερων δεδομένων, παρά η εμπιστοσύνη στο έντερο μας, μπορεί να οδηγήσει σε ακριβέστερες προβλέψεις ανατροπών και, συνεπώς, καλύτερων ολικών αγκυλών.

Ποια πλεονεκτήματα έχουν αυτά τα κουτιά πάνω από την ανθρώπινη διαίσθηση; Για ένα, τα μηχανήματα μπορούν να αναγνωρίσουν πρότυπα σε όλα τα δεδομένα 2001-2017 σε λίγα δευτερόλεπτα. Επιπλέον, δεδομένου ότι οι μηχανές βασίζονται μόνο σε δεδομένα, ενδέχεται να είναι λιγότερο πιθανό να πέσουν για τις ψυχολογικές προκαταλήψεις του ανθρώπου.

Αυτό δεν σημαίνει ότι η μηχανική μάθηση θα μας δώσει τέλειες αγκύλες. Παρόλο που το κουτί παρακάμπτει την ανθρώπινη προκατάληψη, δεν είναι άνοσο σε λάθος. Τα αποτελέσματα εξαρτώνται από προηγούμενα δεδομένα. Για παράδειγμα, αν ένας σπόρος αριθ. 1 θα χάσει στον πρώτο γύρο, το μοντέλο μας δεν θα το πρόβλεπε πιθανώς, γιατί αυτό δεν συνέβη ποτέ πριν.

Επιπλέον, οι αλγόριθμοι μηχανικής μάθησης λειτουργούν καλύτερα με χιλιάδες ή και εκατομμύρια παραδείγματα. Μόνο 544 παιχνίδια πρώτου γύρου Μαρτίου Madness έχουν παιχτεί από το 2001, έτσι ώστε οι αλγόριθμοί μας να μην καλούν σωστά κάθε αναστάτωση. Απαντώντας στον εμπειρογνώμονα μπάσκετ Jalen Rose, η παραγωγή μας πρέπει να χρησιμοποιηθεί ως εργαλείο σε συνδυασμό με τις γνώσεις σας - και την τύχη! - να επιλέξετε τα σωστά παιχνίδια.

Μάθηση μάθησης μηχανών;

Δεν είμαστε οι πρώτοι άνθρωποι που εφαρμόζουν μηχανική μάθηση στην Madness Madness και δεν θα είμαστε οι τελευταίοι. Στην πραγματικότητα, οι τεχνικές εκμάθησης μηχανών μπορεί σύντομα να είναι απαραίτητες για να κάνουν το βραχίονα σας ανταγωνιστικό.

Δεν χρειάζεστε ένα βαθμό στα μαθηματικά για να χρησιμοποιήσετε μηχανική μάθηση - αν και μας βοηθάει. Σύντομα, η μηχανική μάθηση μπορεί να είναι πιο προσιτή από ποτέ. Οι ενδιαφερόμενοι μπορούν να ρίξουν μια ματιά στα μοντέλα μας online. Μη διστάσετε να διερευνήσετε τους αλγόριθμους μας και να καταλήξετε σε μια καλύτερη προσέγγιση μόνοι σας.


Αυτό το άρθρο δημοσιεύθηκε αρχικά στην Η συζήτηση. Η συζήτηση

Matthew Osborne, υποψήφιος διδάκτωρ στα μαθηματικά, το κρατικό πανεπιστήμιο του Οχάιο

Kevin Nowland, Υποψήφιος Διδάκτωρ στα Μαθηματικά, Το Πανεπιστήμιο του Οχάιο

Μπορεί ένα μοντέλο υπολογιστών να προβλέψει τον πρώτο γύρο της τρέχουσας τρέλας του τρέχοντος έτους;