https://frosthead.com

Αυτό το AI που παίζει πόκερ γνωρίζει πότε πρέπει να κρατάτε το Em και πότε να το διπλώσετε

Ένα πρόγραμμα υπολογιστών που ονομάζεται Pluribus έχει κερδίσει επαγγελματίες του πόκερ σε μια σειρά παιχνιδιών Texas Hold'em χωρίς όρια έξι παικτών, φτάνοντας ένα ορόσημο στην έρευνα τεχνητής νοημοσύνης. Είναι το πρώτο bot που κερδίζει τους ανθρώπους σε έναν περίπλοκο διαγωνισμό για πολλούς παίκτες.

Όπως αναφέρουν ερευνητές από το εργαστήριο AI του Facebook και το πανεπιστήμιο Carnegie Mellon στο επιστημονικό περιοδικό Science, ο Pluribus αναδείχθηκε νικητής τόσο σε αγώνες ανθρώπινου όσο και αλγορίθμου. Αρχικά, ο Merrit Kennedy γράφει για το NPR, πέντε εκδόσεις του bot που αντιμετωπίζουν έναν επαγγελματία παίκτη πόκερ. στον επόμενο γύρο των πειραμάτων, ένα bot έπαιξε έναντι πέντε ανθρώπων. Σύμφωνα με μια ανάρτηση blog στο Facebook, το AI κέρδισε κατά μέσο όρο περίπου $ 5 ανά χέρι, ή $ 1, 000 ανά ώρα, όταν παίζει εναντίον πέντε ανθρώπινων αντιπάλων. Το ποσοστό αυτό θεωρείται "αποφασιστικό περιθώριο νίκης" μεταξύ των επαγγελματιών πόκερ.

Μιλώντας με τον Kennedy, ο τετράχρονος πρωταθλητής του World Poker Tour Darren Elias εξηγεί ότι βοήθησε να εκπαιδεύσει τον Pluribus ανταγωνιζόμενος τέσσερα τραπέζια των αντιπάλων των bot και προειδοποιώντας τους επιστήμονες όταν έκανε το AI λάθος. Σύντομα, το bot "βελτιωνόταν πολύ γρήγορα, από το να είναι ένας μέτριος παίκτης για έναν παίκτη πόκερ παγκοσμίου επιπέδου σε ένα θέμα ημερών και εβδομάδων." Η εμπειρία, ο Ηλίας λέει, ήταν "αρκετά τρομακτική".

Σύμφωνα με τον James Vincent της Verge, το Pluribus - ένα εκπληκτικά χαμηλού κόστους AI που εκπαιδεύεται με πόρους υπολογιστικού νέφους κάτω των 150 δολαρίων - έχει περαιτέρω γνώση της στρατηγικής του πόκερ παίζοντας εναντίον αντιγράφων του και μάθησης μέσω δοκιμών και σφαλμάτων. Όπως σημειώνει η Jennifer Ouellette για την Ars Technica, ο bot γνώριζε γρήγορα ότι η καλύτερη πορεία δράσης του ήταν ένας συνδυασμός παιχνιδιού και απρόβλεπτων κινήσεων.

Οι περισσότεροι άνθρωποι αποφεύγουν το "στοιχημάτινο στοίχημα", το οποίο βρίσκει έναν παίκτη που τελειώνει σε ένα γύρο με ένα τηλεφώνημα και ξεκινώντας το επόμενο με ένα στοίχημα, αλλά ο Pluribus αγκάλιασε εύκολα τη μη δημοφιλή στρατηγική. Ταυτόχρονα, σύμφωνα με τις αναφορές του Ouellette, το AI προσέφερε επίσης ασυνήθιστα μεγέθη στοιχημάτων και επέδειξε καλύτερη τυχαιοποίηση από τους αντιπάλους.

"Η μεγάλη του δύναμη είναι η ικανότητά της να χρησιμοποιεί μικτές στρατηγικές", δήλωσε ο Ηλίας, σύμφωνα με μια δήλωση της CMU. "Αυτό είναι το ίδιο πράγμα που προσπαθούν να κάνουν οι άνθρωποι. Είναι θέμα εκτέλεσης για τον άνθρωπο - να το κάνουμε αυτό με έναν εντελώς τυχαίο τρόπο και να το κάνουμε με συνέπεια. Οι περισσότεροι άνθρωποι απλά δεν μπορούν. "

Το Pluribus δεν είναι το πρώτο AI που παίζει πόκερ για να νικήσει τους επαγγελματίες του κόσμου. Το 2017, οι δημιουργοί του bot, Noam Brown και Tuomas Sandholm, ανέπτυξαν μια προηγούμενη επανάληψη του προγράμματος που ονομάζεται Libratus. Αυτό το AI νίκησε αποφασιστικά τέσσερις επαγγελματίες του πόκερ σε 120.000 χέρια δύο παικτών Texas Hold'em, αλλά όπως εξηγεί το blog blog του Facebook, περιορίστηκε από το γεγονός ότι αντιμετώπισε μόνο έναν αντίπαλο κάθε φορά.

Σύμφωνα με τον Will Knight του MIT Technology Review, το πόκερ αποτελεί πρόκληση για το AI επειδή περιλαμβάνει πολλούς παίκτες και μια πληθώρα κρυφών πληροφοριών. Συγκριτικά, τα παιχνίδια όπως το σκάκι και το Go περιλαμβάνουν μόνο δύο συμμετέχοντες και οι θέσεις των παικτών είναι ορατές σε όλους.

Για να ξεπεράσουν αυτά τα εμπόδια, οι Brown και Sandholm δημιούργησαν έναν αλγόριθμο σχεδιασμένο να προβλέψει τις επόμενες δύο ή τρεις κινήσεις των αντιπάλων αντί να μετρήσει τα βήματα τους στο τέλος του παιχνιδιού. Παρόλο που η στρατηγική αυτή φαίνεται να δίνει προτεραιότητα στο βραχυπρόθεσμο κέρδος έναντι των μακροπρόθεσμων κερδών, η Ο Vincent της Verge γράφει ότι "η βραχυπρόθεσμη επιδείνωση είναι πραγματικά ό, τι χρειάζεστε".

Προχωρώντας προς τα εμπρός, τα προγράμματα για πολλούς παίκτες, όπως το Pluribus, θα μπορούσαν να χρησιμοποιηθούν για το σχεδιασμό φαρμάκων ικανών να καταπολεμήσουν τα ανθεκτικά στα αντιβιοτικά βακτηρίδια, καθώς και για τη βελτίωση της ασφάλειας του κυβερνοχώρου και των στρατιωτικών ρομποτικών συστημάτων. Οπως και Η Ouellette της Ars Technica σημειώνει ότι άλλες πιθανές εφαρμογές περιλαμβάνουν την επίβλεψη πολυκομματικών διαπραγματεύσεων, την τιμολόγηση προϊόντων και τις στρατηγικές υποβολής προσφορών για τη διοργάνωση διαγωνισμών.

Προς το παρόν, ο Μπράουν λέει στον Knight, ο αλγόριθμος θα παραμείνει σε μεγάλο βαθμό σε περιτύλιξη - κυρίως για να προστατεύσει τη βιομηχανία του online πόκερ από τις καταστροφικές οικονομικές απώλειες.

Ο ερευνητής καταλήγει: "Θα μπορούσε να είναι πολύ επικίνδυνο για την κοινότητα του πόκερ".

Αυτό το AI που παίζει πόκερ γνωρίζει πότε πρέπει να κρατάτε το Em και πότε να το διπλώσετε