https://frosthead.com

Το νέο AI της Google μπορεί να κερδίσει τον άνθρωπο πρωταθλητή στο παιχνίδι του Go

Σχεδόν ακριβώς πριν από 20 χρόνια, ο υπολογιστής της IBM Deep Blue νίκησε τον παγκόσμιο σκακιστή πρωταθλητή Garry Kasparov στο δικό του παιχνίδι. Ήταν μια κρίσιμη στιγμή στην ιστορία της τεχνητής νοημοσύνης - η πρώτη φορά που ένας υπολογιστής είχε κατακτήσει σθεναρά τον πρωταθλητή του σκακιού.

Όμως όλοι όσοι είδαν αυτό το σημάδι ότι η επανάσταση του ΑΙ πέρασε, οι επικριτές είπαν "όχι τόσο γρήγορα". Το σκάκι ήταν σχετικά απλό να σπάσει, είπαν. Η πραγματική δοκιμή του AI θα ήταν ένας υπολογιστής που θα μπορούσε να νικήσει έναν πρωταθλητή του ανθρώπου στο Go, το περίπλοκο αρχαίο κινεζικό παιχνίδι στρατηγικής σκέφτηκε να περιλαμβάνει τη διαίσθηση και την κατανόηση της αισθητικής. Και εκείνη την ημέρα ήταν απίθανο να έρθει οποιαδήποτε στιγμή σύντομα.

'' Μπορεί να είναι εκατό χρόνια πριν ένας υπολογιστής χτυπά τους ανθρώπους στο Go - ίσως ακόμα περισσότερο », ανέφερε ο αστροφυσικός και ο fan του Piet Piet Hut στους The New York Times το 1997. '' Αν ένας ευλόγως έξυπνος άνθρωπος έμαθε να παίζει Go, λίγους μήνες θα μπορούσε να κερδίσει όλα τα υπάρχοντα προγράμματα ηλεκτρονικών υπολογιστών. Δεν χρειάζεται να είσαι Kasparov. ''

Αν ένας υπολογιστής νίκησε έναν πρωταθλητή Go, οι Times εξήγησαν, θα ήταν "ένα σημάδι ότι η τεχνητή νοημοσύνη αρχίζει πραγματικά να γίνει τόσο καλή όσο το πραγματικό πράγμα".

Λοιπόν, παιδιά, εκείνη τη στιγμή έφτασε, περίπου εκατό χρόνια πριν από το χρονοδιάγραμμα. Το AlphaGo, ένα πρόγραμμα που αναπτύχθηκε από την ομάδα DeepMind της Τεχνητής Νοημοσύνης της Google, έχει χτυπήσει τον European Go champion Fan Hui 5 με 0.

Τα ευρήματα αναφέρθηκαν σήμερα στο περιοδικό Nature .

Το Go ξεκινά απλά, με ένα 19 με 19 πλέγμα και δύο χρώματα τεμαχίων (που ονομάζονται πέτρες), μαύρο για έναν παίκτη, λευκό για το άλλο. Οι παίκτες βάζουν τις πέτρες τους σε κενές διασταυρώσεις-τα σημεία διέλευσης δύο γραμμών πλέγματος. Σιγά-σιγά, κάθε παίκτης προσπαθεί να περικυκλώνει τις πέτρες του άλλου παίκτη, σε ποιο σημείο συλλαμβάνονται και μετακινούνται από το σκάφος. Μπορεί να υπάρχουν αρκετές περικοπές σε εξέλιξη στο συμβούλιο σε κάθε δεδομένη στιγμή και είναι συχνά δύσκολο να πούμε ποιος πρόκειται να συλλάβει ποιος.

"Το παιχνίδι του Go θεωρείται από καιρό ως το πιο δύσκολο παιχνίδι των κλασικών παιχνιδιών για τεχνητή νοημοσύνη εξαιτίας του τεράστιου χώρου αναζήτησης και της δυσκολίας αξιολόγησης των θέσεων και κινήσεων του σκάφους", γράφουν οι συγγραφείς του βιβλίου.

Το AlphaGo "μαθαίνει" τόσο μέσω της κατάρτισης από ανθρώπους εμπειρογνώμονες, όσο και μέσω της πρακτικής παίζοντας εναντίον του. Δεδομένου ότι ο Go έχει πάρα πολλές πιθανές κινήσεις για έναν υπολογιστή για να χτυπήσει απλά τα δεδομένα κατά την επόμενη απόφαση του - ένα σημαντικό σημείο που κολλάει τις προηγούμενες προσπάθειες του Go-playing-το AlphaGo χρησιμοποιεί αντί αυτού δύο διαφορετικά "βαθιά νευρικά δίκτυα". "Δίκτυο πολιτικής" - αυτό δίνει στον υπολογιστή μια χούφτα υποσχόμενων κινήσεων για να εξετάσει, με βάση τα παρελθόντα παιχνίδια, οπότε δεν χρειάζεται να χτυπά με κάθε δυνατή κίνηση. Το "δίκτυο αξίας" μειώνει το βάθος της αναζήτησης - δηλαδή, αντί να ψάχνει μέχρι το τέλος του παιχνιδιού, εκατοντάδες απομακρυσμένες κινήσεις, το πρόγραμμα μπορεί να φανεί μόνο μια χούφτα μακριά για να κάνει τις επιλογές του.

Αυτό είναι ένα μεγάλο ζήτημα: εκτός από το ότι είναι μια δοκιμασία των εξουσιών του AI, η δημιουργία ενός προγράμματος Go-παίζοντας ικανό να κερδίσει πρωταθλητές ανθρώπων ήταν κάτι σαν κούρσα εξοπλισμών. Για χρόνια, διάφοροι προγραμματιστές και εταιρείες έχουν φωνάξει για να δημιουργήσουν την έκδοση Go του Deep Blue. Μερικοί έχουν πάρει κοντά. Ένα γαλλικό πρόγραμμα που ονομάζεται Crazy Stone κτύπησε τον πρωταθλητή Yoshio Ishida του πεντάλεπτου Ιαπωνικού Go, το 2013, αν και ο Crazy Stone έλαβε ένα χάντικαπ (το AlphaGo δεν ήταν) και ο Ishida δεν θεωρήθηκε κορυφαίος παίκτης σε αρκετές δεκαετίες. Μέχρι στιγμής, το AlphaGo έχει κερδίσει άλλα προγράμματα Go 99, 8 τοις εκατό του χρόνου.

Μόλις λίγες ώρες πριν η Google κυκλοφόρησε επίσημα τα δικά της νέα, το Facebook, χωρίς αμφιβολία, ξεκίνησε να χτυπηθεί στη γροθιά, έριξε την ανακοίνωση ότι η δική τους AI "έφτασε κοντά" για να νικήσει τους πρωταθλητές του Go.

Γιατί λοιπόν το Go θεωρείται τόσο ισχυρό τεστ AI; Θα ήταν πολύ αναγωγικό να πούμε ότι το Go είναι πιο εύκολο από το σκάκι.

"Το παιχνίδι αντανακλά τις ικανότητες των παικτών στην εξισορρόπηση της επίθεσης και της άμυνας, καθιστώντας τις πέτρες να λειτουργούν αποτελεσματικά, παραμένοντας ευέλικτες ως ανταπόκριση στις μεταβαλλόμενες καταστάσεις, χρονοδιάγραμμα, ανάλυση με ακρίβεια και αναγνώριση των δυνάμεων και αδυναμιών του αντιπάλου", εξηγεί η British Go Association ιστοχώρο, που αντιπροσωπεύει τη σύνθετη έκκληση της Go.

Ενώ το σκάκι έχει κατά μέσο όρο 35 νομικές κινήσεις ανά στροφή, η Go έχει κατά μέσο όρο 200. Και ενώ υπάρχουν περίπου 10 ³³ πιθανές διαμορφώσεις ενός σκάφους σκακιού, μια πλατφόρμα Go έχει τουλάχιστον 2, 08 X 10 '107 - περισσότερες διαμορφώσεις από ότι υπάρχουν άτομα στο σύμπαν. Σε αντίθεση με το σκάκι, όπου ο αριθμός των κομματιών στο τραπέζι είναι πολύ καλός δείκτης για το ποιος κερδίζει, είναι πολύ δύσκολο να γνωρίζουμε ποιος είναι μπροστά στο Go.

"Δεν υπάρχει καλό ευρετικό για να καθορίσουμε αν μια θέση είναι καλή ή κακή για έναν παίκτη", εξηγεί ο πρόεδρος της British Go Association, Jon Diamond. "Είναι εν μέρει ανάλυση, και είναι εν μέρει αναγνώριση προτύπων. Αξιολογείτε το διοικητικό συμβούλιο με έναν περίπλοκο τρόπο που δεν έχουμε επεξεργαστεί πώς να αναπαράγουμε σε υπολογιστές. "

Η Diamond λέει ότι ήταν αρκετά έκπληκτος που άκουσε την επιτυχία του AlphaGo. "Υποθέτω ότι δεν περίμενα αυτό για περίπου πέντε έως δέκα χρόνια για να είμαι ειλικρινής", λέει. "Έκαναν μια καλή δουλειά."

Η επιτυχία του AlphaGo μπορεί να σημαίνει ότι είμαστε πολύ πιο κοντά από ό, τι θεωρούσαμε προηγουμένως ότι έχουμε AI που μπορούν να αποδώσουν σε ανθρώπινο επίπεδο σε άλλες περιοχές. Το AlphaGo μπορεί να είναι ένα "βήμα προς βήμα" σε άλλα είδη AIs, λένε οι προγραμματιστές του. Ένα AI που μπορεί να κάνει τα είδη των σύνθετων, διαισθητικών φαινομενικών αποφάσεων που είναι απαραίτητες για να κερδίσει το Go μπορεί να είναι σε θέση, για παράδειγμα, να διαγνώσει έναν άρρωστο ασθενή και να συνταγογραφήσει εξατομικευμένη πορεία θεραπείας, σύμφωνα με τους προγραμματιστές.

Τον Μάρτιο, η AlphaGo θα δοκιμάσει ξανά τη σφριγηλότητα της, όταν πηγαίνει επικεφαλής με τον Lee Sedol της Κορέας, που θεωρείται ο κορυφαίος παίκτης του Go στον κόσμο.

"Ανεξάρτητα από το αποτέλεσμα, θα είναι ένα σημαντικό γεγονός στην ιστορία baduk (go)", λέει ο Lee σε ένα δελτίο τύπου. "Άκουσα ότι το AI του Google DeepMind είναι εκπληκτικά ισχυρό και ισχυρότερο, αλλά είμαι σίγουρος ότι μπορώ να κερδίσω τουλάχιστον αυτή τη φορά".

Το νέο AI της Google μπορεί να κερδίσει τον άνθρωπο πρωταθλητή στο παιχνίδι του Go