https://frosthead.com

Το τελευταίο AI διδάσκει στον εαυτό του να παίζει χωρίς να έχει ανθρώπινη βοήθεια

Πέρυσι, ένα πρόγραμμα τεχνητής νοημοσύνης που ονομάζεται AlphaGo, το οποίο δημιουργήθηκε από την ομάδα DeepMind της Google, κέρδισε έναν πρωταθλητή στο Go, ένα αρχαίο κινεζικό παιχνίδι στρατηγικής που είναι κατά πολλούς τρόπο πιο περίπλοκο από το σκάκι. Όπως έγραψε η Emily Matchar για το Smithsonian.com την εποχή εκείνη, ήταν ένα εκπληκτικό επίτευγμα, δεδομένου ότι τόσο αργά το 1997 μερικοί άνθρωποι προέβλεπαν ότι θα χρειαστούν 100 χρόνια για έναν υπολογιστή για να νικήσει έναν άνθρωπο στο Go.

Ενώ το κατόρθωμα είναι εντυπωσιακό, το AlphaGo έμαθε να παίζει το παιχνίδι αναλύοντας προηγούμενα παιχνίδια που παίζουν οι άνθρωποι. Αλλά όπως αναφέρει ο Merrit Kennedy στο NPR, μια νέα έκδοση της τεχνητής νοημοσύνης που ονομάζεται AlphaGo Zero έχει καταλάβει πώς μπορεί να κυριαρχήσει το παιχνίδι μόνη της, χωρίς ανθρώπινη εισροή ή χειραγώγηση - μια εξέλιξη που έχει μεγάλες συνέπειες για τη μελλοντική ανάπτυξη του AI.

Σύμφωνα με ένα δελτίο τύπου από το DeepMind, οι προηγούμενες εκδόσεις του AlphaGo έμαθαν να παίζουν το παιχνίδι μελετώντας αγώνες μεταξύ επαγγελματιών και ισχυρών ερασιτεχνών παικτών, απορροφώντας τους κανόνες του παιχνιδιού και επιτυχημένες στρατηγικές παιχνιδιού. Το AlphaGo Zero, ωστόσο, δεν έβλεπε κανένα παιχνίδι που έπαιζε ο άνθρωπος. Αντ 'αυτού, δόθηκε στους κανόνες του παιχνιδιού και στη συνέχεια έπαιξε εναντίον του, χρησιμοποιώντας την ενίσχυση της μάθησης για να διδάξει σωστές και λανθασμένες κινήσεις και μακροπρόθεσμες στρατηγικές. Καθώς το AI έπαιξε το παιχνίδι, ενημέρωσε το προηγμένο νευρωνικό του δίκτυο για να προβλέψει καλύτερα τις κινήσεις του αντιπάλου του.

Οι ερευνητές παρακολουθούσαν ότι το AI κατέκτησε το παιχνίδι σε πραγματικό χρόνο. Μετά από τρεις μέρες ήταν σε θέση να νικήσει μια προηγούμενη έκδοση που ονομάζεται AlphaGo Lee, η οποία χτύπησε τον Κορεατικό κύριο πλοίαρχο Lee Sedol σε 4 από τα 5 παιχνίδια το 2016. Μετά από 21 μέρες πήρε το AlphaGo Master, την έκδοση που χτύπησε 60 top Go online παίκτες και ο καλύτερος παίκτης στον κόσμο Ke Jie νωρίτερα αυτό το έτος. Η τελευταία έκδοση έπληξε τα παιχνίδια AlphaGo Master 100 σε 0. Μετά από 40 ημέρες, έφτασε σε επίπεδα παιχνιδιού που κανείς δεν έχει δει πριν. Η έρευνα εμφανίζεται στο περιοδικό Nature.

"Σε σύντομο χρονικό διάστημα, το AlphaGo Zero έχει καταλάβει όλες τις γνώσεις του Go που έχουν συσσωρευτεί από ανθρώπους για χιλιάδες χρόνια παίζοντας", λέει ο επικεφαλής ερευνητής David Silver του Google DeepMind σε ένα βίντεο στο Youtube. "Μερικές φορές είναι πραγματικά επιλεγμένο να προχωρήσει πέρα ​​από αυτό και να ανακαλύψει κάτι που οι άνθρωποι δεν είχαν καν ανακαλύψει σε αυτή τη χρονική περίοδο και ανακάλυψαν νέα κομμάτια γνώσης που είναι δημιουργικά και καινοτόμα με πολλούς τρόπους".

Όπως αναφέρει η Agence France-Presse, το AlphaGo Zero έφτασε σε αυτό το επίπεδο γνώσης πολύ πιο αποτελεσματικά από τους προκατόχους του. Ενώ η προηγούμενη επανάληψη είχε 48 μονάδες επεξεργασίας δεδομένων και έπαιξε 30 εκατομμύρια εκπαιδευτικά παιχνίδια κατά τη διάρκεια αρκετών μηνών, η Zero είχε μόνο 4 μονάδες επεξεργασίας και έπαιξε 4, 9 εκατομμύρια εκπαιδευτικά παιχνίδια σε διάστημα τριών ημερών. "Οι άνθρωποι τείνουν να υποθέτουν ότι η μηχανική μάθηση αφορά τα μεγάλα δεδομένα και τις τεράστιες ποσότητες υπολογισμών, αλλά στην πραγματικότητα αυτό που είδαμε με το AlphaGo Zero είναι ότι οι αλγόριθμοι έχουν πολύ μεγαλύτερη σημασία, " λέει η Silver.

Αλλά η έρευνα είναι κάτι περισσότερο από απλά να κυριαρχήσει ένα επιτραπέζιο παιχνίδι. Όπως αναφέρει ο Ian Sample στο The Guardian, αυτός ο τύπος tabula rasa ή η τυφλή πλατφόρμα μάθησης θα μπορούσε να οδηγήσει σε μια νέα γενιά τεχνητής νοημοσύνης γενικού σκοπού που θα μπορούσε να βοηθήσει στην επίλυση προβλημάτων σε τομείς που μπορούν να προσομοιωθούν καλά σε έναν υπολογιστή, , αναδίπλωση πρωτεϊνών ή φυσική σωματιδίων. Με την οικοδόμηση των γνώσεών του από το έδαφος χωρίς ανθρώπινες προκαταλήψεις ή περιορισμούς, οι αλγόριθμοι θα μπορούσαν να πηγαίνουν στις κατευθύνσεις που οι άνθρωποι δεν έχουν ακόμη σκεφτεί να δούμε.

Ενώ πολλοί άνθρωποι στην κοινότητα του AI βλέπουν το AlphaGo Zero ως μεγάλο επίτευγμα, ο καθηγητής ψυχολογίας στο Πανεπιστήμιο της Νέας Υόρκης, Gary Marcus, που ειδικεύεται στην τεχνητή νοημοσύνη, λέει στον Kennedy του NPR ότι δεν πιστεύει ότι ο αλγόριθμος είναι πραγματικά tabula rasa, στην κατασκευή του αλγορίθμου. Επίσης, δεν πιστεύει ότι το tabula rasa AI είναι τόσο σημαντικό όσο φαίνεται. «Στην βιολογία, ο πραγματικός ανθρώπινος εγκέφαλος δεν είναι tabula rasa ... Δεν βλέπω τον κύριο θεωρητικό λόγο για τον οποίο πρέπει να το κάνετε αυτό, γιατί πρέπει να εγκαταλείψουμε πολλές γνώσεις που έχουμε για τον κόσμο», λέει.

Παρόλα αυτά, η γρήγορη κυριαρχία του Alpha Go είναι εντυπωσιακή - και λίγο τρομακτική.

Το τελευταίο AI διδάσκει στον εαυτό του να παίζει χωρίς να έχει ανθρώπινη βοήθεια