Η ΔΟΚΙΜΉ TURING ΜΕΤΡΆ ΚΆΤΙ, ΑΛΛΆ ΔΕΝ ΕΊΝΑΙ "ΝΟΗΜΟΣΎΝΗ"

Ο Άλαν Τούρινγκ, ένας από τους πατέρες της εποχής των υπολογιστών, ήταν ένας εξαιρετικά έξυπνος άνθρωπος. Τόσο έξυπνο, στην πραγματικότητα, που κατάλαβε ότι ο όρος "μηχανική νοημοσύνη" ήταν σχεδόν άσκοπη. Καλύτερα, σκέφτηκε, να μιλήσει για το τι μπορεί πράγματι να κάνει μια μηχανή: Μπορεί να μιλήσει; Μπορεί να κρατήσει μια συνομιλία; Τουλάχιστον αυτό είναι κάτι που μπορούμε να προσπαθήσουμε να μελετήσουμε. Ο Turing τελικά πρότεινε αυτό που έχει γίνει γνωστό ως "τεστ Turing": Εάν ένας δικαστής δεν μπορεί να πει ποια από τις δύο κρυφές οντότητες είναι άνθρωπος και η οποία είναι τεχνητή, το μηχάνημα έχει «περάσει» τη δοκιμή - λέγεται ότι συνέβη αυτό το περασμένο Σάββατο στο Λονδίνο.

σχετικό περιεχόμενο

Η Silicon Valley οφείλει την επιτυχία της σε αυτήν την τεχνολογία που δεν έχετε ποτέ ακούσει
Η πρόβλεψη 60 ετών του Alan Turing για τα μοτίβα στη φύση αποδεικνύεται αληθινή

"Είμαστε ... υπερήφανοι που δηλώνουμε ότι η δοκιμασία του Alan Turing πέρασε για πρώτη φορά", δήλωσε ένας από τους διοργανωτές, Kevin Warwick του Πανεπιστημίου της Reading, καθώς ανακοινώθηκαν τα αποτελέσματα. Το νικηφόρο chatbot πηγαίνει από το όνομα του "Eugene Goostman", ενός προγράμματος ηλεκτρονικού υπολογιστή που μιμείται την προσωπικότητα ενός 13χρονου Ουκρανού αγοριού. Ο "Ευγένιος" κατόρθωσε να πείσει το 33% των δικαστών ότι ήταν ανθρώπινο στην εκδήλωση του Σαββάτου, που πραγματοποιήθηκε στα γραφεία της Βασιλικής Εταιρείας στο Λονδίνο κατά την 60ή επέτειο από το θάνατο του Τούρινγκ. (Ο Τούρινγκ, ένας ομοφυλόφιλος, καταδικάστηκε για σοβαρή απερισκεψία το 1952 και διατάχθηκε να υποβληθεί σε ορμονική "θεραπεία" ως μέρος συμφωνίας επίκληση. Δύο χρόνια αργότερα πέθανε από δηλητηρίαση από κυανιούχο σε μια προφανή αυτοκτονία.)

Αλλά μια λέξη της προσοχής είναι εντάξει. Η "νοημοσύνη" ήταν πάντα ένα ολισθηρό θέμα, και το τεστ της Turing ειδικότερα από καιρό ήταν γεμάτο διαμάχες. Ο Turing περιέγραψε πώς θα μπορούσε να λειτουργήσει σε ένα χαρτί του 1950 με τίτλο "Υπολογιστικά μηχανήματα και νοημοσύνη." Έλαβε την ιδέα από ένα παραδοσιακό βικτοριανό παζλ παιχνιδιού, όπου προσπαθείτε να καταλάβετε αν το πρόσωπο που κρύβεται πίσω από μια κουρτίνα είναι ένας άνδρας ή μια γυναίκα, θέτοντας ερωτήσεις. (Οι απαντήσεις στις ερωτήσεις έπρεπε να καταγραφούν, επειδή η φωνή θα ήταν χαρά.) Εδώ θα δουλέψει η έκδοση του Turing: Θα είχατε έναν δικαστή, που θα καθόταν μπροστά σε δύο κουρτίνες, χωρίς να ξέρει τι είναι πίσω του . Πίσω από μια κουρτίνα είναι ένας άνθρωπος? πίσω από το άλλο είναι ένας υπολογιστής. Ο δικαστής μπορεί να θέσει ερωτήσεις από οποιαδήποτε από τις δύο κρυφές οντότητες. Με βάση τις απαντήσεις, ο δικαστής προσπαθεί να καταλάβει αν η κρυμμένη οντότητα είναι άνθρωπος ή μηχανή. (Ο Turing οραματιζόταν τη συνομιλία ως διαμεσολαβούμενη από τηλετυπικά μηχανήματα · σήμερα μπορούμε να χρησιμοποιήσουμε οποιοδήποτε είδος ηλεκτρονικού, με βάση το κείμενο διεπαφή, όπως το είδος που χρησιμοποιείται στις αίθουσες συνομιλίας στο Διαδίκτυο ή τα άμεσα μηνύματα.)

Ο Turing υπολόγισε ότι μέχρι το έτος 2000 "ένας μέσος ερωτών δεν θα έχει περισσότερες από 70% πιθανότητες να κάνει τη σωστή ταυτοποίηση" - δηλαδή, τα προγράμματα ηλεκτρονικών υπολογιστών θα στοιχίσουν τους δικαστές το 30% του χρόνου - μετά από πέντε λεπτά αμφισβήτησης. Τα "πέντε λεπτά" είναι σημαντικά. Η Turing δεν μίλησε για ένα χρονικό όριο ως εγγενές μέρος της δοκιμής και θα μπορούσε κανείς να υποστηρίξει ότι για να μπορέσει μια μηχανή να περάσει πραγματικά το τεστ, θα έπρεπε να είναι σε θέση να χειριστεί οποιοδήποτε ζήτημα. Πιθανώς τα πέντε λεπτά κριτήρια ήταν ένα αυθαίρετο αλλά απαραίτητο όριο. Το έτος 2000 ήρθε και πήγε, με τα chatbots να σταματήσουν μόνο την πρόοδο. (Σε μια πιο νηφάλια στιγμή, απαντώντας σε μια ερώτηση από έναν ερωτηθέντα του BBC το 1952, ο Turing είπε ότι θα ήταν 100 χρόνια πριν μια μηχανή περάσει τη δοκιμασία.)

Πίσω το 2012, ήμουν δικαστής σε ένα "μαραθώνιο δοκιμής Turing", το μεγαλύτερο σύνολο δοκιμών Turing που διεξήχθη ταυτόχρονα. πραγματοποιήθηκε στο Bletchley Park, στην Αγγλία, το site της ζωτικής σημασίας εργασίας του Turing κατά τα τελευταία χρόνια του Δευτέρου Παγκοσμίου Πολέμου. (Διοργανώθηκε από την ίδια ομάδα που έτρεξε το event του Σαββάτου και μια νωρίτερη έκδοση του Eugene ήταν ο νικητής εκείνος ο καιρός.) Η οργάνωση για την εκδήλωση του Σαββάτου ήταν η ίδια όπως και το 2012: Οι κριτές δακτυλογράφησαν τις ερωτήσεις τους σε έναν υπολογιστή, τότε περίμενε να εμφανιστούν οι απαντήσεις στις οθόνες τους. οι chatbots, μαζί με τους "κρυμμένους ανθρώπους", βρίσκονταν σε ένα άλλο δωμάτιο, από την όραση.

Το πρώτο πράγμα που έγινα υπερσυνείδητο είναι ότι όταν είστε δικαστής σε μια δοκιμασία του Turing, πέντε λεπτά περνούν αρκετά γρήγορα. Και όσο πιο σύντομη είναι η συζήτηση, τόσο μεγαλύτερο είναι το πλεονέκτημα του υπολογιστή. όσο μεγαλύτερη είναι η ανάκριση, τόσο μεγαλύτερη είναι η πιθανότητα ο υπολογιστής να απομακρυνθεί. Μου αρέσει να ονομάζω αυτό το φαινόμενο μανεκέν: Έχετε ποτέ ζητήσει συγγνώμη σε ένα πολυκατάστημα μανεκέν, υποθέτοντας ότι μόλις μπήκατε σε ένα ζωντανό ανθρώπινο ον; Εάν η συνάντηση διαρκεί μόνο ένα κλάσμα του δευτερολέπτου, ενώ εσείς αντιμετωπίζετε τον άλλο τρόπο, μπορείτε να φανταστείτε ότι απλά βούτητε εναντίον ενός ανθρώπου. Όσο μεγαλύτερη είναι η συνάντηση, τόσο πιο προφανής είναι η μανεκέν της μανεκέν.

Είναι το ίδιο με τα chatbots. Μια ανταλλαγή των hellos δεν αποκαλύπτει τίποτα - αλλά όσο πιο πολύ φτάνετε σε αυτό, τόσο περισσότερα προβλήματα προκύπτουν. Οι Chatbots, βρήκα, φαίνονται επιρρεπείς στην αλλαγή του θέματος χωρίς λόγο. Συχνά, δεν μπορούν να απαντήσουν σε απλές ερωτήσεις. Με τον κίνδυνο να ακούγονται ασαφείς, απλά δεν ακούνε τον άνθρωπο . Σε μία από τις συνομιλίες μου το 2012, έγραψα σε ένα απλό αστείο - και η οντότητα με την οποία συζητούσα με άλλαξε αμέσως το θέμα σε χάμπουργκερ. (Ο επιστήμονας υπολογιστών Scott Aaronson είχε πρόσφατα μια παρόμοια εμπειρία όταν κουβεντιάστηκε με τον Eugene μέσω της ιστοσελίδας του bot.) Ο Aaronson ζήτησε από τον Eugene πόσα πόδια έχει μια καμήλα, απάντησε: "Κάτι μεταξύ 2 και 4. Ίσως, τρία; Αργότερα, όταν ο Aaronson ρώτησε πόσα πόδια έχει ένα μυρμήγκι, ο Eugene κατηγόρησε την ίδια ακριβώς απάντηση, τριπλό smiley και όλα).

Σημειώστε επίσης ότι ο Eugene δεν μιμείται έναν γηγενή αγγλόφωνο ενήλικα. προσποιείται ότι είναι ένας νεαρός και κάπως αδυσώπητος ουκρανικός έφηβος, ο οποίος μιλάει σε λογικά καλά (αλλά μακριά από τέλεια) Αγγλικά. Όπως δήλωσε στον Mashable.com ο Βλαντιμίρ Βεσέλοφ, ένας από τους προγραμματιστές του προγράμματος, είπε: "Ξοδεψαμε πολύ χρόνο να αναπτύξουμε ένα χαρακτήρα με μια πιστευτή προσωπικότητα." Αν και ο Eugene θα ασχοληθεί με οποιονδήποτε θέμα, η ηλικία του "το καθιστά απόλυτα λογικό δεν γνωρίζει τα πάντα. "Ο Eugene δεν έρχεται αμέσως και αναγγέλλει την ηλικία και την εθνικότητά του. αλλά θα το αποκαλύψει αν το ζητήσει - και το τελικό αποτέλεσμα μπορεί να είναι ένα ορισμένο ποσό επιείκειας από τους δικαστές, ειδικά όσον αφορά την αγγλική γραμματική και χρήση λέξεων. (Υποθέτω ότι οι περισσότεροι δικαστές το Σάββατο ήταν γηγενείς αγγλικοί ομιλητές, αν και δεν το γνωρίζω αυτό με βεβαιότητα.) Οι πίνακες πιθανότατα θα είχαν μετατραπεί εάν ο Eugene συναντούσε ποτέ έναν ντόπιο ουκρανικό ομιλητή ως δικαστή.

Ο αγώνας για να οικοδομήσουμε μια μηχανή ομιλίας υπογραμμίζει πόσο πολύπλοκη είναι η γλώσσα. Δεν είναι μόνο θέμα συζήτησης - πρέπει να μιλήσετε για κάτι, και αυτό που λέτε πρέπει να έχει νόημα - και πρέπει να έχει νόημα στο πλαίσιο αυτού που ο άλλος έχει μόλις πει. Για εμάς, είναι εύκολο. για τους υπολογιστές, όχι τόσο πολύ. Και έτσι τα chatbots βασίζονται σε μια συλλογή από κόλπα: Απομνημόνευση megabytes των κονσερβοποιημένων απαντήσεων ή καθαρισμός του Διαδικτύου για διάλογο που μπορεί να προσεγγίσει τη συνομιλία που βρίσκονται στη μέση του. Με άλλα λόγια, αυτό που μια μηχανή στερείται νοημοσύνης μπορεί να είναι σε θέση να αντισταθμίσει την ακατέργαστη υπολογιστική ισχύ. Αυτός είναι ο λόγος για τον οποίο η Google ή το Siri (ο προσωπικός βοηθός του iPhone) μπορεί να φανεί τόσο έξυπνος για εμάς: ο Siri μπορεί να μην έχει «μυαλό», αλλά έχει πρόσβαση σε μια τεράστια βάση δεδομένων πληροφοριών, μπορεί να δράσει σαν να το κάνει. Ήταν η ίδια προσέγγιση βίαιης δύναμης που επέτρεψε στον "Watson" της IBM να κερδίσει στο Jeopardy! το 2011.

Όλα αυτά εγείρουν μια κρίσιμη ερώτηση: Ποια είναι ακριβώς η μέτρηση του τεστ Turing; Κάποιοι κριτικοί πρότειναν ότι είναι ανταμοιβή ανταμοιβής αντί για νοημοσύνη. NYU Ο ψυχολόγος Gary Marcus, γράφοντας στο NewYorker.com, λέει ότι ο Eugene πετυχαίνει "με την εκτέλεση μιας σειράς" πακέτων "σχεδιασμένων να καλύψουν τους περιορισμούς του προγράμματος." Ο Steven Harnad, ψυχολόγος και επιστήμονας υπολογιστών στο Πανεπιστήμιο του Κεμπέκ στο Μόντρεαλ, σκεπτικιστή, λέγοντας στο The Guardian ότι ήταν "πλήρης ανοησία" να ισχυριστεί ότι ο Ευγένιος είχε περάσει τη δοκιμή του Turing. (Για την πίστη του, ο Τούρινγκ γνώριζε καλά αυτό το ζήτημα · ονομάζει την ιδέα του «το παιχνίδι απομίμησης», και μίλησε για την νοημοσύνη μόνο με φειδώ.) Ακόμη πιο αδέξια, ο υπολογιστής, αντίθετα με τον άνθρωπο, αναγκάζεται να εξαπατήσει. "Η δοκιμή Turing είναι πραγματικά μια δοκιμασία για να είναι ένας επιτυχημένος ψεύτης", δήλωσε ο Pat Hayes, ένας επιστήμονας υπολογιστών στο Ινστιτούτο Ανθρώπινης και Μηχανικής Γνώσης στην Pensacola της Φλόριντα, μετά από τον μαραθώνιο δοκιμών του Turing το 2012. "Αν είχατε κάτι που πραγματικά θα μπορούσε να περάσει το παιχνίδι απομίμησης του Turing, θα ήταν ένα πολύ επιτυχημένο« ανθρώπινο μιμητικό »."

Και το "ανθρώπινο" είναι το άλλο βασικό σημείο: Δεν είναι δυνατόν να υπάρχουν άλλα είδη νοημοσύνης στον κόσμο πέρα από το είδος που εμφανίζεται από το είδος μας; Μια πραγματικά έξυπνη μηχανή θα είχε αμέτρητες πρακτικές εφαρμογές, αλλά γιατί να επικεντρωθεί στη δημιουργία περισσότερων "ανθρώπων"; Μετά από όλα, έχουμε ήδη πολλούς ανθρώπους. Όπως επεσήμανε ο γλωσσολόγος Noam Chomsky, όταν προσπαθούμε να οικοδομήσουμε μια μηχανή που κινείται υποβρύχια, δεν απαιτούμε να "κολυμπήσει" - και ένα υποβρύχιο δεν είναι λιγότερο από ένα επίτευγμα για την ανικανότητά του να κάνει το backstroke.

Ναι, ο Eugene είναι εντυπωσιακός, τουλάχιστον σε μικρές εκρήξεις. Και όμως, ακόμη και οι καλύτεροι chatbots σκοντάφτονται σε ερωτήσεις που θα μπορούσε να χειριστεί αλαζονικά το παιδί της μισής ηλικίας του Eugene. Ίσως να μην προκαλεί έκπληξη το γεγονός ότι οι περισσότεροι ερευνητές του AI αφιερώνουν λίγο χρόνο για τη δοκιμή Turing. Η ευφυΐα του μηχανήματος, στην πραγματικότητα, κινείται προς τα εμπρός και μάλλον γρήγορα. Το λογισμικό μετάφρασης φωνής-προς-κείμενο, το οποίο ήταν αρκετά αξιολύπητο μόλις πριν από λίγα χρόνια, βελτιώνεται ραγδαία, όπως και τα προγράμματα μετάφρασης γλωσσών. Το Amazon έχει συχνά μια αρκετά καλή ιδέα για το τι θέλετε να αγοράσετε ακόμα και πριν να το κάνετε. Και το αυτοκίνητο αυτο-οδήγησης της Google θα ήταν απλώς φαντασίωση πριν από μια δεκαετία. Αλλά η συζήτηση, καθώς συνεχίζουμε να ανακαλύπτουμε, είναι πολύ δύσκολη και δεν είναι πιθανό να είναι τα σύνορα στα οποία το AI λάμπει πιο έντονα. Προς το παρόν, αν ψάχνετε για κάποιον που θα συνομιλήσει, συστήνω έναν πραγματικό άνθρωπο.

Ο Dan Falk είναι επιστημονικός δημοσιογράφος με έδρα το Τορόντο.