https://frosthead.com

Οι νευροεπιστήμονες έχουν μετατρέψει τα εγκεφαλικά κύματα σε προφορική ομιλία

Η ίδια τεχνολογία που εξουσιοδοτεί τον συνηθισμένο κινητό σας βοηθό μπορεί να δώσει μια φωνή σε εκείνους που έχουν χάσει την ικανότητα να μιλήσουν. Όπως αναφέρει η Renae Reints για την Fortune, οι νευροεπιστήμονες του Πανεπιστημίου της Κολούμπια πρόσφατα σημείωσαν σημαντική πρόοδο προς αυτόν τον φουτουριστικό στόχο, μεταφράζοντας με επιτυχία τα εγκεφαλικά κύματα σε κατανοητό λόγο για πρώτη φορά.

Η έρευνα της ομάδας, που δημοσιεύτηκε σε επιστημονικές εκθέσεις, περιλαμβάνει μια κάπως αντισυμβατική προσέγγιση. Αντί να κατευθύνουν άμεσα τις σκέψεις για να παράγουν ομιλία, οι ερευνητές κατέγραψαν νευρολογικά πρότυπα που δημιουργήθηκαν από άτομα που εξέφραζαν ακρόαση σε άλλους που μιλούσαν. Αυτά τα κύματα εγκεφάλου τροφοδοτήθηκαν σε έναν φωνοκωδικοποιητή - έναν αλγόριθμο τεχνητής νοημοσύνης που συνθέτει την ομιλία - και στη συνέχεια μετατράπηκε σε κατανοητή, αν και ρομποτική, ηχητική ομιλία αντικατοπτρίζοντας τις φράσεις που ακούνε οι συμμετέχοντες.

«Οι φωνές μας βοηθούν να συνδεθούμε με τους φίλους μας, την οικογένεια και τον κόσμο γύρω μας και αυτός είναι ο λόγος για τον οποίο χάνουμε τη δύναμη της φωνής μας λόγω τραυματισμού ή ασθένειας είναι τόσο καταστροφική», λέει ο συγγραφέας της μελέτης Nima Mesgarani, μηχανικός στο πρόγραμμα νευροβιολογίας της Κολούμπια μία δήλωση. «Με τη σημερινή μελέτη, έχουμε έναν πιθανό τρόπο να αποκαταστήσουμε αυτή την εξουσία. Έχουμε δείξει ότι, με τη σωστή τεχνολογία, οι σκέψεις αυτών των ανθρώπων θα μπορούσαν να αποκωδικοποιηθούν και να κατανοηθούν από οποιονδήποτε ακροατή. "

Αξίζει να σημειωθεί, σύμφωνα με τον George Dvorsky του Gizmodo, ότι οι επιστήμονες δεν έχουν ακόμη καταλάβει πώς να μεταφράζουν απευθείας τις εσωτερικές σκέψεις, γνωστές και ως φανταστικές ομιλίες, σε λέξεις. Σε αυτό το ιδανικό σενάριο, τα άτομα που χρησιμοποιούν την τεχνολογία ομιλίας απλώς θα οραστούν τι θέλουν να πουν, στη συνέχεια, περιμένετε για ένα τεχνητό φωνητικό σύστημα για να λεκτικοποιήσετε αυτές τις σκέψεις.

Ο τελευταίος βρετανός φυσικός Stephen Hawking χρησιμοποίησε μια στοιχειώδη εκδοχή της τεχνολογίας σύνθεσης ομιλίας για να επικοινωνήσει με άλλους. Όπως γράφει η Nina Godlewski για το Newsweek, ο Hawking διαγνώστηκε με αμυοτροφική πλευρική σκλήρυνση (ALS) στην ηλικία των 21 ετών. Η νόσος των κινητικών νευρώνων τελικά διεκδίκησε τις ικανότητες ομιλίας του, αναγκάζοντάς τον να χρησιμοποιήσει ένα χερό κλικ για να ενεργοποιήσει την ομιλία.

Όταν ο Hawking έχασε τη χρήση των χεριών του, άλλαξε σε ένα σύστημα βασισμένο στις κινήσεις του προσώπου. Το Dvorsky του Gizmodo εξηγεί περαιτέρω ότι ο επιστήμονας χρησιμοποίησε έναν διακόπτη μάγουλο συνδεδεμένο με τα γυαλιά του για να επιλέξει τα λόγια που ομιλούνται από ένα φωνητικό συνθεσάιζερ.

Μια προηγμένη επανάληψη αυτής της τεχνολογίας θα παραλείψει τον μεσαίο άνθρωπο, επιτρέποντας στους χρήστες να παράγουν ομιλία χωρίς τη βοήθεια υπολογιστή ή συστήματος ευαίσθητων στις μετακινήσεις.

Συγκριτικά, οι σημειώσεις του Avery Thompson για τη Λαϊκή Μηχανική, η μελέτη της ομάδας Columbia επικεντρώνεται στην μετάφραση "ομιλούσας ομιλίας". Οι ερευνητές στρατολόγησαν πέντε ασθενείς με επιληψία που υποβλήθηκαν σε χειρουργική επέμβαση στον εγκέφαλο και τους ζήτησαν να ακούσουν μια σειρά από προφορικές λέξεις - μετρώντας από το μηδέν έως το εννέα ενώ συνδέονται με συσκευές νευρικής παρακολούθησης.

Τα κύματα του εγκεφάλου που συλλαμβάνονται από αυτά τα εργαλεία τοποθετήθηκαν στον φωνοκωδικοποιητή, ο οποίος συνέθεσε ομιλία με τη βοήθεια ενός νευρικού δικτύου εκπαιδευμένου, με τα λόγια του Kristin Houser του Futurism, για να "καθαρίσει" την έξοδο και να καταστήσει τους ήχους κατανοητούς.

Στη συνέχεια, οι επιστήμονες ζήτησαν 11 άλλους συμμετέχοντες να ακούσουν την ομιλία με δυνατότητα AI. Σημαντικά, ο συγγραφέας της μελέτης Mesgarani επισημαίνει στη δήλωση της Columbia ότι αυτά τα άτομα ήταν σε θέση να «κατανοήσουν και να επαναλάβουν» τους ήχους γύρω στο 75% του χρόνου - «καλά και πέρα ​​από» τα ποσοστά που παρατηρήθηκαν σε οποιαδήποτε προηγούμενα πειράματα. (Μπορείτε να κρίνετε τις εγγραφές για τον εαυτό σας εδώ).

Σε μια συνέντευξη με το Dvorsky του Gizmodo, ο Mesgarani λέει ότι αυτός και οι συνάδελφοί του ελπίζουν να συνθέσουν πιο σύνθετες φράσεις στο εγγύς μέλλον. Οι ερευνητές θέλουν επίσης να καταγράφουν τα σήματα του εγκεφάλου που παράγονται από άτομα που εξετάζουν ή σκέπτονται την πράξη της ομιλίας και όχι απλώς να ακούνε άλλους. Τελικά, ο Mesgarani προσθέτει στη δήλωση ότι η ομάδα στοχεύει να μετατρέψει την τεχνολογία σε εμφύτευμα ικανή να μεταφράσει τις σκέψεις του χρήστη απευθείας σε λέξεις.

Οι πιθανοί περιορισμοί της νέας έρευνας περιλαμβάνουν το μικρό μέγεθος δείγματος και, σύμφωνα με τον νευροεπιστήμονα του Πανεπιστημίου Newcastle Andrew Jackson, ο οποίος δεν συμμετείχε στη μελέτη, το γεγονός ότι τα νευρικά δίκτυα θα πρέπει να εισαχθούν σε έναν τεράστιο αριθμό σημάτων εγκεφάλου από κάθε νέο συμμετέχοντα προκειμένου να συνθέσει ομιλία πέρα ​​από τους αριθμούς μηδέν έως εννέα.

"Θα είναι ενδιαφέρον στο μέλλον να δούμε πόσο καλά εκπαιδευμένοι αποκωδικοποιητές για ένα άτομο γενικεύονται σε άλλα άτομα", λέει ο Τζάκσον στο Gizmodo . "Είναι λίγο σαν τα πρώτα συστήματα αναγνώρισης ομιλίας που χρειάστηκε να εκπαιδευτούν ξεχωριστά από τον χρήστη, σε αντίθεση με τη σημερινή τεχνολογία, όπως η Siri και η Alexa, που μπορούν να έχουν νόημα για τη φωνή κάποιου, και πάλι χρησιμοποιώντας νευρικά δίκτυα. Μόνο ο χρόνος θα δείξει εάν αυτές οι τεχνολογίες θα μπορούσαν να κάνουν την ίδια ημέρα για τα σήματα του εγκεφάλου. "

Οι νευροεπιστήμονες έχουν μετατρέψει τα εγκεφαλικά κύματα σε προφορική ομιλία