https://frosthead.com

Όταν τα μηχανήματα βλέπουν

αναγνώριση μοτίβου

Αναγνώριση προτύπου πτερυγίου πεταλούδας. Η εικόνα είναι ευγενική προσφορά του Li Li

Εδώ στην Ουάσιγκτον ακούσαμε αυτό το πράγμα που ονομάζετε "προγραμματισμός εκ των προτέρων", αλλά δεν είμαστε ακόμα έτοιμοι να το αγκαλιάσουμε. Λίγο πολύ φουτουριστικό.

Ακόμα, δεν μπορούμε παρά να θαυμάσουμε από μακριά όσους προσπαθούν να προβλέψουν τι θα μπορούσε να συμβεί περισσότερο από ένα μήνα από τώρα. Έτσι, εντυπωσιάστηκα πριν από λίγες εβδομάδες, όταν οι μεγάλοι στοχαστές της IBM φανταζόταν τον κόσμο πέντε χρόνια από τώρα και εντόπισαν αυτό που πιστεύουν ότι θα είναι πέντε τομείς καινοτομίας που θα έχουν το μεγαλύτερο αντίκτυπο στην καθημερινότητά μας.

Έχουν κάνει αυτό εδώ και λίγα χρόνια, αλλά αυτή τη φορά οι τραγουδισμένοι ψίθυροι ακολούθησαν ένα θέμα - τις πέντε ανθρώπινες αισθήσεις. Όχι ότι λένε ότι μέχρι το 2018 θα μπορέσουμε όλοι να δούμε, να ακούσουμε και να μυρίσουμε καλύτερα, αλλά μάλλον ότι οι μηχανές θα - με τη χρήση ταχέως εξελισσόμενων αισθητήριων και γνωστικών τεχνολογιών, οι υπολογιστές θα επιταχύνουν τη μετατροπή τους από την ανάκτηση δεδομένων και επεξεργάζοντας τους κινητήρες με εργαλεία σκέψης.

Δείτε ένα μοτίβο;

Σήμερα, ας ασχοληθούμε με το όραμα. Είναι λογικό άλμα να υποθέσουμε ότι η IBM ενδέχεται να αναφέρεται στο Project Glass της Google. Δεν υπάρχει αμφιβολία ότι έχει επαναπροσδιορίσει το ρόλο των γυαλιών, από το geeky αξεσουάρ που μας βοηθά να δούμε καλύτερα να combo συσκευή smartphone / δεδομένων βουτιά που θα φορέσουμε κάποια μέρα στα πρόσωπά μας.

Αλλά αυτό δεν μιλάει ο IBMers. Έχουν επικεντρωθεί στην όραση μηχανής, συγκεκριμένα στην αναγνώριση προτύπων, όπου, μέσω επαναλαμβανόμενης έκθεσης σε εικόνες, οι υπολογιστές είναι σε θέση να εντοπίζουν τα πράγματα.

Όπως αποδείχθηκε, η Google συνέβη σε ένα από τα πιό αξιοσημείωτα πειράματα αναγνώρισης προτύπων του περασμένου έτους, έργο στο οποίο ένα δίκτυο 1.000 υπολογιστών που χρησιμοποίησε 16.000 επεξεργαστές, αφού εξέτασε 10 εκατομμύρια εικόνες από βίντεο YouTube, η γάτα έμοιαζε.

Αυτό που το έκανε ιδιαίτερα εντυπωσιακό είναι ότι οι υπολογιστές ήταν σε θέση να το κάνουν χωρίς ανθρώπινη καθοδήγηση για το τι πρέπει να αναζητήσουν. Όλη η εκμάθηση έγινε μέσω των μηχανών που συνεργάζονται για να αποφασίσουν ποια χαρακτηριστικά των γατών αξίζουν την προσοχή τους και ποια πρότυπα έχουν σημασία.

Και αυτό είναι το μοντέλο για το πώς τα μηχανήματα θα μάθουν όραμα. Ο John Smith, ένας ανώτερος διευθυντής της Intelligent Information Management της IBM, εξηγεί:

"Ας πούμε ότι θέλαμε να διδάξουμε έναν υπολογιστή πώς μοιάζει με μια παραλία. Θα ξεκινήσαμε παρουσιάζοντας στον υπολογιστή πολλά παραδείγματα σκηνών στην παραλία. Ο υπολογιστής θα μετατρέψει αυτές τις εικόνες σε ξεχωριστά χαρακτηριστικά, όπως διανομές χρωμάτων, μοτίβα υφής, πληροφορίες ακμής ή πληροφορίες κίνησης στην περίπτωση βίντεο. Στη συνέχεια, ο υπολογιστής θα αρχίσει να μαθαίνει πώς να διακρίνει τις σκηνές της παραλίας από άλλες σκηνές με βάση αυτά τα διαφορετικά χαρακτηριστικά. Για παράδειγμα, θα έμαθε ότι για μια σκηνή στην παραλία, ορισμένες διανομές χρώματος βρίσκονται συνήθως, σε σύγκριση με την αστική πόλη της πόλης. "

Πόσο έξυπνος είναι έξυπνος;

Καλό για αυτούς. Αλλά το αντιμετωπίστε, ο εντοπισμός μιας παραλίας είναι πολύ βασικό στοιχείο για τους περισσότερους από εμάς τους ανθρώπους. Θα μπορούσαμε να παρασύρουμε το πόσα μηχανήματα σκέψης θα μπορούσαν να κάνουν για εμάς;

Ο Gary Marcus, καθηγητής ψυχολογίας στο Πανεπιστήμιο της Νέας Υόρκης, το σκέφτεται. Γράφοντας πρόσφατα στην ιστοσελίδα του The New Yorker, καταλήγει στο συμπέρασμα ότι, ενώ έχει σημειωθεί μεγάλη πρόοδος σε αυτό που αποκαλείται "βαθιά εκμάθηση", τα μηχανήματα έχουν ακόμη πολύ δρόμο να προχωρήσουν πριν θεωρηθούν πραγματικά έξυπνα.

"Ρεαλιστικά, η βαθιά εκμάθηση είναι μόνο μέρος της μεγαλύτερης πρόκλησης της κατασκευής έξυπνων μηχανών. Τέτοιες τεχνικές δεν έχουν τρόπους να εκπροσωπούν αιτιώδεις σχέσεις (όπως μεταξύ των ασθενειών και των συμπτωμάτων τους) και είναι πιθανό να αντιμετωπίσουν προκλήσεις για να αποκτήσουν αφηρημένες ιδέες όπως "αδελφοί" ή "όμοιοι". Δεν έχουν προφανείς τρόπους για να κάνουν λογικές συνέπειες είναι επίσης πολύ μακριά από την ενσωμάτωση της αφηρημένης γνώσης, όπως πληροφορίες για τα αντικείμενα, για τα οποία είναι και για το πώς χρησιμοποιούνται συνήθως ".

Οι λαοί της IBM θα αναγνωρίσουν αναμφίβολα τόσο πολύ. Η μηχανική μάθηση έρχεται σε βήματα, όχι άλματα.

Πιστεύουν όμως ότι μέσα σε πέντε χρόνια, η βαθιά εκμάθηση θα έχει πάρει αρκετά βήματα προς τα εμπρός ώστε οι υπολογιστές, για παράδειγμα, να αρχίσουν να διαδραματίζουν πολύ μεγαλύτερο ρόλο στην ιατρική διάγνωση, να γίνουν πραγματικά καλύτεροι από τους γιατρούς όταν πρόκειται να εντοπίσουν όγκους, ή ασθενούς ιστού σε MRIs, ακτίνες Χ ή αξονικές τομογραφίες.

Και αυτό θα μπορούσε να κάνει μεγάλη διαφορά στη ζωή μας.

Βλέποντας πιστεύει

Εδώ είναι περισσότεροι τρόποι που η μηχανική όραση έχει αντίκτυπο στη ζωή μας:

  • Βάζοντας το καλύτερο δυνατό χέρι προς τα εμπρός: Η τεχνολογία που αναπτύχθηκε στο Πανεπιστήμιο του Pittsburgh χρησιμοποιεί αναγνώριση προτύπων για να επιτρέψει στους παραπληγικούς να ελέγχουν ένα ρομποτικό χέρι με το μυαλό τους.
  • Το στόμα σας λέει ναι, αλλά ο εγκέφαλός σας λέει όχι: Οι ερευνητές στο Stanford διαπίστωσαν ότι χρησιμοποιώντας αλγόριθμους αναγνώρισης προτύπων σε σαρκώματα MRI του εγκεφάλου θα μπορούσαν να τους βοηθήσουν να προσδιορίσουν αν κάποιος είχε πραγματικά χαμηλότερο πόνο στην πλάτη ή αν το φαινόταν.
  • Όταν οι σμήνοι σας είναι έτοιμοι για τα κοντινά τους: Πέρυσι μια ρουμανική εκκίνηση που ονομάζεται SkinVision ξεκίνησε μια εφαρμογή για το iPhone που επιτρέπει στους ανθρώπους να τραβήξουν μια εικόνα σκουληκιών στο δέρμα τους και έπειτα το λογισμικό αναγνώρισης της SkinVision να εντοπίσει τυχόν παρατυπίες και να επισημάνει το επίπεδο κινδύνου προσφέροντας μια πραγματική διάγνωση. Το επόμενο βήμα είναι να δοθεί η δυνατότητα στους ανθρώπους να στέλνουν εικόνες του δέρματός τους απευθείας στον δερματολόγο τους.
  • Έχω πάρει μια συμφωνία για σας: Τώρα υπό ανάπτυξη είναι μια τεχνολογία μάρκετινγκ που ονομάζεται Facedeals. Λειτουργεί έτσι: Μόλις μια φωτογραφική μηχανή στην είσοδο ενός καταστήματος σας αναγνωρίσει, σας στέλνουν εξατομικευμένες προσφορές στο κατάστημα στο έξυπνο τηλέφωνό σας. Και ναι, θα πρέπει να επιλέξετε πρώτα.
  • Θα ήξερα εκείνη τη σφραγίδα οπουδήποτε: Ένα μηχανογραφημένο σύστημα φωτο-ταυτότητας που χρησιμοποιεί αναγνώριση προτύπων βοηθά τους Βρετανούς επιστήμονες να παρακολουθούν γκρίζες φώκιες, οι οποίες έχουν μοναδικά σημάδια στα παλτά τους.

Βίντεο bonus: Ενώ είμαστε για το θέμα της τεχνητής νοημοσύνης, εδώ είναι ένα σμήνος ρομπότ παίζοντας Beethoven, φιλοφρονήσεις των επιστημόνων στη Γεωργία Tech. Το στοίχημα δεν περιμένατε να το δείτε σήμερα.

Περισσότερα από το Smithsonian.com

Ένας πιο ανθρώπινος τεχνητός εγκέφαλος

Πώς η τεχνολογία καταπολεμά την τρομοκρατία

Όταν τα μηχανήματα βλέπουν