Όταν σκέφτεστε την τεχνητή νοημοσύνη, το πεδίο της βοτανικής πιθανότατα δεν είναι το ανώτατο στο μυαλό σας. Όταν επεξεργάζεστε τις ρυθμίσεις για την έρευνα υπολογιστικής αιχμής, τα αιωνόβια μουσεία μπορεί να μην βρίσκονται στην κορυφή της λίστας. Και όμως, ένα απλά δημοσιευμένο άρθρο του περιοδικού δεδομένων βιοποικιλότητας δείχνει ότι μερικές από τις πιο συναρπαστικές και ευφάνταστες καινοτομίες στη μηχανική μάθηση δεν πραγματοποιούνται σε κανέναν άλλο από το Εθνικό Βοτανικό Μουσείο του Εθνικού Μουσείου Φυσικής Ιστορίας στην Ουάσιγκτον,
Το χαρτί, το οποίο καταδεικνύει ότι τα ψηφιακά νευρωνικά δίκτυα είναι σε θέση να διακρίνουν μεταξύ δύο παρόμοιων οικογενειών φυτών με ποσοστά ακρίβειας πάνω από το 90 τοις εκατό, συνεπάγεται όλα τα είδη των δυνατοτήτων ύδρευσης για επιστήμονες και ακαδημαϊκούς που προχωρούν. Η μελέτη βασίζεται σε λογισμικό που βασίζεται σε αλγόριθμους "βαθιάς μάθησης", οι οποίοι επιτρέπουν στα προγράμματα ηλεκτρονικών υπολογιστών να συγκεντρώνουν εμπειρία με τον ίδιο ακριβώς τρόπο που κάνουν οι ειδικοί του ανθρώπινου δυναμικού, ανεβαίνοντας το παιχνίδι τους κάθε φορά που τρέχουν. Σύντομα, αυτή η τεχνολογία θα μπορούσε να επιτρέψει συγκριτικές αναλύσεις εκατομμυρίων ξεχωριστών δειγμάτων από όλες τις γωνιές του πλανήτη - μια πρόταση που θα είχε ζητήσει προηγουμένως ένα αδύνατο ποσό ανθρώπινης εργασίας.
"Αυτή η κατεύθυνση της έρευνας δείχνει πολλά υποσχέσεις", λέει ο καθηγητής του Stanford, Mark Algee-Hewitt, εξέχουσα φωνή στο κίνημα των ψηφιακών ανθρωπιστικών επιστημών και βοηθός διευθυντή διδακτικού προσωπικού στο πανεπιστημιακό κέντρο χωρικής και τεχνητής ανάλυσης. "Αυτές οι μέθοδοι έχουν τη δυνατότητα να μας δώσουν τεράστιες ποσότητες πληροφοριών σχετικά με τις συλλογές που περιέχουν", λέει, και "καθιστώντας έτσι αυτά τα δεδομένα προσιτά".
Αυτά τα νέα ευρήματα στηρίζονται σε χρόνια εργασίας στο Ινστιτούτο Smithsonian για τη συστηματική ψηφιοποίηση των συλλογών του για ακαδημαϊκή και δημόσια πρόσβαση στο διαδίκτυο και αντιπροσωπεύουν μια αξιοσημείωτη διεπιστημονική συνάντηση μυαλών: οι βοτανολόγοι, οι εμπειρογνώμονες ψηφιοποίησης και οι επιστήμονες των δεδομένων έπαιξαν ρόλο να φέρουν τα αποτελέσματα στο φως.
Η ιστορία ξεκινάει τον Οκτώβριο του 2015, όταν η εγκατάσταση συσκευής κάμερας και μεταφορικού ιμάντα κάτω από το Μουσείο Φυσικής Ιστορίας απλοποίησε απλά τις προσπάθειες ψηφιοποίησης της βοτανικής συλλογής του Smithsonian. Αντί να χρειαστεί να σαρώνουν χειροκίνητα κάθε πιεσμένο λουλούδι και συστάδες χόρτου στο χώρο αποθήκευσης τους, οι εργαζόμενοι θα μπορούσαν τώρα να αναβαθμίσουν ολόκληρες σειρές δειγμάτων, να αφήσουν τη ζώνη να δουλέψει τη μαγεία της και να τις ανακτήσει και να τις ανακαταγράψει στο τέλος της ουράς. Ένα πλήρωμα τριών ατόμων έχει επιβλέψει τη ζώνη από το ντεμπούτο του και περνάει περίπου 750.000 δείγματα κάθε χρόνο. Πριν από καιρό, το απόθεμα βοτάνων του Smithsonian, πέντε εκατομμύρια δείγματα ισχυρό, θα είναι εντελώς online.
Κάθε δείγμα φέρει ετικέτα με λεπτομερή δελτίο ταυτότητας, το οποίο παρέχει πληροφορίες σχετικά με την προέλευσή του καθώς και βασικά στατιστικά στοιχεία. Τα περιεχόμενα αυτών των καρτών έχουν μεταγραφεί και μεταφορτωθεί μαζί με τις ψηφιακές εικόνες, παρέχοντας μια ολοκληρωμένη εικόνα για κάθε στοιχείο της συλλογής για όσους έχουν την τάση να ψάξουν.
Στο ψηφιοποιημένο βοτανικό αρχείο του Smithsonian, εικόνες υψηλής ανάλυσης των δειγμάτων συνδυάζονται με μεταγραφές των εύχρηστων ετικετών ταυτότητας που επικολλώνται σε αυτά. (Εθνικό Μουσείο Φυσικής Ιστορίας)«Κάνει τη συλλογή μας προσιτή σε όποιον έχει υπολογιστή και σύνδεση στο διαδίκτυο», λέει η Laurence Dorr, μόνιμη σχολή μουσείων, «η οποία είναι μεγάλη για να απαντήσει σε κάποιες ερωτήσεις». Ακόμα κι έτσι, ο Dorr βρήκε ότι δεν μπορούσε να σφίξει μια αίσθηση αναξιοποίητου δυναμικού . Σίγουρα, έχουν πλέον διατεθεί τεράστιες ποσότητες δειγμάτων δεδομένων στην ηλεκτρονική κοινότητα, αλλά η ανάλυσή της συνολικά παρέμεινε φανταστική. Η αναζήτηση ειδικών δειγμάτων και μικρών κατηγοριών δειγμάτων ήταν αρκετά εύκολη, αλλά ο Ντόρτ αναρωτήθηκε αν υπήρχε ένας τρόπος μόχλευσης των δεδομένων για να εξαχθούν συμπεράσματα για χιλιάδες δείγματα. "Τι μπορείτε να κάνετε με αυτά τα δεδομένα;" θυμάται αναρωτιέται. Ένας άντρας που ονομάστηκε Adam Metallo έδωσε σύντομα μια συναρπαστική απάντηση.
Ο Metallo, αξιωματικός του γραφείου προγράμματος ψηφιοποίησης του Smithsonian, παρακολούθησε ένα συνέδριο στο οποίο ο τεχνολογικός γίγαντας NVIDIA-αγαπητός των PC gamers παντού - παρουσίαζε μονάδες επεξεργασίας γραφικών νέας γενιάς ή GPU. Το Metallo αναζητούσε τρόπους βελτίωσης των δυνατοτήτων ψηφιακής απόδοσης του Smithsonian, αλλά ήταν ένα άσχετο σε μεγάλο βαθμό κομμάτι από πληροφορίες που έδιναν την προσοχή του και έμειναν μαζί του. Εκτός από τη δημιουργία δυναμικών, υψηλής πιστότητας τρισδιάστατων γραφικών, του είπαν ότι οι GPU της NVIDIA ήταν κατάλληλες για μεγάλες αναλύσεις δεδομένων. Συγκεκριμένα, οι ενισχυμένες μονάδες GPU ήταν ακριβώς αυτό που χρειάζονταν για την εντατική ψηφιακή αναγνώριση προτύπων. πολλοί αλγόριθμοι εκμάθησης μηχανών είχαν βελτιστοποιηθεί για την πλατφόρμα NVIDIA.
Το Metallo ήταν άμεσα ενθουσιασμένο. Αυτή η τεχνολογία "βαθιάς μάθησης", η οποία ήδη αναπτύχθηκε σε εξειδικευμένους κλάδους όπως αυτοκινητοβιομηχανία και ιατρική ακτινολογία, είχε μεγάλες δυνατότητες για τον κόσμο των μουσείων - που, όπως επισημαίνει το Metallo, αποτελεί "το μεγαλύτερο και παλαιότερο σύνολο δεδομένων που έχουμε τώρα προς το."
"Τι σημαίνει για τα μεγάλα σύνολα δεδομένων που δημιουργούμε στο Smithsonian μέσω ψηφιοποίησης;" Το Metallo ήθελε να το μάθει. Η ερώτησή του αντικατοπτρίζει απόλυτα εκείνη της Laurence Dorr, και όταν συνδέονται δύο, οι σπινθήρες άρχισαν να πετούν. "Η συλλογή βοτανικών ήταν μία από τις μεγαλύτερες συλλογές που επεξεργαζόμασταν πιο πρόσφατα", θυμάται ο Metallo. Μια συνεργασία προτάθηκε.
Ενώ πολλές μορφές μηχανικής μάθησης απαιτούν από τους ερευνητές να επισημάνουν τους βασικούς μαθηματικούς δείκτες στις εικόνες που πρόκειται να αναλυθούν - μια επίπονη διαδικασία που ισοδυναμεί με τη συγκράτηση των αλγορίθμων βαθιάς μάθησης του χεριού του υπολογιστή-σύγχρονου χρόνου, μπορεί να διδάξει ποιοι δείκτες αναζητούν στην εργασία, και ανοίγοντας την πόρτα σε μεγαλύτερες έρευνες. Παρ 'όλα αυτά, η συγγραφή ενός ειδικού προγράμματος Smithsonian για βαθιά εκμάθηση και η βαθμονόμησή του για διακριτά ζητήματα βοτανικής έρευνας ήταν μια δύσκολη επιχείρηση - η Dorr και η Metallo χρειάζονταν τη βοήθεια των επιστημόνων δεδομένων για να κάνουν το όραμα τους πραγματικότητα.
Οι επιστήμονες δεδομένων καταρτίζουν δείγματα εκπαίδευσης για το νευρικό δίκτυο κατά τη διάρκεια του γεγονότος που θυμάται ο Paul Frandsen ως «μια ψυχρή ημέρα του Ιανουαρίου». (Εθνικό Μουσείο Φυσικής Ιστορίας)Ένας από τους ειδικούς που έφεραν στο πλοίο ήταν ο επιστήμονας έρευνας Smithsonian Paul Frandsen, ο οποίος αναγνώρισε αμέσως τη δυνατότητα δημιουργίας ενός νευρικού δικτύου που τροφοδοτείται με GPU NVIDIA για να ασχοληθεί με τη συλλογή των βοτανικών. Για τον Frandsen, αυτό το έργο συμβόλιζε ένα βασικό πρώτο βήμα κάτω από ένα υπέροχο και ανεξερεύνητο μονοπάτι. Σύντομα, λέει, «θα αρχίσουμε να ψάχνουμε για μορφολογικά πρότυπα σε παγκόσμια κλίμακα και θα είμαστε σε θέση να απαντήσουμε σε αυτά τα πραγματικά μεγάλα ερωτήματα που παραδοσιακά θα έπαιρναν χιλιάδες ή εκατομμύρια ανθρωποώρες αναζητώντας τη βιβλιογραφία και ταξινομώντας τα πράγματα. Θα μπορέσουμε να χρησιμοποιήσουμε αλγόριθμους που θα μας βοηθήσουν να βρούμε αυτά τα μοτίβα και να μάθουμε περισσότερα για τον κόσμο. "
Τα απλά δημοσιευθέντα ευρήματα είναι μια εντυπωσιακή απόδειξη της έννοιας. Δημιουργήθηκε από μια ομάδα εννέα με επικεφαλής τον ερευνητή βοτανολόγο Eric Schuettpelz και τους επιστήμονες δεδομένων Paul Frandsen και Rebecca Dikow, η μελέτη στοχεύει να απαντήσει σε δύο μεγάλης κλίμακας ερωτήσεις σχετικά με τη μηχανική μάθηση και το χορτοφάγο. Το πρώτο είναι το πόσο αποτελεσματικό είναι ένα εκπαιδευμένο νευρωνικό δίκτυο για την ταξινόμηση των δειγμάτων που είναι χρωματισμένα με υδράργυρο από μη απολιθωμένα. Το δεύτερο, το επίκεντρο του εγγράφου, είναι το πόσο αποτελεσματικό μπορεί να είναι ένα τέτοιο δίκτυο στη διαφοροποίηση των μελών των δύο επιφανειακά παρόμοιων οικογενειών φυτών, δηλαδή στις οικογένειες των φραγκοκρατών Lycopodiaceae και Selaginellaceae .
Η πρώτη δοκιμασία απαιτούσε η ομάδα να περάσει από χιλιάδες δείγματα πριν από τον αγώνα, επισημαίνοντας οριστικά ποια ήταν ορατά μολυσμένα με υδράργυρο (ένα απόθεμα ξεπερασμένων τεχνικών βοτανικής συντήρησης). Ήθελαν να είναι σίγουροι ότι ήξεραν με 100 τοις εκατό βεβαιότητα που είχαν λερωθεί και οι οποίες δεν ήταν - διαφορετικά, η αξιολόγηση της ακρίβειας του προγράμματος δεν θα ήταν δυνατή. Η ομάδα των κερασιών πήρε σχεδόν 8.000 εικόνες καθαρών δειγμάτων και 8.000 περισσότερα δείγματα με χρώματα για την εκπαίδευση και τον έλεγχο του υπολογιστή. Μέχρι τη στιγμή που τελείωσαν τις παράμετροι του νευρικού δικτύου και απέσυραν όλη την ανθρώπινη βοήθεια, ο αλγόριθμος ταξινόμησε δείγματα που δεν είχε δει ποτέ πριν με 90% ακρίβεια. Εάν τα πιο διφορούμενα δείγματα - π.χ. εκείνα στα οποία η χρώση ήταν ελάχιστη ή / και πολύ εξασθενημένη - απορρίφθηκαν, ο αριθμός αυτός αυξήθηκε στο 94%.
Αυτό το αποτέλεσμα υποδηλώνει ότι το λογισμικό βαθιάς εκμάθησης θα μπορούσε σύντομα να βοηθήσει τους βοτανολόγους και άλλους επιστήμονες να αποφύγουν να σπαταλούν χρόνο σε κουραστικά καθήκοντα διαλογής. "Το πρόβλημα δεν είναι ότι ένας άνθρωπος δεν μπορεί να καθορίσει εάν ένα δείγμα είναι χρωματισμένο με υδράργυρο", διευκρινίζει το Metallo, αλλά μάλλον ότι "είναι δύσκολο να ταξινομηθεί χειροκίνητα και να καταλάβουμε πού υπάρχει η μόλυνση" και δεν είναι λογικό να να το κάνετε από άποψη διαχείρισης χρόνου. Ευτυχώς, η μηχανική μάθηση θα μπορούσε να μετατρέψει έναν σημαντικό χρόνο απορροής σε πολύ λίγες μέρες από ταχεία αυτοματοποιημένη ανάλυση.
Η τοποθέτηση δειγμάτων ανά μία φορά απαιτεί πολλή ενέργεια και καθιστά δύσκολη την εξαγωγή συμπερασμάτων μεγάλης κλίμακας. Τώρα, οι μεγάλες αναλύσεις δεδομένων παρέχουν στα μουσεία νέους τρόπους προσέγγισης των συλλογών τους. (Arborold Arboretum)Το τμήμα διάκρισης των ειδών της μελέτης είναι ακόμα πιο συναρπαστικό. Οι ερευνητές εκπαιδεύτηκαν και δοκιμάστηκαν το νευρικό δίκτυο με περίπου 9.300 κλασσικά και 9.100 δείγματα spikemoss. Όπως και με το πείραμα χρώσης, περίπου το 70% αυτών των δειγμάτων χρησιμοποιήθηκαν για αρχική βαθμονόμηση, το 20% χρησιμοποιήθηκε για βελτίωση και το τελικό 10% χρησιμοποιήθηκε για την επίσημη αξιολόγηση της ακρίβειας. Μόλις βελτιστοποιηθεί ο κώδικας, ο ρυθμός επιτυχίας του υπολογιστή στο διαχωρισμό μεταξύ των δύο οικογενειών ήταν 96% - και σχεδόν τέλειος 99%, αν παραλείψανταν τα πιό περίεργα δείγματα.
Μια μέρα, ο Φραντςσεν υποθέτει ότι τέτοια προγράμματα θα μπορούσαν να χειριστούν την κατηγοριοποίηση των δειγμάτων σε μουσεία ανά τον κόσμο. "Σε καμία περίπτωση δεν νομίζω ότι αυτοί οι αλγόριθμοι θα κάνουν τίποτα για να αντικαταστήσουν τους επιμελητές", λέει ο ίδιος γρήγορα, "αλλά αντ 'αυτού πιστεύω ότι μπορούν να βοηθήσουν τους επιμελητές και τους ανθρώπους που ασχολούνται με τη συστηματική να είναι πιο παραγωγικοί, ώστε να μπορούν να κάνουν τη δουλειά τους πολύ πιο γρήγορα."
Η επιτυχία του νευρικού δικτύου σε αυτή τη μελέτη ανοίγει το δρόμο για την ταχεία δοκιμή επιστημονικών υποθέσεων σε μαζικές συλλογές. Ο Dorr βλέπει στα πορίσματα της ομάδας τη δυνατότητα διεξαγωγής εκτεταμένων μορφολογικών συγκρίσεων ψηφιοποιημένων δειγμάτων - συγκρίσεων που θα μπορούσαν να οδηγήσουν σε σημαντικές επιστημονικές ανακαλύψεις.
Αυτό δεν σημαίνει ότι η βαθιά εκμάθηση θα αποτελέσει μια ασημένια σφαίρα στην έρευνα σε όλους τους τομείς. Ο Mark Algee-Hewitt του Στάνφορντ τονίζει ότι «είναι σχεδόν αδύνατο να αναδημιουργηθεί γιατί και πώς ένα νευρωνικό δίκτυο λαμβάνει τις αποφάσεις του», οι προσδιορισμοί που απομένουν στα προγράμματα υπολογιστών θα πρέπει να είναι πάντα απλοί και επαληθεύσιμοι στη φύση, προκειμένου να είναι αξιόπιστοι.
"Προφανώς, " λέει ο Dorr, ένα αυτόνομο πρόγραμμα ηλεκτρονικών υπολογιστών "δεν πρόκειται να δοκιμάσει γενετικές σχέσεις, τέτοια πράγματα" - τουλάχιστον οποιαδήποτε στιγμή στο εγγύς μέλλον. "Αλλά μπορούμε να αρχίσουμε να μαθαίνουμε για τη διανομή των χαρακτηριστικών ανά γεωγραφική περιοχή ή από ταξινομική μονάδα. Και αυτό θα είναι πραγματικά ισχυρό. "
Πάνω απ 'οτιδήποτε, αυτή η έρευνα είναι ένα άλμα. Είναι πλέον σαφές ότι η τεχνολογία βαθιάς εκμάθησης έχει μεγάλη υπόσχεση για επιστήμονες και άλλους ακαδημαϊκούς σε όλο τον κόσμο, καθώς και για το περίεργο κοινό για το οποίο παράγουν γνώση. Αυτό που απομένει είναι η αυστηρή παρακολούθηση.
"Αυτό είναι ένα μικρό βήμα", λέει ο Frandsen, "αλλά είναι ένα βήμα που πραγματικά μας λέει ότι αυτές οι τεχνικές μπορούν να λειτουργήσουν σε ψηφιοποιημένα δείγματα μουσείων. Είμαστε ενθουσιασμένοι για τη δημιουργία πολλών περισσότερων έργων στους επόμενους μήνες, για να δοκιμάσουμε να δοκιμάσουμε τα όριά της λίγο περισσότερο. "