https://frosthead.com

Πώς η Margaret Dayhoff έφερε Σύγχρονη Πληροφορική στη Βιολογία

Το 1984, το Εθνικό Ίδρυμα Βιοϊατρικής Έρευνας ξεκίνησε μια δωρεάν ηλεκτρονική βάση δεδομένων που περιέχει πάνω από 283.000 αλληλουχίες πρωτεϊνών. Σήμερα ο Resource Information Protector επιτρέπει στους επιστήμονες σε όλο τον κόσμο να πάρουν μια άγνωστη πρωτεΐνη, να τις συγκρίνουν με χιλιάδες γνωστές πρωτεΐνες στη βάση δεδομένων και να καθορίσουν τους τρόπους με τους οποίους είναι όμοιοι και διαφορετικοί. Από αυτά τα δεδομένα μπορούν να εξαγάγουν γρήγορα και με ακρίβεια την εξελικτική ιστορία μιας πρωτεΐνης και τη σχέση της με διάφορες μορφές ζωής.

Η ταπεινή προέλευση αυτής της τεράστιας ηλεκτρονικής βάσης δεδομένων αρχίζει πολύ πριν από το Διαδίκτυο. Όλα ξεκίνησαν με το Atlas of Protein Sequence and Structure, ένα τυπωμένο βιβλίο του 1965 που περιείχε τις 65 τότε γνωστές ακολουθίες πρωτεϊνών, που συνέταξε μια γυναίκα με την ονομασία Margaret Dayhoff. Για να δημιουργήσει το Atlas της, η Dayhoff εφάρμοσε τεχνολογίες αιχμής στον υπολογιστή για να βρει λύσεις σε βιολογικά ερωτήματα, συμβάλλοντας στη δημιουργία ενός νέου πεδίου που ονομάζουμε τώρα βιοπληροφορική. Αρχικά ένας χημικός, ο Dayhoff αξιοποίησε τις νέες και εξελισσόμενες τεχνολογίες της εποχής των υπολογισμών μετά τον Β 'Παγκόσμιο Πόλεμο για πρωτοποριακά εργαλεία που οι χημικοί, οι βιολόγοι και οι αστρονόμοι θα μπορούσαν να χρησιμοποιήσουν στη διεπιστημονική μελέτη της προέλευσης της ζωής στη Γη.

Η Dayhoff (στη συνέχεια, η Margaret Oakley) γεννήθηκε στη Φιλαδέλφεια στις 11 Μαρτίου 1925 στην Ruth Clark, καθηγήτρια μαθηματικών γυμνασίου και τον ιδιοκτήτη μικρής επιχείρησης Kenneth Oakley. Σε ηλικία δέκα ετών, η οικογένειά της μετακόμισε στη Νέα Υόρκη. Εκεί φοίτησε στα δημόσια σχολεία και τελικά έγινε ο Βαλεντιοκεντίας της Bayside High το 1942. Παρακολούθησε το πανεπιστήμιο της Νέας Υόρκης στο Πανεπιστήμιο της Ουάσιγκτον, με υποτροφία, αποφοίτησε από τα μαθήματα magna cum laude μόλις τρία χρόνια αργότερα το 1945.

Την ίδια χρονιά, η Dayhoff εισήλθε στο Πανεπιστήμιο Columbia για να πάρει το διδακτορικό δίπλωμα της στην κβαντική χημεία υπό τη φροντίδα του εξέχοντος χημικού και του ερευνητή των επιχειρήσεων του Β 'Παγκοσμίου Πολέμου George Kimball. Η αποδοχή της ήταν μια σπανιότητα για το διάστημα. Μετά τον Β 'Παγκόσμιο Πόλεμο, περισσότεροι άνδρες εισήλθαν στις επιστήμες και η χημεία έγινε ακόμη πιο ανδροκρατούμενη από την προηγούμενη δεκαετία, ενώ μόνο το 5% των διδάκτορων χημείας πηγαίνουν στις γυναίκες, από 8%.

Κατά τη διάρκεια του χρόνου του Dayhoff στο πανεπιστήμιο, η Κολούμπια ήταν μια εστία για την τεχνολογία πληροφορικής. Έχει καυχηθεί μερικά από τα πρώτα εργαστήρια πληροφορικής στις ΗΠΑ και το 1945 έγινε έδρα του IBM Watson Scientific Laboratory με επικεφαλής τον αστρονόμο WJ Eckert. Το εργαστήριο του Watson είχε αρχικά λειτουργήσει ως κέντρο πληροφορικής για τους Συμμάχους κατά τους τελευταίους μήνες του Β 'Παγκοσμίου Πολέμου. Μετά τον πόλεμο, έγινε ένας χώρος για την ανάπτυξη μερικών από τους πρώτους σούπερ υπολογιστές, συμπεριλαμβανομένου του Ηλεκτρονικού Υπολογιστή Επιλεκτικής Ακολουθίας (SSEC), τον οποίο ο Eckert χρησιμοποίησε αργότερα για να υπολογίσει σεληνιακές τροχιές για τις αποστολές Apollo.

Με αυτήν την τεχνολογία στα χέρια της, η Dayhoff συνδύασε το ενδιαφέρον της για τη χημεία με τον υπολογισμό μέσω μηχανών διάτρητων καρτών - κυρίως πρώιμων ψηφιακών υπολογιστών. Τα μηχανήματα επέτρεψαν στην Dayhoff να αυτοματοποιήσει τους υπολογισμούς της, αποθηκεύοντας έναν αλγόριθμο σε ένα σύνολο καρτών και δεδομένα σε ένα άλλο. Χρησιμοποιώντας το μηχάνημα, ήταν σε θέση να επεξεργάζεται τους υπολογισμούς πολύ πιο γρήγορα και με ακρίβεια από ό, τι με το χέρι.

Το ιδιαίτερο αντικείμενο του Dayhoff ενδιαφέροντος ήταν πολυκυκλικές οργανικές ενώσεις, οι οποίες είναι μόρια που αποτελούνται από τρία ή περισσότερα άτομα ενωμένα σε ένα στενό δακτύλιο. Χρησιμοποίησε τις μηχανές διάτρητης κάρτας για να εκτελέσει έναν μεγάλο αριθμό υπολογισμών σχετικά με τις συντονισμένες ενέργειες των μορίων (τη διαφορά μεταξύ της πιθανής ενέργειας ενός μορίου μιας συγκεκριμένης κατάστασης και της μέσης κατάστασης) για να προσδιορίσει την πιθανότητα μοριακής σύνδεσης και αποστάσεων δεσμών.

Η Dayhoff αποφοίτησε με διδακτορικό δίπλωμα στην κβαντική χημεία σε μόλις τρία χρόνια. Η έρευνα που ανέλαβε ως μεταπτυχιακός φοιτητής δημοσιεύθηκε, με τον Kimball ως συνυπογράφο, το 1949 στην Εφημερίδα της Χημικής Φυσικής κάτω από τον απλό τίτλο Υπολογισμός των Κανόνων Resonance Energies.

Επίσης, το 1948, ο Dayhoff παντρεύτηκε τον Edward Dayhoff, φοιτητή πειραματικής φυσικής τον οποίο είχε συναντήσει στην Κολομβία. Το 1952, το ζεύγος μετακόμισε στην Ουάσιγκτον, όπου ο Edward ανέλαβε θέση στο Εθνικό Γραφείο Προτύπων και η Dayhoff γεννήθηκε στην πρώτη της από τις δύο κόρες, Ruth. Η Dayhoff σύντομα εγκατέλειψε την έρευνα για να γίνει μαμά διαμονής στο σπίτι της Ruth και της μικρότερης κόρης της Judith, εκτός από μια διετή θέση μεταδιδακτορικού στο Πανεπιστήμιο του Maryland.

Όταν επέστρεψε στην έρευνα και άρχισε να ζητεί επιχορηγήσεις για να χρηματοδοτήσει το έργο της το 1962, συναντήθηκε με ένα σοκ. Τα Εθνικά Ινστιτούτα Υγείας απέρριψαν μια αίτηση επιχορήγησης που απαρίθμησε τον Dayhoff ως κύριο ερευνητή, με την εξήγηση ότι "[ο Dayhoff] έχει περάσει από πολύ οικεία επαφή για κάποιο χρονικό διάστημα ... με αυτή την πολύπλοκη και ταχέως αναπτυσσόμενη περιοχή", όπως γράφει ο ιστορικός Bruno Strasser το επερχόμενο βιβλίο του Συλλογή Πειράματα: Κάνοντας μεγάλη βιολογία δεδομένων . Αυτό το είδος ανοδικής ανόδου για τις γυναίκες που έχουν πάρει το χρόνο τους για να μεγαλώσουν τα παιδιά είναι μόνο ένας από τους τρόπους με τους οποίους τα επιστημονικά ιδρύματα εμπόδισαν - και συνέχισαν να εμποδίζουν - την πρόοδο των γυναικών.

Παρά την έλλειψη υποστήριξης της NIH, η Dayhoff επρόκειτο να εισέλθει στην πιο επακόλουθη δεκαετία της καριέρας της. Το 1960, δέχτηκε μια μοιραία πρόσκληση από τον Robert Ledley, έναν πρωτοπόρο βιοφυσικό τον οποίο συναντήθηκε μέσω του συζύγου της, για να τον ενώσει στο Εθνικό Ίδρυμα Βιοϊατρικής Έρευνας στο Silver Spring του Maryland. Ο Ledley γνώριζε ότι οι δεξιότητες πληροφορικής του Dayhoff θα ήταν κρίσιμες για το στόχο του ιδρύματος να συνδυάσει τους τομείς της πληροφορικής, της βιολογίας και της ιατρικής. Θα υπηρετεί ως βοηθός διευθυντής του για 21 χρόνια.

Μόλις βρισκόταν στο Μέριλαντ, η Dayhoff διέθετε δωρεάν τη χρήση του στο ολοκαίνουργιο mainframe IBM 7090 του Πανεπιστημίου της Georgetown. Το σύστημα IBM σχεδιάστηκε για το χειρισμό σύνθετων εφαρμογών, με ταχύτητες υπολογισμών έξι φορές πιο γρήγορα από τα προηγούμενα μοντέλα. Αυτή η ταχύτητα επιτεύχθηκε με την αντικατάσταση της πιο αργής, ογκώδους τεχνολογίας κενού σωλήνα με γρηγορότερα, πιο αποδοτικά τρανζίστορ (τα συστατικά που παράγουν τα 1s και 0s των υπολογιστών). Χρησιμοποιώντας το mainframe, οι Dayhoff και Ledley άρχισαν να αναζητούν και να συγκρίνουν πεπτιδικές αλληλουχίες με προγράμματα FORTRAN που είχαν γράψει οι ίδιοι σε μια προσπάθεια να συγκεντρώσουν μερικές αλληλουχίες σε μια πλήρη πρωτεΐνη.

IBM 7090 Κονσόλα χειριστή IBM 7090 στο Κέντρο Έρευνας Ames της NASA το 1961, με δύο τράπεζες των μονάδων μαγνητικών ταινιών IBM 729. (NASA)

Η δέσμευση της Dayhoff και της Ledley για την εφαρμογή ανάλυσης ηλεκτρονικών υπολογιστών στη βιολογία και στη χημεία ήταν ασυνήθιστη. "Η κουλτούρα της στατιστικής ανάλυσης, πόσο μάλλον της ψηφιακής πληροφορικής, ήταν εξ ολοκλήρου ξένη προς τους περισσότερους [βιοχημικούς]" εξηγεί ο Strasser σε συνέντευξή του στο Smithsonian.com . «Κάποιοι ακόμη και οι ίδιοι είναι πολύτιμοι για να μην είναι« θεωρητικοί », και έτσι κατανοούσαν την ανάλυση των δεδομένων χρησιμοποιώντας μαθηματικά μοντέλα».

Ωστόσο, μια επιστημονική πειθαρχία, στην οποία ήταν κατανοητή η κατανόηση του υπολογιστή του Dayhoff, ήταν η αστρονομία. Αυτό το ενδιαφέρον για τον υπολογισμό οφείλεται εν μέρει στον WJ Eckhart, ο οποίος το 1940 είχε χρησιμοποιήσει μηχανές IBM με διάτρητες κάρτες για να προβλέψει πλανητικές τροχιές. Και στη δεκαετία του 1960, το αμερικανικό ενδιαφέρον για την εξερεύνηση του διαστήματος ήταν σε πλήρη εξέλιξη, πράγμα που σήμαινε χρηματοδότηση για τη NASA. Στο Πανεπιστήμιο του Maryland, η Dayhoff συναντήθηκε με την φασματοσκοπία Ellis Lippincott, η οποία την έφερε σε μια εξαετή συνεργασία με τον Carl Sagan στο Χάρβαρντ το 1961. Οι τρεις από αυτούς ανέπτυξαν θερμοδυναμικά μοντέλα χημικής σύστασης της ύλης και ο Dayhoff σχεδίασε ένα πρόγραμμα υπολογιστή θα μπορούσε να υπολογίσει τις συγκεντρώσεις αερίων ισορροπίας σε πλανητικές ατμόσφαιρες.

Με το πρόγραμμα της Dayhoff, η Lippincott και η Sagan κατάφεραν να επιλέξουν ένα στοιχείο που θα μπορούσε να αναλύσει, επιτρέποντάς τους να ερευνήσουν πολλές διαφορετικές ατμοσφαιρικές συνθέσεις. Τελικά, ανέπτυξαν ατμοσφαιρικά μοντέλα για την Αφροδίτη, τον Δία, τον Άρη και ακόμη και μια αρχέγονη ατμόσφαιρα της Γης.

Εξερευνώντας τον ουρανό, ο Dayhoff έλαβε επίσης μια ερώτηση που οι ερευνητές είχαν εξερευνήσει τουλάχιστον από τη δεκαετία του 1950: ποια είναι η λειτουργία των πρωτεϊνών; Οι αλληλουχίες πρωτεϊνών ήταν ένα μέσο για να πάρει την απάντηση, αλλά η αλληλούχιση μεμονωμένων πρωτεϊνών ήταν εξαιρετικά αναποτελεσματική. Οι Dayhoff και Ledley υιοθέτησαν μια διαφορετική προσέγγιση. Αντί να αναλύουν πρωτεΐνες σε απομόνωση, συνέκριναν πρωτεΐνες προερχόμενες από διαφορετικά φυτικά και ζωικά είδη. "Με τη σύγκριση των αλληλουχιών της ίδιας πρωτεΐνης σε διαφορετικά είδη, θα μπορούσε κανείς να παρατηρήσει ποια μέρη της αλληλουχίας ήταν πάντοτε πανομοιότυπα σε όλα τα είδη, μια καλή ένδειξη ότι αυτό το τμήμα της αλληλουχίας ήταν κρίσιμο για το καλό της πρωτεΐνης", λέει ο Strasser.

Το Dayhoff διερεύνησε βαθύτερα, κοιτάζοντας την κοινή ιστορία των πρωτεϊνών. Αναλύει όχι μόνο τα τμήματα που ήταν τα ίδια μεταξύ των ειδών, αλλά και οι παραλλαγές τους. "Έλαβαν αυτές τις διαφορές ως ένα μέτρο εξελικτικών αποστάσεων μεταξύ των ειδών, που τους επέτρεψαν να αναδημιουργήσουν φυλογενετικά δέντρα", εξηγεί ο Strasser.

Η Dayhoff, πάντα έτοιμη να αξιοποιήσει τη δύναμη της νέας τεχνολογίας, ανέπτυξε μηχανογραφικές μεθόδους για τον προσδιορισμό των ακολουθιών πρωτεϊνών. Διεξήγαγε μια ανάλυση υπολογιστών πρωτεϊνών σε μια ευρεία ποικιλία ειδών, από τον μύκητα Candida μέχρι τη φάλαινα. Στη συνέχεια χρησιμοποίησε τις διαφορές τους για να καθορίσει τις προγονικές σχέσεις τους. Το 1966, με τη βοήθεια του Richard Eck, ο Dayhoff δημιούργησε την πρώτη ανακατασκευή ενός φυλογενετικού δέντρου.

Σε ένα επιστημονικό αμερικανικό άρθρο του 1969, «Computer Analysis of Protein Evolution», η Dayhoff παρουσίασε στο κοινό ένα από αυτά τα δέντρα μαζί με την έρευνά της χρησιμοποιώντας υπολογιστές για την ανάλυση αλληλουχιών πρωτεϊνών. "Κάθε αλληλουχία πρωτεϊνών που είναι εγκατεστημένη, κάθε εξελικτικός μηχανισμός που φωτίζεται, κάθε σημαντική καινοτομία στην ιστολογία της φυλογενετικής που αποκαλύπτεται θα βελτιώσει την κατανόησή μας για την ιστορία της ζωής», έγραφε. Προσπαθούσε να παρουσιάσει στην κοινότητα των επιστημών της ζωής τις δυνατότητες των μηχανογραφικών μοντέλων.

Ο επόμενος στόχος της ήταν να συγκεντρώσει όλες τις γνωστές πρωτεΐνες σε ένα μέρος όπου οι ερευνητές θα μπορούσαν να βρουν αλληλουχίες και να τις συγκρίνουν με άλλους. Αντίθετα από σήμερα, όταν είναι εύκολο να καλέσετε πηγές σε μια ηλεκτρονική βάση δεδομένων με απλά μια λέξη-κλειδί, η Dayhoff έπρεπε να σκουπίσει τα φυσικά περιοδικά για να βρει τις πρωτεΐνες που αναζητούσε. Σε πολλές περιπτώσεις, αυτό σήμαινε τον έλεγχο του έργου των συνεργατών του για λάθη. Ακόμη και με τη βοήθεια ηλεκτρονικού υπολογιστή, το έργο της συλλογής και καταλογογράφησης των ακολουθιών απαιτούσε άφθονο χρόνο και επιστημονικό μάτι.

Όλοι δεν είδαν αξία σε αυτό που έκανε. Σε άλλους ερευνητές, το έργο του Dayhoff μοιάζει με το έργο συλλογής και καταλογογράφησης της φυσικής ιστορίας του 19ου αιώνα και όχι με το πειραματικό έργο του επιστήμονα του 20ού αιώνα. "Η συλλογή, η σύγκριση και η ταξινόμηση των πραγμάτων της φύσης φαινόταν παρωχημένη σε πολλούς πειραματικούς βιολόγους στο δεύτερο μισό του 20ού αιώνα", λέει ο Stasser. Αναφέρεται στο Dayhoff ως «ξένος». «Συνέβαλε σε ένα πεδίο που δεν υπήρχε και συνεπώς δεν είχε επαγγελματική αναγνώριση», λέει.

Το 1965, η Dayhoff δημοσίευσε για πρώτη φορά τη συλλογή της από τις 65 γνωστές πρωτεΐνες στο Atlas of Protein Sequence and Structure, μια τυπωμένη έκδοση της βάσης δεδομένων της. Τελικά τα δεδομένα μεταφέρθηκαν στη μαγνητική ταινία και τώρα ζουν στο διαδίκτυο όπου οι ερευνητές συνεχίζουν να χρησιμοποιούν τα δεδομένα της για να βρουν χιλιάδες περισσότερες πρωτεΐνες. Άλλες βιοϊατρικές βάσεις δεδομένων συγκαταλέγονται μεταξύ άλλων στην Protein Data Bank, μια συνεργατική συλλογή πρωτεϊνών και νουκλεϊνικών οξέων που ξεκίνησε το 1971 και η GenBank, η βάση δεδομένων γενετικής ακολουθίας που ξεκίνησε το 1982. Η Dayhoff ξεκίνησε μια επιστημονική επανάσταση.

"Σήμερα, κάθε δημοσίευση στην πειραματική βιολογία περιέχει έναν συνδυασμό νέων πειραματικών δεδομένων και συμπερασμάτων που προέρχονται από συγκρίσεις με άλλα δεδομένα που διατίθενται σε μια δημόσια βάση δεδομένων, μια προσέγγιση που η Dayhoff ξεκίνησε πριν από μισό αιώνα", λέει ο Strasser.

Καθώς η βιοπληροφορική αυξήθηκε, τα καθήκοντα συλλογής και υπολογισμού μειώθηκαν σε μεγάλο βαθμό στις γυναίκες. Οι συνεργάτες της Dayhoff στον Άτλαντα ήταν όλες οι γυναίκες εκτός από τον Ledley. Όπως οι γυναίκες "υπολογιστές" της NASA στη δεκαετία του 1960 και οι γυναίκες κωδικοποιητές του Β 'Παγκοσμίου Πολέμου, οι γυναίκες αυτές σύντομα ωθήθηκαν στο περιθώριο της επιστημονικής πρακτικής. Αναφερόμενος στα «κορίτσια ENIAC» που προγραμμάτισαν τον πρώτο ψηφιακό υπολογιστή γενικής χρήσης, ο ιστορικός της πληροφορικής Jennifer Light γράφει ότι «είναι εντός των ορίων ακριβώς αυτών των επαγγελματικών ταξινομήσεων χαμηλής κατάστασης ότι οι γυναίκες ασχολήθηκαν με πρωτοφανή δουλειά».

Στο βιογραφικό σκίτσο της Dayhoff, ο Lois T. Hunt, ο οποίος εργάστηκε με τον Άτλαντα μαζί της, έγραψε ότι η Dayhoff πίστευε ότι η έρευνά της για την αρχέγονη ατμόσφαιρα της Γης θα μπορούσε να της δώσει «τις απαραίτητες ενώσεις για το σχηματισμό της ζωής». υπολογιστική, είναι αυτό που συνδέει μαζί τα διαφορετικά μέρη της επιστημονικής έρευνας του Dayhoff. Από τη μικροσκοπική πρωτεΐνη μέχρι τη μεγάλη ατμόσφαιρα, ο Dayhoff αναζητούσε τα μυστικά της εμφάνισης της ζωής σε αυτόν τον πλανήτη. Αν και δεν τους ξεκλειδώνει όλα, έδωσε στη σύγχρονη επιστήμη τα εργαλεία και τις μεθόδους για να συνεχίσει την αναζήτηση.

Πώς η Margaret Dayhoff έφερε Σύγχρονη Πληροφορική στη Βιολογία