https://frosthead.com

Αυτό μπορεί να είναι το μεγαλύτερο οικογενειακό δέντρο του κόσμου

Η άνοδος του ελέγχου DNA μέσω υπηρεσιών όπως το 23andme δείχνει ότι υπάρχει μια μεγάλη αγορά έξω εκεί για το οικογενειακό ιστορικό.

Τώρα, οι επιστήμονες έχουν βασιστεί σε αυτά τα δεδομένα δημοσιεύοντας αυτό που πιστεύουν ότι είναι η μεγαλύτερη βάση δεδομένων γενεαλογικού υλικού στον κόσμο, με ένα οικογενειακό δέντρο που συνδέει 13 εκατομμύρια ανθρώπους και απλώνεται πίσω περισσότερο από πέντε αιώνες.

Όπως αναφέρει ο Jocelyn Kaiser για το περιοδικό Science, ο Yaniv Erlich, υπολογιστικός γενετιστής στο Πανεπιστήμιο Columbia, σκέφτηκε το έργο πριν από επτά χρόνια αφού έλαβε ένα μήνυμα ηλεκτρονικού ταχυδρομείου από έναν μακρινό σχετικό ξάδελκο μέσω του Geni.com, ενός από τους πολλούς ιστοτόπους όπου αναζητούσαν οικογενειακούς δεσμούς.

Με την υποστήριξη του υπεύθυνου τεχνολογίας της Gemi.com, ο Erlich κατέβαλε τα δημόσια προφίλ του ιστοτόπου - δεκάδες εκατομμύρια από αυτά. Αν και δεν προσέφερε δεδομένα DNA, οι πληροφορίες περιελάμβαναν το όνομα, το φύλο, την ημερομηνία και τον τόπο γέννησης, την ημερομηνία θανάτου και τους άμεσους συγγενείς.

Η Φύση έγραψε για το έργο του Erlich στα αρχικά του στάδια το 2013 και πέρυσι η Σαράχ Ζανγκ του Ατλαντικού ανέφερε ότι οι ερευνητές είχαν εκδώσει ένα πρότυπο του τεράστιου δέντρου. Τώρα, γράφει ο Kaiser, η ομάδα του Erlich δημοσίευσε μια μελέτη για το έργο τους στο περιοδικό Science. Χρησιμοποιώντας τα δεδομένα, κατέληξαν σε 5, 3 εκατομμύρια δέντρα, το μεγαλύτερο από τα οποία συνδέει περίπου 13 εκατομμύρια συγγενείς, κυρίως ευρωπαϊκής προέλευσης.

Από την έναρξη του έργου, ο Erlich έχει γίνει ο επικεφαλής επιστήμονας της MyHeritage, μιας εταιρείας γενεαλογικού ελέγχου και DNA που κατέχει το Geni.com. Έκανε ένα Reddit Ask Me Everything την περασμένη Παρασκευή για τα ευρήματά του, διορθώνοντας παρανοήσεις και εξηγώντας τη μεθοδολογία πίσω από το έργο. Σημείωσε επίσης ότι το πιο ενδιαφέρον κομμάτι της εμπειρίας γι 'αυτόν ήταν να υπολογίσουμε πώς να μεταφράσουμε όλα τα διαθέσιμα δεδομένα σε κάτι προσωπικό.

Σε μια συνέντευξη με την Nicole Wetsman της National Geographic, ο Erlich λέει ότι η μελέτη του πώς να δουλέψεις με αυτά τα δεδομένα ήταν επίσης το πιο δύσκολο μέρος του έργου. "Τα γονιδιωματικά σύνολα δεδομένων έχουν συγκεκριμένα εργαλεία, δομές δεδομένων, μεθόδους, αλλά δεν είχαμε κανένα από αυτά για αυτό. Ανακαλύψαμε τον τροχό καθώς πήγαμε », λέει.

Τελικά, οι ερευνητές χρησιμοποίησαν τη μαθηματική θεωρία γραφημάτων για να οργανώσουν και να επαληθεύσουν τις πληροφορίες, αναφέρει η Laura Geggel για τη Live Science . Συγκρίθηκαν επίσης τα προφίλ με περίπου 80.000 δημόσια πιστοποιητικά θανάτου από το Βερμόντ σε περίοδο 25 ετών για να διασφαλιστεί ότι δεν ήταν μόνο πλούσια προφίλ που φορτώθηκαν στο Geni.com.

Η ομάδα αποφάσισε τότε ποιες πληροφορίες ήθελαν να αναζητήσουν για να ελέγξουν τη βάση δεδομένων, γράφει ο Wetsman.

Άρχισαν να αναζητούν μοτίβα και βρήκαν διακυμάνσεις στη διάρκεια ζωής, κάτι που είχαν προβλέψει. Για παράδειγμα, είδαν μια σταγόνα νεαρών ανδρών κατά τη διάρκεια του εμφυλίου πολέμου και των παγκοσμίων πολέμων Ι και ΙΙ, και μια αύξηση της παιδικής επιβίωσης κατά τη δεκαετία του 1900. Ήταν επίσης σε θέση να παρακολουθήσουν τη μετανάστευση, όπως η άφιξη του Mayflower το 1620 στη σημερινή Μασαχουσέτη, ακολουθούμενη από αύξηση των γεννήσεων στην περιοχή αυτή.

Οι ερευνητές διαπίστωσαν επίσης ότι η μακροζωία έχει να κάνει περισσότερο με το περιβάλλον και τη συμπεριφορά από τη γενετική. στην πραγματικότητα, τα δεδομένα αποκάλυψαν ότι τα γονίδια είναι μόνο 16 τοις εκατό υπεύθυνα για τη διάρκεια ζωής. Ωστόσο, ο Paola Sebastiani, καθηγητής βιοστατιστικής στη Σχολή Δημόσιας Υγείας του Πανεπιστημίου της Βοστώνης, προειδοποιεί να συνάγει συμπεράσματα γύρω από αυτά τα δεδομένα σε συνέντευξή του στο Wetsman. "Υπάρχει πολλή σύγχυση σχετικά με τους ορισμούς της μακροζωίας", λέει.

Ο γενετιστής Peter Visscher του Πανεπιστημίου του Queensland στο Μπρίσμπεϊν, στην Αυστραλία, λέει στο Kaiser ότι τα δεδομένα της ομάδας Erlich συμμορφώνονται έχουν τη δυνατότητα να παρέχουν πληροφορίες για τη γενετική του ρόλου σε ασθένειες, εάν τα δεδομένα συνδέονται με πληροφορίες για την υγεία.

Η ερευνητική ομάδα έχει ήδη αρχίσει να συνδυάζει το δέντρο με πληροφορίες από το DNA.Land, το οποίο συγκεντρώνει δεδομένα DNA, πράγμα που θα μπορούσε να σημαίνει ότι μπορεί να έρθει σύντομα ένα ακόμη μεγαλύτερο δέντρο. Οι ερευνητές προβλέπουν ότι εάν η βάση δεδομένων μπορεί να επιστρέψει 65 γενεές, θα είναι σε θέση να ολοκληρώσει το δέντρο.

Αυτό μπορεί να είναι το μεγαλύτερο οικογενειακό δέντρο του κόσμου