https://frosthead.com

Η μεγάλη πλειονότητα των πρώτων δεδομένων από παλαιές επιστημονικές μελέτες μπορεί τώρα να λείπει

Ένα από τα θεμέλια της επιστημονικής μεθόδου είναι η αναπαραγωγικότητα των αποτελεσμάτων. Σε ένα εργαστήριο οπουδήποτε στον κόσμο ένας ερευνητής πρέπει να μπορεί να μελετά το ίδιο θέμα με έναν άλλο επιστήμονα και να αναπαράγει τα ίδια δεδομένα ή να αναλύει τα ίδια δεδομένα και να παρατηρεί τα ίδια μοτίβα.

Αυτός είναι ο λόγος για τον οποίο τα ευρήματα μιας μελέτης που δημοσιεύθηκε σήμερα στο Current Biology αφορούν τόσο. Όταν μια ομάδα ερευνητών προσπάθησε να στείλει ηλεκτρονικό ταχυδρομείο στους συντάκτες 516 βιολογικών μελετών που δημοσιεύθηκαν μεταξύ 1991 και 2011 και να ζητήσουν τα ακατέργαστα δεδομένα, φοβήθηκαν να διαπιστώσουν ότι περισσότερο από το 90 τοις εκατό των παλαιότερων δεδομένων (από έγγραφα που έχουν γραφτεί πριν από περισσότερα από 20 χρόνια) απρόσιτος. Συνολικά, ακόμη και με άρθρα που δημοσιεύθηκαν μόλις το 2011, ήταν σε θέση μόνο να εντοπίσουν τα δεδομένα για 23 τοις εκατό.

"Όλοι γνωρίζουν ότι εάν ρωτήσετε έναν ερευνητή για δεδομένα από παλιές μελέτες, θα τα βγάλουν και δεν θα ξέρουν πού είναι", λέει ο Timothy Vines, ζωολόγος στο Πανεπιστήμιο της Βρετανικής Κολομβίας, ο οποίος οδήγησε η προσπάθεια. "Αλλά πραγματικά δεν υπήρχαν ποτέ συστηματικές εκτιμήσεις για το πόσο γρήγορα εξαφανίζονται τα δεδομένα που κατέχουν οι συγγραφείς".

Για να κάνει την εκτίμησή τους, η ομάδα του επέλεξε έναν τύπο δεδομένων που ήταν σχετικά συνεπής με τις χρονικές ανατομικές μετρήσεις των φυτών και των ζώων και έριξε μεταξύ 25 και 40 χαρτιά για κάθε περίεργο έτος κατά τη διάρκεια της περιόδου που χρησιμοποίησε αυτό το είδος δεδομένων αν μπορούσαν να κυνηγήσουν τους ακατέργαστους αριθμούς.

Ένα εκπληκτικό ποσό των ερωτημάτων τους σταμάτησε στο πρώτο βήμα: για το 25 τοις εκατό των μελετών, οι ενεργές διευθύνσεις ηλεκτρονικού ταχυδρομείου δεν βρέθηκαν, με τις αδιευκρίνιστες διευθύνσεις που αναγράφονται στο ίδιο το χαρτί και οι αναζητήσεις στο διαδίκτυο να μην εμφανίζονται σε τρέχοντα. Για άλλα 38 τοις εκατό των μελετών, τα ερωτήματά τους οδήγησαν σε καμία απάντηση. Ένα άλλο 7% των συνόλων δεδομένων χάθηκαν ή ήταν απρόσιτα.

"Μερικές φορές, για παράδειγμα, αποθηκεύτηκαν σε δισκέτες τριών και μισής ίντσας, οπότε κανείς δεν θα μπορούσε να έχει πρόσβαση σε αυτήν, επειδή δεν είχαν πλέον τις κατάλληλες μονάδες δίσκου", λέει ο Vines. Επειδή η βασική ιδέα της διατήρησης δεδομένων είναι έτσι ώστε να μπορεί να χρησιμοποιηθεί από άλλους σε μελλοντική έρευνα, αυτό το είδος απαξίωσης ουσιαστικά καθιστά άχρηστα τα δεδομένα.

Αυτά μπορεί να φαίνονται σαν κανονικά εμπόδια, αλλά οι επιστήμονες είναι ακριβώς όπως εμείς οι άλλοι - αλλάζουν τις διευθύνσεις ηλεκτρονικού ταχυδρομείου, παίρνουν νέους υπολογιστές με διαφορετικούς δίσκους, χάνουν τα αρχεία τους - έτσι οι τάσεις αυτές αντικατοπτρίζουν σοβαρά, συστημικά προβλήματα στην επιστήμη.

Και η διατήρηση δεδομένων είναι τόσο σημαντική, αξίζει να θυμηθούμε, γιατί είναι αδύνατο να προβλέψουμε σε ποιες κατευθύνσεις η έρευνα θα κινηθεί στο μέλλον. Η αμπέλια, για παράδειγμα, διεξάγει τη δική της έρευνα σε ένα ζευγάρι ειδών φραγκοστάφυλων που προέρχονται από την Ανατολική Ευρώπη και φαίνεται ότι βρίσκονται στη διαδικασία της υβριδοποίησης. Στη δεκαετία του '80, λέει, μια ξεχωριστή ομάδα ερευνητών εργάστηκε για το ίδιο θέμα και βρήκε ένα παλιό χαρτί που τεκμηριώνει τη διανομή αυτών των βακαλάων στη δεκαετία του 1930. Γνωρίζοντας ότι η κατανομή τους είχε αλλάξει σχετικά λίγο κατά τη διάρκεια των παρεμβάσεων δεκαετιών επέτρεψε στους επιστήμονες να κάνουν κάθε είδους υπολογισμούς που δεν θα ήταν άλλως εφικτοί. "Ότι τα αρχικά δεδομένα είναι διαθέσιμα, από μια πολύ μικρή παλιά μελέτη που γράφτηκε στα πολωνικά, ήταν εξαιρετικά χρήσιμη για τους ερευνητές που ήρθαν 70 χρόνια αργότερα", λέει.

Υπάρχει επίσης το γεγονός ότι τόσο μεγάλο μέρος αυτής της έρευνας καταβάλλεται με δημόσια χρηματοδότηση, μεγάλο μέρος της οποίας προέρχεται από επιχορηγήσεις που προβλέπουν ότι τα προκύπτοντα δεδομένα πρέπει να είναι ελεύθερα διαθέσιμα στο κοινό. Επιπροσθέτως, τα δεδομένα πεδίου επηρεάζονται από τις συνθήκες του περιβάλλοντος στο οποίο συλλέγονται - επομένως, είναι αδύνατο να αναπαράγονται τέλεια αργότερα, όταν έχουν μεταβληθεί οι συνθήκες.

Ποια είναι η λύση; Ορισμένα περιοδικά, συμπεριλαμβανομένης της Μοριακής Οικολογίας, της οποίας η Vines είναι διαχειριστής, υιοθέτησαν πολιτικές που απαιτούν από τους δημιουργούς να υποβάλλουν ανεπεξέργαστα δεδομένα μαζί με τα έγγραφά τους, επιτρέποντας στο ίδιο το περιοδικό να αρχειοθετεί τα δεδομένα διαρκώς. Αν και τα περιοδικά, όπως οι άνθρωποι, είναι ευαίσθητα στις μεταβαλλόμενες διευθύνσεις ηλεκτρονικού ταχυδρομείου και την τεχνολογική απαξίωση, τα προβλήματα αυτά μπορούν να αντιμετωπιστούν πολύ πιο εύκολα σε θεσμική κλίμακα.

Η μεγάλη πλειονότητα των πρώτων δεδομένων από παλαιές επιστημονικές μελέτες μπορεί τώρα να λείπει