Το 1854, απαντώντας σε μια καταστροφική επιδημία χολέρας που σάρωσε μέσω του Λονδίνου, ο βρετανός γιατρός John Snow εισήγαγε μια ιδέα που θα φέρει επανάσταση στον τομέα της δημόσιας υγείας: τον επιδημιολογικό χάρτη. Καταγράφοντας περιπτώσεις χολέρας σε διαφορετικές γειτονιές της πόλης και σχεδιάζοντάς τους σε έναν χάρτη βασισμένο στις κατοικίες των ασθενών, ανακάλυψε ότι μια μόνη μολυσμένη αντλία νερού ήταν υπεύθυνη για πολλές από τις μολύνσεις.
Ο χάρτης τον έπεισε - και τελικά τις δημόσιες αρχές - ότι η θεωρία των ασθενειών του μυασώματος (που ισχυριζόταν ότι οι ασθένειες εξαπλώθηκαν μέσω επιβλαβών αερίων) ήταν ψευδής και ότι η θεωρία των γεννητικών οργάνων (η οποία ορθώς ισχυριζόταν ότι οι μικροοργανισμοί ήταν φταίξιμοι) ήταν αλήθεια. Βάζουν μια κλειδαριά στη χειρολαβή της αντλίας που είναι υπεύθυνη για το ξέσπασμα, σηματοδοτώντας μια μετατόπιση παραδείγματος που μόνιμα άλλαξε τον τρόπο με τον οποίο χειριζόμαστε τις μολυσματικές ασθένειες και έτσι την αποχέτευση.
Η τεχνολογία χαρτογράφησης είναι αρκετά διαφορετική, όπως και η ασθένεια, αλλά υπάρχει κάποια ομοιότητα μεταξύ του χάρτη του Snow και ενός νέου έργου που διεξάγεται από μια ομάδα ερευνητών υπό την ηγεσία του Henry Kautz του Πανεπιστημίου του Rochester. Με τη δημιουργία αλγορίθμων που μπορούν να εντοπίσουν τις τάσεις της γρίπης και να κάνουν προβλέψεις με βάση τις λέξεις-κλειδιά στα διαθέσιμα στο κοινό tweet, λαμβάνουν μια νέα προσέγγιση για τη μελέτη της μετάδοσης της νόσου - μία που θα μπορούσε να αλλάξει τον τρόπο με τον οποίο μελετάμε και παρακολουθούμε την κίνηση των ασθενειών στην κοινωνία .
«Μπορούμε να σκεφτούμε τους ανθρώπους σαν αισθητήρες που κοιτάζουν τον κόσμο γύρω τους και στη συνέχεια αναφέρουν τι βλέπουν και βιώνουν στα κοινωνικά μέσα», εξηγεί ο Kautz. "Αυτό μας επιτρέπει να κάνουμε λεπτομερείς μετρήσεις σε πληθυσμιακή κλίμακα και δεν απαιτεί ενεργή συμμετοχή των χρηστών".
Με άλλα λόγια, όταν τιτλοφορούμε ότι έχουμε μόλις χαμηλωθεί από έναν οδυνηρό βήχα και έναν πυρετό, προσφέρουμε άτυπες πληροφορίες για ένα τεράστιο πείραμα δημόσιας υγείας, πληροφορίες που οι ερευνητές μπορούν να χρησιμοποιήσουν για την παρακολούθηση της κίνησης ασθενειών όπως η γρίπη σε υψηλή ανάλυση και σε πραγματικό χρόνο.
Το έργο Kautz, που ονομάζεται SocialHealth, χρησιμοποίησε tweets και άλλα είδη κοινωνικών μέσων για να εντοπίσει μια σειρά ζητημάτων δημόσιας υγείας - πρόσφατα, άρχισαν να χρησιμοποιούν tweets για να παρακολουθούν περιπτώσεις τροφικής δηλητηρίασης στα εστιατόρια της Νέας Υόρκης καταγράφοντας όσους είχαν δημοσιεύσει τα geotagged tweets από ένα εστιατόριο, μετά από τα tweets τους για τις επόμενες 72 ώρες, ελέγχοντας για αναφορές εμετού, διάρροια, κοιλιακό άλγος, πυρετό ή ρίγη. Με αυτόν τον τρόπο ανιχνεύθηκαν 480 πιθανές περιπτώσεις τροφικής δηλητηρίασης.
Αλλά καθώς η εποχή αλλάζει, είναι η δουλειά τους που εντοπίζει τον ιό της γρίπης που ανοίγει τα μάτια. Το Google Flu Trends προσπάθησε επίσης να χρησιμοποιήσει τους ερευνητές της Google για την παρακολούθηση της κυκλοφορίας της γρίπης, αλλά το μοντέλο υπερεκτιμήθηκε σε μεγάλο βαθμό το ξέσπασμα του περασμένου έτους, ίσως επειδή η κάλυψη των μέσων ενημέρωσης από τη γρίπη προκάλεσε τους ανθρώπους να αρχίσουν να κάνουν ερωτήματα που σχετίζονται με τη γρίπη. Η ανάλυση Twitter αντιπροσωπεύει ένα νέο σύνολο δεδομένων με λίγες ιδιότητες - υψηλότερη γεωγραφική ανάλυση και ικανότητα καταγραφής της κίνησης ενός χρήστη με την πάροδο του χρόνου - που θα μπορούσε να αποφέρει καλύτερες προβλέψεις.
Για να ξεκινήσουν το έργο τους για την παρακολούθηση της γρίπης, οι ερευνητές της SocialHealth εξέτασαν συγκεκριμένα τη Νέα Υόρκη, συλλέγοντας περίπου 16 εκατομμύρια geotagged δημόσια μηνύματα ανά μήνα από 600.000 χρήστες για τρεις μήνες. Παρακάτω υπάρχει μια χρονική περίοδος μιας ημέρας Twitter της Νέας Υόρκης, με διαφορετικά χρώματα που αντιπροσωπεύουν διαφορετικές συχνότητες των tweets σε αυτή τη θέση (μπλε και πράσινο σημαίνει λιγότερα tweets, πορτοκαλί και κόκκινο σημαίνει περισσότερα):
Για να χρησιμοποιήσει όλα αυτά τα δεδομένα, η ομάδα του ανέπτυξε έναν αλγόριθμο που καθορίζει εάν κάθε τιτίβισμα αντιπροσωπεύει μια έκθεση των συμπτωμάτων που μοιάζουν με γρίπη. Προηγουμένως, άλλοι ερευνητές είχαν κάνει αυτό απλά κάνοντας αναζήτηση λέξεων-κλειδιών σε tweets (για παράδειγμα), αλλά η ομάδα του διαπίστωσε ότι η προσέγγιση οδηγεί σε ψευδώς θετικά: Πολλοί περισσότεροι χρήστες τιτίζουν ότι είναι άρρωστοι από την εργασία από ό, τι είναι αισθάνομαι άρρωστος.
Για να γίνει αυτό, ο αλγόριθμος της ομάδας του ψάχνει για τρεις λέξεις στη σειρά (αντί για ένα) και εξετάζει πόσο συχνά η συγκεκριμένη ακολουθία είναι ενδεικτική μιας ασθένειας, με βάση ένα σύνολο tweets που είχαν επισημανθεί με το χέρι. Η φράση "άρρωστος από γρίπη", για παράδειγμα, σχετίζεται έντονα με την ασθένεια, ενώ η "άρρωστη και κουρασμένη" είναι λιγότερο. Μερικές συγκεκριμένες λέξεις-κεφαλαλγία, πυρετός, βήχας- συνδέονται στενά με την ασθένεια ανεξάρτητα από την αλληλουχία των τριών λέξεων από την οποία ανήκουν.
Μόλις αυτά τα εκατομμύρια των tweets κωδικοποιήθηκαν, οι ερευνητές θα μπορούσαν να κάνουν μερικά ενδιαφέροντα πράγματα μαζί τους. Για αρχάριους, εξέτασαν τις μεταβολές των σχετιζόμενων με τη γρίπη tweets με την πάροδο του χρόνου και τις συνέκρινε με τα επίπεδα της γρίπης όπως αναφέρθηκε από το CDC, επιβεβαιώνοντας ότι τα tweets έλαβαν με ακρίβεια τη συνολική τάση στα ποσοστά γρίπης. Ωστόσο, σε αντίθεση με τα δεδομένα CDC, είναι διαθέσιμο σχεδόν σε πραγματικό χρόνο, αντί για μια εβδομάδα ή δύο μετά το γεγονός.
Αλλά επίσης έκαναν βαθύτερα, κοιτάζοντας τις αλληλεπιδράσεις μεταξύ διαφορετικών χρηστών - όπως αντιπροσωπεύονται από δύο χρήστες tweeting από την ίδια θέση (η ανάλυση GPS είναι περίπου μισό μπλοκ της πόλης) εντός της ίδιας ώρας - για να εικονογραφήσει πόσο πιθανό είναι ότι ένα υγιές άτομο θα άρρωναν μετά από να έρθουν σε επαφή με κάποιον που πάσχει από τη γρίπη. Είναι προφανές ότι δύο άτομα που διπλασιάστηκαν από το ίδιο μπλοκ σε απόσταση 40 λεπτών δεν συναντήθηκαν απαραίτητα αυτοπροσώπως, αλλά οι πιθανότητες να έχουν συναντηθεί είναι ελαφρώς υψηλότερες από δύο τυχαίους χρήστες.
Ως αποτέλεσμα, όταν εξετάζετε ένα αρκετά μεγάλο σύνολο δεδομένων αλληλεπιδράσεων, εμφανίζεται μια εικόνα μετάδοσης. Διαπίστωσαν ότι εάν ένας υγιής χρήστης συναντήσει 40 άλλους χρήστες που αναφέρουν ότι είναι άρρωστοι με συμπτώματα γρίπης, οι πιθανότητες να πάρουν τα συμπτώματα της γρίπης την επόμενη μέρα αυξάνονται από λιγότερο από το ένα τοις εκατό στο 20%. Με 60 αλληλεπιδράσεις, ο αριθμός αυτός αυξάνεται στο 50%.
Η ομάδα εξέτασε επίσης τις αλληλεπιδράσεις στο ίδιο το Twitter, απομονώνοντας ζεύγη χρηστών που ακολουθούν ο ένας τον άλλον και καλώντας τους "φιλίες". Παρόλο που πολλές σχέσεις Twitter υπάρχουν μόνο στον Ιστό, μερικοί αντιστοιχούν σε αλληλεπιδράσεις πραγματικού βίου και βρήκαν ότι ένας χρήστης ο οποίος έχει δέκα φίλους που αναφέρουν ότι είναι άρρωστοι, είναι 28% πιθανότερο να αρρωστήσουν την επόμενη μέρα. Συνολικά, χρησιμοποιώντας και τους δύο αυτούς τύπους αλληλεπιδράσεων, ο αλγόριθμος τους ήταν σε θέση να προβλέψει εάν ένα υγιές άτομο θα αρρωστήσει (και τιτίβισμα γι 'αυτό) με 90% ακρίβεια.
Είμαστε ακόμα στα αρχικά στάδια αυτής της έρευνας και υπάρχουν πολλοί περιορισμοί: Οι περισσότεροι άνθρωποι εξακολουθούν να μην χρησιμοποιούν το Twitter (ναι, πραγματικά) και ακόμη και αν το κάνουν, ίσως να μην τιτίζουν για να αρρωστήσουν.
Αλλά αν αυτό το είδος του συστήματος μπορούσε να αναπτυχθεί περαιτέρω, είναι εύκολο να φανταστεί κανείς όλες τις εφαρμογές. Το smartphone σας θα μπορούσε να σας προειδοποιήσει αυτόματα, για παράδειγμα, εάν περάσατε υπερβολικά μεγάλο χρονικό διάστημα στις θέσεις που καταλαμβάνουν άτομα με τη γρίπη, με αποτέλεσμα να επιστρέψετε στην πατρίδα σας για να σταματήσετε να βγάλετε τον εαυτό σας στη διαδρομή μόλυνσης. Οι κάτοικοι ολόκληρης της πόλης θα μπορούσαν ακόμη να προειδοποιηθούν αν ήταν στα πρόθυρα μιας επιδημίας.
Παρά τα 150 χρόνια που αφαιρέσαμε από την ανακάλυψη της απεικόνισης της νόσου John Snow, είναι σαφές ότι εξακολουθούν να υπάρχουν πτυχές των πληροφοριών σχετικά με τις ασθένειες που δεν καταλαβαίνουμε πλήρως. Τώρα, όπως και τότε, η χαρτογράφηση των δεδομένων θα μπορούσε να βοηθήσει στην απόδοση των απαντήσεων.