Tweets από όλο τον κόσμο, σχεδιασμένα από τοποθεσία ως μέρος μιας νέας μελέτης. Κάντε κλικ για μεγέθυνση. Εικόνα μέσω της Πρώτης Δευτέρας / Leetaru et. al.
Είναι δύσκολο να εκτιμήσεις πόσο γρήγορα και διεξοδικά το Twitter έχει καταλάβει τον κόσμο. Πριν από μόλις επτά χρόνια, το 2006, ήταν μια ιδέα σκιαγραφημένη σε ένα μαξιλάρι χαρτιού. Τώρα, η υπηρεσία χρησιμοποιείται από περίπου 554 εκατομμύρια χρήστες - αριθμός που αντιστοιχεί στο 8% περίπου όλων των ανθρώπων στον πλανήτη - και έχουν αποσταλεί περίπου 170 δισεκατομμύρια tweets, με τον αριθμό να ανεβαίνει κατά περίπου 58 εκατομμύρια κάθε μέρα .
Όλα αυτά τα tweets αποτελούν μια ανεκτίμητη πηγή ειδήσεων, ψυχαγωγίας, συνομιλίας και σύνδεσης μεταξύ των ανθρώπων. Αλλά για τους επιστήμονες, είναι επίσης πολύτιμες ως κάτι μάλλον διαφορετικό: ακατέργαστα δεδομένα.
Επειδή το Twitter διαθέτει ένα ανοιχτό API (το οποίο επιτρέπει τη λήψη των tweets ως ακατέργαστα, αναλύσιμα δεδομένα) και πολλά tweets είναι geotagged, οι ερευνητές μπορούν να χρησιμοποιήσουν δισεκατομμύρια από αυτά τα tweets και να τα αναλύσουν ανά τοποθεσία για να μάθουν περισσότερα για τη γεωγραφία των ανθρώπων σε ολόκληρο τον πλανήτη. Το περασμένο φθινόπωρο, στο πλαίσιο του παγκόσμιου Twitter Heartbeat, μια ομάδα του Πανεπιστημίου του Ιλλινόις ανέλυσε τη γλώσσα και τη θέση πάνω από ένα δισεκατομμύριο tweets από όλες τις ΗΠΑ για να δημιουργήσει εκλεπτυσμένους χάρτες θεμάτων όπως θετικά και αρνητικά συναισθήματα που εκφράστηκαν κατά τη διάρκεια του τυφώνα Sandy ή υποστήριξη για τον Barack Obama ή Mitt Romney κατά τη διάρκεια των προεδρικών εκλογών.
Όπως ανέφερε ο Joshua Keating στο blog του Foreign of War of Ideas, μέλη της ίδιας ομάδας, με επικεφαλής τον Kalev Leetaru, έχουν περάσει πρόσφατα ένα βήμα παραπέρα. Όπως δημοσιεύθηκε σε νέα μελέτη νωρίτερα αυτή την εβδομάδα στο online περιοδικό First Monday, αναλύθηκαν οι τοποθεσίες και οι γλώσσες των 46.672.798 tweets που ταχυδρομήθηκαν μεταξύ 23 Οκτωβρίου και 30 Νοεμβρίου του περασμένου έτους για να δημιουργήσουν ένα εντυπωσιακό πορτρέτο της ανθρώπινης δραστηριότητας σε όλο τον πλανήτη, στην κορυφή της θέσης. Έκαναν χρήση της Twitter decahose, μια ροή δεδομένων που συλλαμβάνει τυχαία το 10% όλων των tweets παγκοσμίως σε κάθε δεδομένη στιγμή (η οποία ανήλθε στα 1.535.929.521 για την χρονική περίοδο) και απλά εστίασε στα tweets με τα σχετικά γεωγραφικά δεδομένα.
Όπως σημειώνουν οι ερευνητές, η γεωγραφική πυκνότητα των tweets σε πολλές περιοχές - ειδικά στον δυτικό κόσμο, όπου οι υπολογιστές, οι κινητές συσκευές και το Twitter χρησιμοποιούνται όλοι σε κορυφαία επίπεδα - προσεγγίζουν τα ποσοστά ηλεκτροδότησης και χρήσης φωτισμού. Ως αποτέλεσμα, οι χάρτες των tweets (όπως η άποψη λεπτομέρειας των ηπειρωτικών ΗΠΑ, παρακάτω) καταλήγουν να φαίνονται πολύ σαν δορυφορικές εικόνες τεχνητού φωτός το βράδυ.
Κάντε κλικ για μεγέθυνση. Εικόνα μέσω της Πρώτης Δευτέρας / Leetaru et. al.
Ως δοκιμή για να δούμε πόσο καλά τα tweets ταιριάζουν με το τεχνητό φως, δημιούργησαν τον σύνθετο χάρτη παρακάτω, στον οποίο τα tweets εμφανίζονται ως κόκκινες κουκκίδες και ο φωτισμός της νύχτας εμφανίζεται ως μπλε. Οι περιοχές στις οποίες αντιστοιχούν σε συχνότητα (και ουσιαστικά ακυρώνονται ο ένας στον άλλο) εμφανίζονται ως λευκές και οι περιοχές όπου το ένα υπερτερεί του άλλου παραμένουν κόκκινο ή μπλε. Πολλές περιοχές καταλήγουν να φαίνονται αρκετά λευκές, με κάποιες βασικές εξαιρέσεις: το Ιράν και η Κίνα, όπου απαγορεύεται το Twitter, είναι εμφανώς μπλε, ενώ πολλές χώρες με σχετικά χαμηλά ποσοστά ηλεκτροδότησης (αλλά όπου το Twitter εξακολουθεί να είναι δημοφιλές) εμφανίζονται ως κόκκινα.
Κάντε κλικ για μεγέθυνση. Εικόνα μέσω της Πρώτης Δευτέρας / Leetaru et. al.
Το έργο έγινε ακόμη πιο ενδιαφέρον όταν οι ερευνητές χρησιμοποίησαν ένα αυτοματοποιημένο σύστημα για να διασπάσουν τα tweets ανά γλώσσα. Η πιο κοινή γλώσσα στο Twitter είναι η αγγλική, η οποία αντιπροσωπεύεται στο 38, 25% όλων των Tweets. Μετά από αυτό ήρθαν οι Ιάπωνες (11, 84%), οι Ισπανοί (11, 37%), οι Ινδονήσιοι (8, 84%), οι Νορβηγοί (7, 74%) και οι Πορτογάλοι (5, 58%).
Η ομάδα δημιούργησε ένα χάρτη όλων των tweets που έχουν γραφτεί στις 26 πιο δημοφιλείς γλώσσες, με το καθένα να αντιπροσωπεύεται από διαφορετικό χρώμα, κάτω από:
Κάντε κλικ για μεγέθυνση. Εικόνα μέσω της Πρώτης Δευτέρας / Leetaru et. al.
Ενώ τα tweets των περισσότερων χωρών κυριαρχούνται από τις επίσημες γλώσσες τους, πολλοί αποκαλύπτονται ότι περιλαμβάνουν tweets σε διάφορες άλλες γλώσσες. Κοιτάξτε αρκετά προσεκτικά και θα δείτε ένα ουράνιο τόξο χρωμάτων που ξεφυτρώνουν από τις γκρίζες κουκίδες (αγγλικά tweets) που καλύπτουν τις ΗΠΑ:
Κάντε κλικ για μεγέθυνση. Εικόνα μέσω της Πρώτης Δευτέρας / Leetaru et. al.
Μεταξύ των άλλων αναλύσεων, η ερευνητική ομάδα εξέτασε ακόμη και τη γεωγραφία της επανεμφάνισης και αναφοράς - της μέσης απόστασης μεταξύ ενός χρήστη και ενός ατόμου που επαναλαμβάνει, καθώς και της μέσης απόστασης μεταξύ αυτού του χρήστη και κάποιας που απλά αναφέρει σε ένα τιτίβισμα. Κατά μέσο όρο, η απόσταση για ένα ρετουμπέτ ήταν 1.115 μίλια και 1.118 για μια αναφορά. Αλλά, αντίθετα, υπήρχε μια θετική σχέση μεταξύ του αριθμού των χρόνων που ένας συγκεκριμένος χρήστης επανέλαβε ή αναφέρθηκε σε έναν άλλο χρήστη και την απόσταση του: Τα ζευγάρια χρηστών με λίγες μόνο αλληλεπιδράσεις ήταν πιο πιθανό να είναι πιο κοντά μαζί (500- 600 μίλια μακριά) από εκείνους με δεκάδες retweets και αναφορές μεταξύ τους.
Αυτό υποδεικνύει ότι οι χρήστες που διαμένουν πολύ μακριά είναι πιθανότερο να χρησιμοποιούν το Twitter για να αλληλεπιδρούν σε τακτική βάση. Μία εξήγηση μπορεί να είναι ότι οι οντότητες με τους περισσότερους οπαδούς - και επομένως οι περισσότερες αναφορές και επαναλήψεις - είναι συχνά διασημότητες, οργανώσεις ή εταιρίες, χρήστες με τους οποίους οι άνθρωποι είναι εξοικειωμένοι αλλά δεν έχουν στην πραγματικότητα προσωπική σχέση. Ένας παγκόσμιος χάρτης επαναλήψεων μεταξύ χρηστών είναι κάτω από:
Κάντε κλικ για μεγέθυνση. Εικόνα μέσω της Πρώτης Δευτέρας / Leetaru et. al.
Το χαρτί περιλάμβανε ακόμα περισσότερες λεπτομέρειες σχετικά με άλλα δεδομένα που σχετίζονται με τα tweets: ο λόγος μεταξύ της επικρατούσας κάλυψης ειδήσεων και του αριθμού των tweets σε μια χώρα (η Ευρώπη και οι ΗΠΑ λαμβάνουν δυσανάλογη κάλυψη από τα μέσα ενημέρωσης, ενώ η Λατινική Αμερική και η Ινδονησία παραβλέπονται) Πρόσθεσε τους περισσότερους χρήστες πρόσφατα (τη Μέση Ανατολή και την Ισπανία) και τους χώρους όπου οι χρήστες έχουν κατά μέσο όρο τους περισσότερους οπαδούς (Νότια Αμερική και Δυτική Ακτή).
Υπάρχουν μερικές προειδοποιήσεις σε όλα αυτά τα δεδομένα. Για ένα, αν και τα tweets ανέλυσαν τον αριθμό των δεκάδων εκατομμυρίων, εξακολουθούν να είναι μόνο το 0, 3% όλων των αποσπασμένων μηνυμάτων, οπότε ενδέχεται να μην αντιπροσωπεύουν επαρκώς όλα τα πρότυπα Twitter, ειδικά αν οι χρήστες που επιτρέπουν τη γεωγραφική σήμανση συμπεριφέρονται διαφορετικά από άλλους. Επιπλέον, στον ταχέως μεταβαλλόμενο κόσμο του Twitter, ορισμένες τάσεις ενδέχεται να έχουν αλλάξει σημαντικά από το περασμένο φθινόπωρο. Όμως, καθώς το Twitter συνεχίζει να αναπτύσσεται και καθώς διατίθενται περισσότερα δεδομένα, είναι λογικό ότι αυτή η ανάλυση θα γίνει πιο δημοφιλής για δημογράφους, επιστήμονες υπολογιστών και άλλους ερευνητές.