https://frosthead.com

Μεγάλα δεδομένα ή πάρα πολλές πληροφορίες;

Όλοι γνωρίζουμε ότι υπάρχουν πολύ περισσότερες πληροφορίες στους κόσμους μας από ό, τι παλιότερα. Όσο περισσότερο, οι περισσότεροι από εμάς είναι αρκετά ανίδεοι.

σχετικό περιεχόμενο

  • Infographics Through the Ages Επισημάνετε την Οπτική Ομορφιά της Επιστήμης
  • Γιατί η Google Flu Trends δεν μπορεί να παρακολουθήσει τη γρίπη (ακόμα)

Εδώ είναι ένα ανεκτίμητο nugget για όλες αυτές τις πληροφορίες, τα συγχαρητήρια του Dave Turek, του υπεύθυνου για την ανάπτυξη του υπερυπολογιστού στην IBM: Από το 2003 και μέχρι το ξεκίνημα της ανθρώπινης ιστορίας, δημιουργήσαμε, σύμφωνα με τους υπολογισμούς της IBM, πέντε exabytes πέντε δισεκατομμύρια gigabytes-πληροφοριών. Μέχρι το περασμένο έτος, ξεκινούσαμε πολλά δεδομένα κάθε δύο μέρες. Μέχρι το επόμενο έτος, προβλέπει ο Turek, θα το κάνουμε κάθε 10 λεπτά.

Αλλά πώς είναι δυνατό αυτό; Πώς έγινε αυτό το ψηφιακό kudzu; Με απλά λόγια, κάθε φορά που το κινητό σας στέλνει τη θέση του GPS, κάθε φορά που αγοράζετε κάτι online, κάθε φορά που κάνετε κλικ στο κουμπί Like στο Facebook, βάζετε ένα άλλο ψηφιακό μήνυμα σε ένα μπουκάλι. Και τώρα οι ωκεανοί καλύπτονται λίγο πολύ μαζί τους.

Και αυτό είναι μόνο ένα μέρος της ιστορίας. Μηνύματα κειμένου, αρχεία πελατών, συναλλαγές ATM, εικόνες κάμερας ασφαλείας ... ο κατάλογος συνεχίζεται και συνεχίζεται. Το τραγούδι για να το περιγράψουμε είναι το "Μεγάλο Στοιχείο", αν και αυτό δεν ανταποκρίνεται στην κλίμακα του τέρατος που δημιουργήσαμε.

Είναι το τελευταίο παράδειγμα τεχνολογίας που ξεπερνά την ικανότητά μας να το χρησιμοποιήσουμε. Σε αυτή την περίπτωση, δεν έχουμε ξεκινήσει να καλύψουμε την ικανότητά μας να συλλαμβάνουμε πληροφορίες, γι 'αυτό το λόγο ένα από τα αγαπημένα τραπεζίτες των διαχειριστών αυτών των μέσων είναι ότι το μέλλον ανήκει σε εταιρείες και κυβερνήσεις που μπορούν να κατανοήσουν όλα τα δεδομένα που είναι συλλογή, κατά προτίμηση σε πραγματικό χρόνο.

Οι επιχειρήσεις που μπορούν να ερμηνεύσουν κάθε ψηφιακή ψίχα που οι πελάτες τους αφήνουν πίσω θα έχουν ένα πλεονέκτημα, η σκέψη δεν πηγαίνει - όχι μόνο όσοι αγόραζαν αυτό που ήρθε την προηγούμενη ώρα - αλλά αν έγραψαν tweeted για αυτό ή δημοσίευσαν μια φωτογραφία κάπου στη στροβιλισμού των κοινωνικών δικτύων. Το ίδιο ισχύει και για τις πόλεις που μπορούν να συγκεντρώσουν δεδομένα από χιλιάδες αισθητήρες που τώρα επισημαίνουν τα αστικά τοπία και μετατρέπουν τις καμπύλες της ζωής στην πόλη, όπως η ροή της κυκλοφορίας, σε μια επιστήμη.

Δεν είναι εκπληκτικό ότι οι πολιτικές εκστρατείες ήδη λαμβάνουν το βύθισμα, εξαγριωμένα δεδομένα εξόρυξης ως μέρος της εστίασής τους στους ψηφοφόρους "νανογραμμάτωσης" έτσι ώστε να γνωρίζουν με ακρίβεια πώς να τους χωρίζουν για τις ψήφους και τα χρήματά τους. Μεταξύ των συμπερασμάτων που ανέφεραν οι αναλυτές, σύμφωνα με τον Thomas Edsall του περιοδικού New York Times, είναι ότι οι Ρεπουμπλικανοί δείχνουν προτίμηση στα εστιατόρια "The Office" και Cracker Barrel, ενώ οι Δημοκρατικοί είναι πιο πιθανό να παρακολουθήσουν "Late Night With David Letterman" και να φάνε στο Chuck E Τυρί.

Αυτή η βιασύνη για την ερμηνεία του ψηφιακού flotsam εξηγεί γιατί η Google την προηγούμενη εβδομάδα ανακοίνωσε ότι θα ξεκινήσει να πουλάει ένα προϊόν που καλεί το BigQuery, το λογισμικό που μπορεί να σαρώσει terabytes των πληροφοριών σε δευτερόλεπτα. Και γιατί μια εκκίνηση που ονομάζεται Splunk, η οποία διαθέτει τεχνολογία που μπορεί να αναλύσει τεράστια ποσά δεδομένων πελατών και συναλλαγών, είδε την αξία των μετοχών της να αυξάνεται σχεδόν κατά 90% την ημέρα που δημοσιεύθηκε τον περασμένο μήνα. Αυτό, για μια εταιρεία που έχασε 11 εκατομμύρια δολάρια πέρυσι.

Άνοδος του επιστήμονα δεδομένων

Αλλά ακόμη και η πρόσβαση στα καλύτερα εργαλεία αποκρυπτογράφησης δεδομένων δεν αποτελεί εγγύηση για μεγάλη σοφία. Πολύ λίγες εταιρείες έχουν προσωπικό στο προσωπικό με την κατάρτιση όχι μόνο για να αξιολογήσουν τα βουνά των δεδομένων - συμπεριλαμβανομένων των φορτίων των αδόμητων tidbits από εκατομμύρια σελίδες στο Facebook και τα έξυπνα τηλέφωνα - αλλά και να κάνουν πραγματικά κάτι μαζί τους.

Πέρυσι, το McKinsey Global Insitute δημοσίευσε μια έκθεση που περιγράφει τα "Big Data" ως "επόμενα σύνορα για την καινοτομία", αλλά επίσης προβλέπει ότι μέχρι το 2018 οι εταιρείες στις ΗΠΑ θα έχουν σοβαρή έλλειψη ταλέντων όταν πρόκειται για τις απαραίτητες αναλυτικές δεξιότητες - όπως πολλοί 190.000 άνθρωποι. Και υποστηρίζει ότι άλλα 1, 5 εκατομμύρια διευθυντές θα πρέπει να εκπαιδευτούν για να λάβουν στρατηγικές αποφάσεις με το χείμαρρο των δεδομένων που έρχονται στο δρόμο τους.

Δεν είναι όλοι, όμως, πιστός στη μαγεία του Big Data. Ο Peter Fader, καθηγητής marketing στο Πανεπιστήμιο Wharton της Penn, δεν είναι πεπεισμένος ότι περισσότερα δεδομένα είναι καλύτερα. Όχι ότι πιστεύει ότι μια εταιρεία δεν πρέπει να προσπαθήσει να μάθει όσο περισσότερο μπορεί για τους πελάτες της. Είναι ακριβώς ότι τώρα υπάρχει τόσο μεγάλη έμφαση στη συγκέντρωση κάθε κομμάτι των δεδομένων που πιστεύει ο όγκος αποτιμάται πάνω από την πραγματική ανάλυση.

Εδώ είναι η λήψη του Fader από μια πρόσφατη συνέντευξη με την τεχνολογική αναθεώρηση του MIT : «Ακόμη και με άπειρη γνώση της συμπεριφοράς του παρελθόντος, συχνά δεν θα έχουμε αρκετές πληροφορίες για να κάνουμε σημαντικές προβλέψεις για το μέλλον. Στην πραγματικότητα, όσο περισσότερα δεδομένα έχουμε, τόσο πιο ψεύτικη εμπιστοσύνη θα έχουμε ... Το σημαντικό μέρος είναι να κατανοήσουμε τα όρια μας και να χρησιμοποιήσουμε την καλύτερη δυνατή επιστήμη για να γεμίσουμε τα κενά. Όλα τα δεδομένα στον κόσμο δεν θα επιτύχουν ποτέ αυτόν τον στόχο για μας. "

Ποια είναι τα δεδομένα σας;

Ακολουθεί μια δειγματοληψία για το πώς χρησιμοποιούνται μεγάλα δεδομένα για την επίλυση μεγάλων προβλημάτων:

  • Ξέρουν πότε ήταν κακή ή καλή: Ενώ οι περισσότερες εταιρείες εστιάζουν στην ανάλυση των πελατών τους, η Amazon βαθμολογεί τα σημεία χρησιμοποιώντας το Big Data για να βοηθήσει τους δικούς τους.
  • Η μελέτη των καρφιών: Θέλετε να μάθετε ποιοι ταύροι ωοτοκούν τις πιο παραγωγικές αγελάδες γάλακτος; Η γαλακτοκομική βιομηχανία έχει επινοήσει έναν τρόπο να τραγουδήσει τους αριθμούς.
  • Διάγνωση με δεδομένα: Οι ερευνητές του SUNY Buffalo αναλύουν μαζικά σύνολα δεδομένων στην προσπάθειά τους να προσδιορίσουν εάν υπάρχει σχέση μεταξύ σκλήρυνσης κατά πλάκας και περιβαλλοντικών παραγόντων, όπως η ανεπαρκής έκθεση στο ηλιακό φως.
  • Ψάχνετε για προβλήματα: Μια εταιρεία που ονομάζεται Recorded Future είναι πληροφορίες εξόρυξης από κοινωνικά δίκτυα και κυβερνητικούς και χρηματοοικονομικούς ιστότοπους για να προβάλετε τις προβλέψεις για το πώς η αύξηση του πληθυσμού, η έλλειψη νερού και οι ακραίες καιρικές συνθήκες θα μπορούσαν να οδηγήσουν σε μελλοντικές πολιτικές αναταραχές και τρομοκρατία.

Βίντεο μπόνους: Η συλλογή δεδομένων είναι ένα πράγμα. Το να φανεί ελκυστικό και κατανοητό είναι μια ολόκληρη άλλη πρόκληση. Ο David McCandless επικαλείται τη δύναμη των «χαρτών πληροφοριών» σε αυτή την ομιλία του TED.

Μεγάλα δεδομένα ή πάρα πολλές πληροφορίες;