https://frosthead.com

Πώς ένα πρόγραμμα υπολογιστή μπορεί να μάθει όλα για σας από ακριβώς το Facebook σας αρέσει

Οι πιθανότητες είναι, όταν αποφασίσατε να "αρέσει" μια τηλεοπτική εκπομπή, μια μπάντα, μια τοπική επιχείρηση ή μια σελίδα στο Facebook του προϊόντος, δεν φανταστήκατε ότι αυτό το κλικ θα είχε πολλές συνέπειες. Μπορεί να δείξει στους φίλους σας λίγο τα ενδιαφέροντά σας και, περιστασιακά, να προκαλέσει την εμφάνιση ενημερώσεων κατάστασης από τη σελίδα στη ροή ειδήσεων.

"Αρέσει", ωστόσο, είναι διαθέσιμα στο κοινό για όποιον μπορεί να δει στο Facebook, ακόμη και άτομα που δεν έχετε εγκρίνει ως φίλους. Και για μια νέα μελέτη που δημοσιεύθηκε σήμερα στα Πρακτικά της Εθνικής Ακαδημίας Επιστημών, μια ομάδα ερευνητών δημιούργησε ένα πρόγραμμα ηλεκτρονικών υπολογιστών που μπορεί να πάρει ένα "likes" του χρήστη και να εξαγάγει με ακρίβεια ένα τεράστιο εύρος πληροφοριών σχετικά με αυτόν ή αυτήν - συμπεριλαμβανομένης της ηλικίας, της εθνικότητας, IQ, πολιτικές κλίσεις, επίπεδο χρήσης ναρκωτικών και ακόμη και σεξουαλικό προσανατολισμό.

Η ερευνητική ομάδα - μια συνεργασία μεταξύ του εργαστηρίου Psychometrics στο Πανεπιστήμιο του Cambridge και της Microsoft Research Cambridge - ανέλυσαν τα δεδομένα 58.000 Αμερικανών χρηστών του Facebook που είχαν επιλέξει να προμηθεύσουν τα προφίλ τους και "τους αρέσει" για ανάλυση μέσω της εφαρμογής myPersonality του Facebook. Οι ερευνητές τροφοδότησαν αυτά τα "likes" σε έναν αλγόριθμο, ειδικά για αυτό το έργο, και στη συνέχεια συνέκριναν τις προβλέψεις του μοντέλου σε μια σειρά χαρακτηριστικών σε αυτά που γνώριζαν με βεβαιότητα για τους χρήστες που είχαν υποβάλει για ανάλυση τα περιεχόμενα των προφίλ τους στο Facebook επισης.

Για κάθε ζευγάρι χαρακτηριστικών που εξετάστηκαν - ας πούμε, καυκάσιος ή αφρικανικός-αμερικανός ή δημοκράτης ή δημοκρατικός - οι ερευνητές πήραν ένα ζευγάρι χρηστών, με έναν που ανήκε σε κάθε κατηγορία και ο αλγόριθμος έπρεπε να επιλέξει τυφλά ποιος χρήστης ταιριάζει σε ποια κατηγορία απλώς βασίζεται τους "αρέσει." Δεν ήταν 100 τοις εκατό τέλειο στο να συμπεράνει καμία από τις κατηγορίες, αλλά ήταν ακανόνιστα ακριβή στην πρόβλεψη πολλών, συμπεριλαμβανομένων ορισμένων χαρακτηριστικών που πιθανώς δεν θα υποθέσει μπορεί να μαντέψει από "σας αρέσει".

Καλά συμπέρανε, για παράδειγμα, ποιος χρήστης ήταν Καυκάσιος και Αφρικανός Αμερικανός το 95% του χρόνου, δημοκράτης και δημοκρατικός 88% του χρόνου και χριστιανικός και μουσουλμανικός 82% του χρόνου. Η ανάλυση της ακρίβειάς της στην πρόβλεψη πολλών από τα εξεταζόμενα χαρακτηριστικά (ως υπενθύμιση, μια τιμή 1 θα σήμαινε ότι το μοντέλο είναι 100 τοις εκατό ακριβές) είναι κάτω.

Το μοντέλο προέβλεψε μια σειρά από χαρακτηριστικά χρήστη με ασυνήθιστη ακρίβεια. Το μοντέλο προέβλεψε μια σειρά από χαρακτηριστικά χρήστη με ασυνήθιστη ακρίβεια. (Εικόνα μέσω PNAS / Kosinski et al.)

Για τους περισσότερους χρήστες, αυτό το επίπεδο ακρίβειας δεν εξαρτάται από κανένα προφανές "είδος" που μπορεί να συνδεθεί με το χαρακτηριστικό που εξετάζεται. Για παράδειγμα, λιγότερο από το 5% των χρηστών που χαρακτηρίστηκαν ως ομοφυλόφιλοι είχαν "άρεσε" για γάμο ομοφυλόφιλων ή άλλες σχετικές σελίδες.

Ο αλγόριθμος, αντίθετα, συγκεντρώνει τους τόνους των φαινομενικά άσχετων «αρέσει» να ομαδοποιήσει τους χρήστες σε τάξεις που μοιράζονταν προβλέψιμες ομοιότητες. Με τη σύγκριση των "συμπαθειών" με τα αποτελέσματα μιας δοκιμασίας προσωπικότητας (επίσης μέρος της εφαρμογής myPersonality), οι ερευνητές διαπίστωσαν ότι όλοι οι χρήστες που "συμπαθούν" τις "Thunderstorms", "The Colbert Report", "Science" ή "Curly Fries" λίγο πιο πιθανό να έχουν υψηλό IQ από όσους δεν το κάνουν. Ομοίως, οι άνδρες χρήστες που "άρεσαν" "Mac Cosmetics" ή "Wicked The Musical" ήταν λίγο πιο πιθανό να είναι ομοφυλόφιλοι, ενώ εκείνοι που τους άρεσε η "Wu-Tang Clan" ή "Shaq" ήταν ελαφρώς λιγότερο πιθανό.

Ανάλυση όλων των "likes" του χρήστη επέτρεψε στον αλγόριθμο να δημιουργήσει ένα γενικό πορτρέτο του, αλλά η ακρίβειά του επηρεάστηκε έντονα από τον αριθμό των "likes" για κάθε χρήστη. Για όσους βρίσκονται στο χαμηλό τέλος, με 1-10 τους αρέσει, οι προβλέψεις δεν ήταν καλύτερες από την τύχη, αλλά για εκείνους με 150 έως 300 "αρέσει", ο αλγόριθμος ήταν σε θέση να βελτιώσει την ικανότητά του να μαντέψει τα χαρακτηριστικά των χρηστών σε ακόμη καλύτερο βαθμό .

Οι ερευνητές διεξήγαγαν κατά κύριο λόγο τη μελέτη για να δείξουν πόσο πολύ μπορούν να μας πουν οι πληροφορίες που είναι διαθέσιμες στο κοινό για εμάς. Μπορεί να μην δημοσιεύετε δημοσίως τον σεξουαλικό προσανατολισμό, τις πολιτικές σας απόψεις ή εάν χρησιμοποιείτε φάρμακα, αλλά αυτό το είδος του προγράμματος μπορεί να αναλύσει τα "σας αρέσει" και να κάνει ακριβείς εικασίες ανεξάρτητα.

Παρόλο που οι χρήστες είχαν υποβάλει τις "προτιμήσεις" και τα προφίλ τους για ανάλυση μέσω μιας εφαρμογής τρίτου μέρους, οι προεπιλεγμένες ρυθμίσεις απορρήτου του Facebook σημαίνουν ότι οι "σας αρέσει" είναι δημόσιες σε οποιονδήποτε. Ήδη οι αλγόριθμοι του Facebook χρησιμοποιούν αυτές τις προτιμήσεις για να υπαγορεύσουν ποιες ιστορίες καταλήγουν στις ειδήσεις των χρηστών και οι διαφημιζόμενοι μπορούν να έχουν πρόσβαση σε αυτούς για να καθορίσουν ποιες είναι οι πιο αποτελεσματικές διαφημίσεις που θα σας δείξουν κατά την περιήγησή σας.

Πώς ένα πρόγραμμα υπολογιστή μπορεί να μάθει όλα για σας από ακριβώς το Facebook σας αρέσει