https://frosthead.com

Το λογισμικό δημιουργεί μια εικόνα που λέει όλα

Κάθε μέρα, οι χρήστες ανεβάζουν πάνω από 350 εκατομμύρια φωτογραφίες στο Facebook. Αυτή η εισροή εικόνων οδήγησε τους αναλυτές να εκτιμήσουν ότι το 10 τοις εκατό των 3, 5 τρισεκατομμυρίων φωτογραφιών στον κόσμο έχουν ληφθεί το τελευταίο έτος. Όλα αυτά τα δεδομένα που πλημμυρίζουν τον Ιστό σημαίνει ότι αν ψάχνετε για μια συγκεκριμένη εικόνα ή αντικείμενο - για παράδειγμα, τι μοιάζει με μια πορτοκαλί γουρουνάκι, θα πλημμυρίσετε θετικά τα αποτελέσματα αναζήτησης.

Τον περασμένο μήνα, ερευνητές του Πανεπιστημίου της Καλιφόρνιας, το Berkeley αποκάλυψαν νέο λογισμικό, το AverageExplorer, που θα επιτρέπει στους χρήστες να βλέπουν την "μέση" εικόνα που αντιπροσωπεύει αυτό που αναζητούν. Αντί μια εικόνα αξίας χίλιων λέξεων, είναι μια εικόνα αξίας χιλιάδων ή περισσότερων εικόνων.

"Όταν εισάγετε μια αναζήτηση εικόνας Google, θα κοσκινίζετε μέσω σελίδων και σελίδων εικόνων" εξηγεί ο μεταπτυχιακός φοιτητής Jun-Yan Zhu, UC Berkeley και επικεφαλής του εγγράφου, που παρουσιάστηκε στο φετινό Διεθνές Συνέδριο και Έκθεση για το Computer Graphics και Διαδραστικές Τεχνικές στο Βανκούβερ. "Είναι τεράστιο και δύσκολο να συνοψίσω. δεν μπορείτε να πάρετε μια αίσθηση του τι συμβαίνει. "

Για την αρχική προσφορά του, ο Zhu και η ομάδα του συγκέντρωσαν φωτογραφίες μέσω των αναζητήσεων εικόνας Flickr, Google και Bing. Το λογισμικό είναι αρκετά χαμηλής ισχύος για να τρέχει σε μια μέση επιφάνεια εργασίας και μπορεί να σπάσει περίπου 10.000 εικόνες ταυτόχρονα.

Οι χρήστες βελτιώνουν τις αναζητήσεις τους με διαφορετικούς τρόπους. Μπορούν να σκιαγραφήσουν και να χρωματίσουν ένα σχήμα, παρόμοιο με το σχέδιο στο Adobe Photoshop ή Illustrator, για να οξύνουν το αποτέλεσμα της μέσης εικόνας τους. Για παράδειγμα, το χρωματισμό του φόντου μιας μέσης εικόνας του Πύργου του Άιφελ θα επιλέξει αυτόματα τη μέση εικόνα για να τραβήξει μόνο φωτογραφίες που τραβήχτηκαν τη νύχτα. Ή, θα μπορούσατε να σχεδιάσετε γωνιακές γραμμές για να ελέγξετε τον προσανατολισμό μιας πεταλούδας στο σύνθετο υλικό.

Γέφυρα στεναγμών, Από μέρα σε νύχτα Με τη διόρθωση των χρωμάτων σε μια εικόνα του μέσου εκθέτη της Γέφυρας των στεναγμών, μπορείτε να αλλάξετε τη σκηνή από μέρα σε σούρουπο τη νύχτα. (Ευγενική παραχώρηση UC Berkeley)

Μόλις δημιουργηθεί μια μέση εικόνα, μια διαδικασία που μπορεί να διαρκέσει έως ένα λεπτό, οι χρήστες μπορούν να βελτιώσουν περαιτέρω το αποτέλεσμα χρησιμοποιώντας αυτό που η ομάδα καλεί τη λειτουργία Explorer. Σε αυτή τη λειτουργία, κάνοντας κλικ σε ένα συγκεκριμένο τμήμα μιας εικόνας, για παράδειγμα τη μύτη της γάτας, θα εμφανιστούν άλλες συνήθεις επιλογές ή βελτιώσεις για αυτό το σημείο - ίσως μπλε ή μαύρη μύτη ή στρογγυλεμένες αντί γωνιακές. Σε ένα βίντεο επίδειξης, για παράδειγμα, η ομάδα επεξεργάστηκε μια εικόνα παιδιών στην αγκαλιά του Άγιου Βασίλη επιλέγοντας μόνο εικόνες όπου ο Άγιος Βασίλης έχει ένα παιδί σε κάθε βραχίονα.

Όπου το σύστημα θα γίνει ιδιαίτερα ισχυρό, λέει ο Zhu, είναι ένα εργαλείο για την κατάρτιση αλγορίθμων υπολογιστών-όρασης, όπως οι εφαρμογές του Google Goggles ή των εφαρμογών Firefly Firefox, οι οποίες μπορούν να προσδιορίσουν τι δείχνει μια κάμερα. "Στον τομέα του ηλεκτρονικού οράματος, οι άνθρωποι δαπανούν πολλά χρήματα για να σχολιάσουν αντικείμενα", εξηγεί. "Τώρα μπορείτε να εφαρμόσετε τον σχολιασμό στη μέση εικόνα. Η ιδέα είναι ότι πρέπει να εργαστείτε μόνο σε μια εικόνα για να μεταδώσετε όλες τις εικόνες σε ένα σύνολο δεδομένων. "

Εύρεση φυλών γάτας Με τη βελτίωση των τρόπων αναζήτησης ενός αποτελέσματος αναζήτησης, οι ερευνητές μπορούν να βρουν συγκεκριμένες φυλές γάτας, συμπεριλαμβανομένων (από αριστερά προς τα δεξιά) Ragdoll, Siamese, Maine Coon και Sphinx. (Ευγενική παραχώρηση UC Berkeley)

Η δημιουργία έργων τέχνης είναι ο φτωχός καρπός για το μέσο όρο. Η ομάδα έλαβε έμπνευση από νέους καλλιτέχνες όπως ο Jason Salavon, ο οποίος έχει δημιουργήσει με προσοχή μέσες φωτογραφίες με το χέρι. Θα μπορούσε επίσης να χρησιμοποιηθεί για να δημιουργήσει ένα plug-in στο Facebook που επιτρέπει στους χρήστες να τσιμπήσουν με τη μέση εικόνα τους.

Οι φιλοδοξίες των ερευνητών είναι ακόμη ευρύτερες και πιο επίκαιρες. Οι κοινωνιολόγοι θα μπορούσαν να χρησιμοποιήσουν το σύστημα για να εντοπίσουν και να ερευνήσουν τις κοινωνικές τάσεις. για παράδειγμα, μια μέση εικόνα θα μπορούσε να αποδείξει ότι οι νύφες συνήθως στέκονται στα δεξιά του γαμπρού σε πορτρέτα γάμου. Το AverageExplorer μπορεί επίσης να είναι ένα χρήσιμο εργαλείο για τους αναλυτές των μέσων ενημέρωσης που προσπαθούν να αναλύσουν την τηλεοπτική κάλυψη - αλλάζει η στάση του Stephen Colbert όταν μιλά για τον George W. Bush εναντίον του Barack Obama;

Επιτρέποντας στους χρήστες να αλληλεπιδρούν διαισθητικά με οπτικά δεδομένα αντί να αγωνίζονται να εισέλθουν στη σωστή σειρά λέξεων-κλειδιών, οι χρήστες θα μπορούν να γεφυρώσουν αυτό που ο σύμβουλος του Zhu και ο συν-δημιουργός του μέσου όρου, Alexei Efros, ονομάζουν "γλωσσική συμφόρηση".

Η ομάδα φαντάζει μια σειρά προσαρμοσμένων εργαλείων που έχουν σχεδιαστεί για συγκεκριμένες και δύσκολα διατεταγμένες εργασίες. Μια εφαρμογή για ψώνια, για παράδειγμα, θα επέτρεπε σε έναν χρήστη να αράχνει τον ιστό για ένα ζευγάρι τακούνια με το ακριβές χρώμα, σχήμα πτέρνας και ύψος που ακολουθεί. Ο Zhu προβλέπει ένα εργαλείο που ενσωματώνει τη ροή εργασίας των καλλιτεχνών των σκαφών της αστυνομίας, επιτρέποντας σε έναν μάρτυρα να αναζητά βάσεις δεδομένων προσώπου για χαρακτηριστικά που ταιριάζουν με τον δράστη και κατασκευάζουν ένα σύνθετο πορτρέτο.

Μια βασική έκδοση του AverageExplorer θα κυκλοφορήσει αυτό το φθινόπωρο.

Το λογισμικό δημιουργεί μια εικόνα που λέει όλα