https://frosthead.com

Το νέο λογισμικό μπορεί να επεξεργαστεί πραγματικά εκφράσεις προσώπου

Η λήψη μιας σκηνής σε μια ταινία μπορεί να απαιτήσει δεκάδες αναλήψεις, μερικές φορές περισσότερες. Στο Gone Girl, ο σκηνοθέτης Ντέιβιντ Φίντσερ λέγεται ότι έχει κατά μέσο όρο 50 παίρνει ανά σκηνή. Για τους πρωταγωνιστές του κοινωνικού δικτύου οι Rooney Mara και Jesse Eisenberg ενήργησαν 99 φορές στην σκηνή έναρξης (σκηνοθετεί ξανά ο Fincher, προφανώς είναι πασίγνωστος για αυτό). Το The Shining του Stanley Kubrick εμπλέκονται σε 127 από τις περίφημες σκηνές όπου η Wendy υποστηρίζει τις σκάλες που ταλαντεύουν ένα ρόπαλο του μπέιζμπολ στον Jack, που θεωρείται ευρέως ότι παίρνει τις περισσότερες ανά σκηνή οποιασδήποτε ταινίας στην ιστορία.

Ένα νέο λογισμικό, από την Disney Research σε συνεργασία με το Πανεπιστήμιο του Surrey, μπορεί να βοηθήσει να μειωθεί ο αριθμός των αναγκαίων αναγκών, εξοικονομώντας έτσι χρόνο και χρήμα. Το FaceDirector συνδυάζει εικόνες από διάφορες λήψεις, καθιστώντας δυνατή την επεξεργασία ακριβών συναισθημάτων πάνω στα πρόσωπα των ηθοποιών.

"Η παραγωγή μιας ταινίας μπορεί να είναι πολύ ακριβή, οπότε ο στόχος αυτού του έργου ήταν να προσπαθήσει να καταστήσει τη διαδικασία πιο αποτελεσματική", λέει ο Derek Bradley, επιστήμονας υπολογιστών στη Disney Research στη Ζυρίχη, ο οποίος βοήθησε στην ανάπτυξη του λογισμικού.

Η Disney Research είναι μια διεθνής ομάδα ερευνητικών εργαστηρίων επικεντρωμένη στα είδη καινοτομίας που μπορεί να είναι χρήσιμα για τη Disney, με τοποθεσίες στο Λος Άντζελες, το Πίτσμπουργκ, τη Βοστώνη και τη Ζυρίχη. Τα πρόσφατα έργα περιλαμβάνουν ρομπότ τοίχου, ένα βιβλίο ζωγραφικής με επαυξημένη πραγματικότητα, όπου τα παιδιά μπορούν να χρωματίσουν μια εικόνα που μετατρέπεται σε έναν κινητό χαρακτήρα 3D σε μια εφαρμογή και ένα γιλέκο για παιδιά που παρέχει αισθήσεις όπως οι δονήσεις ή το συναίσθημα των σταγόνων βροχής που αντιστοιχούν σκηνές ιστορικού βιβλίου. Η ομάδα πίσω από το FaceDirector εργάστηκε για το έργο για περίπου ένα χρόνο, πριν παρουσιάσει την έρευνά του στο Διεθνές Συνέδριο για το Vision Computer στο Σαντιάγκο της Χιλής τον περασμένο Δεκέμβριο.

Η κατανόηση του τρόπου συγχρονισμού των διαφορετικών αναλήψεων ήταν ο κύριος στόχος του έργου και η μεγαλύτερη πρόκλησή του. Οι ηθοποιοί μπορεί να έχουν τα κεφάλια τους στραμμένα σε διαφορετικές γωνίες από το να παίρνουν, να μιλούν σε διαφορετικούς τόνους ή να κάνουν παύση σε διαφορετικές χρονικές στιγμές. Για να λυθεί αυτό, η ομάδα δημιούργησε ένα πρόγραμμα που αναλύει τις εκφράσεις του προσώπου και τα ακουστικά στοιχεία. Οι εκφράσεις προσώπου παρακολουθούνται με χαρτογράφηση σημείων προσώπου, όπως οι γωνίες των ματιών και του στόματος. Το πρόγραμμα καθορίζει τότε ποια πλαίσια μπορούν να χωρέσουν το ένα στο άλλο, όπως τα κομμάτια του παζλ. Κάθε κομμάτι παζλ έχει πολλούς συντρόφους, έτσι ένας διευθυντής ή συντάκτης μπορεί στη συνέχεια να αποφασίσει τον καλύτερο συνδυασμό για να δημιουργήσει την επιθυμητή έκφραση του προσώπου.

Για να δημιουργήσει υλικό με το οποίο θα πειραματιστεί, η ομάδα έφερε μια ομάδα μαθητών από το Πανεπιστήμιο Τεχνών της Ζυρίχης. Οι φοιτητές ενήργησαν αρκετές αναλήψεις διαλόγου, κάθε φορά που έκαναν διαφορετικές εκφράσεις του προσώπου - ευτυχισμένοι, θυμωμένοι, ενθουσιασμένοι και ούτω καθεξής. Η ομάδα ήταν στη συνέχεια σε θέση να χρησιμοποιήσει το λογισμικό για να δημιουργήσει οποιουσδήποτε συνδυασμούς εκφράσεων του προσώπου που μεταβίβαζαν πιο αποχρωματισμένα συναισθήματα - λυπημένα και λίγο θυμωμένα, ενθουσιασμένα, αλλά φοβισμένα και ούτω καθεξής. Ήταν σε θέση να αναμειγνύουν αρκετές παίρνει - ας πούμε, φοβισμένη και ουδέτερη - να δημιουργήσει αυξανόμενα και πτώματα συναισθήματα.

Η ομάδα του FaceDirector δεν είναι σίγουρη πως ή πότε το λογισμικό μπορεί να γίνει εμπορικά διαθέσιμο. Το προϊόν εξακολουθεί να λειτουργεί καλύτερα όταν χρησιμοποιείται με σκηνές γυρισμένες ενώ κάθεται μπροστά από ένα στατικό υπόβαθρο. Οι κινούμενοι ηθοποιοί και τα κινούμενα υπαίθρια τοπία (σκέφτονται τα ταλαντούμενα δέντρα, τα αυτοκίνητα που περνούν) παρουσιάζουν περισσότερο μια πρόκληση για συγχρονισμό.

Το νέο λογισμικό μπορεί να επεξεργαστεί πραγματικά εκφράσεις προσώπου