Από τη γέννηση σύγχρονων μυθιστορημάτων αγγλικής γλώσσας στη δεκαετία του 1700, οι άνδρες και γυναίκες χαρακτήρες από τον Paul Atreides στην Elizabeth Bennet γελούσαν, χαμογέλασαν, αισθάνθηκαν και ενήργησαν στις σελίδες τους. Μια νέα μελέτη που διεξήχθη με τη χρήση ενός αλγόριθμου μηχανικής μάθησης έδωσε νέα προοπτική στις ιστορίες τους. «Η μεταμόρφωση του φύλου στην αγγλόφωνη φαντασία», που δημοσιεύθηκε αυτή την εβδομάδα στην εφημερίδα Cultural Analytics, ανέλυσε την παρουσίαση του φύλου σε περισσότερα από 100.000 μυθιστορήματα, βρίσκοντας ένα παράδοξο όταν ήρθε στα μυθιστορήματα του 20ού αιώνα: όπως οι άκαμπτοι ρόλοι των φύλων φάνηκε να διαχέεται, υποδεικνύοντας μεγαλύτερη ισότητα μεταξύ των φύλων, τον αριθμό των γυναικείων χαρακτήρων - και το ποσοστό των γυναικών συγγραφέων - μειώθηκε.
Χτίστηκε από τον συγγραφέα της μελέτης Ted Underwood, καθηγητή Αγγλικών και Επιστημών Πληροφορίας στο Πανεπιστήμιο του Ιλινόις και του συνεργάτη του επιστήμονα πληροφορικής David Bamman του Πανεπιστημίου της Καλιφόρνια στο Berkeley, ο αλγόριθμος ανέλυσε τους χαρακτήρες και τους συγγραφείς των 104.000 μυθιστορημάτων - πολύ περισσότερο από εσάς θα διαβάσω σε μια ζωή. Ο Underwood και ο Bamman χτίστηκαν αρχικά τον αλγόριθμο για μια προηγούμενη μελέτη για τον χαρακτηρισμό: συμμετείχαν στην τρέχουσα μελέτη από τη συνάδελφο Sabrina Lee, πτυχιούχο φοιτητή στο Πανεπιστήμιο του Illinois. Τα μυθιστορήματα επιλέχθηκαν κυρίως από την ψηφιακή βιβλιοθήκη HathiTrust και αντιπροσώπευαν μια επιλογή από bestseller από τα έτη 1703 έως 2009. Ο κατάλογος περιλαμβάνει δημοφιλείς τίτλους όπως Pride and Prejudice, Dune και μερικά από τα μυθιστορήματα του Raymond Chandler.
Κατά την εξέταση των δεδομένων και την κατάταξή τους σε βάθος, οι ερευνητές μπόρεσαν να δουν τις τάσεις σε ορισμένες περιόδους: μεταξύ περίπου 1800 και δεκαετίας του 1970, για παράδειγμα, μια "σταθερή μείωση" του ποσοστού των γυναικών συγγραφέων - από περίπου 50 τοις εκατό σε λιγότερο από 25 τοις εκατό. Την ίδια περίοδο, είδαν μια μείωση στον αριθμό των γυναικών χαρακτήρων που ονομάστηκαν. Αυτές οι τάσεις αρχίζουν να αντιστρέφονται στο δεύτερο μέρος του 20ού αιώνα. Και κατά τη διάρκεια της μελέτης τους, δραματικές και γρήγορες μετατοπίσεις στις λέξεις που χρησιμοποιούνται για να χαρακτηρίσουν το φύλο - καθώς και μείωση του αριθμού των λέξεων που έχουν συγκεκριμένο φύλο.
Πολλά από αυτά τα λόγια δεν ήταν ρητά γονιμοποιημένα, όπως «καρδιά» ή «σπίτι», αν και δεν αποκλείστηκαν δυνητικά ομιλητικά λόγια όπως «φούστα» ή «μουστάκι». Για παράδειγμα, στη δεκαετία του 1800 το ρήμα "felt" συνδέεται περισσότερο με τις γυναίκες, ενώ το ρήμα "got" συνδέεται συχνότερα με τους άνδρες. Αυτές οι τάσεις μειώθηκαν με την πάροδο του χρόνου, μέχρι το 1900, άλλες λέξεις συνδέονταν περισσότερο με τους άνδρες και τις γυναίκες. Στη δεκαετία του 1900, οι λέξεις που σχετίζονταν με την αγάπη συσχετίστηκαν περισσότερο με τις γυναίκες και υπήρξε μια αντίστοιχη μείωση στη χρήση αυτών των λέξεων σε σχέση με τους άνδρες. «Οι γυναίκες χαμογελούν και γελάνε», γράφουν οι συγγραφείς, «αλλά οι άνδρες στα μέσα του αιώνα, προφανώς, μπορούν μόνο να χαμογελούν και να γοητεύουν». Ομοίως, τον 19ο αιώνα, υπάρχει πολύ περισσότερη συζήτηση για τα συναισθήματα, αρχικά κυρίως όσον αφορά τους χαρακτήρες των γυναικών. Στον 20ο αιώνα, υπάρχουν πολλά περισσότερα σχετικά με τα σώματα και τα ρούχα - για παράδειγμα, οι άνδρες του μεσαίου αιώνα βάζουν συνεχώς τα πράγματα σε τσέπες ή τα βγάζουν έξω.
Είναι το είδος του αποτελέσματος που καταδεικνύει την ανάγκη για προσεγγίσεις μηχανικής μάθησης, ο Underwood λέει: «Η πραγματικότητα είναι ότι ο πολιτισμός δεν έρχεται με σαφείς ορισμούς του τι είναι το φύλο ή τι είναι ακόμη και ένα λογοτεχνικό είδος», λέει. "Και η μηχανική μάθηση μας αφήνει να δουλέψουμε με έννοιες που είναι ασαφείς".
Η μέθοδος χρησιμοποιήθηκε συχνότερα για να δουλέψει με τα τραπεζικά δεδομένα ή για να βοηθήσει τα αυτο-οδήγηση αυτοκινήτων να παραμείνουν ασφαλή, οπότε μπορεί να φαίνεται σαν μια παράξενη ικανότητα για την ανάλυση του μυθιστορήματος. Όμως ο Underwood και άλλοι μελετητές στον τομέα των ψηφιακών ανθρωπιστικών σπουδών βλέπουν μεγάλες δυνατότητες.
Ο Seth Long, ένας καθηγητής Αγγλικών στο Πανεπιστήμιο της Νεμπράσκα, ο οποίος εργάζεται επίσης στον τομέα των ψηφιακών ανθρωπιστικών επιστημών, αναφέρει ότι αυτά τα απροσδόκητα αποτελέσματα καταδεικνύουν τη δύναμη των μεγάλων δεδομένων για την ανθρωπιστική επιστήμη. «Η στατιστική μοντελοποίηση θα απαιτήσει έναν πολύ διαφορετικό τρόπο κατανόησης της λογοτεχνικής ιστορίας», λέει. Ένας αλγόριθμος είναι μια κενή πλάκα μέχρι τις δεδομένες πληροφορίες, αλλά μόλις έχει αυτές τις πληροφορίες, μπορεί να τραβήξει τα πράγματα από αυτό που οι άνθρωποι δεν μπορούν. Σε αυτή την περίπτωση, αυτό διακόπτει τις επιστημονικές υποθέσεις σχετικά με το πώς πρέπει να παρακολουθεί η ιστορία της λογοτεχνίας με την ιστορία της κοινωνικής προόδου των γυναικών.
«Όταν βλέπετε τη μελέτη παράλληλα με άλλα παραδοσιακά λογοτεχνικά ιστορικά έργα, μπορείτε να δείτε συνδέσεις που ίσως να μην έχετε δει άλλως», λέει ο Claire Jarvis, καθηγητής Αγγλικών στο Πανεπιστήμιο του Στάνφορντ. Αυτό επιβεβαιώνει μερικές από τις "κουκουβάγιες" που είχε για την πορεία της λογοτεχνίας, με ποσοτικό τρόπο. Αυτό περιλαμβάνει τη μείωση του ποσοστού των γυναικών συγγραφέων καθ 'όλη τη διάρκεια της μελέτης, που εξέπληξε τον Underwood.
«Θα περίμενα να σημειώσω κάποια πρόοδο, μόνο όσον αφορά την ισότητα εκπροσώπησης στις γυναίκες στη μυθοπλασία», λέει ο Underwood. "Ίσως δεν είναι μεγάλη πρόοδος, αλλά κάποια πρόοδος. Και πραγματικά δεν βλέπουμε κανένα ".
Τα πρώτα μυθιστορήματα που χρησιμοποιούν σύγχρονα αγγλικά θεωρούνταν περισσότερο ως ψυχαγωγία και λιγότερο ως νόμιμη λογοτεχνική προσπάθεια. Αλλά «καθώς το μυθιστόρημα γίνεται όλο και πιο αξιοσέβαστο», λέει ο Jarvis, «συσχετίζεται λιγότερο με τη γυναικεία συγγραφική ταυτότητα». Με άλλα λόγια: οι άντρες έμπαιναν στο να γράφουν μυθιστορήματα όταν άρχισαν να μοιάζουν με μια «σοβαρή» αναζήτηση.
Αν και οι λογοτέχνες ιστορικοί μίλησαν για την αποχώρηση των γυναικών από το μυθιστόρημα σε ορισμένα σημεία πριν, λέει ο Underwood, κανείς δεν έκανε το είδος της ευρείας κλίμακας εργασίας που θα επέδειξε συνεχείς τάσεις. Εκεί μπαίνει η μηχανική μάθηση.
Λέει ο Λι, "Οι λογοθεραπευτές, γνωρίζουμε πολύ καλά ότι υπάρχουν σιωπές" - δηλαδή, οι θέσεις στη λογοτεχνική ιστορία όπου δεν γράφτηκαν βιβλία. Μια άλλη σιωπή που αισθάνεται είναι σημαντική είναι η αυξανόμενη απουσία ονομασμένων γυναικείων χαρακτήρων στα μυθιστορήματα που μελετήθηκαν. Είναι οπαδός των μυθιστορημάτων της ψευδώνυμης ιταλικής συγγραφέως Elena Ferrante και λέει ότι ο χαρακτηρισμός της γυναικείας φιλία στα βιβλία του Ferrante υπογραμμίζει τη «σιωπή» της φιλίας των γυναικών στη μυθοπλασία αλλού, τόσο από το παρελθόν όσο και από το παρόν. Για την ίδια η μελέτη υπογραμμίζει το ίδιο πράγμα και υπογραμμίζει τη σημασία των έργων με γυναίκες που βλέπουν τις γυναίκες. Η απουσία γυναικών από το μυθιστόρημα "έχει διαμορφώσει ήσυχα τον τρόπο που αισθανόμαστε για τη λογοτεχνική ιστορία", λέει ο Underwood.
Οι συγγραφείς σημειώνουν ότι η μελέτη τους δεν καλύπτει όλα τα μυθιστορήματα που γράφονται κατά τη διάρκεια αυτής της χρονικής περιόδου και λείπει η αντιπροσώπευση από τη φαντασία του είδους, όπως τα μυθιστορήματα ειδύλλιας και η μυθιστοριογραφία, που έγινε δημοφιλής τον 20ό αιώνα. Ωστόσο, οι ερευνητές έκαναν μέτρα για να διορθώσουν την προκατάληψη τους ελέγχοντας τη βάση δεδομένων τους σε σχέση με άλλες βάσεις δεδομένων. Τα βιβλία που επέλεξαν αντιπροσωπεύουν τη λογοτεχνία που θεωρούνταν σημαντική από τις ακαδημαϊκές βιβλιοθήκες και οι συγγραφείς σημειώνουν ότι πρέπει να γίνουν περισσότερα έργα για τη φαντασία του είδους. «Το λογοτεχνικό φύλο μπορεί να κατασκευαστεί διαφορετικά σε διαφορετικά είδη, ή σε διαφορετικά μέρη του λογοτεχνικού πεδίου», γράφουν οι συγγραφείς.
Οι μέθοδοι μάθησης μηχανών προσφέρουν έναν νέο τρόπο να εξετάσουμε τις σιωπές και τις παρουσίες του παρελθόντος-παράξενα, μέσω του φακού της πρόβλεψης. Γενικά, οι αλγόριθμοι χρησιμοποιούνται για την πρόβλεψη ή την ανίχνευση προτύπων βάσει ενός συνόλου πληροφοριών, αλλά ο Long λέει ότι η χρήση τους στην ιστορία είναι ότι μπορούν να ανιχνεύσουν τις μακροπρόθεσμες τάσεις στο παρελθόν, καθώς και το παρόν ή το μέλλον. "Νομίζω ότι είναι ένας τόσο ισχυρός τρόπος να κρατάμε υπό έλεγχο τις δικές μας ερμηνείες", λέει.