https://frosthead.com

Ένας συγγραφέας χρησιμοποιεί τις στατιστικές για να αποκαλύψει τα μυστικά του τι κάνει μεγάλη γραφή

Στα περισσότερα μαθήματα βιβλιοθηκών σε επίπεδο κολλεγίων, βρίσκετε μαθητές που αναλύουν μικρές μερίδες λογοτεχνικών κλασικών: τα σαλιτζίκια του Σαίξπηρ, το ρεύμα συνειδητότητας του Τζόις και τις staccato ποινές του Χέμινγουεϊ. Δεν υπάρχει αμφιβολία ότι υπάρχουν πολλά που μπορούν να μάθουν για έναν συγγραφέα, τη βιοτεχνία του και το νόημα μιας ιστορίας από αυτόν τον τύπο στενής ανάγνωσης.

Αλλά ο Μπεν Μπλατ κάνει ισχυρό επιχείρημα για μια άλλη προσέγγιση. Εστιάζοντας σε συγκεκριμένες προτάσεις και παραγράφους, θέτει στο νέο του βιβλίο, το αγαπημένο λέγμα του Nabokov είναι το Mauve, οι αναγνώστες παραμελούν όλες τις άλλες λέξεις, οι οποίες, σε ένα μέσο μυθιστόρημα, ανέρχονται σε δεκάδες χιλιάδες σημεία δεδομένων.

Ο δημοσιογράφος και ο στατιστικιστής δημιούργησαν μια βάση δεδομένων του κειμένου από ένα κλασσικό κλασικό και μπεστ σέλερ του 20ού αιώνα για να απαντήσουν ποσοτικά σε πολλά θέματα ενδιαφέροντος. Η ανάλυσή του αποκάλυψε κάποιες ιδιόμορφες μορφές που διαφορετικά θα μπορούσαν να περάσουν απαρατήρητες:

Με τους αριθμούς, οι καλύτερες προτάσεις που ανοίγουν στα μυθιστορήματα τείνουν να είναι σύντομες. Ο παραγωγός συγγραφέας James Patterson έχει κατά μέσο όρο 160 κλισέ ανά 100.000 λέξεις (115 φορές περισσότερο από τη σεβαστή Jane Austen) και ο Βλαντιμίρ Νάμποκοφ χρησιμοποίησε τη λέξη μωβ 44 φορές πιο συχνά από τον μέσο συγγραφέα τους τελευταίους δύο αιώνες.

Ο Smithsonian.com μίλησε με τον Blatt για τη μέθοδο του, μερικά από τα βασικά του ευρήματα και γιατί τα μεγάλα δεδομένα είναι σημαντικά για τη μελέτη της λογοτεχνίας.

Έχετε λάβει μια στατιστική προσέγγιση για να μελετήσετε τα πάντα, από το Waldo's Where to Seinfeld, τις αρθρώσεις γρήγορου φαγητού στα ποπ τραγούδια. Μπορείτε να εξηγήσετε τη μέθοδο σας και γιατί κάνετε τι κάνετε;

Είμαι δημοσιογράφος δεδομένων και κοιτάζω τα πράγματα στην ποπ κουλτούρα και την τέχνη. Μου αρέσει πολύ να κοιτάζω τα πράγματα ποσοτικά και αμερόληπτα που έχουν πολλές πληροφορίες που οι άνθρωποι δεν έχουν περάσει. Αν θέλατε να μάθετε ποιο είναι το τυπικό άτομο από τις Ηνωμένες Πολιτείες, θα ήταν χρήσιμο, αλλά δεν θα μιλάτε μόνο σε ένα άτομο, θα ξέρετε τα πάντα γι 'αυτά και στη συνέχεια θα υποθέσετε ότι τα πάντα για τους ανθρώπους στις Ηνωμένες Πολιτείες είναι ίδιο. Νομίζω ότι ένα πράγμα με το γράψιμο αυτού του είδους χάνεται είναι ότι μπορείτε να εστιάσετε σε μια πρόταση από έναν συγγραφέα, ειδικά σε μαθήματα δημιουργικής γραφής ή ένα πέρασμα και χάνετε τη μεγαλύτερη εικόνα για να δείτε αυτά τα γενικά πρότυπα και τις τάσεις που χρησιμοποιούν οι συγγραφείς ξανά και ξανά, εκατοντάδες και ίσως χιλιάδες φορές στη δική τους γραφή.

Preview thumbnail for video 'Nabokov's Favorite Word Is Mauve: What the Numbers Reveal About the Classics, Bestsellers, and Our Own Writing

Το αγαπημένο λέγμα του Nabokov είναι το Mauve: Τι αποκαλύπτουν οι αριθμοί για τις κλασικές, τις καλύτερες πωλήσεις και τη δική μας γραφή

Αγορά

Τι σας έκανε να γυρίσετε στη λογοτεχνία;

Το υπόβαθρό μου είναι στα μαθηματικά και την επιστήμη των υπολογιστών, αλλά πάντα αγάπησα την ανάγνωση και τη γραφή. Καθώς γράφω όλο και περισσότερο, με ενδιέφερε πολύ το πώς οι συγγραφείς και οι άνθρωποι δίνουν συμβουλές γραφής. Υπάρχουν πολλά από αυτά που έχουν νόημα, αλλά δεν φαίνεται να υποστηρίζονται από πληροφορίες, και πολλά από αυτά που έρχονται σε σύγκρουση μεταξύ τους. Απλώς σκέφτηκα ότι έπρεπε να υπάρχει ένας τρόπος να ληφθούν αυτά τα θέματα γραπτώς ότι οι άνθρωποι ήταν ήδη καλά ενήμεροι και μιλώντας και δοκιμάζοντάς τους σε μεγάλους συγγραφείς και δημοφιλείς συγγραφείς για να δουν αν αυτή η συμβουλή είναι πραγματική ή αν πρόκειται για συμβουλευτικές συμβουλές που δεν " δεν σημαίνει τίποτα στα πραγματικά βιβλία και στις πραγματικές σελίδες.

Ποια ήταν η πρώτη ερώτηση που θέλατε να ρωτήσετε για λογοτεχνικά κλασικά και bestseller;

Το πρώτο κεφάλαιο του βιβλίου είναι για τη συμβουλή του εάν πρέπει ή όχι να χρησιμοποιήσετε -όχι επιρρήματα. Αυτό είναι και το πρώτο κεφάλαιο που έγραψα χρονολογικά. Είναι ως επί το πλείστον σχετικά με τη συμβουλή του Stephen King να μην χρησιμοποιήσει -κατά επιρρήματα στο βιβλίο του για τη συγγραφή, το οποίο για πολλούς συγγραφείς είναι το βιβλίο για το γράψιμο. Αλλά πολλοί άλλοι συγγραφείς - Toni Morrison, Chuck Palahniuk - και κάθε τάξη δημιουργικής συμβουλής δεν συμβουλεύει να χρησιμοποιήσει ένα επίχρισμα, γιατί είναι μια περιττή λέξη και ένα σημάδι ότι δεν είναι σύντομη. Αντί να λέει: "Έτρεξε γρήγορα", μπορείτε να πείτε, "Σπριντ."

Έτσι ήθελα να μάθω, είναι πραγματικά αλήθεια; Εάν αυτό είναι μια τέτοια καλή συμβουλή, θα περίμενε κανείς ότι οι σπουδαίοι συγγραφείς πραγματικά το χρησιμοποιούν λιγότερο. Θα περίμενε κανείς ότι οι ερασιτέχνες συγγραφείς το χρησιμοποιούν περισσότερο από τους δημοσιευμένους συγγραφείς. Απλά ήθελα πραγματικά να το ξέρω, στυλιστικά, πρώτα αν ο Stephen King ακολούθησε τις δικές του συμβουλές και στη συνέχεια αν ισχύει για όλους τους άλλους μεγάλους και σεβαστούς συγγραφείς.

Λοιπόν, τι βρήκατε;

Στην πραγματικότητα, υπάρχει μια τάση που οι συγγραφείς όπως ο Hemingway, ο Morrison και ο Steinbeck, τα καλύτερα βιβλία τους, εκείνα που κρατιούνται και έχουν μεγαλύτερη προσοχή τώρα, είναι τα βιβλία με το μικρότερο ποσό - και μάλλον επιρρήματα. Επίσης, αν συγκρίνετε τη συγγραφή ερασιτεχνικής φαντασίας και την ηλεκτρονική γραφή που δεν έχει συνταχθεί με τους bestsellers και τους νικητές του βραβείου Pulitzer των τελευταίων χρόνων, υπάρχει μια διαφορά, όπου χρησιμοποιούνται λιγότερο οι επιρρήματα από τους δημοσιευμένους συγγραφείς. Δεν είμαι τόσο μονόπλευρη που νομίζω ότι μπορείς να βγάλεις μόνο τα επίθετα από ένα βιβλίο εντάξει και να γίνει ένα σπουδαίο βιβλίο. Αυτό προφανώς δεν είναι το πώς λειτουργεί. Υπάρχει όμως το γεγονός ότι οι συγγραφείς που γράφουν με πολύ άμεσο τρόπο δημιουργούν βιβλία που συνολικά ζουν το μεγαλύτερο χρονικό διάστημα.

p13 - Adverbs.JPG

Πώς προχωρήσατε στη δημιουργία μιας βάσης δεδομένων λογοτεχνικών έργων;

Για πολλές από τις ερωτήσεις, χρησιμοποιούσα τους ίδιους 50 συγγραφείς που είχα επιλέξει κάπως αυθαίρετα. Ουσιαστικά βασίστηκε σε συγγραφείς που ήταν στην κορυφή της λίστας των bestseller, συγγραφείς που ήταν πάνω από τους μεγαλύτερους συντάκτες όλων των χρονικών καταλόγων και συγγραφέων που απλά αναπαριστούσαν μια σειρά διαφορετικών ειδών και χρόνων και αναγνώστες. Έτσι, σε όλο το βιβλίο, μπορείτε να συγκρίνετε αυτούς τους συγγραφείς και να τους γνωρίσετε.

Ήταν πολύ σημαντικό για μένα, αν είπα κάτι σαν "ο Toni Morrison χρησιμοποιεί αυτή τη λέξη σε αυτό το ρυθμό", μιλούσα για κάθε μυθιστόρημα που έγραψε ποτέ και όχι μόνο για τα τρία που έχω ήδη. Στο βιβλίο μου, υπάρχουν 50 έως 100 συγγραφείς που αναφέρονται σε όλο. Βρήκα τις βιβλιογραφίες τους και στη συνέχεια βρήκα όλα τα μυθιστορήματά τους που είχαν γράψει μέχρι εκείνο το σημείο ως το πλήρες ρεκόρ τους. Σε κάποιους τρόπους, είναι λίγο σαν τη διατήρηση των αθλητικών στατιστικών, όπου κάθε βιβλίο είναι κάτι σαν μια εποχή και στη συνέχεια όλες αυτές οι εποχές ή τα βιβλία έρχονται μαζί ως καριέρα. Μπορείτε να δείτε πώς οι συγγραφείς αλλάζουν με την πάροδο του χρόνου και πώς κάνουν τα πράγματα συνολικά. Μόλις έχετε όλα τα βιβλία σε αρχείο, τότε απαντώντας σε αυτές τις ερωτήσεις που με κάποιους τρόπους είναι πολύ τρομακτικό είναι πολύ απλή.

Και πώς επεξεργαστήκατε όλο αυτό το κείμενο;

Υπάρχει μια γλώσσα προγραμματισμού που ονομάζεται Python, και μέσα σε αυτό, υπάρχει ένα σύνολο εργαλείων που ονομάζεται Toolkit φυσικής γλώσσας, συχνά συντομογραφία NLTK. Τα εργαλεία που εμπλέκονται σε αυτό είναι ελεύθερα διαθέσιμα σε κανέναν. Μπορείτε να κατεβάσετε το πακέτο online και να το χρησιμοποιήσετε σε Python ή σε άλλες γλώσσες. Δεν μπορείτε να πάρετε πολλές από τις γραπτές ερωτήσεις ειδικότερα, αλλά μπορείτε να πείτε πόσες φορές εμφανίζεται αυτή η λέξη στο κείμενο; Μπορεί να περάσει και να εντοπίσει πού οι προτάσεις καταλήγουν και πού ξεκινούν οι προτάσεις, καθώς και τμήματα του λόγου-επίθετου εναντίον του αγγέλου έναντι του ρήματος. Έτσι, μόλις έχετε αυτά τα εργαλεία, μπορείτε να λάβετε τα δεδομένα.

Ποια στατιστικά στοιχεία συγκεντρώσατε χειροκίνητα; Ποιο ήταν το πιο κουραστικό;

Υπάρχει μια ενότητα όπου εξετάζω τις αρχικές προτάσεις. Ο Elmore Leonard, ο οποίος ήταν ένας πολύ επιτυχημένος μυθιστοριογράφος, είπε: «Ποτέ μην ανοίγετε ένα βιβλίο με καιρό.» Αυτό είναι επίσης συμβουλές που βρέθηκαν σε πολλούς οδηγούς γραφής. Έτσι, πέρασα εκατοντάδες συγγραφείς για να δούμε πόσο συχνά ανοίγουν το βιβλίο τους για τον καιρό. Για παράδειγμα, η Danielle Steel, πιστεύω ότι το 45 τοις εκατό των πρώτων ποινών της στα βιβλία είναι για τον καιρό. Πολλές φορές είναι απλώς "Ήταν μια υπέροχη μέρα", ή "Ήταν φωτεινό και ηλιόλουστο, " τέτοια πράγματα. Για αυτό, δεν υπήρχε τρόπος να το κάνετε αυτόματα χωρίς να έχετε κάποιο λάθος, οπότε θα περάσω απλώς όλα τα αρχεία του βιβλίου και θα επισημάνω αν υπήρχε καιρός. Μπορείτε να πείτε ότι ήταν κουραστικό, γιατί ήταν πολλά δεδομένα που συλλέχθηκαν, αλλά ήταν αρκετά διασκεδαστικό να περάσετε και να διαβάσετε εκατοντάδες εισαγωγικές προτάσεις ταυτόχρονα. Υπάρχουν και άλλα πρότυπα που εμφανίζονται με σαφήνεια από τους συγγραφείς με την πάροδο του χρόνου.

p207 --- Weather.jpg

Όπως λέτε, κουραστική για μερικούς, διασκέδαση για τους άλλους. Κάποιοι μπορεί να πιστεύουν ότι αυτή η αναλυτική προσέγγιση είναι βαρετή, αλλά υποστηρίζετε ότι μπορεί να είναι "διασκεδαστική" και "συχνά εντελώς αστείο". Ποιο ήταν το πιο αστείο σας εύρημα;

Ο τίτλος του βιβλίου, το αγαπημένο λέγμα του Nabokov είναι ο Mauve, είναι για το πώς, με τους αριθμούς, η λέξη που χρησιμοποιεί με το υψηλότερο ποσοστό σε σύγκριση με τα αγγλικά είναι μωβ. Αυτό καταλήγει να έχει πολύ νόημα εάν κοιτάξετε το ιστορικό του, επειδή είχε συναισθησία. Μίλησε, στην αυτοβιογραφία του, για το πώς όταν άκουσε διαφορετικά γράμματα και ήχους, ο εγκέφαλός του θα προκαλούσε αυτόματα χρώματα.

Επανέλαβα αυτό το πείραμα σε άλλους 100 συγγραφείς για να δούμε τι είναι η αγαπημένη τους λέξη. Ως αποτέλεσμα, παίρνετε τρεις λέξεις που είναι αντιπροσωπευτικές της γραφής τους από τις λέξεις που χρησιμοποιούν περισσότερο. Πολιτισμός, φαντασία και περιφρόνηση. Αυτή είναι η Jane Austen. Νομίζω ότι αν είδες αυτά τα λόγια, η Jane Austen μπορεί να είναι μια από τις πρώτες σου εικασίες. Και έπειτα έχετε έναν συγγραφέα όπως ο John Updike, ο οποίος είναι λίγο πιο λιτός και πραγματικός και διαφορετικός χρόνος. Τα αγαπημένα του λόγια είναι ραμμένα, τρυπημένα και πατημένα. Νομίζω ότι βλέποντας την προσωπικότητα να έρθει μέσα από αυτά τα απλά μαθηματικά ερωτήματα είναι πολύ ενδιαφέρον. Αν έχετε έναν αγαπημένο συγγραφέα, περνώντας μέσα από αυτό αποκαλύπτει κάτι για την προσωπικότητά τους που ίσως να μην έχετε παρατηρήσει πριν.

Ο Ray Bradbury είχε γράψει ότι η αγαπημένη του λέξη ήταν η κανέλα. Με τους αριθμούς, το χρησιμοποιεί πολύ. Η εξήγηση του γιατί του άρεσε η κανέλα ήταν ότι του υπενθύμισε το ντουλάπι της γιαγιάς του. Γύρισα λοιπόν και βρήκα άλλα λόγια μπαχαρικών και μυρίζοντας λέξεις που θα μπορούσαν να συσχετιστούν με το ντουλάπι της γιαγιάς, και ο Ray Bradbury χρησιμοποιεί τα περισσότερα από αυτά τα λόγια με πολύ υψηλό ρυθμό. Από κάποια άποψη, μπορείτε να πάρετε αυτό το περίεργο, φρουδοβικό βλέμμα σε κάτι σχετικά με τις παιδικές ηλικίες των συγγραφέων. Αν ο Ray Bradbury δεν το είχε πει, ίσως να το καταλάβετε.

Συγκρίνατε Αμερικανούς και Βρετανούς συγγραφείς, επιβεβαιώνοντας ένα στερεότυπο ότι οι Αμερικανοί είναι δυνατοί. Μπορείτε να το εξηγήσετε αυτό;

Αυτός βασίστηκε αρχικά σε μια μελέτη που πραγματοποίησε ένας μεταπτυχιακός φοιτητής στο Stanford. Είχε εντοπίσει λέξεις που χρησιμοποιούνται για να περιγράψουν το διάλογο στα βιβλία και τις περιέγραψαν ως δυνατές, ουδέτερες ή ήσυχες. "Ψιθύρισε" και "μουρμούρισε" θα ήταν κάτω από ήσυχο. Το ουδέτερο θα ήταν "είπε" ή "είπε" και θα ήταν δυνατά "θα αναφωνήσει" ή θα "φώναζε". Πέρασα τους 50 συγγραφείς που εξέτασα, καθώς και μεγάλα δείγματα μυθιστοριογραφίας ανεμιστήρων, από ένα τρελό περιθώριο, αλλά ένα σημαντικό περιθώριο, ότι οι Αμερικανοί έχουν μια υψηλότερη αναλογία από τα δυνατά λόγια στις ήσυχες λέξεις. Υπάρχουν μερικές εξηγήσεις. Θα μπορούσε έτσι να μιλήσουν οι Αμερικανοί καθ 'όλη τη διάρκεια της ζωής τους, γι' αυτό οι συγγραφείς τους περιγράφουν συχνά μιλώντας. Θα μπορούσατε να το δείτε απλώς ως Αμερικανοί συγγραφείς που προτιμούν τις πιο ιστορικές ιστορίες με thriller, thriller, high tempo σε σύγκριση με τις πιο λεπτές ιστορίες. Οι Αμερικανοί είναι πράγματι πιο δυνατοί από τους αριθμούς.

Blatt_author photo_Credit Sierra Katow.JPG Ο Ben Blatt, συγγραφέας του αγαπημένου λόγου του Nabokov είναι ο Mauve (Sierra Katow)

Γιατί νομίζετε ότι η εφαρμογή μαθηματικών στο γράψιμο είναι ένας καλός τρόπος για να μελετήσετε τη λογοτεχνία;

Σίγουρα δεν υποστηρίζω ότι αυτό θα πρέπει να είναι ο πρώτος τρόπος μελέτης της λογοτεχνίας αν προσπαθείτε να βελτιώσετε τη γραφή σας. Αλλά ακόμη και ένα μυθιστόρημα με μέτριο μήκος είναι πιθανώς 50.000 λέξεις, και αυτό είναι 50.000 σημεία δεδομένων. Είστε απλά δεν θα είναι σε θέση να απορροφήσει όλα αυτά σε μια στιγμή, και θα υπάρξουν ορισμένες ερωτήσεις που απλά δεν μπορεί να απαντήσει στην ανάγνωση από μόνοι σας. Είναι καλό να δούμε τη μεγαλύτερη εικόνα. Αν καθίσετε και μελετήσετε μια παράγραφο, είστε στη δημιουργική σας τάξη γραφής που μιλάτε στον καθηγητή σας, αν υπάρχει κάποιος τρόπος να το εξετάσετε, θα το δείτε απλώς σε όλα. Αλλά με τα δεδομένα, αυτό το είδος σας απαλλάσσει από αυτό, και μπορείτε να απαντήσετε σε κάποιες ερωτήσεις χωρίς αυτές τις προκαταλήψεις και να λάβετε πραγματικά κάποιες νέες πληροφορίες.

Αναφέρετε ότι συνεχίζατε να σκέφτεστε πίσω στο "The Great Grammatizator" του Roald Dahl.

Υπάρχει μια μεγάλη ιστορία Roald Dahl όπου ουσιαστικά ένας μηχανικός επινοεί έναν τρόπο να γράψει μια ιστορία. Σε αυτό το σενάρια για την κρίση, κάποιος μπορεί απλώς να δώσει στο μηχάνημα μια πλοκή και θα φτύσει ένα τελικό μυθιστόρημα. Η υπαινιγμός είναι ότι παράγουν μυθιστορήματα που είναι τόσο τυπολογικά και βασικά. Ο πρωταγωνιστής σε αυτή την ιστορία επιλέγει να μην ενταχθεί στη λειτουργία της μηχανής και να αγωνιστεί εναντίον της, δημιουργώντας τη δική της γραφή και τέχνη.

Σίγουρα πιστεύω ότι αυτό το βιβλίο, εάν γράφετε, θα απαντήσει σε πολλές ερωτήσεις για σένα και σίγουρα θα αλλάξει τον τρόπο που σκέφτεσαι για μερικά πράγματα, αλλά τελικά δεν υπάρχει καμία αντικατάσταση για ιδέες που κάνουν τους ανθρώπους να σκέφτονται και σκηνές που κάνουν τους ανθρώπους φοβούνται ή συνδέονται με τους χαρακτήρες. Αυτό το βιβλίο εξετάζει την τέχνη της γραφής και όχι απαραίτητα πώς να δημιουργήσει μια αξέχαστη ιστορία. Αυτό το βιβλίο δεν προσπαθεί να σχεδιάσει ένα τέλειο μυθιστόρημα και δεν νομίζω ότι είμαστε τόσο κοντά σε αυτό που μπορεί να φοβούνται κάποιοι.

Ένας συγγραφέας χρησιμοποιεί τις στατιστικές για να αποκαλύψει τα μυστικά του τι κάνει μεγάλη γραφή