Computer-Algorithmus soll Code Fiction Bestseller zu knacken
(ISNS)--der englische Schriftsteller William Somerset Maugham sagte einmal, dass es drei Regeln für das Schreiben von Romanen.
"Leider", fügte er hinzu: "niemand weiß was sie sind."
Stony Brook University in New York drei Informatiker denke, fanden sie einige Regeln durch ein Computerprogramm, das vorhersagen kann, welche Bücher erfolgreich sein werden. Der Algorithmus hatte soviel wie 84 Prozent Genauigkeit, wenn es auf bereits veröffentlichte Manuskripte angewendet.
Wenn so, es kommt viel zu spät für die mehr als 20 Buch Redakteure, die Rowlingss ersten Manuskript über einen jungen Zauberer namens Harry Potter abgelehnt hat.
Sie sagten, es ist die erste Studie, zwischen Stilelemente des Buches und seine Popularität und Kritikerlob korrelieren.
In einer Publikation durch die Vereinigung der Computerlinguistik sagte Vikas Ganjigunte Ashok, Song Feng und Yejin Choi der Schreibstil von Büchern mit dem Erfolg des Buches korreliert war.
Die Forscher setzten einen Prozess namens statistische Stylometry, eine statistische Analyse der literarischen Stile in verschiedenen Genres von Büchern und identifizierten charakteristischen Stilelemente häufiger bei erfolgreichen Bände als erfolglos.
Sie begannen ihre Forschung mit Project Gutenberg, eine Datenbank 44.500 Bücher in der Public Domain. Ein Buch wurde als erfolgreich angesehen, wenn es kritisch mit Beifall begrüßt wurde und einen hohe Download-Zähler hatte. Die Bücher für die Analyse gewählt vertreten alle Genres der Literatur, aus Science Fiction, Poesie.
Dann sie einige Bücher nicht in der Gutenberg-Datenbank, einschließlich Charles Dickens' "Tale of Two Cities," hinzugefügt und Ernest ist "Der alte Mann und das Meer." Sie fügten Dan Browns neuesten Roman "The Lost Symbol" und Bücher, die den Pulitzer-Preis, den National Book Award und andere Auszeichnungen gewonnen haben.
Sie nahmen die ersten 1.000 Sätze 4.129 Bücher von Poesie und 1.117 Kurzgeschichten und dann auf verschiedene Faktoren analysiert. Sie schaute Wortarten, Nutzung von Grammatikregeln, die Verwendung von Phrasen und "Verteilung des Gefühls" – eine Methode zur Messung des Gebrauch von Wörtern.
Sie fanden, dass erfolgreiche Bücher aus großen Konjunktionen verwenden, um Sätze zu verbinden ("und" oder "aber") und Präpositionen als weniger erfolgreiche Bücher. Sie fanden auch einen hohen Anteil an Substantive und Adjektive in den erfolgreichen Büchern; weniger erfolgreiche Bücher stützte sich auf weitere Verben und Adverbien zu beschreiben, was passiert war.
Erfolgreicher Bücher stützte sich auf Verben Denkprozesse anstatt Handlungen und Emotionen zu beschreiben. Die Ergebnisse nach Genre, aber Bücher, die weniger erfolgreich sind, variiert die Forscher berichteten, verwendet Wörter wie "wollte", "nahm" oder "versprochen." Erfolgreiche Autoren beschäftigt "erkannt" oder "erinnert." "
"Es hat mit zeigen im Vergleich zu Pflege zu tun, sagte" Choi. "Um wirklich Anklang mit Lesern, anstatt zu sagen,"sie war wirklich sehr traurig,"könnte es besser, ihre körperlichen Zustand, um eine wörtliche Beschreibung geben zu beschreiben sein. Sie sprechen mehr wie ein Journalist würde."
Kommunikation Forscher Journalisten nutzen mehr Substantive, Pronomen und Präpositionen als andere Autoren glauben, weil diese Wortformen mehr Informationen geben, erklärte Choi.
"Schriftsteller, die eher wie Journalisten schreiben literarischen Erfolg", sagte sie.
Sollte als keine Überraschung, da viele große Schriftsteller--Dickens und Hemingway Namen zwei--begannen ihre Karriere als Journalisten.
Choi betonte, dass sie eine Korrelation, nicht Kausalität beschrieb, die Ergebnisse könnten jedoch prädiktive.
Die Technik fällt unter die Kategorie des maschinellen Lernens und wurde verwendet, um erfolgreich Literatur analysiert werden. Moshe Koppel, Informatiker an der israelischen Bar-Ilan Universität, entwickelt zum Beispiel eine Programm, die sagen kann, ob der Autor eines Buches männlich oder weiblich, 80 Prozent der Zeit ist.
Er sagte die Stony Brook-Studie war gut gemacht aber die Probenahme Größe war zu klein. Einige der Bücher hatten weniger als 100 Downloads.
Es ist nicht praktisch, in der realen Welt nach Michael Hamilburg, einen literarischen Agenten in der Mitchell-Hamilburg-Agentur in Los Angeles, deren Aufgabe es ist, Bestseller Bücher unter Tausenden von Handschriften zu finden.
"Während es sehr interessante Ideen präsentiert, sehe ich nicht noch die reale Anwendungen, die vorteilhaft, meine tägliche Arbeit oder endgültige Entscheidungen wäre," sagte Hamilburg. "Es ist sehr schwierig, Entscheidungen zu quantifizieren, die oft durch Intuition und Beziehungen hergestellt werden."
Mindestens ein Romancier stimmt.
Ron Hansen, der Autor mehrere erfolgreiche Romane, darunter "Die Ermordung des Jesse James durch den Coward Robert Ford," die in einen Film mit Brad Pitt gemacht wurde, sagte, dass Stil nicht der Schlüssel ist.
"Die meisten Menschen kaufen und Bücher zu lesen, da sie von dem Thema erfasst sind", sagte Hansen, lehrt die Schrift an der Santa Clara University in Kalifornien. "Stilistische Merkmale fliegen die Wissenschaftler angesichts der meisten Lehre der kreativen Schreiben, wenn sie über Verben Nomen hervorzuheben. Verben sind der Motor der Fiktion und Qualität schriftlich bemisst sich oft durch ihre Vielfalt, Präzision und Kraft", sagte Hansen.
Oder als Sportjournalist rot Smith sagte einmal: "schreiben ist einfach. Sie öffnen nur eine Vene und bluten."
In Science News Service wird unterstützt durch das American Institute of Physics. Joel Shurkin ist ein freiberuflicher Schriftsteller mit Sitz in Baltimore. Er ist der Autor von neun Bücher über Wissenschaft und Wissenschaftsgeschichte und unterrichtete Wissenschaftsjournalismus an der UC Santa Cruz, Stanford University und der University of Alaska Fairbanks. Er twittert auf @shurkin.