Warum sind Computer Witze So schlecht?
Das war die Frage einer Gruppe von Forschern – darunter The New YorkerCartoon Editor, Bob Mankoff — fragte in einer Studie von Arxiv und MITS Technology Review hervorgehoben. Und wirklich, fragt, warum Roboter Witze erzählen können keinen Umweg zu Fragen, warum Menschen etwas lustig finden.
Was ist Komik? Kann es eventuell quantitative sein? Und warum es so schwer zu definieren ist — für mechanische Reproduktion davon? Das sind Fragen, die Wissenschaftler seit Jahrzehnten geplagt haben. Und es ist die zentrale Frage, die eine unglaublich vielfältige Gruppe von Autoren auf ein neues Papier auf der Suche nach einer Antwort, einschließlich Bob Mankoff, University of Michigan Informatiker Dragomir Radev und Wissenschaftler von Yahoo! und Columbia versammelt.
Zusammen, sie wollten etwas tun, das klingt sehr einfach: analysieren, was New Yorker Bildunterschriften Computer denken "lustigsten" vergleichen, dass, wie diese Analyse im Vergleich zu Amazon Turk Menschen und die eigentlichen Gewinner Beschriftungen von New Yorker Redaktion ausgewählt. Ihre Studie, Humor im kollektiven Diskurs: unbeaufsichtigte Komik-Erkennung in der New Yorker Cartoon Caption Contest erklärt wie kompliziert blöde Witze werden können.
Hier ist, wie es funktioniert: sie begann mit der Wahl 50 des New Yorker "unveröffentlicht" cartoon-Wettbewerbe. Sie enthalten 5.000 unterschiedliche Antworten auf die einzelnen Cartoon und anschließend analysiert jede Antwort um festzustellen, dass die Arten von syntaktischen Elemente in jedem ausgedrückt werden. Nehmen Sie zum Beispiel diesen Wettbewerb:
Sie schufen ein "lexikalische Netzwerk" für die Antworten, die Verknüpfung der oberen Beschriftungen von Struktur, syntaktische Bedeutung und Stil. Hier ist, was das für die Karikatur oben aussah:
Was ist lustig? Oder "zumindest für die Leser des New Yorker," die Autoren merken an, entscheidend?
Die computergestützte Analyse tauchte ein paar Hinweise, aber keine solide Antworten. Für eine Sache, sind die besten Witze meist Negative konzentriert. Sie sind in der Regel auch unter Bezugnahme auf eine Person oder in der Karikatur. Und dann gibt es so genannte "lexikalische Zentralität", die Sie oben in den Links sehen, die die meisten Verbindungen haben – oder etwas viele gemeinsam.
"Interessanter, die Legenden, die die kollektive Weisheit der Wettbewerb Teilnehmer überflügelt semantische Ausreißer, reflektieren wir auch zeigte" sie schreiben. Mit Hilfe dieses Netzwerks konnte sie finden, welche Elemente die Witze gemein hatten, und eine Art Ranking zu erreichen.
Aber MIT weist darauf hin, was interessant ist, dass sie wirklich einen Abschluss nicht – das macht deutlich, warum Humor eine schwierige Sache ist, zu studieren und in Maschinen zu replizieren. Kurzum, sie sagen, dass New Yorker Beschriftungen mit numerischen Analyse Bewertung zu ein paar extrem breiten Ergebnissen geführt Menschen, über welche Untertitel finden "lustig:" Witze, die eine negative Stimmung haben. Witze, die Menschen betreffen. Witze, bei denen eine verknüpfungsfähiges Thema, das viele Menschen "zu erhalten."
Sicher! Aber das sind immer noch außerordentlich breiten Einblicke – ganz zu schweigen von der Tatsache, die sie nur für New Yorker gelten Bildunterschriften, eine extrem verdünnte Form von Humor (einige argumentieren würde nicht qualifiziert überhaupt), die sicherlich nicht universell für alle Menschen ist, wenn es darum geht Lols.
Sie feststellen, dass sie gehen, um die Untertitel zu studieren, zu halten – und anderen Forschern zur Verfügung zu stellen – und dass das nächste Mal herum, sie gehen zu graben in Wortspiele: "z. B." Sag meiner Frau werde ich zu Hause in einem Minotaurus. ""
[Arxiv; h/t MIT Technology Review; Bild: AP Photo/Lilli Strauss]
Kontaktieren Sie den Autor unter [email protected].