Twang Twitter?: Slang in Tweets zeigt wo du herkommst
Eine Twang in die Stimme des Anrufers hören kann eine sicher sein.
Werbegeschenk von wo sie in den Vereinigten Staaten leben. Stellt sich heraus, diese selben Dialekte
Lauf im Überfluss auf Twitter.
Forscher an der Carnegie Mellon University (CMU) Schule
Informatik haben kürzlich festgestellt, dass regionale
Umgangssprache und Dialekte sind so offensichtlich in Tweets, wie sie im Alltag sind
Gespräche.
Zuvor Studium der regionalen Dialekten basieren auf
mündliche Befragung. Zwar schriftlicher Kommunikation weniger reflektierend ist der regionalen
Einflüsse durch ein Maß an Formalität, die von Menschen ausgehen, Twitter, auf die
Andererseits bietet eine neue Möglichkeit des Studiums regionale Dialekte wie Tweets zu neigen
werden Sie informelle und Konversation. [Tote Sprachen zeigen eine verlorene Welt]
Jacob Eisenstein, postdoctoral Fellow in CMU Maschine
Learning-Abteilung, sagte die automatisierte Methode, die er und seine Kollegen haben
entwickelt für die Analyse von Twitter Wort-Einsatz zeigt, denen dass die regionale Dialekten scheinen
in sozialen weiterentwickelt werden
Medien.
Für ihre Forschung gesammelt, Eisenstein und sein Team ein
Woche im Wert von Twitter-Nachrichten im März 2010 und ausgewählte Geotagged (hinzugefügt
geographische Identifizierung auf Medien wie Fotos, Videos, Webseiten, SMS
Nachrichten oder RSS-feeds) Nachrichten von Twitter-Nutzern, die mindestens 20 schrieb
Nachrichten. Das ergab eine Datenbank von 9.500 Benutzer und 380.000 Nachrichten.
Sie entdeckten bestimmte Regionalismen, die bereits
bekannte und mit bestimmten Bereichen des Landes verbunden. Zum Beispiel eine
Südländer ist "y ' all," ein Pittsburghers "Yinz," sowie
die üblichen regionalen teilt in Referenzen zu Soda, pop und Coke.
Aber andere Phrasierung mit social Media selbst entwickelt hat.
In Nordkalifornien ist etwas, das ist cool
"Koo" in Tweets, während in Südkalifornien, ist es "gurren".
In vielen Städten ist etwas "Sumthin," aber Tweets in New York City
Bevorzugung "Suttin." Während viele von uns in den Tweets des Seins beschweren könnten
"sehr" müde, tendenziell Menschen in Nord-Kalifornien
"Hella" müde, New Yorker sind "Deadass" müde und
Angelenos sind einfach müde "af," das "als für steht
f***."
Eisenstein denkt einige hierfür ist geprägt von der
140-Zeichen-Grenze des Twitter-Nachrichten, aber die Geographie Einfluss ist auch
sichtbar sind. Das statistische Modell das Research-Team verwendet, um regionale erkennen
Variation in Wort-Nutzung und Themen konnte vorhersagen, den Standort von einem Hochtöner in der
kontinentalen Vereinigten Staaten mit einem mittleren Fehler von etwa 300 Meilen.
Die automatisierte Analyse von Twitter-Nachricht-Streams bietet Linguisten
die Möglichkeit, regionale Dialekte in Echtzeit zu entwickeln. "Es wird sein
interessant um zu sehen, was passiert,"sagte Eisenstein. "Wird"Suttin"
"bleiben ein Wort sehen wir vor allem in New York City zu, oder wird es zu verbreiten?"
Hier ist eine Liste der einige häufig verwendete Umgangssprache auf Twitter.
- COO: Cool-LA/Southern California
- Fasho: sicher – LA/Southern California
- GNA: gonna – Boston
- Iono: Ich weiß nicht-Northern California
- Lames: Menschen – Lake Erie Region lahm
- Koo: Cool-Northern California
- LLS: lachen wie s ***-Washington D.C.
- Od: übertrieben (sehr) – Lake Erie Region
- OMW: auf meinem Weg – LA/Southern California
- SMH: den Kopf schütteln – LA / Southern California
- Suttin: etwas – New York/Boston
- WJT: Was machst du – LA/Southern California
Eisenstein präsentiert die Studie am 8. Januar um die
Linguistic Society of America Jahrestagung in Pittsburgh.
- Twitter
Experiment erforscht ESP - 10
Technologien, die Ihr Leben verändern wird - 10
Dinge, die Sie über Sie wissen nicht