Wie Skype Translator lernt Sprache von Social Media
Wenn Microsoft und Skype Skype Translator im Mai ergab, jeder angezeigt Ehrfurcht und staunen Sie über einen Dienst, der schließlich die Sprachbarriere durchqueren konnte. Die Prämisse war, dass die app Skype Translator Rede in Echtzeit ermöglicht flüssige Konversation zwischen deutschsprachigen Partnern mit verschiedenen lingual Zungen umwandeln würde.
Etwas so monumental zu erreichen (und auch die Freigabe der Betatests noch in diesem Jahr) ist an sich eine gewaltige Herausforderung. Allerdings gibt es eine weitere Schicht an diesem Science-Fiction-Babelfisch, und ist, dass die Unterschiede zwischen dem Schreiben und sprechen lernen.
Teresa Chong mit IEEE Spectrum sprach mit dem Entwicklungsteam von Microsoft in Redmond, Washington, wie genau Skype Translator übernimmt alle der "Ums" "Ahs", weiß Sie, "und"Likes", die Pocke Alltagssprache sowie vocal Beugungen, die eine Frage aus einer Anweisung zu trennen. Chong unterstreicht das Hauptproblem:
Die Kluft zwischen übersetzen von Text und Sprache zu übersetzen, weil einige der besten maschinelle Übersetzungssysteme heute unterrichtet werden über große Mengen an qualitativ hochwertigen Text, der nicht die Ungeschicklichkeit enthält, der Spracherkennungssysteme bewältigen.
Erstens Microsoft fand des traditionellen Ansatzes, aber anstatt nur Zuordnung Sätze zwischen Sprachen, das Team ging einen Schritt weiter und einzelne Wörter als auch abgebildet. Dies half, grammatikalische Ungereimtheiten in verschiedenen Sprachen zu überwinden. Jedoch dies bald brachte sie zu social Media wo jede Plattform – vor allem Facebook, SMS und Twitter – brachte eine einzigartige Herausforderung. Die Forscher angepasst "social Media Text Nomalization Plattform", um ihre bestehenden System und verbesserte Textübersetzung um sechs Prozent mit einem Entwickler sagen "es wirklich die Nadel auf Verständnis und übersetzen diese Art von Daten besser bewegen."
Dies ist ein weiteres Beispiel wie social Media für Forschung, nicht nur in den Sozialwissenschaften, aber in Informatik sowie unerlässlich ist. Hoffentlich, wird Microsoft auch Reddit, Imgur und Zucken der jüngsten Bemühungen mit den digitalen Ökologien Research Partnership (natürlich, genannt "DERP"), profitieren die Forscher über ihre Plattform Zugang zu Community-getriebene Daten ermöglicht.
Die Entwicklung der Maschine Sprachenlernen wird ständig weiterentwickelt, und jetzt werden unsere Hashtags, Posts, Tweets und digital Slang an Skype Translator Zukunft. [IEEE Spectrum]