Googles Sprachsuche ist übrigens immer viel besser
Google veröffentlicht seine erste neuronale Netz betriebene Spracherkennungssystem im Jahr 2011 und es wurde langsam Verbesserung seitdem. Aber jetzt, es ist bekannt, dass die Zugabe von wiederkehrenden neuronale Netze weit schneller machen – und viel genauer.
In einem Blog-Post erklärt das Google-Rede-Team, dass es hinzugefügt hat, was seine Algorithmen als konnektionistischen zeitlichen Einordnung und Sequenz diskriminierende Trainingstechniken bekannt sind. Wenn das Ihnen nicht viel Sinn machen, ist hier eine einfache Erklärung wie es funktioniert:
In einem traditionellen Rede Recognizer gliedert sich die Wellenform, gesprochen von einem Benutzer in kleine aufeinander folgende Scheiben oder "Frames" von 10 Millisekunden von Audio. Jeder Frame wird für seine Frequenzanteile analysiert und die daraus resultierende Merkmalsvektor wird durch ein akustisches Modell übergeben... Das Erkennungsmodul versöhnt dann alles, was diese Informationen, um den Satz der Benutzer bestimmen spricht. Wenn der Benutzer das Wort "Museum" zum Beispiel - / m j u z spricht ich @ m / in phonetischer Schreibweise - möglicherweise schwer zu sagen, wo der /j/ Ton endet und wo die Synkope beginnt, aber in Wahrheit das Erkennungsmodul interessiert nicht, wo genau dieser Übergang geschieht: alle die es interessiert ist, dass diese Klänge gesprochen wurden.
Unsere verbesserte akustische Modelle setzen auf wiederkehrende neuronale Netze (RNN). RNNs haben Feedback-Schleifen in ihrer Topologie, so dass sie Modell zeitliche Abhängigkeiten: Wenn der Benutzer Synkope im vorherigen Beispiel spricht, ihrer artikulatorischen Apparat kommt von einen /j/ Ton und aus einem Computerbrowser-Sound vor. Versuchen Sie es laut sagen - "Museum" - es fließt ganz natürlich in einem Atemzug und RNNs erfassen können, die.
Durch die Einführung dieser Fähigkeit, Informationen über Klänge auf beiden Seiten jedes Snippet enthalten, die Algorithmen steht eine viel bessere Chance zu verstehen, was du sagst. In der Tat, behauptet Google macht es Stimme suchen weitaus genauer, vor allem in lauten Umgebungen, sowie zu machen, "unglaublich schnell."
Du musst gar nichts tun, um die Verbesserung nutzen: die Neuausrichtung des neuronalen Netzes ist bereits durch die Google-Suche-app für iOS und Android verwendet wird.