MWC: Die Renaissance der Spracherkennung

An den verschiedensten Ecken auf dem Messegelände waren Spracherkennungslösungen für die Massen zu sehen.

In Pocket speichern vorlesen Druckansicht 24 Kommentare lesen
Lesezeit: 2 Min.
Von

Beim Hype um Windows Mobile 6.5 und Microsofts neue Handy-Dienste ist eine weitere Ankündigung des Software-Riesen ein wenig untergegangen. So stellt das Unternehmen auch recite vor, eine kostenlose Anwendung für Windows-Smartphones. Das derzeit nur für etwa ein Dutzend Handytypen und die englische Sprache verfügbare, als "Technology Preview" bezeichnete Programm ist eine Art Zettelkasten für Sprachnotizen, das die gespeicherten Texte per Spracheingabe durchsuchen kann.

Das Programm von Microsoft ist nur ein Hinweis von vielen auf dem Mobile World Congress, dass die sprecherunabhängige Erkennung offenbar reif für den Sprung in den Anwendungs-Mainstream ist. An den verschiedensten Ecken auf dem Messegelände waren Spracherkennungslösungen für die Massen zu finden. Die Technik, die in den letzten Jahren eher ein Nischendasein geführt hat, scheint auf dem Handy derzeit eine Renaissance zu erleben.

Den gesprochenen Text erkennen können soll zum Beispiel auch Yahoos vielseitiger Web-Client Yahoo Mobile, etwa für die Suche mit Google. Mit dem Server-basierten Voice on the Go soll der Anwender auschließlich per Sprachsteuerung und -eingabe Nachrichten bearbeiten, E-Mails, Textnachrichten, Tweets für die Mikroblogging-Plattform Twitter und mehr verfassen können – ideal etwa, um während der Autofahrt zu arbeiten. Das System ist bereits in etlichen Ländern verfügbar, auch in Deutschland. Dial2Do, eines der Unternehmen aus der Endrunde der Mobile Peer Awards, betreibt einen ähnlichen Dienst.

nuance stellte das sprachbasierte Such- und Diktiersystem Nuance Voice Control 2.0 vor. Das Framework richtet sich an Provider oder Gerätehersteller, die damit mobile Anwendungen wie Browser, E-Mail-Client oder Online-Shops mit Spracherkennung und einer Diktierfunktion verbinden können. Eine rudimentäre lokale Spacherkennung ermöglicht die Navigation durch das Anwendungsmenü, Suchanfragen oder diktierte Textabschnitte werden als Sprachdateien über eine Datenverbindung an einen nuance-Server gesendet und dort interpretiert. Die Server-Anwendung, die auf Dragon NaturallySpeaking basiert, soll sich mit der Zeit den sprachlichen Eigenheiten des Anwenders anpassen. (jo)