Chrome-Browser hört zu

In die jetzt aktualisierte Beta-Version seines Browsers Chrome baute Google eine Technik ein, die Gesprochenes in Text wandelt. Das Unternehmen hat eine Spezifikation dafür beim W3C eingereicht.

In Pocket speichern vorlesen Druckansicht 62 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Christian Kirsch

Das nun zweidimensionale Logo ist die für jeden Nutzer der Beta von Googles Browser Chrome sofort sichtbare Neuerung in Version 11.0.696.16. Unter der Haube gibt es jedoch eine größere Attraktion: Eine Variante des input-Elements wandelt Gesprochenes in Text. Auf einer Demo-Seite zeigt Google seine Implementierung. Gleichzeitig legte das Unternehmen einen Entwurf für eine "HTML 5 Speech Input API" beim W3C vor. In die erste Version des neuen Web-Standards HTML 5 dürfte es der Vorschlag angesichts des W3C-Zeitplans jedoch kaum schaffen.

Beispielhaft zeigt die aktuelle Beta von Chrome den Einsatz von Spracherkennung im Browser.

Er sieht zahlreiche Attribute und Konfigurationsmöglichkeiten vor, die Spracheingabe im Browser vereinfachen könnten. Googles Beispiel verwendet lediglich das proprietäre Attribut x-webkit-speech, um ein input-Element zum Zuhören zu bewegen. Das Gesprochene schickt der Browser via HTTPS an einen Google-Rechner, der den erkannten Text auf demselben Weg zurücksendet. Im Hintergrund passiert dabei gelegentlich Eigenartiges: Aus dem "fängt" in "Fischers Fritze fängt frische Fische" machte der Server obstinat ein "fischt". Die jetzige Implementierung verwendet die im Browser oder Betriebssystem gewählte Landeseinstellung, sodass aus "J'ai beacoup faim" das deutsche "Tchibo Gutschein" wird. Ergänzt man wie im Standard-Vorschlag vorgesehen ein lang-Attribut samt passendem Wert, nutzt der Server jedoch automatisch das Wörterbuch für diese Sprache.

Der zur Normung eingereichte Vorschlag erlaubt die Vorgabe regulärer Ausdrücke, einer Wortliste oder einer SGRS-Grammatik (Speech Recognition Grammar Specification), um das Erkennen der Wörter zu erleichtern. Fünf Events berichten unter anderem vom Beginn und Ende des Sprechens. (ck)