Webbrowser Chrome hört zu

Die jetzt veröffentlichte Beta von Googles Webbrowser Chrome enthält eine API für die Spracherkennung. Sie funktioniert für verschiedene Sprachen, die Erkennung findet auf einem Google-Server statt.

99

15.01.2013, 10:09 Uhr

Lesezeit: 3 Min.

iX Magazin

Von

Christian Kirsch

In die jetzt veröffentlichte Beta der Version 25 seines Webbrowsers Chrome hat Google eine JavaScript-Schnittstelle integriert, die Spracherkennung in Webanwendungen ermöglicht. Die ereignisorientierte API erlaubt das Einstellen der Sprache und bei einigen Sprachen des Dialekts. Bevor sie benutzbar ist, muss der Benutzer dem Browser gestatten, das Mikrofon des Rechners für die Sprachaufzeichnung zu benutzen.

Für das Erkennen des Gesprochenen verwendet Google offenbar eigene Server. In einem kurzen Test fand während der Spracherkennung via HTTPS reger Datenaustausch zwischen dem Browser und einem vermutlich in München stehenden Rechner aus Googles Netz statt. Während des Sprechens veränderte sich gelegentlich der erkannte Text, offenbar kontextabhängig.

Ein kurzes Tutorial erläutert einige Aspekte der Schnittstelle, die nicht vom Web-Standardisierungskomiteee W3C selbst, sondern von einer "Community Group" entwickelt wird. Dass dort auch ein Vertreter von Mozilla mitarbeitet, spricht für Interesse auch bei anderen Browser-Herstellern. Zwar beschreibt Entwurf der Sprach-API bereits Funktionen für die Umsetzung von geschriebenem Text in Gesprochenes. Sie sind jedoch weder bislang in Chrome noch in einem anderen Browser enthalten.

"Anstößige" Begriffe ersetzt die Chrome-Implementierung durch Sternchen. Das soll sich abschalten lassen, was jedoch im Moment zumindest unter Mac OS X nicht funktioniert, da das Menü nicht erscheint. Im Deutschen und Französischen schlägt die Anstößigkeitskontrolle gar nicht an, während sie im Englischen das doppeldeutige "cock" zwanghaft zensiert. So wird aus dem harmlosen "The cock is crowing" (Der Hahn kräht) ein unzweideutiges "Your c*** is throbbing". Vermutlich nutzt Google bei der Spracherkennung Erkenntnisse aus dem Betrieb der Suchmaschine, um die Wahrscheinlichkeit der Eingabe zu beurteilen.

Neben der Sprach-API führt Chrome 25 eine Schnittstelle für Web-Komponenten ein, die ebenso wie jene noch mit dem Präfix webkit markiert ist. Diese API erlaubt das Erstellen wiederverwendbarer, gekapselter Elemente, indem sie "Shadow DOMs" einführt. Der Browser stellt solche Fragmente erst dar, wenn man sie in einen DOM-Knoten einfügt. Sie sollen die Trennung von Inhalt, Form und Stil erleichtern.

Zwei weitere neue APIs liefern JavaScript-Programmen Informationen über geladene Ressourcen (Resource Timing API) und stellen hochauflösende Zeitmarkierungen bereit, mit denen sich die Performance einer Anwendung untersuchen lässt (User Timing API). Die Chrome-Implementierung von IndexedDB unterstützt jetzt nebenläufige Transaktionen. Entwickler sollten ihre Anwendungen daraufhin testen, ob sie sich unbeabsichtigt auf sequenziell ausgeführte Transaktionen verlassen, warnt Google in diesem Zusammenhang.

Viele der jetzt in die Desktop-Beta von Chrome eingeflossenen Funktionen seien auch in der vor kurzem veröffentlichten Android-Beta verfügbar, heißt es. Allerdings finden sich in deren Beschreibung weder Hinweise auf die Sprach- noch auf die Web-Compontents-API. (ck)