Googles Cloud Speech API wird zum vollwertigen Cloud-Service

Googles Automatic-Speech-Recognition-Service verlässt den Beta-Status und ist nun ein offizieller Service der Google Cloud Platform

vorlesen Druckansicht
Googles Cloud Speech API wird zum vollwertigen Cloud-Service
Lesezeit: 1 Min.
Von
  • Alexander Neumann

Rund ein Jahr nach der ersten Präsentation ist nun die Cloud Speech API zum vollwertigen Dienst der Google Cloud Platform geworden. Mit dem Service lässt sich Sprache in geschriebenen Text umwandeln. Erkannt werden offenbar rund 80 Sprachen. Die API ermöglicht es Entwicklern, Sprachbefehle für Apps und Dienste zu aktivieren und Audiodateien zu transkribieren. Ihr liegen wohl die gleichen Techniken zugrunde, die bei verbreiteten Angeboten wie Google Search, Google Now und Google Assistant zum Einsatz kommen.

Die Cloud Speech API kann den Text bereits während des Erkennens als Stream ausliefern. Alternativ übersetzt sie Audiodateien (z. B. FLAC, AMR, PCMU und Linear-16) in geschriebene Texte. Das System kann offensichtlich Hintergrundgeräusche selbsttätig herausfiltern. Außerdem gibt es eine Funktion, die als unangemessen klassifizierte Inhalte in einigen Sprachen nicht überträgt.

Seit Öffnung des Cloud-Services im Rahmen eines allgemein verfügbaren Beta-Programms sind einige Neuerungen hinzugekommen. So werden mehr Dateiformate unterstützt – ergänzt wurden etwa WAV, Opus, und Speex. Ansonsten spricht Google von einer beschleunigten Ausführung und einer genaueren Transkription bei längeren Audioaufnahmen. (ane)