Microsoft bietet Spracherkennung für individuelle Szenarien an

Als Teil der Cognitive Services hat Microsoft das Toolset mit neuem Namen als öffentliche Vorschauversion veröffentlicht. Entwickler können die Speech-to-Text-Engine mit individuellen Daten verknüpfen.

In Pocket speichern vorlesen Druckansicht
Microsoft bietet Spracherkennung für individuelle Modelle an
Lesezeit: 1 Min.
Von
  • Rainald Menge-Sonnentag

Microsoft erweitert das Portfolio der Cognitive Services, die das Unternehmen anfangs als Projekt Oxford gestartet und im vergangenen Sommer umbenannt hatte. Der jüngste Zuwachs ist der Custom Speech Service, der nun als öffentliche Vorschauversion verfügbar ist. Auch er hat eine Umbenennung erfahren: In der geschlossenen Phase hieß er Custom Recognition Intelligent Service (CRIS). Die zugehörige Website ist nach wie vor unter cris.ai erreichbar, zeigt aber bereits den neuen Namen.

Die öffentliche Vorschauversion ermöglicht nun allen interessierten Entwicklern die Verwendung von Microsofts Speech-to-Text-Engine mit individuellen Text- und/oder Sprachdaten. Laut dem Blogbeitrag ist die Engine darauf optimiert, in angepassten Szenarien zu arbeiten. Denkbar ist beispielsweise die Einbindung eines spezifischen Jargons oder von Produktbezeichnungen. Ebenso ist eine Anpassung für akustische Besonderheiten möglich, um die Erkennung beispielsweise für den Einsatz in lauten Fabrikhallen zu optimieren.

Die Projektseite bietet eine Einstiegshilfe, erfordert jedoch zunächst eine Registrierung. Außerdem hat Microsoft auf GitHub ein Beispiel zur Einbindung spezifischer Sprachdaten abgelegt. Eine Preisliste ist unter den Cognitive Services zu finden. Bis zu 5000 monatlichen Anfragen ist der Dienst demnach kostenlos, darüber gibt es je nach Anforderung unterschiedliche Modelle. Derzeit befinden sich die Custom Speech Services noch in der Previewphase. (rme)