Machine Learning: Sprache verarbeiten mit den Azure Cognitive Services

Neue Errungenschaften im Machine Learning machen Spracherkennung und -synthese praxistauglich. So verschriftlichen Sie Sprache und verwandeln Texte in Sprache.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 11 Min.
Von
  • Dr. Fabian Deitelhoff
Inhaltsverzeichnis

Neben Amazon und Google hat auch Microsoft mit den Azure Cognitive Services und den dort integrierten Speech Services Dienste wie Spracherkennung und Sprachsynthese in die Cloud gebracht. Dadurch ist es nicht mehr notwendig, eigene Long-Short-Term-Memory- oder ähnliche Systeme zu trainieren, um Sprache verarbeiten oder generieren zu können. Für viele Anwendungsbereiche sind die Möglichkeiten in der Cloud ausreichend. Und falls nicht, lassen sich die Systeme von Microsoft modifizieren. Was das bedeutet, zeigt dieser Artikel an einem Use Case aus dem wissenschaftlich-praktischen Kontext.

Mehr zum Thema Machine Learning

Unter den Azure Cognitive Services fasst Microsoft einen Produktbereich zusammen, der KI-Modelle als APIs bereitstellt. Entwickler und Data Scientists können die Dienste in eigene Produkte integrieren. Grundsätzlich lassen sich die Funktionen auch selbst implementieren. Die dafür notwendigen Algorithmen stehen häufig als Open-Source-Projekte bereit, auch das Training dieser Algorithmen kann jeder selbst durchführen.

Als Problem erweist es sich, die notwendigen Trainingsdaten zu finden und Zeit und Wissen in die korrekte Auswahl von Algorithmen und Training zu investieren. Hier können die Cognitive Services einen Vorteil bieten, da sie anpassbare und vortrainierte Modelle verwenden, die über die Cloud-Plattform bereitgestellt werden. Zudem sind vorgefertigte Docker-Container verfügbar.