Machine Learning: Sprache verarbeiten mit den Azure Cognitive Services

Neue Errungenschaften im Machine Learning machen Spracherkennung und -synthese praxistauglich. So verschriftlichen Sie Sprache und verwandeln Texte in Sprache.

Artikel verschenken

1

31.01.2022, 08:00 Uhr

Lesezeit: 11 Min.

iX Magazin

Von

Dr. Fabian Deitelhoff

Machine Learning: Sprache verarbeiten mit den Azure Cognitive Services
Speech to Text, Text to Speech
Verschiedene Sprachmodelle
Fazit

Artikel in iX 2/2022 lesen

Neben Amazon und Google hat auch Microsoft mit den Azure Cognitive Services und den dort integrierten Speech Services Dienste wie Spracherkennung und Sprachsynthese in die Cloud gebracht. Dadurch ist es nicht mehr notwendig, eigene Long-Short-Term-Memory- oder ähnliche Systeme zu trainieren, um Sprache verarbeiten oder generieren zu können. Für viele Anwendungsbereiche sind die Möglichkeiten in der Cloud ausreichend. Und falls nicht, lassen sich die Systeme von Microsoft modifizieren. Was das bedeutet, zeigt dieser Artikel an einem Use Case aus dem wissenschaftlich-praktischen Kontext.

Unter den Azure Cognitive Services fasst Microsoft einen Produktbereich zusammen, der KI-Modelle als APIs bereitstellt. Entwickler und Data Scientists können die Dienste in eigene Produkte integrieren. Grundsätzlich lassen sich die Funktionen auch selbst implementieren. Die dafür notwendigen Algorithmen stehen häufig als Open-Source-Projekte bereit, auch das Training dieser Algorithmen kann jeder selbst durchführen.

Als Problem erweist es sich, die notwendigen Trainingsdaten zu finden und Zeit und Wissen in die korrekte Auswahl von Algorithmen und Training zu investieren. Hier können die Cognitive Services einen Vorteil bieten, da sie anpassbare und vortrainierte Modelle verwenden, die über die Cloud-Plattform bereitgestellt werden. Zudem sind vorgefertigte Docker-Container verfügbar.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Pornografische VR-Spiele im Test: Wie interaktiv sie wirklich sind

Pornografische Spiele versprechen interaktiven Sex in der virtuellen Realität. Wir finden heraus, was sie wirklich können.

iOS 18 und macOS 15: 20 Tipps zu Kalender, Nachrichten, Karten & Co

Apple wertet seine mitgelieferten Apps auf – von Nachrichten über Safari und Kalender bis zu Karten. 20 Tipps zu den entscheidenden Neuerungen.

Notstrom und Ersatzstrom über Solaranlage: Was man dazu braucht

Mit eigener Stromerzeugung und Akku liegt der Gedanke nahe, das zur Stromversorgung bei Ausfällen zu nutzen. Das Thema ist jedoch komplexer, als es aussieht.

Fotos-App: Die besten Tipps für iOS 18

iOS 18 und iPadOS 18 strukturieren die Fotos-App um. Während die Bearbeitung wie gehabt abläuft, muss sich der Nutzer an die neue Medienverwaltung gewöhnen.

Im Test: Programme und Dienste zur systemübergreifenden Dateiübertragung

Kreuz und quer über alle Systeme wird der Dateiaustausch zur Herausforderung. Sechs kostenlose Tools versprechen, die Systemgrenzen ohne Cloud zu überwinden.

Pornos auf der VR-Brille: Apple Vision Pro und Meta Quest 3

Sind VR-Pornos dank hochauflösender Brillen so lebensecht, dass sie gefährlich für zwischenmenschliche Beziehungen sind oder süchtig machen? Ein Realitätscheck.

nach oben

Alle Angebote

Newsletter heise-Bot Push Push-Nachrichten

${intro} ${title}