Transkriptionsdienste im Test: Audioaufnahmen in Text wandeln

Webdienste mit künstlicher Intelligenz erkennen deutsche und englische Rede ohne aufwendiges Training. Damit kann man sich ganz auf das Gespräch konzentrieren.

Artikel verschenken

8

(Bild: Thorsten Hübner)

11.08.2021, 15:00 Uhr

Lesezeit: 15 Min.

c't Magazin

Von

André Kramer

Transkriptionsdienste im Test: Audioaufnahmen in Text wandeln
- Transkriptionsdienste in der Praxis
- Akustik, Lexikon und Sprachmodell
Einzelbesprechungen
Fazit
Vergleichstabelle

Artikel in c't 17/2021 lesen

Transkriptionsdienste wandeln gesprochene Alltagssprache in lesbaren Text. Mit Methoden maschinellen Lernens funktioniert das mittlerweile sprecherunabhängig, das heißt ohne vorheriges Training. Das bietet deutlich mehr Freiheit als der frühere Ansatz, bei dem die eingerichtete Software fest an einen Sprecher gebunden war und somit ausschließlich als persönliche Diktatsoftware diente. Auf YouTube erscheinen bei jedem Video automatisch generierte Untertitel, die zwar gerade in Beiträgen mit vielen exotischen Fachbegriffen nicht immer akkurat sind, aber durchaus gut genug, um den Inhalt wiederzugeben. Sie helfen gehörlosen Zuschauern, aber auch solchen die gerade Kartoffelchips oder eine laute elektrische Zahnbürste im Mund haben.

Webdienste zur Audiotranskription sind für alle hilfreich, die regelmäßig Interviews oder Redebeiträge verschriftlichen. Die Vision der Hersteller: Man hat immer den Audio-Recorder auf dem Smartphone bereit, schickt die Aufnahme im WAV- oder MP3-Format durch die KI auf den Server des Dienstes der Wahl und lädt sich nach kurzer Wartezeit den lupenrein lesbaren Text herunter. Verglichen mit digitalen Assistenten sollen sie besser mit komplexen Themen zurechtkommen. Siri und Alexa geht es da eher wie jemandem mit Fremdsprachenkenntnissen aus der Schule: Für Standardsituationen reicht es, aber bei freier Rede ist schnell der Ofen aus.

Sechs Webdienste versprechen deutschsprachige Audioaufnahmen zuverlässig in editierbaren Text zu verwandeln: Amberscript, Audext, f4x, Happyscribe, Trint und Wreally transcribe.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Elektroauto lädt an bidrektionaler Wallbox

Kaufberatung: Wallboxen mit Gleich- und Wechselstrom für bidirektionales Laden

Bidirektionales Laden nimmt auch in Deutschland langsam an Fahrt auf. Wir zeigen, welche passenden Wallboxen verfügbar und angekündigt sind.

A4-Multifunktions-Farblaserdrucker bis 400 Euro im Test

Brauchbare Lasermultifunktionsdrucker mit Farbe gibt es schon ab gut 300 Euro, ab 380 Euro mit Duplex-Einzugscanner. Aber der Toner ist teuer.

Kaufberatung: So finden Sie die passenden PC-Komponenten für Ihre Anwendungen

PC-Selbstbauer stehen vor einer riesigen Auswahl an CPUs, SSDs und Grafikkarten. Wir geben Tipps, wie Sie die richtigen Teile für Ihre Bedürfnisse auswählen.

Videostreaming: Übernahme von Warner Bros. Discover, Start von HBO Max

Während hierzulande der Start von HBO Max bevorsteht, tobt ein Milliardenpoker um den Mutterkonzern, dessen Ausgang die Streamingwelt verändern wird.

Messung der Oberflächentemperatur einer Niedertemperatur-Infrarotheizung mit Wärmebildkamera.

Wärme auf Knopfdruck: Was Infrarotstrahler als Zusatzheizung leisten

Niedrigtemperatur-Infrarotstrahler können schnell und bedarfsgerecht für Wohlbefinden sorgen. Beim Kauf sollten Verbraucher einiges beachten.

Interview: Warum Deutschlands größte Behörde ihre Abhängigkeit von MS reduziert

Die Bundesagentur für Arbeit nutzt Microsoft Office und Teams, will aber unabhängiger von dem US-Konzern werden. Warum, erklärt CIO Stefan Latuski im Interview.