Diese Software versteht einen

Sprache zu Schrift: Mit dem Online-Tool "Trint" kann man Gespräche transkribieren lassen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 3 Min.
Von
  • Hans Dorsch

Ich habe gerade Interviews mit einem digitalen Rekorder aufgenommen. Aus drei Aufnahmen von je einer Stunde muss ich jetzt die interessanten Inhalte und passenden Zitate herausholen. Normalerweise eine zeitraubende und nervende Angelegenheit. Doch nun hilft mir die Beta-Version des Online-Tools "Trint". Dazu muss ich zunächst die Audio-Dateien von meinem Rekorder auf die Website www.trint.com laden und die Sprache der Aufnahme angeben – Englisch, Deutsch, Französisch oder Spanisch.

Dann wandeln die Trint-Server sie in lesbaren Text um. Das dauert rund zehn Minuten pro Stunde Aufnahme. Anschließend öffne ich das Ergebnis im Browser und überfliege den Text. Fällt mir ein falsch erkanntes Wort auf, klicke ich darauf, höre den Originalton zu genau dieser Stelle und korrigiere den Text. Interessante Passagen und potenzielle Zitate kann ich markieren. Schließlich speichere ich den Text als Word-Dokument inklusive Zeitmarken und Hervorhebungen. Transkripte lassen sich per E-Mail mit Kollegen teilen, die sie ebenfalls online bearbeiten können – ohne Software und ohne Spezialkenntnisse.

Das alles hört sich unspektakulär an, aber jeder, der schon einmal ein Interview abschreiben musste, weiß: Es ist eine Befreiung von einer riesigen Last. Selbst versierte Schreiber brauchen für eine Stunde Tonaufnahme zwischen zwei und drei Stunden zum Transkribieren. Und Transkriptionsdienste verlangen etwa 90 Euro pro abgeschriebener Stunde. Die 16 Euro (27 Cent pro Minute), die Trint für meine drei Interviews nimmt, sind dagegen schon fast billig.

Herkömmliche Diktiersysteme sind deutlich aufwendiger. "Dragon Dictate" etwa, die bekannte Diktiersoftware von Nuance, muss gekauft, auf einem Computer installiert und auf einen Sprecher trainiert werden. Dann erreicht sie Erkennungsraten von fast 100 Prozent. Bei unbekannten Sprechern und schlechter Tonqualität nimmt die Trefferquote jedoch stark ab. Korrekturen sind umständlich, zumindest in den Versionen für Privatkunden.

Die Spracherkennung von Mac und iPhone lieferte in meinen Tests nur mittelmäßige Ergebnisse, auch bei Aufnahmen mit hoher Qualität. Auch bei Trint hat die Aufnahmequalität großen Einfluss auf die Erkennungsrate. In meinem nicht repräsentativen Test erreichte sie bei einem Telefoninterview auf Deutsch etwa 80 Prozent; ebenso bei einem Vortrag in einem großen Saal, rund zehn Meter vom Lautsprecher entfernt.

Bei einem Interview auf Englisch mit niederländischem Akzent stieg sie auf 85 Prozent, bei einem Interview auf akzentfreiem Hochdeutsch ohne Hintergrundgeräusche auf 95 Prozent. 100-prozentige Genauigkeit ist dabei gar nicht nötig, denn im Zweifel ist immer noch die Tonspur da.

Für Journalisten, Soziologen und andere, die viele Interviews führen, ist der Dienst eine große Hilfe. Auch Vorträge lassen sich damit durchsuchbar machen. Schon jetzt kann man bequem Untertitel für Videos erstellen, die auch ohne Ton funktionieren sollen. Demnächst will Trint noch einen Videoplayer mit Suchfeld zum Einbetten in Websites anbieten.

Produkt: Trint
Hersteller: Trint
Preis: 0,27 Cent pro Minute

(bsc)