Audiotranskription ohne Cloud
Mit noScribe können auch Laien leistungsfähige KI-Audiotranskription einfach nutzen. Das Programm läuft lokal und erreicht eine hohe Genauigkeit.
OpenAI hat sein Transkriptionstool Whisper mit 680.000 Stunden Audio- und Videomaterial gefüttert. Das Tool steht zwar unter einer Open-Source-Lizenz (MIT License), das Problem ist aber, dass die Audiotranskriptions-Modelle nicht mal so eben zu installieren und zu bedienen sind. Eine Lösung dafür stammt von Kai Dröge. Der Soziologe der Hochschule Luzern arbeitet viel mit langen, persönlichen Interviews und hatte schon immer Bauchschmerzen damit, Clouddienste für Transkriptionen zu nutzen. Dröge hat Informatik studiert und in Zusammenarbeit mit einer kleinen Community aus Whisper eine laientaugliche, lokal laufende Software für alle gängigen Betriebssysteme entwickelt.
Das 3,5 GByte große Softwarepaket können Nutzer auf GitHub herunterladen, die Installation und Nutzung erschließen sich auch für IT-Laien. Dröge hat in das Programm zwei der fünf Whisper-Modelle integriert. Ursprünglich für die sozialwissenschaftliche Forschung gedacht, eignet sich noScribe auch gut für andere Zwecke. Man kann damit etwa eingesprochene Tagebucheinträge, Sitzungsprotokolle oder diktierte E-Mails und Briefe transkribieren. Zusätzlich hat der Entwickler einen Editor eingebaut, der das Transkript und die jeweilige Audiodatei verknüpft, sowie eine optionale Sprechererkennung implementiert.