FFmpeg 8.0 integriert Whisper: Lokale Audio-Transkription ohne Cloud
Die kommende Version 8.0 von FFmpeg erhält optional Whisper. OpenAIs KI-Transkription werden sich flexibel einsetzen lassen.
(Bild: whiteMocca/Shutterstock.com)
FFmpeg, das weitverbreitete Multimedia-Framework, integriert Whisper: Mit der neuen Funktion können Nutzer ihre Audioinhalte direkt innerhalb von FFmpeg automatisch transkribieren. Das auf maschinellem Lernen basierende Spracherkennungssystem stammt von OpenAI. Die Neuerung ist Teil von FFmpeg 8.0, das in den kommenden Wochen freigegeben werden soll.
Der neue Whisper-Filter in FFmpeg arbeitet lokal, überträgt also keine Inhalte in die Cloud. Voraussetzung ist die whisper.cpp-Library, anschließend aktiviert ein --enable-whisper das Feature. Standardmäßig erkennt die Software die Sprache automatisch, Whisper kann Audioaufzeichnungen in über 90 Sprachen transkribieren. Im Zweifel lässt sich aber eine Sprache vorgeben; dasselbe gilt für den Einsatz einer GPU, der im Default aktiviert ist.
Auf Wunsch kann der neue Filter auch SRT-Dateien fĂĽr Videos erstellen oder fĂĽr Live-Ăśbertragungen den Ton transkribieren. Ferner lassen sich die per Whisper ĂĽbertragenen Informationen in FFmpeg weiterverwenden oder in einem automatisierten Workflow an andere Anwendungen weiterreichen. Bislang mussten Nutzer und Entwickler fĂĽr solche Funktionen auf mehrere Tools zurĂĽckgreifen, was die Integration erschwerte.
Videos by heise
FFmpeg erscheint als Open-Source-Software; dasselbe gilt fĂĽr Whisper. Ein erster Einblick in die Integration findet sich hier.
Siehe auch:
- FFmpeg: Download schnell und sicher von heise.de
(fo)