MacWhisper: Lokale Audiotranskription unterscheidet Sprecher
Zu den auf dem Mac beliebtesten Apps zur Erfassung von Konversationen zählt MacWhisper. Mittels lokaler KI kann es nun auch Personen auseinanderhalten.
MacWhisper mit Speaker Detection: Lange gehegter Wunsch.
(Bild: Jordi Bruin)
Software zum Transkribieren von Gesprächen, Videocalls und Interviews kam in den vergangenen Jahren deutlich voran. Eine Neuerung ist, dass dies auch lokal auf dem Rechner möglich ist – dank quelloffener Modelle unter anderem von OpenAI. Die auf dem Mac dafür wohl beliebteste Software nennt sich MacWhisper und stammt vom niederländischen Entwickler Jordi Bruin. Der hat nun seinen Nutzern einen lange erwarteten Feature-Wunsch erfüllt: Endlich ist es möglich, automatisch zwischen Sprechern zu unterscheiden. Das Feature ist seit Version 12.0.1 verfügbar, die diesen Monat erschienen ist.
Wer spricht gerade?
"Wenn Sie jetzt ein Interview, eine Besprechung oder ein Gespräch transkribieren, erkennt MacWhisper automatisch verschiedene Sprecher, gruppiert ihre Aussagen und beschriftet sie – so werden Ihre Transkripte übersichtlicher und sind einfacher zu navigieren", schreibt Bruin dazu im Beipackzettel. Die Funktion hatte zu den nachgefragtesten Features innerhalb der Nutzerschaft gezählt. An der Tatsache, dass die Transkribierung weiterhin auf dem eigenen Mac läuft, Daten also nicht (etwa zum Training) in der Cloud landen, ändert sich nichts.
Videos by heise
"Die gesamte Verarbeitung passiert privat auf Ihrem Mac, es wird nichts an einen Server geschickt und es arbeitet auch offline." Umgesetzt wurde dies in Zusammenarbeit mit ArgMax und dessen Modellen WhisperKit Pro und SpeakerKit. Entsprechend muss man diese auch auswählen. Möglich ist weiterhin, vorab eine Sprache zu selektieren oder diese automatisch erkennen zu lassen. In der Praxis funktioniert das insbesondere dann gut, wenn die Konversation nur eine Sprache verwendet. Gibt es gleich mehrere, kommt manchmal noch Wortsalat heraus.
Auch Server-Modelle verfĂĽgbar
Die Sprechererkennung ist Teil von MacWhisper Pro, ist also nicht gratis nutzbar – für die Freischaltung werden nicht ganz günstige 59 Euro fällig. Dafür gibt es zusätzlich auch noch eine Text- und Grammatikkorrektur über Server-Modelle, Batch-Transkribierung und die Unterstützung für Distilled-Modelle. Die Pro-Version kann zudem YouTube-Videos transkribieren und unterstützt diverse weitere Cloud-Modelle von OpenAI, Anthropic, X.ai und via Ollama. Eine Feature-Übersicht findet sich hier. Bruin gibt Studenten, Non-Profits sowie Journalisten 30 Prozent Rabatt, wenn sich diese per E-Mail bei ihm melden. Zuletzt kam auch noch Unterstützung für ElevenLabs Scribe und Deepgram Nova hinzu.
MacWhisper beherrscht über 100 Sprachen. Die App kann zudem Audio von diversen Mac-Apps direkt erfassen, so dass man nichts umständlich abspeichern muss. Hardware-Voraussetzung ist ein Mac mit M-Chip, also Apple Silicon. Im Preis sind Updates integriert, ein Abo gibt es nicht.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Preisvergleich (heise Preisvergleich) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (heise Preisvergleich) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
(bsc)