Angriff der Klonstimmen: Eleven Labs KI im Video-Test

Seite 2: Transkript des Videos

Inhaltsverzeichnis

Herzlich willkommen! *Kichern* Pardon. Herzlich willkommen! Heute testen wir Robostimmen.

Dafür haben wir die Stimmen von meinen Kollegen Sophia, Gregor und mir geklont, um realgetreu betonte Texte für einen Podcast einzusprechen. Damit geht's jetzt los.

KI-Tools können echte Stimmen schon erstaunlich gut nachahmen. Modelle von ElevenLabs z.B. analysieren Klang und charakteristische Eigenheiten einer Stimme, um davon einen Klon zu erstellen.

Weil das beim Vorlesen von getippten Text aber noch etwas hölzern klingt, ermöglicht das neue Speech-to-Speech-Feature eine bessere Betonung. Wenn Sophia z.B. im Urlaub einen Podcast nicht aufnehmen kann, könnte Gregor einfach ihre Klonstimme auswählen und selbst eine aktuelle Folge einsprechen.

Voraussetzung für die Speech-to-Speech-Funktion mit einer Klonstimme ist ein ElevenLabAbo ab einem Euro. Um unsere Stimmen zu klonen, sprechen wir zuerst etwa eine Minute Text ein und starten dann die Analyse.

Einen Augenblick später ist die Klonstimme fertig und jemand anderes kann damit Texte einsprechen. Geht das wirklich so schnell? Ja, das geht wirklich so schnell. Entweder klickt man direkt auf Record Audio und spricht ins Mikro oder man nimmt den Audioschnipsel mit einem Programm wie Audacity auf und lädt ihn danach hoch.

Die Aufnahme verwandelt sich nicht sofort in die Klonstimme, aber kurze Schnipsel sind oft schon nach wenigen Sekunden fertig. Jetzt habe ich mir Sophia und Gregor dazu geholt.

Du sprichst ja manchmal kurz informiert ein. Wir versuchen da einfach mal uns gegenseitig zu vertreten.

So, dann bin ich jetzt mal das Original. Kurz informiert by Heise Online mit Sophia Zimmermann. Am heutigen Dienstag beginnt das womöglich letzte britische Gerichtsverfahren über die Auslieferung des Australiers Julien Assange an die USA.

Ich bin Gregor und ich bin heute die erste Fälschung. Kurz informiert by Heise Online mit Sophia Zimmermann. Am heutigen Dienstag beginnt das womöglich letzte britische Gerichtsverfahren über die Auslieferung des Australiers Julien Assange an die USA.

Okay, und ich bin die zweite Fälschung. Kurz informiert bei Heise Online mit Sophia Zimmermann. Am heutigen Dienstag beginnt das womöglich letzte britische Gerichtsverfahren über die Auslieferung des Australiers Julien Assange an die USA.

Wie so oft beim Einsatz von künstlicher Intelligenz bergen auch die Tools von ElevenLab Gefahren. Eine wichtige Voraussetzung für das Klonen einer Stimme ist, dass man auch die Rechte daran besitzt, statt den nächstenbesten Synchronsprecher zu klonen.

Und natürlich, dass man die Technik nicht für illegale Zwecke missbraucht. Stichwort Enkeltrick. Wir empfehlen auch ältere Verwandte und Bekannte darauf hinzuweisen, wie täuschend echt sich Stimmen mittlerweile nachahmen lassen.

Mit ElevenLab geht das sogar schon in 29 Sprachen. Beim Wechsel von einer Sprache in einer anderen machen sich allerdings verräterische Fehler bemerkbar.

Ein deutscher Akzent zum Beispiel bleibt auch dann hörbar, wenn man die Klonstimme eines englischen Muttersprachlers benutzt.

Die Speech-to-Speech-Funktion übernimmt schließlich auch feinste Betonungen. Mehr Tipps zum Feintuning gibt es übrigens in unserem Ratgeber zum Thema auf heise plus.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

(xkr)