Eleven Labs: Stimmen nachahmen mit perfekter Betonung

Die KI-Tools von Eleven Labs klonen echte Stimmen verblĂĽffend gut. Mit einer neuen Funktion erreichen Sie sogar die ideale Intonation.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen

(Bild: LightField Studios, fizkes – Shutterstock)

Lesezeit: 15 Min.
Inhaltsverzeichnis

KI-Tools können echte Stimmen bereits erstaunlich gut imitieren. Die Branchengröße Eleven Labs etwa benötigt nur eine rund einminütige Stimmaufnahme, um einen Klon zu erstellen, der dem Original beim Vorlesen von Text (Text to Speech) sehr nahekommt. Einzig die Betonung klang bislang etwas hölzern, doch auch dieses Problem gehört dank eines neuen Features der Vergangenheit an. Nach dem Training der Stimme sprechen Sie die Zeilen neuerdings einfach selbst in das Mikrofon – und zwar genau so betont, wie Sie es sich wünschen.

Bei der Umwandlung behält die KI Sprachmelodie, Rhythmus und phonetische Feinheiten bei, um sie auch mit der geklonten Stimme wiederzugeben. Nach ein paar Sekunden Rechenzeit klingt das Resultat fast so, als würde der Besitzer der Originalstimme sprechen. Es scheint, als würde man sich eine fremde Stimme “anziehen”, um mit ihr Podcasts, Radiosendungen, Hörbücher oder Video-Tonspuren aufzunehmen.

Mehr zum Thema KĂĽnstliche Intelligenz (KI)

In diesem Ratgeber erläutern wir die notwendigen Funktionen, Abomodelle und Tricks, um dem Stimmvorbild möglichst nahezukommen. Eine wichtige Voraussetzung für das Klonen einer Stimme ist natürlich, dass man auch die Rechte daran besitzt, statt den nächstbesten Synchronsprecher zu klonen.

Das war die Leseprobe unseres heise-Plus-Artikels "Eleven Labs: Stimmen nachahmen mit perfekter Betonung". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.