Stimmen-Kloner Elevenlabs ist über eine Milliarde Dollar wert

Synthetische Stimmen sind das Produkt der Algorithmen von Elevenlabs. Das Venture Capital fließt.​

In Pocket speichern vorlesen Druckansicht 4 Kommentare lesen

(Bild: Shutterstock/lapandr)

Lesezeit: 3 Min.

Der Stimmen-Kloner Elevenlabs ist mehr als eine Milliarde US-Dollar wert, zumindest bestimmten Wagniskapitalgebern. Sie haben für 80 Millionen US-Dollar Anteile an dem Unternehmen gekauft; rechnet man diese Investition auf alle Anteile hoch, kommt man auf über eine Milliarde Dollar. Letzten Juni lag die Bewertung noch bei etwa 100 Millionen Dollar. Im Silicon Valley gelten Start-ups mit Milliardenbewertung als Unicorns, also Einhörner. Elevenlabs hat 40 Mitarbeiter.

Sie haben Software programmiert, die künstliche Stimmen erzeugt (Text-to-Speech) und dabei auch echte Stimmen nachmachen kann. Schon wenige Minuten Tonaufnahme reichen. Voriges Jahr nutzte der Journalist Joseph Cox Elevenlabs, um seine eigene Stimme zu klonen. Damit gelang es ihm tatsächlich, das Voice-ID-Verfahren seiner Bank zu überwinden. Nach einigen Versuchen hielt die Bank die künstliche Stimme für echt und gewährte Zugriff auf das Konto. Elevenlabs hat daraufhin Software programmiert, die Elevenlabs-Stimmen als solche erkennen soll.

Elevenlabs wurde 2022 von den beiden Polen Piotr Dabkowski und Mati Staniszewski gegründet. Dabkowski hat früher bei Google an maschinellem Lernen gearbeitet, Staniszewski kam von Palantir. Bislang hatten sie 21 Millionen Dollar Wagniskapital aufgenommen. Das frische Geld soll in Forschung, Infrastruktur, Entwicklung neuer Dienste sowie "Verbesserung von Sicherheitsmaßnahmen (fließen), um verantwortungsvolle und ethische Entwicklung von KI-Technik sicherzustellen". Dazu gehört ein Programm, das auch synthetische Stimmen anderer Anbieter erkennen soll.

Zu den Kunden des Unternehmens zählen Medienunternehmen, Computerspielefirmen und andere Unterhaltungsanbieter sowie Anbieter von Konversations-KI. Bereits bisher bot Elevenlabs automatisierte Synchronisation von Spielfilmen für 29 Sprachen an; dabei sollten die künstlichen Synchronstimmen möglichst der Stimme und Intonation des Originalschauspielers entsprechen. Neu im Angebot hat Elevenlabs das Dubbing Studio: Es bietet zusätzliche Funktionen, darunter das Redigieren der automatischen Übersetzungen.

Wenig Begeisterung löst die rasante Entwicklung der Stimmensynthese bei Synchronsprechern aus. Manche beschuldigen die Firma, ihre Stimmen ohne Erlaubnis geklont zu haben. Elevenlabs versucht, Synchronsprecher für seine Voice Library zu begeistern. Dort können Menschen synthetische Versionen ihrer eigenen Stimme feilbieten; lizenziert jemand diese Stimme, erhält der Mensch Guthaben, das er bei Elevenlabs ausgeben darf. Für je elf Buchstaben, die Elevenlabs in der Art des Menschen vorliest, darf der Mensch dann je einen Buchstaben von Elevenlabs vorlesen lassen.

Am Montag hat das Unternehmen zudem die Vorschau auf eine App für mobile Endgeräte vorgestellt; sie soll Text vorlesen, beispielsweise von Webseiten. Die ersten drei Monate soll die App gebührenfrei sein. Die aktuellen Wagniskapitalgeber sind den Angaben zufolge Andreessen Horowitz, Nat Friedman und Daniel Gross; kleinere Summen kamen von Sequoia Capital, SV Angel, Smash Capital, Broadlight Capital und Credo Ventures.

(ds)