Eleven Labs und Spotify: KI-vertonte Bücher fürs Streaming
Eleven Labs veröffentlicht eine Reader-App für die Vertonung und zum Streamen von Inhalten. Auch Spotify ist an Bord.
(Bild: Andrey Suslov/Shutterstock.com)
Eleven Labs hat den Eleven Reader vorgestellt. Eine App, über die man Bücher veröffentlichen kann, Bücher und Inhalte, die dann in der App mittels KI-Stimme vorgetragen werden. Ab sofort können alle Menschen und Inhalteersteller auf den Dienst zugreifen. Die KI-vertonten Inhalte werden zudem von Spotify zugelassen. Dazu kooperieren die beiden Unternehmen seit Kurzem.
Die Idee dahinter sei, schreibt Eleven Labs in einem Blogbeitrag, die Vertonung von Büchern leistbarer zu machen. Dies sei bisher nämlich recht teuer gewesen, sodass nur etwa 5 Prozent aller Bücher als Audio-Version verfügbar sind. Erste Autoren konnten bereits die App nutzen, um ihre Inhalte dort vertonen zu lassen sowie für Hörer abrufbar zu machen. Nun darf das jeder. Es gibt allerdings eine Warteliste.
Videos by heise
Noch scheint die Vertonung zudem kostenlos zu sein. In Zukunft werde sie jedoch kostenpflichtig, zumindest schreibt TechCrunch von 11 bis 330 US-Dollar im Monat, die Verlage zahlen könnten – was günstiger sei als ein Studio zu mieten und Sprecher zu buchen.
Eleven Labs zahlt für Hörer
Die Autoren werden nicht für die Bereitstellung ihrer Inhalte in der App bezahlt, sie bekommen eine Vergütung, sobald Nutzer mit ihren Inhalten interagieren. Gemeint ist damit freilich, wenn die Inhalte gehört werden. Bei einer Hörzeit von elf Minuten sollen die Autoren 1,10 US-Dollar bekommen. In einer Testphase habe man festgestellt, dass Menschen im Durchschnitt 19 Minuten mit einem Audiobuch verbringen. Auch wenn die Vergütung gering klingt, sagt Eleven Labs, es sei die beste in der Branche. Zunächst gibt es sie aber auch nur für englischsprachige Bücher von Autoren aus den USA. Hörer haben die Möglichkeit, sich eine Stimme auszusuchen – sofern der Autor das zulässt.
Eleven Labs ist auf Stimmen-KI spezialisiert. Das Unternehmen bietet etwa sprechende KI-Agenten an – beziehungsweise die Möglichkeit, anderen KI-Agenten eine Stimme zu geben. Die Software lässt sich in bestehende Systeme integrieren. Man kann Sprachaufnahmen für allerlei Bedürfnisse erstellen und diese in verschiedene Sprachen umwandeln.
(emw)