Synthesia: Besuch in der Fabrik der niesenden Avatare

Von London aus versucht ein Start-up, den Markt mit KI-Videos aufzurollen. Wie kann sichergestellt werden, dass dies nicht für Deepfakes missbraucht wird?

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Synthesia-Avatar mit Händen, platziert in London

Synthesia-Avatar mit Händen, platziert in London.

(Bild: Synthesia)

Lesezeit: 8 Min.
Inhaltsverzeichnis

Das Start-up ist in London hervorragend gelegen. Man geht von der brandneuen Elizabeth-Line-Station Tottenham Court Road die Einkaufsstraße Oxford Street runter, biegt in eine Seitengasse auf einen hübschen Platz ein und erreicht dann das Kent-House, in dem ansonsten ein paar Investmentfirmen und ein Human-Resources-Unternehmen sitzen. Hier hat sich Synthesia angesiedelt, eine Firma, die, wenn es nach ihren Managern und Geldgebern geht, den Videomarkt aufrollen soll.

Statt menschlicher Moderatoren, Experten oder Seminarleiter werden Avatare auf Plattformen wie YouTube, auf Firmenwebseiten, im Intranet und auf Angeboten von Bildungseinrichtungen zu sehen sein, die wie echte Menschen aussehen und auch so sprechen. Man wolle damit Video-Profis nicht das Geschäft vermiesen, sagt Alexandru Voica, der Corporate-Affairs-Manager, der heise online freundlich begrüßt. Stattdessen gehe es darum, Inhalte zu unterhaltsamen Filmen zu machen, die sonst in Textform auf den Servern versauern. Voica, der aus Rumänien stammt, Informatik studiert und zuvor bei Meta gearbeitet hat, ist nicht unskeptisch in Sachen Künstliche Intelligenz. Überoptimismus liegt ihm fern. Dennoch sieht er, wohin die Reise geht.

Synthesia hat neben seinen aktuell britischen auch dänische und deutsche Wurzeln. Der Chef und Co-Gründer Victor Riparbelli stammt aus Dänemark, sein Co-Gründer Matthias Niessner hat noch immer eine Professur für Visual Computing an der TU München. Weitere Mitarbeiter und frühe Kollegen kommen von den Universitäten Cambridge, Stanford und University College London. "Unsere Mission ist es, jeden zu ermächtigen, Videoinhalte zu machen – ohne Kameras, Mikrofone oder ein Studio", lautet das Firmenmotto. Man wolle den Prozess der Content-Kreation "radikal verändern".

In der Praxis heißt dies, dass die Avatare von Synthesia nun (relativ gut) niesen können. Elf neue "expressive Avatare" hat das Start-up zuletzt online gebracht. Sie werden über ein Webinterface mit Textmaterial bestückt. Das Geschäft basiert auf dem Ansatz "Avatar as a Service": Einsteiger können kostenlos Inhalte bis zu 36 Minuten im Jahr generieren, für 20 oder 59 Euro im Monat gibt es 120 respektive 360 Minuten. Alles darüber hinaus muss man über den Firmenvertrieb regeln, dann sind Branding, unendlich viele Minuten und eine unbegrenzte Anzahl an Avataren drin.

Der Synthesia-Chef spricht als Avatar zu seinen Mitarbeitern.

(Bild: Synthesia)

Das, was Synthesia in den ersten Jahren nach der Gründung 2017 anbot, wirkte zunächst noch recht starr. Die Basis der Avatare waren stets echte Menschen; das Unternehmen hat sich bestimmte Verfahren wie Loops der Gesichtszüge patentieren lassen. Nach und nach – und insbesondere mit Einführung der jüngsten Software-Variante, die Synthesia Software 2.0 nennt – wurde es besser. Die Avatare wirken täuschend echt – zumindest, wenn man nicht genau hinsieht. Bis zu 95 Prozent der Zeit für die Videoproduktion soll sich einsparen lassen. Die Idee ist, dass Firmen selbst ihr Lern- und Marketingmaterial produzieren können, ohne dafür aufwendige Videostudios engagieren zu müssen.