Videoschnipsel aus Textvorgabe: Meta stellt KI-Videogenerator "Make-A-Video" vor

Nach den KI-Bildgeneratoren könnten KI-Videogeneratoren kommen. Einen hat Meta AI nun vorgestellt, die Ergebnisse sind teils ziemlich irritierend.

2

30.09.2022, 10:31 Uhr

Lesezeit: 2 Min.

Von

Martin Holland

"Junges Pärchen, das in heftigem Regen läuft"

(Bild: Meta AI)

Der US-Konzern Meta hat mit "Make-A-Video" ein KI-Werkzeug vorgestellt, das aus Textvorgaben kurze Videosequenzen erzeugen können soll. Der KI-Videogenerator erschafft offenbar bislang nur kurze Videosequenzen, er basiert auf den jüngsten Fortschritten bei KI-Bildgeneratoren. Die Technik habe das Potenzial, Künstlern und Künstlerinnen neue Möglichkeiten zu eröffnen, versichert Meta. Trainiert wurde die Software nicht mit Videodaten und zugehörigen Beschreibungen, sondern von verschlagworteten Bildern und Videos. Einzelheiten zur Technik hat das verantwortliche Team in einer Forschungsarbeit zusammengetragen. Bislang ist der Generator nicht öffentlich verfügbar, ein Zugang kann aber beantragt werden.

Von Bildern und Videos gelernt

"Verwirrter Grizzly im Matheunterricht"

(Bild: Meta AI)

Nach den großen Fortschritten von KI-Bildgeneratoren, um die sich zuletzt ein regelrechter Hype entwickelt hat, gelten KI-Videogeneratoren als nächste – wenn auch ungemein schwierigere – Stufe. So basieren KI-Bildgeneratoren wie Midjourney, DALL·E und Stable Diffusion auf immens umfangreichem Trainingsmaterial aus Bildern mit Beschreibungen, die im Internet zusammengetragen werden. Bislang war davon ausgegangen worden, dass KI-Videogeneratoren analog dazu mit riesigen Mengen an gut beschriebenem Videomaterial trainiert werden müssen. Das KI-Team von Meta ist nun aber anders vorgegangen. Wie Meta AI erklärt, hat die KI anhand beschriebener Bilder "gelernt, wie die Welt aussieht". Wie sich die Welt bewegt, habe sie dann beim unüberwachten Betrachten von Videos gelernt.

Videos by heise

"Ein Ritter, der auf einem Pferd durch die Landschaft reitet."

(Bild: Meta AI)

Heraus kommen der Vorstellung zufolge bislang vor allem kurze Videoschleifen, die als GIFs gezeigt werden. Auf den ersten Blick sehen einige der Videoschnipsel durchaus beeindruckend aus, aber sobald man genauer hinsieht werden kleine und größere Fehler deutlich. Vor allem die Augen von Lebewesen scheinen noch ein Problem zu sein, aber auch Bewegungen wie etwa natürliches Laufen. Laut Meta AI kann "Make-A-Video" aus einer geschriebenen Beschreibung kurze Videos erstellen, oder Fotos zum Leben erwecken. Außerdem kann das Werkzeug aufbauend auf einem Videoschnipsel neue erstellen. Wie gut das wirklich funktioniert, lässt sich ohne Zugang zu dem Werkzeug aber noch nicht weiter bewerten.