Videoproduktion mit künstlicher Intelligenz umsetzen

Bilder, Texte und Musik – gibt es alles bereits KI-generiert. Aber wie steht es mit Videos? Wir haben ausprobiert, wie KI die Videoproduktion unterstützt.

Artikel verschenken

1

(Bild: KI Midjourney | Bearbeitung: c't)

20.03.2023, 15:30 Uhr

Lesezeit: 16 Min.

c't Magazin

Von

Immo Junghärtchen

Videoproduktion mit künstlicher Intelligenz umsetzen
Video als Bausatz
Sprecher simulieren
Schnitt mit Texteditor
Trickkiste
Fazit
Exkurs: Große Worte, wenig Bewegung

Artikel in c't 8/2023 lesen

Videoproduzenten kommen schnell ins Schleudern ob der vielen unterschiedlichen Disziplinen, die sie meistern müssen, bevor der vollendete Film bereit ist fürs Publikum: Filmmaterial sichten und arrangieren, dazu eine passend eingetaktete Tonspur aufnehmen. Zum Schluss möchten Untertitel das Werk untermalen, ebenfalls synchron. Beim Abarbeiten der langen To-Di-Liste fragt sich der gestresste Filmer: Ist unter den vielen künstlichen Intelligenzen auch eine für mich dabei?

Um es gleich vorweg zu nehmen: KIs können aktuell keine durchgehenden Videoinhalte aus reinem Text produzieren. Kurze Szenen gelingen – allerdings muss man auch selbst viel Zeit aufwenden, um sie zu generieren. Die KIs verdingen sich dabei noch eher als Assistenten: Sie helfen beim Durchforsten von Musteraufnahmen (Stock Videography), simulieren authentische Sprecherpersönlichkeiten und analysieren gesprochene Inhalte, um synchrone Untertitel zu erzeugen.

In unserem Experiment haben wir versucht, zu einem bereits existierenden Text einen passenden Videoclip zu drehen und dabei möglichst viel Arbeit den KIs aufzuhalsen. Als Grundlage wählten wir den gemeinfreien Klassiker "Auf zwei Planeten" von Kurd Laßwitz. Das 1897 erstmalig veröffentlichte Buch gilt als einer der ersten Science-Fiction-Romane. Es beginnt mit einer Arktisdurchquerung dreier Männer in einem Hightech-Heißluftballon – also perfekter Stoff für spannende Filmszenen. Unser Ausgangsmaterial besteht lediglich aus einer Textdatei sowie einer gut zehnminütigen Hörbuch-Einsprechfassung davon, die wir in Audacity aufgezeichnet haben. Damit existiert eine definierte Zeitleiste, also die Länge des Projekts und darauf verteilte (akustische) Inhalte. Am Ende soll ein Video im Querformat herauskommen (16:9), das zum Text passt.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Darstellung eines rollenbasierten Zugriffskonzept verschiedener Nutzer auf eine Datenbank.

FastAPI: So härten Sie Ihre REST-Schnittstelle gegen unbefugte Zugriffe ab

REST-Schnittstellen im Netz brauchen ein Zugriffskonzept. So gelingt ihre Absicherung inklusive Rollenmodell zur Rechtevergabe auf Basis von FastAPI in Python.

Lego Smart Play: Patentanträge und FCC-Dokumente enthüllen Technik

Lego packt eine Elektronik-Plattform mit 3D-Magnettracking, Multi-Radio-Funk und induktivem Laden in einen Klemmbaustein. Patente zeigen, wie es funktioniert.

Ecotank ET-3950: Multifunktionaler Tintentankdrucker im Test

Epsons aktueller Ecotank ET-3950 druckt, scannt und kopiert sogar beidseitig. Die Tintenkosten sind dank nachfüllbarer Tanks extrem gering.

Probleme lösen mit dem c’t-Notfall-Windows 2026

Passwort vergessen? Bootloader defekt? Daten verloren? Mit unserem Notfallsystem bekommen Sie Windows-Probleme Schritt für Schritt wieder in den Griff.

Heimkinoanlagen mit c’t-Messsignalen in Dolby Atmos optimieren

Eine Einmessautomatik liefert bei einer Dolby-Atmos-Anlage lediglich eine gute Ausgangsbasis. Unsere Messsignale helfen bei der manuellen Feinjustierung.

Analyse: Hat die EU die Updatepflicht für Smartphones verbockt?

Mit dem Ökodesign zwingt die EU Smartphonehersteller, mindestens fünf Jahre Updates zu liefern. Doch Motorola glaubt, ein Schlupfloch gefunden zu haben.