KÜNSTLICHE INTELLIGENZ
Text rein, Video raus
Den Inhalt von Bildern und Videos beschreiben können KI-Programme schon länger. Nun beschritten Yitong Li und seine Kollegen von der Duke University in Durham den umgekehrten Weg: Ihre Algorithmen erzeugten aus einfachen, bewusst unrealistischen Texteingaben wie „Golfen auf Wasser“ oder „Schwimmen im Schnee“ Videos.
Ausgangspunkt war eine Datenbank von YouTube-Clips, verschlagwortet nach Sportarten wie Golf, Kitesurfen oder Schwimmen sowie nach der Umgebung wie Gras, Meer oder Schwimmbad. Daraus lernten die Algorithmen, den gewünschten Sport mit einem beliebigen Hintergrund zu kombinieren und daraus ein Video zu generieren. Diese Filmschnipsel sind bisher zwar nur eine Sekunde lang, haben nur 32 Frames und eine Auflösung von 64 mal 64 Pixeln. Li und Kollegen wollen den Videogenerator aber um zahlreiche menschliche Bewegungsabläufe erweitern und die Auflösung erhöhen.
Anwendungen erwarten sie beispielsweise in der Filmindustrie. Dort könnten die Algorithmen direkt aus dem Drehbuch heraus, ohne Probeaufnahmen oder aufwendige Animationen, eine erste Vorab-Visualisierung erzeugen. Eine weitere Einsatzmöglichkeit wäre die Darstellung von Zeugenaussagen bei Unfällen. JAN OLIVER LÖFKEN