Diffuse: Ex KI-Chef von Snap veröffentlicht KI-Videogenerator

Higgsfield AI hat Diffuse veröffentlicht. Eine Video-KI, für die man nur ein Selfie braucht, um sich in verschiedene bewegte Szenen zu bringen.

In Pocket speichern vorlesen Druckansicht
Beispiele von Diffuse

Beispiele von Diffuse

(Bild: Diffuse)

Lesezeit: 3 Min.

Ein Selfie und schwupps, so schnell lernt man, auf einem Longboard zu gehen. Das sieht beeindruckender aus, als es ist. Denn in Wahrheit handelt es sich um ein mit der KI Diffuse generiertes Video. Mit der App braucht es nur eines Selfies und schon kann man sich selbst in derlei bewegte Posen bringen. Möglich sind lustige Tänze, andere Sportarten und mehr.

Diffuse ist als App für iOS verfügbar, allerdings noch nicht in Deutschland. Dennoch ist die Entwicklung spannend. Nicht zuletzt, weil beispielsweise OpenAI seine Video-KI Sora noch unter Verschluss hält. Das Unternehmen, das Diffuse anbietet, heißt Higgsfield und ist von Alex Mashrabov, einem ehemaligen KI-Chef von Snap, gegründet worden. Snap hat früh einen eigenen KI-Chatbot integriert, auch für die Filter und Augmented-Reality-Effekte bei Snapchat wird freilich KI genutzt.

Die neue App basiert auf einem angepassten Text-zu-Video-Modell. Neben der Selfie-Option kann man auch Videos mit fiktiven Inhalten per Prompt erstellen. Dabei geht es jedoch eindeutig eher um den spaßigen und sozialen Faktor, nicht um professionelle Videos. Beispiel auf der Webseite ist etwa, dass man einem Freund ein Video von sich schickt, bei dem man freudige Bewegungen ausführt, die man vielleicht selbst vor der Kamera nicht so hinbekäme. Dennoch sind auch die Videos auf der Startseite von Higgsfield beeindruckend: Sehr realistisch wirkende Frauen lächeln in die Kamera, Autos fahren im Sand und ein Mann läuft mit Hasenkopf durch die Gegend.

"Wir sind ein Basismodell-Unternehmen, das Social-Media-Creation demokratisieren möchte", heißt es. Es gibt eine Warteliste für diejenigen, die einen besonders "leistungsfähigen und realistischen Modus" testen wollen. Mehr ist weder über das Modell noch geplante Bezahlversionen bekannt.

Auch Sora soll noch in diesem Jahr für die zahlende Allgemeinheit verfügbar gemacht werden, verriet CTO Mira Murati kürzlich in einem Interview. OpenAI sieht allerdings die Gefahr des großen Missbrauchspotenzials der Video-KI und sagt, sie deshalb noch unter Verschluss zu halten. Einige Videokünstler durften sie bereits testen. Die Videos haben nach wie vor die üblichen Artefakte und Ungenauigkeiten, die KI-Bildgeneratoren und nun eben auch Videogeneratoren produzieren. Das sieht man auch in den Beispielen von Diffuse ganz deutlich – da fahren Autos ineinander. Will man ein lustiges Video posten oder einem Freund schicken, stört das aber wahrscheinlich weniger, als wenn Filmschaffende damit kämpfen müssen.

(emw)