Alibaba veröffentlicht Video-KI-Modelle als Open Source

Alibaba Cloud veröffentlicht vier Video-KI-Modelle als Open-Source. Wan2.1 soll es mit den Großen aus den USA aufnehmen können.

vorlesen Druckansicht 7 Kommentare lesen
Screenshot aus einem Beispielvideo der Video-KI Wan2.1

Screenshot aus einem Beispielvideo der Video-KI Wan2.1

(Bild: Alibaba)

Lesezeit: 2 Min.
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Das chinesische Unternehmen Alibaba Cloud hat angekündigt, Open-Source-Versionen seiner videogenerierenden Künstlichen Intelligenz Wan2.1 zu veröffentlichen. Insgesamt geht es um vier Modelle, je zur Hälfte mit 14 und 1,3 Milliarden Parametern. Diese sollen hochwertige Bilder und Videos aus Text- und Bildeingaben erzeugen können.

Entwickler, Forscher und Unternehmen weltweit können die Modelle über die KI-Modell-Community Model Scope von Alibaba Cloud sowie auf der Plattform Hugging Face herunterladen und direkt einsetzen, teilte das Unternehmen mit. Wan2.1 führe die Bestenliste des Benchmarks VBench mit 82,22 Prozent Gesamtbewertung an und sei das einzige Open-Source-Modell unter den Top 5 der videogenerierenden KIs. Mit dem Text-zu-Video-Modell mit 1,3 Milliarden Parametern sei es auf einem Standard-Notebook möglich, in rund vier Minuten ein 5-Sekunden-Video in 480p-Auflösung zu erzeugen.

Wan2.1 ist das erste Videogenerierungsmodell, das Texteffekte sowohl in Chinesisch als auch in Englisch unterstützt. Es gilt zudem als besonders fortschrittlich bei der "Multi-Objekt-Interaktion" – die KI kann Videos erstellen, in denen mehrere Objekte oder Personen realistisch miteinander interagieren, was als technisch sehr anspruchsvoll gilt.

Die Veröffentlichung durch Alibaba folgt dem Beispiel der textgenerierenden KI DeepSeek, die ebenfalls aus China kommt. Deren Open-Source-Veröffentlichung und Leistungsfähigkeit hat vor allem in den USA viel Aufsehen erregt. Die jetzige Video-KI-Veröffentlichung dürfte den Wettbewerb mit den US-amerikanischen KI-Entwicklungsschmieden ebenfalls weiter anheizen. So tritt Wan2.1 in einem Umfeld an, wo bislang vor allem geschlossene und teure Modelle dominieren.

Videos by heise

Alibaba plant außerdem Investitionen in Höhe von rund 52 Milliarden US-Dollar. Diese sollen in Cloud-Computing und KI-Infrastruktur fließen. Das chinesische Technologieunternehmen ist für sein erstes Open-Source-Modell Qwen (Qwen-7B) bekannt. Zudem ist Alibaba lokaler Partner von Apple in China, um dort die Einführung der Apple Intelligence zu ermöglichen.

(mki)