Happy Horse: Alibabas geheimes KI-Videomodell stürmt die Benchmarks

Das KI-Modell Happy Horse sorgt für Aufsehen: Es generiert Videos mit synchronem Ton und schlägt die Konkurrenz. Nun wurde enthüllt, wer wohl dahintersteckt.

vorlesen Druckansicht 1 Kommentar lesen
Beispiele für Videos, die mit Happy Horse generiert wurden

Beispiele für Videos, die mit Happy Horse generiert wurden

(Bild: HappyHorse)

Lesezeit: 3 Min.

Im Wettlauf um die beste Video-KI macht ein neuer Name von sich reden: Happy Horse ist aus dem Stand an die Spitze verschiedener Benchmarks gesprungen. Dabei hat es auch Seedance 2.0 überholt, das Modell von TikTok-Herausgeber ByteDance. In einem Medienbericht wird jetzt behauptet, wer tatsächlich dahintersteckt: der chinesische Internetkonzern Alibaba.

Auf der Internetseite von Happy Horse, auf der Interessierte das Modell ausprobieren können, gibt es keinen Aufschluss darüber, von wem das Open-Source-KI-Modell ausgeht. Mit Happy Horse 1.0 können Videos mit 1080p-Auflösung und synchronem Audio erzeugt werden. Es gilt als eines der ersten Open-Weight-Modelle, das nativ Dialog, Umgebungsgeräusche und Effekte in einem Video generiert. Wie sich andere KI-Videogeneratoren mit und ohne Tonspur schlagen, zeigt ein aktueller Vergleich. Happy Horse vermeidet dabei den bei anderen Modellen mehrstufigen Prozess, in dem erst das stille Video, dann die Vertonung und anschließend die Lippensynchronisation erzeugt wird. Neben Englisch, Mandarin, Kantonesisch, Japanisch und Koreanisch werden auch Deutsch und Französisch als Sprachen unterstützt.

Das US-Technikmagazin The Information will jetzt die Alibaba Group als Urheber ermittelt haben und stützt sich dabei auf namentlich nicht genannte Quellen. Die Cloud-Computing-Abteilung des Internetkonzerns bereite aktuell die Veröffentlichung für Unternehmenskunden vor, heißt es in dem Bericht weiter.

Videos by heise

Die Veröffentlichung als Happy Horse folge einem in KI-Kreisen inzwischen üblichen Muster der Bekanntmachung. Modelle werden dabei zunächst als „Mystery Model“ mit unbekannter Herkunft veröffentlicht. Erst kürzlich nutzte auch der Hersteller Xiaomi dieses Vorgehen, als dessen KI-Modell MiMo-V2 unter dem Pseudonym Hunter Alpha für Aufsehen sorgte. Im besten Falle erzeugen sie wegen ihrer Leistungsfähigkeit große Aufmerksamkeit, wie es auch bei Happy Horse der Fall ist. Ab einem bestimmten Zeitpunkt wird dann offenbart, wer wirklich dahintersteckt. Gerade chinesische KI-Modelle erhoffen sich davon offenbar einen größeren PR-Effekt, als wenn sie die Modelle selbst zunächst vorstellen.

Nachdem OpenAI vor kurzem bekanntgegeben hat, dass es seine Video-KI Sora völlig überraschend einstellt, preschen die chinesischen Anbieter mit ihren Modellen immer weiter vor. Der KI-Videogenerator Seedance 2.0 von ByteDance, der im Februar veröffentlicht wurde, galt bereits als herausragend, weil er hyperrealistische Videos generiert, die allerdings auch rasch Hollywood-Studios wegen mutmaßlicher Urheberrechtsverstöße auf den Plan riefen.

Inzwischen hat ByteDance seinem Modell Seedance 2.0 Grenzen gesetzt, um geschützte Charaktere zu blockieren. Das, was von Happy Horse bislang zu sehen war, ist ähnlich, wenn nicht sogar noch bemerkenswerter. Verglichen mit den Ergebnissen der ersten Sora-Version von Februar 2024, die damals viel Aufmerksamkeit erregte, sind die Erzeugnisse für den Laien vielfach nicht mehr als KI-Videos zu identifizieren – ein Problem, das Nutzer von sozialen Medien zunehmend im Alltag erleben.

(mki)