Sora 2: OpenAIs neue Video-KI kommt mit Ton und eigener Social-App
OpenAI stellt Sora 2 vor: Die Video-KI erzeugt nun synchronisierten Ton und wird über eine neue iOS-Social-App vertrieben, die auf Interaktion setzt.
(Bild: OpenAI)
OpenAI hat eine überarbeitete Version seines Text-zu-Video-Modells Sora veröffentlicht. Sora 2 soll im Vergleich zum im Februar 2024 vorgestellten Vorgänger Sora eine verbesserte physikalische Genauigkeit und eine höhere fotorealistische Qualität aufweisen. Die wesentlichste Neuerung ist jedoch die Fähigkeit des Systems, Videos mit synchronisierten Dialogen, Soundeffekten und Hintergrundgeräuschen zu generieren.
Während frühere Modelle die Realität mitunter verformten, um einen Prompt zu erfüllen, verspricht Sora 2 konsistentere Ergebnisse. Als Beispiel nennt OpenAI einen Basketballwurf: Anstatt dass ein verfehlter Ball zum Korb teleportiert, soll er nun physikalisch korrekt vom Brett abprallen. Auch die Steuerbarkeit und die technischen Möglichkeiten wurden erweitert. Die Auflösung scheint jedoch weiterhin auf 1920 × 1080 Pixel begrenzt zu sein – zumindest sind alle Beispiele auf der Webseite in höchstens 1080p –, auch wenn in einem Beispielprompt die Auflösung 4K vorgegeben wird. Andere Videogeneratoren wie Veo3 unterstützen auch 4K-Auflösungen.
Eine offizielle Obergrenze für die Videolänge nennt OpenAI für Sora 2 nicht, die veröffentlichten Prompts spezifizieren Längen von fünf bis zehn Sekunden. Wie detailliert die Anweisungen sein können, zeigt OpenAI am Beispiel eines Drachenvideos. Der zugehörige Prompt definiert nicht nur die Szene, sondern auch Kameratyp ("large-format digital sensor emulation"), Objektiv (50mm sphärisch), Filterung ("Black Pro-Mist 1/8"), Farbpalette ("Stahlblauer Gletscher", "warmer Bernsteinrand am Drachen") und die exakte Geräuschkulisse ("Donner der Flügelmembran bei jedem Abschwung", "entfernter Kalbungsboom des Gletschers").
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externes Video (TargetVideo GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (TargetVideo GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Social-App für iOS
Parallel zur Vorstellung des Modells führt OpenAI eine neue iOS-App namens "Sora" ein. Diese ermöglicht es Nutzern, Videos zu erstellen, die Inhalte anderer zu remixen und sich über einen Feed auszutauschen. Eine zentrale Funktion der App ist "Cameos". Damit können Nutzer nach einer einmaligen Aufnahme von Video und Audio ihr eigenes Abbild in von Sora generierte Szenen integrieren.
OpenAI adressiert nach eigenen Angaben die mit der Technologie verbundenen Risiken wie Desinformation und Suchtpotenzial. Der Feed der Sora-App soll auf Kreativität anstatt auf Verweildauer optimiert sein. Nutzer sollen den Empfehlungsalgorithmus über natürlichsprachliche Anweisungen steuern können.
Für Jugendliche sind standardmäßig tägliche Nutzungslimits und eingeschränkte Berechtigungen für die "Cameos"-Funktion vorgesehen. Über die ChatGPT-Kindersicherung können Eltern zudem die Personalisierung des Feeds deaktivieren. Nutzer behalten laut OpenAI die Kontrolle über ihr mittels "Cameo" erstelltes Abbild und können den Zugriff darauf jederzeit widerrufen. Die Generierung von schädlichen, gewalttätigen oder nicht jugendfreien Inhalten soll durch Filter und Moderation unterbunden werden.
Die Sora-App wird zunächst in den USA und Kanada über ein Einladungssystem eingeführt. Nach Erhalt einer Einladung ist der Zugriff auch über die Webseite sora.com möglich. Die Nutzung von Sora 2 soll zu Beginn kostenlos sein. Abonnenten von ChatGPT Pro erhalten Zugang zu einem als "Sora 2 Pro" bezeichneten, höherwertigen Modell. Eine API für Entwickler ist ebenfalls geplant. Als mögliches zukünftiges Geschäftsmodell stellt OpenAI in Aussicht, dass Nutzer für zusätzliche Rechenkapazitäten bezahlen können. Das Vorgängermodell Sora 1 Turbo bleibt weiterhin verfügbar.
(vza)