KI-Update kompakt: Lumiere, Microsofts SLMs, SAP, KI-Rezensionsprüfer

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Podcasts immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

25.01.2024, 15:40 Uhr

Lesezeit: 5 Min.

Von

Isabel Grünewald

Google präsentiert realistisches Text-zu-Video-Modell Lumiere

Google stellt Lumiere vor, ein neues Text-zu-Video-Diffusionsmodell, das realistische KI-Videos erzeugt und viele Probleme bisheriger Ansätze überwindet.

Lumiere wurde mit 30 Millionen Videoclips trainiert und basiert auf einer neuartigen Architektur. Im Gegensatz zu älteren Modellen, die lediglich einzelne Keyframes im zukünftigen Video generieren und fehlende Bilder dann über ein weiteres Modell dazurechnen, verarbeitet Lumiere direkt ganze Videos. Das wird durch zeitliches Down- und Upsampling ermöglicht, bei dem die Anzahl der Bilder pro Sekunde reduziert und anschließend wieder erhöht wird. Dadurch betrachtet das Modell die gesamte Videolänge, jedoch mit weniger Bildern pro Sekunde, und lernt so, Objekte und Szenen über die reduzierte Anzahl von Frames zu bewegen und verändern.

In einer Benutzerstudie übertraf Lumiere bestehende Text-zu-Video-Modelle wie Imagen Video, Pika, Stable Video Diffusion und Gen-2. Die veröffentlichten Beispiele und das dazugehörige Paper zeigen, dass Lumiere flüssigere und natürlichere Bewegungen erzeugt. Google hat bisher allerdings noch keine Demo, kein verfügbares Modell oder Produkt mit Lumiere bereitgestellt.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Podcasts immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Microsoft gründet GenAI-Team für kostengünstigere KI-Modelle

Microsoft hat ein neues GenAI-Team gegründet, um kosteneffiziente Small Language Models (SLMs) für Konversationen zu entwickeln. Ziel ist es, die Qualität großer Sprachmodelle wie OpenAIs GPT-4 zu erreichen, jedoch mit geringerem Ressourcenverbrauch.

SLMs sollen hauptsächlich bei einfachen Anfragen an Chatbots wie Bing und Windows Copilot zum Einsatz kommen. Das GenAI-Team wird von Corporate Vice President Misha Bilenko geleitet und berichtet an CTO Kevin Scott. Es setzt sich aus führenden KI-Entwicklern zusammen, darunter Sebastien Bubeck, der auch an Microsofts Mini-Modell Phi-2 beteiligt war.

Da die Skalierung von KI-Modellen kostspielig ist, möchte Microsoft die Kosten reduzieren, um sie Millionen von Kunden zugänglich zu machen. Neben kleineren Modellen plant das Unternehmen auch, durch den Einsatz eigener KI-Hardware Geld zu sparen. Ob die Pläne erfolgreich sind, hängt auch davon ab, welche Kunden Microsoft ansprechen möchte. Viele Early-Adopter von großen Sprachmodellen halten GPT-4 für gerade gut genug, um nützlich zu sein, und könnten weiterhin größere Modelle bevorzugen.

SAP setzt auf künstliche Intelligenz und Restrukturierung

Das Softwareunternehmen SAP konnte seine Ziele für das Geschäftsjahr 2023 erreichen und teilweise übertreffen. Nun plant das Unternehmen, vermehrt in strategische Wachstumsbereiche wie KI zu investieren. Ein massives Restrukturierungsprogramm begleitet diese Neuausrichtung, um die operative Organisation mithilfe von KI auf Effizienz und Gewinnsteigerung auszurichten. Dabei fallen etwa 8.000 Stellen weg.

Laut SAP versucht das Management, soziale Härten zu vermeiden, könne sie jedoch nicht ausschließen. Umschulungsmaßnahmen sollen einem Teil der Betroffenen eine Perspektive bieten, während Freiwilligenprogramme zum Abschied ermutigen. Da in den strategischen Wachstumsbereichen neue Stellen entstehen, soll die Gesamtzahl der Mitarbeitenden bis Ende 2024 auf dem derzeitigen Niveau von rund 107.600 Beschäftigten bleiben. Die Restrukturierungskosten werden auf etwa zwei Milliarden Euro geschätzt.

Firefox 122 integriert KI-gestützten Rezensionsprüfer

Mozilla hat die neueste Version des Webbrowsers Firefox 122 veröffentlicht, die neben Sicherheitsupdates auch KI-Funktionen zur Erkennung gefälschter Rezensionen auf Online-Verkaufsplattformen wie Amazon, Best Buy oder Walmart bietet. Die Integration erfolgt nach der letztjährigen Übernahme von FakeSpot, einem Unternehmen, das sich auf die Identifizierung gefälschter Bewertungen und Bereitstellung realistischerer Einschätzungen spezialisiert hat.

Videos by heise

In Firefox 122 können Nutzer den „Rezensionsprüfer“ aktivieren, indem sie „about:config“ in die Adressleiste eingeben und die Option „browser.shopping.experience2023.enabled“ auf „true“ setzen. Beim Besuch einer unterstützten Shopping-Seite erscheint der Assistent, der anbietet, die Rezensionen auf der Seite zu filtern. Der Filterprozess dauert bis zu 60 Sekunden und zeigt anschließend die Qualität der Rezensionen auf einer Skala von A bis F. Zudem berechnet die KI eine Sterne-Bewertung basierend auf den als echt eingestuften Rezensionen, um ein realistischeres Bild der Produktqualität zu liefern.

Nvidia-Feature konvertiert SDR-Inhalte in HDR für verbesserte Videowiedergabe

Nvidia hat mit RTX Video HDR ein neues Feature für seine RTX-Video-Upscaling-Technologie vorgestellt, das SDR-Inhalte automatisch in HDR-Inhalte umwandelt. Es ist nun für Nvidias RTX-GPUs verfügbar und soll die Videowiedergabe in Chromium-basierten Browsern wie Google Chrome und Microsoft Edge verbessern. In Kombination mit der RTX Video Super Resolution kann die KI-Technologie SDR-Videos auf bis zu 4K in HDR skalieren.

Um RTX Video HDR zu nutzen, müssen Anwender den Januar-Studio-Treiber herunterladen und installieren, die Windows HDR-Funktionen aktivieren und die HDR-Funktion in der Nvidia Systemsteuerung unter „RTX Video Enhancement“ einschalten. Voraussetzung für die Verwendung des Features ist ein HDR10-kompatibler Monitor.

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.