KI-Update kompakt: Meta FAIR, Apple Intelligence, KI-Chip-Export, Veo2 & Imagen3

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 9 Min.
Von
Inhaltsverzeichnis

Meta präsentiert mehrere neue KI-Entwicklungen aus seinem FAIR-Team. Mit Meta Video Seal wird ein unsichtbares, aber robustes Wasserzeichen für KI-generierte Videos eingeführt, das auch bei Bearbeitung oder Kompression bestehen bleibt.

Das Tool Meta Motivo ermöglicht die Steuerung virtueller Agenten mit realistischen Bewegungsabläufen, die durch Reinforcement Learning trainiert werden. Meta führt zudem

Flow Matching als Alternative zu Diffusionsmodellen ein, das bereits in verschiedenen Anwendungen wie Meta Movie Gen und Meta Audiobox zum Einsatz kommt.

Zusätzlich stellt Meta neue Entwicklungen in der Theory-of-Mind-Forschung vor sowie ein Large Concept Model zur Entkopplung von Sprachfähigkeit und Denken. Mit dem Dynamic Byte Latent Transformer soll außerdem die Verarbeitung einzelner Buchstaben und Zahlen verbessert werden.

Die Suchfunktion in ChatGPT von OpenAI ist ab sofort für alle angemeldeten Nutzerinnen und Nutzer weltweit kostenlos verfügbar.Bisher war die Funktion nur für zahlende Kunden zugänglich. Das Unternehmen hat die Suchfunktion laut eigenen Angaben in den letzten Monaten verbessert und beschleunigt, vor allem auf Mobilgeräten.

Auch eine Integration mit Kartendiensten und Sprachsuche sind neu. Nutzerinnen können ChatGPT jetzt auch als Standardsuchmaschine in ihrem Browser einstellen. In einer Reihe von Demos zeigt OpenAI, wie die Suche funktioniert, zum Beispiel für Veranstaltungsempfehlungen, Restauranttipps oder Urlaubsplanung. Dabei greift ChatGPT auf Echtzeitdaten aus dem Web zu und liefert multimediale Antworten mit Bildern, Videos und eingebetteten Karten.

Die Staaten der Europäischen Union (EU) und Unternehmen stehen vor der Herausforderung, die europäische Verordnung für Systeme mit Künstlicher Intelligenz zeitnah umzusetzen. Viele KI-Anwendungen, die unter die Vorgaben des AI Acts fallen, unterliegen aber gleichzeitig bereits anderen Regularien, etwa der Datenschutz-Grundverordnung (DSGVO) und dem Digital Services Act (DSA). Hinzu kommen Vorgaben etwa für den Finanz-, Medizin- oder Automobilbereich. "Der AI Act als horizontaler Rechtsrahmen ergänzt sektorale Regelungen und weitere Digitalgesetze, ist jedoch nur unzureichend auf diese abgestimmt." Das ist der Kernpunkt einer jetzt veröffentlichten Studie, die der Rechtsprofessor Philipp Hacker (Frankfurt/Oder) für die Bertelsmann-Stiftung erstellt hat.

Der weitreichende, risikobasierte Ansatz des AI Act zielt laut dem Juristen darauf ab, KI-Anwendungen nach ihrem Risikopotenzial zu kategorisieren und für potenziell besonders gefährliche Systeme strenge Auflagen zu schaffen. Bis August 2026 stehe für die Wirtschaft und die Mitgliedsstaaten die Aufgabe an, die KI-Verordnung Stück für Stück in der Praxis anzuwenden. Doch einzelne Teile passten noch nicht zusammen, geht aus dem Papier hervor: Inkonsistenzen, Überschneidungen und Unklarheiten könnten die reibungslose Umsetzung behindern und zu Rechtsunsicherheiten führen. Kurzfristig empfiehlt der Autor eine bessere Verzahnung bestehender Regelwerke, um Doppelungen zu vermeiden und die Effizienz zu steigern. Nationale Aufsichtsbehörden sollten zudem Leitlinien zur Anwendung der KI-Verordnung in spezifischen sektoralen Kontexten herausgeben.

Apple Intelligence fasst iPhone-Mitteilungen zusammen – nur längst nicht immer korrekt. Die BBC hat sich jetzt bei Apple über die KI-Funktion von iOS 18 beschwert, weil das Betriebssystem eine Headline der britischen Medienanstalt falsch zusammenfasste. Der Tatverdächtige im Fall des Mordes an einem US-Versicherungschef habe sich selbst erschossen, lautete die inkorrekte Kürzung der BBC-Headline durch Apple Intelligence. Als Beleg veröffentlichte die BBC einen iPhone-Screenshot. Wie die als Push-Nachricht verbreitete Originalüberschrift des Artikels tatsächlich lautete, geht daraus nicht mehr hervor.

Für die BBC ist es essenziell, dass Leserinnen und Leser den veröffentlichten Informationen vertrauen können – Smartphone-Mitteilungen eingeschlossen, betonte ein Sprecher der britischen öffentlich-rechtlichen Medienanstalt. Der Sender habe die Bedenken bei Apple vorgebracht und den Hersteller aufgefordert, "das Problem zu beheben". Es handele sich bei solchen Falschinformationen um keinen Einzelfall, heißt es bei der BBC unter Verweis auf weitere Berichte aus sozialen Medien. Skurrile Mitteilungszusammenfassungen von Apple Intelligence sorgten in der Tat mehrfach für Aufsehen. Im Kontext privater Mitteilungen – etwa bei Messaging-Apps – sind diese mitunter auch noch unfreiwillig komisch. Bei Nachrichten hingegen nicht. Apple stuft die KI-Funktionen noch als Beta ein.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Die USA planen neue Exportregeln für KI-Chips. Diese würden Unternehmen wie Google und Microsoft eine Schlüsselrolle als globale Gatekeeper für den Zugang zu dieser Technologie außerhalb der USA geben. Der neue Plan soll noch im Dezember vorgestellt werden, wie Reuters von zwei mit dem Entwurf vertrauten Personen erfuhr. Um diese Rolle als "Gatekeeper" zu übernehmen, müssten die Unternehmen strenge Auflagen erfüllen: Sie sollen der US-Regierung regelmäßig wichtige Informationen übermitteln und chinesischen Nutzern konsequent den Zugang zu KI-Chips verwehren.

Im Gegenzug dürften sie dann KI-Fähigkeiten über ihre Cloud-Dienste weltweit ohne zusätzliche Lizenzen anbieten. Für die engsten Verbündeten der USA soll es Ausnahmen geben: 19 Länder, darunter die Niederlande, Japan und Taiwan, sollen unbegrenzten Zugang zu den KI-Chips oder den damit möglichen Fähigkeiten erhalten. Länder mit Nuklear-Embargo wie Russland, China, Iran und Venezuela bleiben dagegen komplett ausgeschlossen. Für alle anderen Länder plant die US-Regierung strenge Obergrenzen für die Einfuhr leistungsstarker KI-Chips von Nvidia und AMD. Unternehmen müssten dann um Lizenzen konkurrieren, um eine begrenzte Zahl der Chips in jedes Land zu importieren.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Google hat mit Veo 2 und Imagen 3 zwei neue KI-Modelle vorgestellt, die in der Video- und Bildgenerierung Spitzenleistungen erreichen sollen. Das Videogenerierungsmodell Veo 2 kann laut Google Videos in 4K-Auflösung erstellen und versteht cinematografische Anweisungen wie Linsentypen oder Kameraeffekte. Die Videolänge kann auf mehrere Minuten ausgedehnt werden und soll deutlich weniger Halluzinationen als vergleichbare Modelle zeigen. Auch bei der Physik soll das Modell Fortschritte gemacht haben.

In direkten Vergleichstests mit menschlichen Bewertern schnitt Veo 2 besser ab als der Wettbewerb, auch im Vergleich zu OpenAIs kürzlich veröffentlichten Sora Turbo. Google räumt jedoch ein, dass es trotz der Fortschritte eine Herausforderung bleibe, durchgehend realistische und dynamische Videos zu erzeugen. Veo 2 wird zunächst nur über ausgewählte Produkte wie VideoFX, YouTube und die Vertex-AI-Plattform verfügbar sein. Ab 2025 soll das System auch in YouTube-Shorts und weiteren Produkten zum Einsatz kommen.

Das neue Bildgenerierungsmodell Imagen 3 soll dank mehrerer technischer Verbesserungen eine bessere Farbbalance, lebendigere Bilder und eine verbesserte Detailgenauigkeit bieten. Das Modell wurde auch bei der Darstellung verschiedener Kunststile optimiert. Imagen 3 wird ab sofort global über Googles ImageFX-Tool in mehr als 100 Ländern ausgerollt und ist auch über Googles Gemini-Chat verfügbar.

Noch in der Testphase ist hingegen der neuartige Bildgenerator Whisk von Google. Er erstellt Bilder, indem man andere Bilder als Prompt eingibt. Worte sind dabei zumindest in einem ersten Schritt nicht notwendig. Der Begriff Whisk bedeutet auf Deutsch Schneebesen. Der Bildgenerator soll also Bilder verrĂĽhren und vielleicht sogar schaumig schlagen? Schaut man sich die Beispielbilder von Google auf der Webseite von Whisk an, erinnern die eher an Spielereien. Alles ist Comic-haft. Es sind keine fotorealistischen Bilder dabei.

Whisk basiert auf Googles KI-Modell Gemini und dem neuen Bildgenerator Imagen 3. Zunächst beschreibt Gemini die geprompteten Bilder im Hintergrund, die Texte fließen dann zu Imagen 3 und werden dort verarbeitet. Die zugrundeliegenden Prompts, also das, was Gemini beschreibt, lassen sich einsehen und editieren. Google sagt, es gehe weniger um pixel-perfekte Bilder, sondern darum, schnell Ideen auf den Weg zu bringen. Allerdings ist Whisk zunächst ausschließlich in den USA verfügbar. Da es ein experimenteller Bildgenerator ist, kann man ihn auch in den USA ausschließlich über die Google Labs erreichen, das ist Googles Testumgebung.

Seit der CEO des sozialen Netzwerkes Telegram Pawel Durow im August in Frankreich wegen zahlreicher Vorwürfe festgenommen wurde, bemüht sich sein Dienst laut eigenen Angaben, gesetzliche Vorgaben besser zu erfüllen. Durow wurde unter anderem mauern bei Behördenanfragen wie solchen zur Löschung von illegalen Inhalten zur Last gelegt, derzeit befindet er sich auf Kaution in Freiheit. Nun hat Telegram unter anderem eine neue Webseite zum Thema Inhaltsmoderation freigeschaltet. Eine interaktive Grafik zeigt, dass die Zahl der gesperrten Gruppen und Kanäle Ende August 2024 sprunghaft anstieg.

Seitdem liegt sie auf einem höheren Niveau als vorher, zum Teil mit über 200.000 Sperren pro Tag. Auch Durow selbst gab nun in einem Posting bei Telegram an, dass sein Dienst rund eine Million Gruppen und Kanäle pro Monat sperrt. Dabei sollen selbst entwickelte Tools des Netzwerkes helfen, die unter anderem mit Künstlicher Intelligenz arbeiten. Wie genau diese arbeiten sollen, erklärt Durow nicht. Er gab aber an, dass von Sperren auch 10 Millionen User pro Monat betroffen sein sollen.

Das war das KI-Update von heise online vom 17. Dezember 2024. Eine neue Folge gibt es jeden Werktag ab 15 Uhr.

(igr)