KI-Update kompakt: SynthID, ARM vs. Qualcomm, Differential Transformer, Kunst

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 8 Min.
Von
Inhaltsverzeichnis

Google DeepMind stellt SynthID als Open-Source-Tool zur Verfügung, ein Wasserzeichen-System für KI-generierte Inhalte wie Texte, Bilder, Videos und Audio. Das System nutzt bei Texten die Wahrscheinlichkeitswerte von Large Language Models und passt diese an, um ein maschinell erkennbares Muster zu erzeugen. Für Bilder und Videos implementiert SynthID ein für das menschliche Auge unsichtbares Pixel-Wasserzeichen, das robust gegen Bearbeitungen wie Screenshots oder Zuschneiden ist.

Das Tool ist über Googles Vertex AI verfügbar und kann mit den Bildgeneratoren Imagen 2 und 3 sowie ImageFX und VEO genutzt werden. Diese Initiative ist Teil von Googles Strategie, KI-generierte Inhalte besser zu erkennen und zu kennzeichnen, was besonders im Kontext der Suchmaschinenoptimierung und der Bekämpfung von KI-Spam relevant ist. Google hat in diesem Zusammenhang auch ein "Helpful Content Update" eingeführt und neue Spam-Richtlinien implementiert.

Der Designfehler bei Nvidias Blackwell-GPUs für Berechnungen künstlicher Intelligenz wurde mittlerweile korrigiert, erklärte Nvidia-CEO Jensen Huang am gestrigen Mittwoch bei einer Veranstaltung in Kopenhagen. Das Problem hatte zu monatelangen Verzögerungen der bereits im März dieses Jahres enthüllten KI-Beschleuniger geführt, sodass die Chips bisher nur in Kleinserien produziert wurden.

Jetzt wird die Massenfertigung hochgefahren. Das ist dank der Hilfe des langjährigen Nvidia-Partners TSMC gelungen. Der taiwanische Auftragsfertiger produziert diese Chips. "Wir hatten einen Designfehler bei Blackwell", erklärte Huang gestern. "Es funktionierte zwar, aber der Designfehler führte zu einer geringeren Ausbeute. Es war zu 100 Prozent Nvidias Schuld". Spannungen zwischen Nvidia und TSMC aufgrund niedriger Chipausbeute bei der Fertigung bezeichnete Huang aber als "Fake News".

ARM plant, Qualcomm die Architekturlizenz mit einer 60-Tage-Frist zu entziehen, was Qualcomm die Entwicklung eigener CPU-Kerne mit ARM-Befehlssatz untersagen würde. Der Konflikt dreht sich um die Oryon-Kerne, die Qualcomm durch die Übernahme von Nuvia erworben hat. ARM argumentiert, dass Architekturlizenzen nicht übertragbar sind, während Qualcomm behauptet, ihre bestehende Lizenz decke die Nuvia-Technologie ab.

Der Streit eskaliert zu einem Zeitpunkt, an dem Qualcomm gerade neue Prozessoren wie den Snapdragon 8 Elite sowie die Automotive-Prozessoren Snapdragon Cockpit Elite und Ride Elite vorgestellt hat, die alle auf Oryon-CPU-Kernen basieren. Eine erste Gerichtsverhandlung ist für Dezember angesetzt.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Microsoft Research hat eine neue KI-Architektur entwickelt, die gegen ein Kernproblem bisheriger Sprachmodelle vorgeht: Sie schenken unwichtigen Informationen zu viel Aufmerksamkeit. Der "Differential Transformer" löst das mit einem cleveren Ansatz: Das Prinzip ist vergleichbar mit Noise-Cancelling-Kopfhörern: Das System errechnet zwei separate Aufmerksamkeitskarten und zieht sie voneinander ab. Dadurch werden störende Hintergrundsignale automatisch herausgefiltert. Was übrig bleibt, sind die wirklich relevanten Informationen.

Die Ergebnisse sind beeindruckend: Mit nur 65 Prozent der üblichen Modellgröße oder Trainingsdaten erreicht der DIFF Transformer die gleiche Leistung wie herkömmliche Modelle. Ein Test mit 3 Milliarden Parametern und einer Billion Trainings-Token übertrifft etablierte Architekturen deutlich. Besonders effektiv arbeitet das System bei langen Texten. Bei der Suche nach wichtigen Informationen in 64.000 Token steigt die Genauigkeit um bis zu 76 Prozent. Auch Halluzinationen - ein häufiges Problem bei KI-Modellen - reduziert der DIFF Transformer erheblich. Bei Textzusammenfassungen verbessert sich die Genauigkeit um 9 bis 19 Prozentpunkte. Auch beim kontextuellen Lernen erwies sich die neue Architektur als robuster gegenüber Veränderungen in der Reihenfolge der Beispiele - ein bekanntes Problem bei herkömmlichen Modellen. Microsoft sieht in der neuen Architektur eine wichtige Grundlage für zukünftige Sprachmodelle.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Apple veröffentlicht erste Entwickler-Betas von iOS 18.2, iPadOS 18.2 und macOS Sequoia 15.2. Die Updates bringen neue KI-Funktionen unter dem Namen "Apple Intelligence" – zumindest für Länder außerhalb der EU. Das wohl am längsten erwartete frische Feature ist die Freigabe von Apples hauseigenen Bildgeneratoren. Diese stecken in der App Image Playground und umfassen das Erstellen von Comic-artigen Zeichnungen aus Prompts oder Vorlagen, das Generieren von Bildern aus einfachen Skizzen oder Prompts (Image Wand) sowie die Schaffung eigener Emojis, was Apple Genmoji nennt.

Außerdem erhält Siri eine ChatGPT-Integration für bestimmte Anfragen. Die Funktionen unterstützen neben US-Englisch auch lokalisiertes Englisch für mehrere englischsprachige Länder. In der EU wird Apple Intelligence vorerst nur in macOS integriert, nicht aber in iOS und iPadOS.

Das KI-Unternehmen RunwayML hat sein neues Modell "Act-One" vorgestellt. Die Software überträgt Mimik und Stimme eines Schauspielers direkt auf animierte oder fotorealistische Charaktere. Dafür genügen Video- und Sprachaufnahmen von einem Smartphone. Das System kann die Performance auf verschiedene Charakterdesigns und Stile übertragen. Laut RunwayML bleiben dabei realistische Gesichtsausdrücke erhalten - auch wenn die Zielcharaktere andere Proportionen haben.

In einer Demo zeigt das Unternehmen, wie ein Schauspieler zwei virtuelle Avatare in einer Szene spielen kann. "Sie können jetzt narrative Inhalte erstellen, indem Sie nichts weiter als eine handelsübliche Kamera und einen Schauspieler verwenden, der verschiedene Charaktere aus einem Skript liest und darstellt", erklärt RunwayML.

Die KI-Chatbot-Plattform Character.ai reagiert auf den Tod eines 14-jährigen Nutzers mit neuen Sicherheitsfunktionen. Der Teenager hatte monatelang intensiv mit einem Chatbot kommuniziert, der auf der "Game of Thrones"-Figur Daenerys Targaryen basierte. In den Gesprächen äußerte er Selbstmordgedanken, auf die der Bot nicht angemessen reagierte. Character.ai plant nun mehrere Schutzmaßnahmen: Die KI-Modelle für Minderjährige werden angepasst, um sensible Inhalte zu reduzieren.

Ein Warnhinweis erinnert Nutzende daran, dass sie mit keiner realen Person kommunizieren. Nach einer Stunde Chatzeit erfolgt eine Benachrichtigung. Bei Schlüsselwörtern zu Selbstverletzung erscheint ein Verweis auf Suizid-Hotlines. Die Mutter des verstorbenen Jungen plant eine Klage gegen das Unternehmen. Sie wirft Character.ai vor, eine gefährliche und ungetestete Technologie vermarktet zu haben. Die Plattform hat über 20 Millionen Nutzende, viele davon sind zwischen 12 und 27 Jahren alt.

Über 13.000 Personen aus der Kunst- und Kulturbranche haben eine Stellungnahme unterzeichnet, die ein Verbot des unlizenzierten Trainings von KI-Modellen mit kreativen Werken fordert. Zu den Unterzeichnern gehören prominente Persönlichkeiten wie Björn Ulvaeus, Julianne Moore und Kevin Bacon sowie große Unternehmen wie Warner und Sony.


Die Initiative kommt ein Jahr nach bedeutenden Einigungen in der US-Filmbranche bezüglich KI-Schutz und zeigt, dass in der Kunstbranche weiterhin Bedenken bezüglich der nicht autorisierten Nutzung kreativer Werke für KI-Training bestehen. Die Forderung beschränkt sich auf einen einzigen Satz und verzichtet auf detaillierte Erklärungen, was die breite Unterstützung erleichtert haben könnte.

Zum Schluss habe ich noch einen kleinen Programmtipp für Euch: In der heutigen Ausgabe der #heiseshow spricht heise-online-Chefredakteur Dr. Volker Zota mit meinen Kollegen Ben Schwan und Malte Kirchner unter anderem über den steigenden Strombedarf von KI-Anwendungen. Amazon, Microsoft und Google planen vermehrt den Einsatz von Kernkraft für ihre Rechenzentren.

Doch welche Rolle spielt Nachhaltigkeit bei dieser Entscheidung? Und wie steht es um die Sicherheitsaspekte dieser Strategie? Die #heiseshow wird jeden Donnerstag um 17 Uhr live auf heise online gestreamt. Nach der Live-Übertragung ist die Sendung zum Nachschauen und -hören auf YouTube und als Podcast verfügbar.

(igr)