KI-Update kompakt: AMD Ryzen AI 300, Nvidia, Roboter-Navigation, Reasoning

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 7 Min.
Von
Inhaltsverzeichnis

AMD hat auf einer Veranstaltung für Journalisten und Analysten in Los Angeles weitere Informationen zu den neuen Notebook-Prozessoren Ryzen AI 300 bekanntgegeben. Diese enthalten die Zen 5 CPU-Architektur, die überarbeitete integrierte Grafik RDNA 3.5 sowie die verbesserte KI-Einheit XDNA2.

Bei Zen 5 setzt AMD auf eine Kombination aus vier leistungsstarken "Classic"-Kernen und bis zu acht kompakteren "Compact"-Kernen. RDNA 3.5 bietet nun doppelt so viele Textursampler sowie Integer- und Compare-Einheiten und ein optimiertes Speichersubsystem. Die Mikroarchitektur wurde umfassend optimiert, unter anderem bei Decoder, Caches und AVX512-Support. Volle AVX512-Performance gibt es aber nur in Desktop-CPUs.

Die XDNA2 KI-Beschleuniger erreichen eine theoretische Rechenleistung von 50 TOPS bei dreifacher Performance des Vorgängers. Dank Unterstützung des Block-FP16-Formats soll sich die Inferenz-Geschwindigkeit von KI-Modellen ohne Genauigkeitsverlust verdoppeln lassen. Zudem kann die XDNA2-Einheit bis zu acht verschiedene KI-Aufgaben parallel ausführen und nicht benötigte Komponenten in den Ruhezustand versetzen.

Die französische Wettbewerbsbehörde Autorité de la concurrence hat offizielle Ermittlungen gegen den Chip-Hersteller Nvidia eingeleitet. Präsident Benoît Cœuré bestätigte dies gegenüber Reuters. Bei einem Nachweis wettbewerbswidrigen Verhaltens könnte dem Unternehmen eine Strafe drohen.

Zuvor hatte die Kartellbehörde den Markt für Hochleistungs-KI-Chips analysiert und Bedenken hinsichtlich Nvidias dominanter Stellung geäußert. In einem Bericht wurden Risiken identifiziert, dass Nvidia seine Marktmacht bei KI-Chips und der CUDA-Plattform missbrauchen könnte.

Nvidias Produkte sind im KI-Bereich kaum zu umgehen. Aktuell versucht das Unternehmen, sein Angebot noch umfassender zu gestalten, bis hin zu kompletten Supercomputern. Die Ermittlungen sollen nun klären, ob Nvidia seine starke Position auf unfaire Weise ausspielt.

Forscherinnen und Forscher von Google DeepMind, Jigsaw und Google.org haben 200 Medienberichte über den Missbrauch von generativen KI-Modellen zwischen Januar 2023 und März 2024 analysiert. Die Studie zeigt, dass die meisten Missbrauchsfälle leicht zugängliche GenAI-Fähigkeiten ausnutzen, die nur minimales technisches Fachwissen erfordern. Zu den häufigsten Taktiken gehören die Manipulation der Darstellung realer Personen, die Verbreitung von Falschinformationen sowie die Skalierung von Inhalten durch GenAI-gestützte Bots und Fake-Profile.

Als Hauptmotive hinter dem GenAI-Missbrauch identifizieren die Forschenden die Beeinflussung der öffentlichen Meinung, die Monetarisierung von Produkten und Dienstleistungen sowie betrügerische Aktivitäten wie Informations-, Geld- oder Vermögensdiebstahl. Zur Meinungsmanipulation werden vor allem emotional aufgeladene synthetische Bilder zu politisch umstrittenen Themen oder gefälschte kompromittierende Darstellungen von Politikern eingesetzt. Auch KI-generierte Inhalte zur Erzielung von Werbeeinnahmen sind weitverbreitet. Die Forschenden betonen, dass es einen branchenweiten Informationsaustausch braucht, um effektiv auf die sich rasch verändernde Bedrohungslage reagieren zu können.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Google Deepmind demonstriert, wie Roboter mit Hilfe des großen Kontextfensters von Gemini 1.5 Pro und multimodaler Eingaben in komplexen Umgebungen navigieren können. Das System verarbeitet bis zu einer Million Token aus verschiedenen Quellen. Dazu gehören menschliche Anweisungen, Videoanleitungen und Schlussfolgerungen des Sprachmodells. In Experimenten führten Forscher die Roboter durch reale Umgebungen. Sie zeigten ihnen wichtige Orte wie Schreibtische.

Anschließend fanden die Roboter selbstständig zu diesen Orten zurück. Dabei reicht ein simples Smartphone-Video aus, um dem Roboter einen Überblick über die Umgebung zu geben. Das System kann sogar abstrahieren: Fragt ein Nutzer nach einem "Ort zum Zeichnen", findet der Roboter ein Whiteboard. In Tests erreichte das "Mobility VLA" genannte System Erfolgsraten von bis zu 90 Prozent bei Navigationsaufgaben. Es verarbeitet verschiedene Eingaben wie Kartenskizzen oder Audioanfragen. Allerdings gibt es noch Einschränkungen: Die Verarbeitung eines Befehls dauert 10 bis 30 Sekunden. Zudem kann der Roboter die Umgebung nicht selbstständig erkunden. Google Deepmind plant, das System auf weitere Roboterplattformen auszuweiten und dessen Fähigkeiten über die reine Navigation hinaus zu erweitern – beispielsweise um Objekte zu inspizieren und darüber zu berichten.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Ein Forschungsteam von Sony AI, der Queen Mary University of London und des Music X Lab hat ein KI-System namens Instruct-MusicGen entwickelt. Es kann bestehende Musik anhand von Textanweisungen gezielt verändern. Etwa kann es Musikspuren – sogenannte Stems – hinzufügen, entfernen oder trennen.

Stems sind gemischte Gruppen von Spuren, oft nach Instrumententyp sortiert, und spielen eine zentrale Rolle in der Musikproduktion. In einem Beispiel extrahiert Instruct-MusicGen etwa die Drums aus einem Track oder fügt Bass hinzu. Für das Training hat Sony nach eigenen Angaben nur lizenzierte Musik und synthetische Datensätze verwendet, um rechtliche Probleme zu vermeiden. Die Forschenden stellen Code, Modell und Gewichte frei zur Verfügung.

Eine Studie des MIT und der Universität Boston zeigt, dass große Sprachmodelle oft eher auswendig gelernte Antworten wiedergeben, anstatt wirklich logisch zu schlussfolgern. Dies steht im Widerspruch zu Behauptungen der Anbieter, ihre KI-Systeme seien besonders gut im "Reasoning", also logischem Denken.

Für die Untersuchung wurden den Modellen Aufgaben zum kontrafaktischen Denken gestellt, bei denen es darum geht, Annahmen über nicht eingetretene Ereignisse zu treffen. Bei leicht abgewandelten Standardaufgaben, wie Additionen in anderen Zahlensystemen oder dem Spiegeln von Objekten, schnitten selbst fortschrittliche Modelle wie GPT-4 deutlich schlechter ab als bei den Ursprungsaufgaben.

Die Ergebnisse deuten darauf hin, dass die Sprachmodelle zwar eine gewisse Fähigkeit zur Verallgemeinerung besitzen, aber lange nicht so gut logisch denken können, wie von den Anbietern suggeriert wird. Stattdessen scheinen sie vor allem auswendig zu lernen und Gelerntes zu reproduzieren. Menschen würden für dieselben Aufgaben zwar länger benötigen, aber auch besser antworten.

Youtube arbeitet an einer KI-Funktion für Youtube Music, die auf Befehl maßgeschneiderte Playlists für Premium-Abonnenten erstellen kann. Laut einer Unternehmenssprecherin soll das Feature zunächst in den USA getestet werden.

Nutzer können demnach in ein Eingabefeld Wünsche für die Playlist eintippen oder aus vordefinierten Kategorien auswählen. Einen ähnlichen Ansatz verfolgt derzeit auch Spotify, wo die KI auf kreative Textbefehle wie "eine Indie-Folk-Playlist, die mein Gehirn umarmt" reagiert.

Youtube testet zudem eine Funktion zur Songsuche durch Summen: Nutzer können eine Melodie in ihr Mikrofon summen, um den passenden Song zu finden. Auch im Hintergrund laufende Lieder sollen so identifiziert und direkt bei Youtube Music gesucht werden können. Wann die neuen KI-Features in Deutschland verfügbar sein werden, ist noch unklar. Es bleibt abzuwarten, ob die generierten Playlists dauerhaft zahlenden Premium-Kunden vorbehalten bleiben.

(igr)