KI-Update kompakt: FACTS Grounding, YouTube, Agentforce 2.0, SwagBot
Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
- Isabel GrĂĽnewald
- The Decoder
Im neuen Google DeepMind KI-Fakten-Test gewinnt Gemini
Google DeepMind stellt mit FACTS Grounding einen neuen Benchmark vor, der die Fähigkeit von KI-Modellen testet, faktenbasierte und detaillierte Antworten auf Basis von vorgegebenen Texten zu liefern. Der Test umfasst 1.719 sorgfältig ausgewählte Beispiele aus verschiedenen Fachgebieten wie Finanzen, Technologie, Einzelhandel, Medizin und Recht.
Eine Besonderheit des Tests ist die Bewertungsmethode: Drei führende KI-Modelle – Gemini 1.5 Pro, GPT-4o und Claude 3.5 Sonnet - fungieren als Richter und bewerten die Antworten nach zwei Kriterien. Zunächst prüfen sie, ob die Anfrage ausreichend beantwortet wird. Anschließend bewerten sie die faktische Korrektheit und ob die Antwort vollständig im bereitgestellten Dokument verankert ist.
Um Manipulationen zu verhindern, teilt Google DeepMind den Benchmark in zwei Hälften: 860 öffentliche Beispiele stehen ab sofort zur Verfügung, während 859 Beispiele zurückgehalten werden. Die finale Bewertung basiert auf dem Durchschnitt beider Sets. Der Benchmark soll kontinuierlich weiterentwickelt werden, um Sprachmodelle zuverlässiger und für mehr Anwendungsszenarien nutzbar zu machen.
Nvidias kompakter "Jetson Orin Nano Super" fĂĽr generative KI
Nvidia stellt mit dem Jetson Orin Nano Super einen neuen, kompakten und erschwinglichen "Supercomputer" für generative KI vor. Das knapp 250 Dollar teure Entwickler-Kit bietet laut Nvidia eine um bis zu 70 Prozent gesteigerte Leistung und eine um 50 Prozent höhere Speicherbandbreite im Vergleich zum Vorgänger – ein Teil davon durch Software-Updates, der Chip basiert weiter auf der Ampere-Architektur.
Jetson Orin Nano Super eignet sich laut dem Unternehmen für kommerzielle KI-Entwicklerinnen, Hobbyisten und Studentinnen, um Fähigkeiten in generativer KI, Robotik oder Computer Vision zu entwickeln. Die Software-Updates zur Leistungssteigerung stehen auch Besitzern des alten Jetson Orin Nano Developer Kits zur Verfügung. Produkte wie Jetson Orin sind wichtig, weil sie den Betrieb kleiner KI-Modelle ohne direkte Cloud-Anbindung ermöglichen – sogenannte "Edge AI"-Anwendungen, also beispielsweise KI-Modelle direkt in der Produktion oder Robotik.
KI-Filter in Nvidia App können Spiele ausbremsen
Die GeForce-Grafikkarten fĂĽhren offenbar zu Leistungsverlusten in Spielen, wenn die neue Nvidia App installiert ist. Die Performance soll sich laut Nutzerberichten um bis zu 15 Prozent reduzieren, obwohl die Funktionen der Nvidia App nicht aktiv genutzt werden. Die Deinstallation der App behebt das Problem, ist aber laut Nvidia nicht notwendig. Der Hersteller empfiehlt, einige KI-Funktionen der Nvidia App abzuschalten, bis ein entsprechendes Update bereitsteht. Im November hatte die Nvidia App die bisherige GeForce Experience ersetzt. Die App dient seitdem als zentrale Anlaufstelle fĂĽr Hardware-Steuerung, Treiber-Downloads und Spiele-Optimierungen fĂĽr GeForce-Grafikkarten.
Die KI-Filter haben demnach zum Leistungsverlust geführt, obwohl sie nicht wirklich verwendet werden und die App wie von Nvidia vorgesehen einfach im Hintergrund läuft. Das hat der Hersteller jetzt im GeForce-Forum bestätigt. Gleichzeitig beschreibt Nvidia, wie das Problem kurzfristig behoben werden kann. Spieler sollten die Game-Filter in den Einstellungen der Nvidia App abschalten und daraufhin das Spiel neu starten. Das sollte die Leistung der Grafikkarte wieder auf das eigentliche Niveau heben. Warum die KI-Filter der App die Performance derart beeinträchtigen, sagt Nvidia bislang nicht.
Deutschland soll mit energiesparender KI an die Weltspitze
Die Informationstechnische Gesellschaft (ITG) betont in einem Positionspapier die Bedeutung, die Herausforderungen großer Sprachmodelle zu bewältigen. Nur so könne der Nutzen der aktuellen Treiber im Bereich Künstliche Intelligenz auf nachhaltige Weise maximiert werden. "Es ist global die Rede davon, mehr Atomkraftwerke zu bauen, um den Energiehunger zu stillen", erklärt Damian Dudek, ITG-Geschäftsführer und Co-Autor des Papiers. "Wir sprechen davon, die Datenverarbeitung effizienter zu gestalten und die Energieaufnahme nach unten zu bringen, damit KI nachhaltig genutzt werden kann."
Neben der Reduzierung der Strukturgröße und der Erhöhung der Anzahl der Transistoren pro Chipfläche gemäß dem Mooreschen Gesetz gibt es laut den Autoren mehrere neue Ansätze, um die Einschränkungen der traditionellen Methode des Chipdesigns zu überwinden. In diesen Feldern sollte Deutschland "am Ball bleiben", betont Dudek. Denn nur wer sich durch Innovation technologisch in eine führende Stellung bringt, habe die Möglichkeit, auch mit Blick auf ethische Anforderungen und Datensicherheit einen global akzeptierten Rahmen abzustecken.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
YouTube gibt Urhebern Kontrolle ĂĽber KI-Training mit ihren Videos
Die Video-Plattform YouTube führt neue Einstellungen für das KI-Training ein, mit denen Content-Erstellerinnen und Ersteller bestimmen können, ob KI-Unternehmen wie OpenAI, Meta oder Google ihre Videos zum Training von Modellen nutzen dürfen. Die neue Option wird in den YouTube-Studio-Einstellungen unter "Third-party training" verfügbar sein. Die Freigabe erfordert die Zustimmung aller Rechteinhaber und gilt nur für öffentlich zugängliche Videos, die den YouTube-Richtlinien entsprechen.
YouTube betont jedoch, dass es keinen Einfluss darauf hat, wie die KI-Unternehmen die Inhalte letztlich verwenden. Die Plattform sieht die neue Funktion als ersten Schritt, um Videoschaffenden im KI-Zeitalter neue Werte aus ihren Inhalten zu erschlieĂźen.
Salesforce erweitert Agentforce-KI um vorgefertigte Workflows
Salesforce entwickelt seine KI-Lösung Agentforce weiter und kündigt nach nur drei Monaten Agentforce 2.0 an. Die KI-Agenten sind darauf ausgelegt, im Vertrieb und Kundendienst in gewissen Grenzen autonom Entscheidungen zu treffen und Handlungen auszuführen, etwa Bestellungen zu verwalten. Da sich viele Kunden mit der Erstellung eigener Agenten schwertun, führt Salesforce nun eine Skill-Bibliothek für Vertrieb und Marketing ein.
Diese Skills können im Agent Builder durchsucht und als Bausteine eingebunden werden, wobei das System passende Skills für spezifische Aufgaben vorschlägt. Die Skills unterstützen auch die Integration mit Tableau für Datenvisualisierung und Vorhersagen sowie mit Slack für automatisierte Channel-Zusammenfassungen. Die neue Version Agentforce 2.0 soll im Februar 2025 erscheinen, wobei die Slack-Integration bereits für Januar geplant ist. Die Vertriebsfunktionen werden ab 2 US-Dollar pro Konversation berechnet.
OpenAI erweitert API um o1-Modell mit Function Calling und mehr
OpenAI hat eine neue Version des o1-Modells für die API und ChatGPT veröffentlicht. Sie soll im Durchschnitt 60 Prozent weniger Token für Reasoning-Aufgaben benötigen als die bisher über API verfügbare Vorgängerversion o1-preview. Darüber hinaus soll sie diese bei Mathematik- und Programmieraufgaben sowie beim Aufruf von Funktionen deutlich übertreffen.
Zudem senkt OpenAI die Preise für die Realtime API für Sprachassistenten um 60 Prozent. Mit "Preference Fine-Tuning" führt das Unternehmen außerdem eine neue Methode ein, um KI-Modelle an Nutzungs- und Entwicklungspräferenzen anzupassen, indem sie aus Paaren von bevorzugten und nicht bevorzugten Antworten lernen. Nach Angaben von OpenAI eignet sich diese Methode besonders für subjektive Aufgaben wie kreatives Schreiben oder Zusammenfassungen, bei denen Ton und Stil wichtig sind.
Autonomer "SwagBot" soll Rinder zu Weideflächen führen
Ein autonomer Hirtenroboter namens SwagBot soll in der Vieh- und Weidewirtschaft aushelfen. Entwickelt wird er von dem Start-up Agerris, einer Ausgründung der Universität Sydney, die seit 2005 an Robotern für die Landwirtschaft arbeitet. Auf den weitläufigen Weideflächen Australiens kann der autonome Roboter Landwirten Arbeit abnehmen, indem er Daten sammelt und den Überblick über Rinder und Weideflächen behält.
Der SwagBot hat vier Beine mit Rädern und ist mit verschiedenen Sensoren und Kameras ausgestattet. Mithilfe von maschinellem Lernen soll er den Gesundheitszustand von Kühen erkennen können, oder sehen, ob eine Weide bereits abgegrast ist. "Sobald sich die Rinder an den Roboter gewöhnt haben, werden sie ihm überallhin folgen", erklärt Salah Sukkarieh, Professor für Robotik an der Universität Sydney und Agerris-CEO. Neben dem SwagBot entwickelt das Start-up auch andere Roboter wie Rippa, der Felder und Obstplantagen überwacht oder einen weiteren Roboter, der Unkraut jäten kann. Auch hierzulande arbeiten Forschungsteams an ähnlichen KI-Projekten.
(igr)