KI-Update kompakt: Zoom AI Companion, KI-Bias, AGI, Robotik
Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
- Isabel GrĂĽnewald
- The Decoder
Zooms AI Companion bekommt agentische Fähigkeiten
Zoom stattet seinen AI Companion mit neuen agentischen Funktionen aus. Der digitale Assistent wird künftig komplexere Aufgaben innerhalb der Zoom-Umgebung übernehmen können. Der AI Companion ist zunächst mit seinen agentischen Fähigkeiten auf die Anwendungen von Zoom beschränkt. In Zoom-Workplaces, also in Meetings, in Docs, im Whiteboard und all den anderen Diensten, die Zoom anbietet, kann der AI-Companion dann aber künftig Aufgaben übernehmen.
Dazu nutzt er Reasoning, also die Fähigkeit, Schlüsse ziehen zu können oder zu denken, und ein Memory (Gedächtnis), damit er sich Aufgaben merken oder hintereinander verschiedene Aufgaben abarbeiten kann. Zoom nennt als Beispiel für Agentenfähigkeiten, dass man ihn zum Beispiel losschicken kann, um nach Terminen im Kalender von mehreren Personen zu schauen, wann ein Meeting für alle Teilnehmer passen würde.
Demnächst will Zoom aber auch Drittanbieter-KI-Agenten zulassen, und Unternehmenskunden sollen sich dann auch eigene KI-Agenten erstellen können. Aktuell handelt es sich noch um vorgefertigte Agenten.
Benchmarks gegen KI-Bias
Ein Team der Stanford University hat neuartige KI-Benchmarks vorgestellt, die Entwicklerinnen und Entwickler helfen könnten, Vorurteile in großen Sprachmodellen zu reduzieren. Die Gruppe kam auf die Idee, nachdem sie verschiedene Fehltritte bestehender KI-Systeme beobachtet hatte. Diese Modelle, die ältere Techniken gegen impliziten Bias verwenden, schneiden bei aktuellen Fairness-Benchmarks zwar scheinbar sehr gut ab, liefern dann aber falsche Outputs. Eines der Beispiele waren historisch falsche Bilder, die Google Gemini ausspuckte, darunter schwarze Wehrmachtssoldaten oder US-Gründerväter ohne weiße Hautfarbe.
"Wenn wir uns darauf konzentrieren, dass Modelle alle Menschen genau gleich behandeln, kann das zu streng sein", sagt Angelina Wang, Hauptautorin des Papers und Postdoc am Stanford Institute for Human-Centered AI und dem Forschungslabor RegLab. Das Ignorieren von Unterschieden zwischen Gruppen kann dazu fĂĽhren, dass KI-Systeme sogar noch weniger fair sind. Wang und ihr Team haben daher neue Benchmarks erstellt, um KI-Systeme anhand von zwei verschiedenen Dimensionen zu bewerten: sogenanntes Unterschiedsbewusstsein und kontextbezogenes Bewusstsein.
Das Unterschiedsbewusstsein wird gemessen, indem der KI beschreibende Fragen über Dinge wie bestimmte Gesetze und demografische Merkmale gestellt werden – Fragen, die eine objektiv richtige Antwort haben. Das kontextbezogene Bewusstsein, ein eher subjektiver Messwert, testet die Fähigkeit des Modells, zwischen Gruppen innerhalb eines größeren Kontextes zu unterscheiden, und enthält dabei wertbasierte Urteile. Mit solchen Benchmarks könnte die Fairness von KI-Modellen besser beurteilt werden – doch um diese Modelle tatsächlich zu verbessern, bedarf es weiterer Techniken. Eine davon könnte darin bestehen, in vielfältigere Trainingsdaten zu investieren, deren Entwicklung jedoch kostspielig und zeitaufwendig sein kann, betont das Forschungsteam.
Deepmind-CEO hält AGI in fünf bis zehn Jahren für möglich
Laut Google Deepmind-CEO Demis Hassabis könnten erste Formen einer Künstlichen Allgemeinen Intelligenz (AGI) in den nächsten fünf bis zehn Jahren entstehen. Bei einem Informationsgespräch in Deepminds Londoner Büro betonte Hassabis, dass heutige KI-Systeme zwar bei bestimmten Aufgaben beeindruckend seien, aber noch viele Fähigkeiten für eine echte AGI fehlen würden.
AGI definiert Hassabis als "ein System, das alle komplexen Fähigkeiten aufweist, die Menschen haben". Die aktuellen KI-Systeme seien noch zu passiv und könnten viele für eine echte AGI notwendige Funktionen nicht ausführen. Für die Weiterentwicklung sei noch umfangreiche Forschungsarbeit nötig. Als zentrale Herausforderung auf dem Weg zur AGI nennt Hassabis die Ausstattung von KI-Systemen mit einem echten Verständnis der realen Welt. Während autonome Planungs- und Problemlösungsfähigkeiten bereits in Spielen wie Go entwickelt wurden, sei die Übertragung in die reale Welt deutlich komplexer.
"Die Frage ist, wie schnell wir die Planungsideen und das agentenbasierte Verhalten, also Planung und Argumentation, verallgemeinern und dann auf die Arbeit in der realen Welt übertragen können", erklärte Hassabis. Dies müsse auf der Basis von Weltmodellen geschehen, die die Umgebung verstehen könnten.
Mit Alexa+ landen alle Sprachaufnahmen in der Cloud
Amazon bestätigt Befürchtungen von Experten, dass der US-Konzern gerade mit dem Start seines neuen digitalen Assistenzsystems Alexa+ Einbußen beim Schutz der Privatsphäre der Nutzer zumindest in Kauf nimmt. Das Unternehmen teilte Kunden am Freitag per E-Mail mit: Nutzer der smarten Lautsprecher Echo könnten diese vom 28. März 2025 an nicht mehr so einstellen, dass sie Alexa-Anfragen lokal verarbeiten. Das bedeutet: Aufzeichnungen aller Sprachbefehle, die sich über Echo-Lautsprecher und Smart Displays an Alexa richten, werden automatisch an Amazon gesendet und in dessen Cloud-Dienst AWS verarbeitet sowie analysiert.
Der Hyperscaler habe die Mail offenbar gezielt an User geschickt, die aktuell noch die Einstellung "Keine Sprachaufzeichnungen senden" auf ihren Echo-Geräten aktiviert haben, berichtet das Magazin Ars Technica. Die Begründung dafür lautet demnach: "Da wir die Fähigkeiten von Alexa mit generativen KI-Funktionen erweitern, die auf der Rechenleistung der sicheren Cloud von Amazon basieren, haben wir beschlossen, diese Funktion nicht mehr zu unterstützen."
Alexa+ basiert auf mehreren großen Sprachmodellen wie der Eigenentwicklung Nova sowie Claude von Anthropic. Ein Amazon-Sprecher erklärte gegenüber heise online: "Das Alexa-Erlebnis soll die Privatsphäre unserer Kunden schützen." Nutzer könnten nach wie vor aus einer Reihe robuster Tools und Steuerelemente wählen, einschließlich der Option, ihre Sprachaufzeichnungen überhaupt nicht zu speichern. Datenschutzfunktionen würden weiterentwickelt.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Fast jeder Zweite hält KI für intelligenter als sich selbst
Laut einer aktuellen Studie des Imagining the Digital Future Center nutzt bereits die Hälfte aller US-Erwachsenen KI-Sprachmodelle wie ChatGPT. Die Forschenden sprechen von einem historischen Anstieg mit einer außergewöhnlich hohen Adoptionsrate für Kommunikationstechnologien. Die Nutzung zeigt dabei eine bemerkenswerte demografische Ausgewogenheit: Frauen verwenden KI-Sprachmodelle inzwischen genauso häufig wie Männer. Auch Menschen mit unterschiedlichem Bildungs- und Einkommensniveau nutzen die Technik etwa gleich häufig. Unter den Chatbots ist ChatGPT klarer Marktführer.
Auf dem zweiten Platz folgt Googles Gemini, dann Microsofts Copilot. Mit deutlichem Abstand folgen dann Metas LLaMa, xAIs Grok und Anthropics Claude. Trotz der wachsenden Verbreitung bezahlen nur wenige fĂĽr die Dienste: Lediglich 20 Prozent der Nutzerinnen und Nutzer verfĂĽgen ĂĽber kostenpflichtige Abonnements, und nur 4 Prozent tragen diese Kosten selbst. Die meisten nutzen also ausschlieĂźlich kostenlose Versionen und ĂĽberwiegend fĂĽr private Zwecke.
Bemerkenswert ist auch die Wahrnehmung der KI-Systeme: Etwa die Hälfte (49 Prozent) der Menschen hält die Modelle für intelligenter als sich selbst, etwa ein Viertel davon sogar für deutlich klüger. Frauen schreiben den KI-Systemen dabei häufiger eine überlegene Intelligenz zu als Männer.
KI ermöglicht humanoiden Robotern das Aufstehen aus jeder Lage
Ein Forschungsteam aus China und Hongkong hat sich Gedanken darüber gemacht, wie humanoide Roboter nach dem Hinfallen möglichst schnell wieder aufstehen können. Herausgekommen ist ein System namens Humanoid Standing-up Control (kurz HoST).
Das HoST-Framework wurde mithilfe der Open-Source-Physik-Simulation Isaac Gym von Nvidia trainiert und kann prinzipiell auf jedem zweibeinigen Roboter angewendet werden. In der Simulation wird mittels verstärkenden Lernens einem humanoiden Roboter durch Versuche und Irrtum das Aufstehen aus unterschiedlichen Lagen und auf verschiedenen Untergründen beigebracht.
Das so trainierte Host-System übertrugen die Wissenschaftler auf einen realen humanoiden G1-Roboter von Unitree. Der Roboter war damit in der Lage, aus jeder Position wieder aufzustehen. Die Art des Untergrundes und ob dieser etwa schräg war, spielten keine Rolle. Selbst Störungen während des Aufstehens in Form von Schlägen konnten den Roboter nicht davon abhalten, sich wieder vollständig aufzurichten.
HoST ist daher ein robuster Ansatz, wie zweibeinige Roboter, die hingefallen sind, wieder auf die Beine kommen können. Das ist etwa wichtig, wenn solche Roboter autonom ohne menschliche Hilfe arbeiten sollen.
Google plant größte Übernahme der Konzerngeschichte mit Wiz
Die Google-Mutter Alphabet unternimmt einen neuen Anlauf zur Übernahme des auf IT-Sicherheit spezialisierten Start-ups Wiz. Voriges Jahr hat Wiz ein Angebot Alphabets über 23 Milliarden US-Dollar ausgeschlagen und sich stattdessen auf einen Börsengang vorbereitet. Für die Wiz Aktionäre könnte sich das jetzt auszahlen, denn nun bietet Alphabet 30 Milliarden Dollar. Das berichtet das Wall Street Journal unter Berufung auf Eingeweihte. Google bemüht sich vermehrt im Bereich Cloud-Computing.
Wiz bietet genau dafĂĽr Sicherheitssoftware an, unter Zuhilfenahme KĂĽnstlicher Intelligenz. Diese soll Bedrohungen in Echtzeit erkennen und verhindern. Das 2020 in Israel gegrĂĽndete Unternehmen Wiz soll bereits Amazon, Microsoft und Google als Kunden gewonnen haben.
xAI kauft KI-Start-up fĂĽr Videogenerierung
Das KI-Unternehmen xAI von Elon Musk hat das Video-Start-up Hotshot übernommen. Hotshot hat in den vergangenen zwei Jahren drei Modelle zur Videogenerierung entwickelt. Diese Modelle sollen nun "auf dem weltweit größten Cluster Colossus" von xAI weiterentwickelt werden. Der eigene Dienst wird mit sofortiger Wirkung eingestellt, bestehende Nutzer können noch bis Ende März ihre Videos herunterladen. Der Service könnte dann über Grok angeboten werden. Der Chatbot kann bereits Bilder generieren – und das mit nur wenigen Einschränkungen. Sollte das Unternehmen eine ähnliche Politik mit dem Videomodell fahren, dürften uns bald noch mehr politische Fake-Videos bevorstehen.
(igr)