KI-Update kompakt: OpenAI, Microsofts Muse, Apple Intelligence, Geisternetze
Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
- Isabel GrĂĽnewald
- The Decoder
OpenAI testet KI als Softwareentwickler
Wie gut können KI-Systeme bereits Software entwickeln? OpenAI hat dies jetzt in einem umfangreichen Praxistest untersucht. Dabei mussten KI-Modelle 1.400 reale Programmieraufträge der Freelancer-Plattform Upwork im Auftragsvolumen von einer Million US-Dollar bearbeiten. Die Ergebnisse zeigen: KI-Systeme machen zwar Fortschritte, können menschliche Entwicklerinnen und Entwickler aber noch nicht ersetzen.
Das leistungsstärkste getestete Modell, Claude 3.5 Sonnet, konnte 26,2 Prozen der Entwicklungsaufgaben und knapp 44,9 Prozent der Management-Aufgaben erfolgreich lösen. Umgerechnet hätte die KI damit über 400.000 Dollar des Gesamtbudgets verdienen können. Die Aufgaben reichten von kleinen Fehlerkorrekturen für 50 Dollar bis zu komplexen Features mit Budgets von 32.000 Dollar. Ein typisches Beispiel war die Behebung eines doppelt ausgelösten API-Aufrufs oder die plattformübergreifende Implementierung einer Video-Wiedergabefunktion. Für realistische Testbedingungen setzte OpenAI auf anspruchsvolle End-to-End-Tests, die von erfahrenen Entwicklern erstellt und mehrfach überprüft wurden. Diese simulierten komplette Benutzerabläufe statt nur einzelner Funktionen. Eine detaillierte Analyse zeigte eine typische Schwäche der KI-Systeme: Sie konnten zwar oft Fehler im Code finden, scheiterten aber häufig daran, die eigentliche Ursache zu verstehen und eine umfassende Lösung zu entwickeln. Um die weitere Forschung zu fördern, hat OpenAI den kompletten Testdatensatz als Open Source veröffentlicht. Damit können auch andere Unternehmen ihre KI-Modelle mit den gleichen Aufgaben testen und die Ergebnisse vergleichen.
Microsoft stellt KI-3D-Generator "Muse" fĂĽrs Gaming vor
Microsoft Research und Xbox Game Studios präsentieren ein neues KI-System namens Muse, das Gameplay generieren und alte Spiele modernisieren soll. Das Modell wurde mit einer halben Million Gaming-Sessions des Multiplayer-Kampfspiels Bleeding Edge trainiert und kann dreidimensionale Spielwelten samt Physik und Spielerinteraktionen verstehen und reproduzieren.
Muse kann bereits konsistente Spielsequenzen von bis zu zwei Minuten Länge bei einer Auflösung von 300 x 180 Pixeln erzeugen. Darin bewegen sich Charaktere physikalisch korrekt. Ein Ziel des Projekts sei es, ältere Spiele aus dem Xbox-Katalog für moderne Geräte zugänglich zu machen. Das Unternehmen stellt das Modell anderen Entwicklern über Azure AI Foundry und Hugging Face zur Verfügung.
Perplexity AI entfernt chinesische Zensur aus Sprachmodell
Perplexity AI hat eine zensurfreie Version des chinesischen KI-Modells Deepseek R1 entwickelt. Das ursprĂĽngliche Modell hatte fĂĽr Aufsehen gesorgt, da es sehr effizient arbeitet, aber bei politisch sensiblen Themen fĂĽr die Volksrepublik China nur mit vorgegebenen Antworten der chinesischen Regierung reagierte. Die hohe Effizienz des Modells fĂĽhrte sogar zu massiven KurseinbrĂĽchen bei US-Chip-Herstellern wie Nvidia.
Für die Entwicklung der zensurfreien Version identifizierten Experten rund 300 zensierte Themen und sammelten 40.000 entsprechende Testfragen, welche zu Zensur in der ursprünglichen R1 Version geführt hatten. Eine besondere Herausforderung war es dabei, faktisch korrekte Antworten und logische Argumentationsketten für die zuvor zensierten Themen zu finden. Tests bestätigen, dass das neue Modell R1 1776 von Perplexity nun unvoreingenommen auf heikle Themen antwortet, ohne dabei seine ursprüngliche Leistungsfähigkeit einzubüßen. Das Modell ist auf dem HuggingFace Repo verfügbar und kann auch über die Sonar API genutzt werden.
Cisco kĂĽndigt neues Servermodell fĂĽr KI an
Bei der Amsterdamer Ausgabe seiner Hausmesse "Cisco Live” brachte Netzwerkspezialist Cisco einen ganzen Reigen von Ankündigungen rund um KI-Cluster aufs Podium. Den Anfang machte die Vorstellung eines auf KI-Workloads optimierten neuen Rack-Servers mit vier Höheneinheiten, den der Hersteller für Retrieval Augmented Generation und Inferenz-Aufgaben vorsieht. Der Server basiert auf Nvidias modularem Referenzdesign MGX und lässt sich flexibel bestücken: Er erlaubt die Ausstattung mit zwei, vier, sechs oder maximal acht Nvidia-GPUs. Das soll Kunden abholen, die zu Beginn noch nicht absehen können, wie viele GPUs sie für ihre KI-Projekte wirklich benötigen und deshalb Nachrüstmöglichkeiten wünschen.
Der Aufbau einer für KI-Workloads passenden Netzwerkinfrastruktur ist kompliziert: So ist das Design der Infrastruktur meist ziemlich komplex, Komponenten unterschiedlicher Hersteller müssen reibungslos zusammenarbeiten und an die Bandbreiten im Netzwerk und Speichersystem werden hohe Anforderungen gestellt. Wer als Kunde den Betriebsaufwand der eigenen Umgebung so gering wie möglich halten will, soll im Laufe des Jahres Ciscos Nexus HyperFabric AI Cluster nutzen können. Die Hardware gehört und steht beim Kunden, die Verwaltungsoberfläche kommt aus der Cloud. HyperFabric für KI dürfte wohl Ciscos Versuch sein, eine Brücke zwischen Auslagerung in die Cloud sowie der sicheren Umgebung unter eigener Kontrolle zu bauen.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Apples neues iPhone 16e beherrscht Apple Intelligence
Apple treibt die Integration seiner KI-Funktionen in der iPhone-Reihe voran. Mit dem neuen iPhone 16e unterstützt nun auch das günstigste Modell die Apple Intelligence. Das ermöglicht der verbaute A18-Chip in Kombination mit mehr Arbeitsspeicher.
Das iPhone 16e löst das bisherige iPhone SE ab. Nach der Einführung des neuen Modells ist das iPhone 15 das einzige Gerät im aktuellen Apple-Portfolio, das die KI-Funktionen nicht unterstützt. Auch dieses dürfte im Herbst durch ein KI-fähiges Nachfolgemodell ersetzt werden.
Die Apple Intelligence verarbeitet Anfragen hauptsächlich direkt auf dem Gerät. Nur bei Bedarf greift das System auf Cloud-Server zu. Bisher beschränken sich die KI-Funktionen auf Textgenerierung, Bildbearbeitung und kleinere Assistenzfunktionen in Apps. Experten erwarten eine tiefere Integration der KI ins Betriebssystem bei der nächsten großen iOS-Version. Das iPhone 16e kostet in der günstigsten Version 700 Euro – deutlich mehr als das Vorgängermodell iPhone SE.
WWF sucht mit KI nach Geisternetzen
Künstliche Intelligenz soll dabei helfen, künftig die Ozeane sauberer zu halten: Die Umweltschutzorganisation World Wide Fund For Nature (WWF) will KI einsetzen, um sogenannte Geisternetze aufzuspüren. Verlorene Fischernetze, auch Geisternetze genannt, stellen eine Gefahr für alle möglichen Meerestiere dar, die sich darin verfangen und so verenden können. Sie aus den Meeren zu entfernen, ist auch deshalb wichtig, weil sie sich zersetzen. Die Mikroplastikpartikel gelangen über die Nahrungskette letztendlich in den menschlichen Körper. Zum Aufspüren solcher Netze nutzt der WWF Sonardaten vom Meeresboden, die beispielsweise zur Sicherung des Schiffsverkehrs oder zur Erkundung von Standorten für Offshore-Windkraftanlagen erhoben werden. Bisher werten Menschen diese Daten noch aus. Das soll künftig KI übernehmen – GhostNetZero heißt das System des WWF, das Microsofts AI for Good Lab entwickelt hat.
Die KI durchsucht die Sonardaten nach Signaturen der Netze. Ein Mensch überprüft die Funde noch. Die Trefferquote liege bei etwa 90 Prozent, teilte der WWF mit. Die Kombination aus Sonarsuche und KI-gestützter Erkennung ermöglicht einen Quantensprung: "Überall auf der Welt wird der Meeresboden kartiert, es existieren gewaltige Datenmengen", sagte Projektleiterin Gabriele Dederer. "Wenn wir vorhandene Bilddaten aus vielbefischten Meereszonen gezielt prüfen können, ist das ein wirklicher Gamechanger für die Suche nach Geisternetzen." Über die Plattform GhostNetZero.ai können zum Beispiel Forschungsinstitute, Behörden oder Windkraftunternehmen ihre Sonardaten vom Meeresboden dem WWF spenden.
(igr)