KI-Update kompakt: OpenAI, Apples Siri, Russische Propagada, Xbox Copilot
Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
- Isabel GrĂĽnewald
- The Decoder
OpenAI macht KI zur "Frage nationaler Sicherheit"
In einem Strategiepapier an die US-Regierung fordert OpenAI weitreichende Maßnahmen zur Sicherung der amerikanischen Führungsposition in Sachen KI. Das Unternehmen betrachtet dies als eine Frage der nationalen Sicherheit, da der internationale Wettbewerb zunimmt und Länder wie China mit Entwicklungen wie DeepSeek den Vorsprung der USA verringern.
OpenAI plädiert für eine zentrale Regulierung und Anpassungen im Urheberrecht, wobei der Fair-Use-Grundsatz stärker betont und das Urheberrecht insgesamt an Bedeutung verlieren soll. Ziel dieser Maßnahmen ist es, die Innovationsfähigkeit der US-amerikanischen KI-Branche zu gewährleisten und die technologische und wirtschaftliche Vormachtstellung der USA zu bewahren.
Baidu präsentiert zwei neue Ernie-Modelle
Der chinesische Techkonzern Baidu hat zwei neue Modelle seiner KI Ernie auf den Markt gebracht. Ernie steht für Enhanced Representation through Knowledge Integration. Wie das Unternehmen mitteilte, handelt es sich um das Basis-Modell Ernie 4.5 und das auf logisches Denken ausgerichtete Modell Ernie X1. Dieses soll laut Firmenangaben "die gleiche Leistung" wie die chinesische KI von DeepSeek bieten, aber "nur die Hälfte" kosten. Dem neuen Basismodell Ernie 4.5 attestiert Baidu "ausgezeichnete multimodale Verständnisfähigkeiten", fortschrittlichere Sprachfähigkeiten und umfassend verbesserte Verständnis-, Generierungs-, Logik- und Gedächtnisfähigkeiten.
X1 soll darüber hinaus über "stärkere Planungs-, Reflexions- und Evolutionsfähigkeiten" verfügen, zitiert die Nachrichtenagentur Reuters Baidu. Baidu lobt den hohen EQ (Emotional Quotient) von Ernie, der es möglich mache, Memes und satirische Cartoons zu verstehen. Das kann ChatGPT von OpenAI allerdings schon länger. Genaue Kennzahlen zu seinen Modellen – etwa, wie viele Parameter jeweils genutzt werden – bleibt Baidu bislang schuldig. Das Unternehmen stellt den KI-Chatbot "Ernie Bot" ab sofort kostenlos zur Verfügung. Dieser spricht zwar auch englisch, die Benutzeroberfläche ist bislang aber nur auf chinesisch verfügbar.
Apples Siri-Fail zeigt KI-Skalierungsdilemma
Apple kämpft mit massiven Problemen bei der Entwicklung neuer KI-Funktionen für Siri. Die ursprünglich für dieses Frühjahr angekündigten Erweiterungen werden laut Bloomberg nun frühestens 2026 mit iOS 19 erscheinen.
Die neuen Funktionen sollen Siri befähigen, auf persönliche Daten der Nutzer zuzugreifen und präziser mit Apps zu interagieren. Siri soll etwa eine Führerscheinnummer oder Fotos bestimmter Personen schnell finden oder E-Mails eigenständig bearbeiten.
Bei der Entwicklerkonferenz WWDC im Juni präsentierte Apple einen kaum funktionierenden Prototyp, obwohl die neue Siri bereits in Werbespots zu sehen war. Jetzt berichtet Bloomberg, dass die geplanten Features in internen Tests nur in 66 bis 80 Prozent der Fälle korrekt funktionieren.
Siri-Direktor Robby Walker bezeichnete die Verzögerungen demnach intern als "hässlich und peinlich" und deutete an, dass selbst der neue Zeitplan für 2026 nicht garantiert sei.
Apple steht vor einem GenAI-Dilemma: Der Konzern legt großen Wert auf Qualität und will keine unfertigen Produkte auf den Markt bringen. Doch selbst eine Trefferquote von 95 Prozent würde bei hunderten Millionen Geräten weltweit immer noch Millionen von Fehlfunktionen bedeuten. Hinzu kommt, dass Apple bereits einige schlechte Erfahrungen mit Apple Intelligence gemacht hat, etwa bei groben Fehlern in Nachrichtenzusammenfassungen - ein Feature, das daraufhin vorerst abgeschaltet wurde.
Google Gemini kann jetzt Videos analysieren
Googles Gemini-Modelle unterstützen jetzt natives Videoverstehen. Nutzerinnen und Nutzer können YouTube-Video-Links im Google AI Studio direkt in ihre Anfragen einbinden und die KI kann den Videoinhalt analysieren und Auskünfte dazu geben. Das System transkribiert dabei den Audiotrack und analysiert Videoframes im Sekundentakt. Entwicklerinnen und Entwickler können spezifische Zeitstempel im Video referenzieren und das Modell um Zusammenfassungen, Übersetzungen oder visuelle Beschreibungen bitten.
Die Funktion befindet sich derzeit in der Vorschau und unterliegt bestimmten Einschränkungen: Pro Tag sind maximal 8 Stunden Video erlaubt, nur ein Video pro Anfrage und ausschließlich öffentliche Videos können verarbeitet werden. Gemini Pro kann Videos bis zu 2 Stunden Länge analysieren, Gemini Flash bis zu einer Stunde.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Googles Gemini ersetzt den Assistant
Bei all diesen Fortschritten war es nur noch eine Frage der Zeit: Jetzt hat Google angekündigt, seinen bisherigen Sprachassistenten im Laufe dieses Jahres durch den eigenen KI-Assistenten Gemini zu ersetzen. Gemini ist bereits auf Smartphones verfügbar, wenn Anwender die entsprechende App manuell installieren. Doch Google wird den Umstieg bald forcieren, zumindest für geeignete Geräte. Das betrifft nicht nur Handys, sondern auch mit dem Smartphone vernetzte Geräte wie Tablets und Autos.
Ende 2025 wird der klassische Google Assistant auch aus den App-Stores genommen, dann steht nur noch Gemini als KI-Assistent zur Verfügung. Für heimische Anlagen wie Lautsprecher und Fernseher soll eine KI den Sprachassistenten ebenfalls ablösen. Der Konzern verspricht entsprechende Informationen in den nächsten Monaten. Bis auf Weiteres wird der Google Assistant auf diesen Geräten aber weiter nutzbar sein. Ob dies auch für Geräte gilt, welche die Mindestanforderungen für Gemini nicht erfüllen, vielleicht sogar über dieses Jahr hinaus, ist bislang unklar.
Russische Propaganda fĂĽr KI-Modelle
Das private Unternehmen Newsguard hat bei einer Untersuchung festgestellt, dass pro-russische Aktivisten Informationen gezielt so bereitstellen, dass sie von gängigen westlichen KI-Modellen wiedergegeben werden. Newsguard spricht hierbei von "LLM-Grooming".
Laut Newsguard soll eine pro-russische Organisation Millionen Webseiten erstellt haben, auf denen russische Propaganda geteilt wird. Dabei handelt es sich vorwiegend um Beiträge aus russischen Staatsmedien und von russlandfreundlichen Influencern. Diese Seiten seien nicht für menschliche Leser konzipiert, sondern explizit so aufbereitet, dass die Crawler der KI-Anbieter bei ihnen Halt machen. So kommt es, dass Informationen von diesen Seiten bei ChatGPT, Meta AI, Gemini, Claude und anderen gängigen KI-Chatbots auftauchen.
Was Newsguard überraschend findet, war eigentlich zu erwarten: KI-Modelle lernen aus Trainingsdaten, die in der Regel aus frei zugänglichen Daten aus dem Internet bestehen. Es ist daher nicht verwunderlich, dass auch Propaganda in diese Daten einfließt und dass Russland versucht, dies zu nutzen. Vermutlich sind sie nicht die einzigen Akteure, die so vorgehen.
Die Anbieter der KI-Chatbots bemühen sich um qualitativ hochwertige Trainingsdaten und lassen diese von Arbeitskräften kontrollieren. Deren Fokus liegt jedoch eher auf der Identifizierung von sexuellen Darstellungen und Gewalt als auf Propaganda oder Falschinformationen.
Newsguard verwendet den Begriff "LLM-Grooming", was fragwĂĽrdig erscheint, da "Grooming" ursprĂĽnglich die Manipulation von Kindern oder Jugendlichen durch Erwachsene fĂĽr sexualisierte Gewalt bezeichnet. Bei LLMs spricht man ĂĽblicherweise von "vergifteten Trainingsdaten", wenn diese unerwĂĽnschte Inhalte enthalten. Was als unerwĂĽnscht gilt, legen die Anbieter fest.
Newsguard analysiert die Glaubwürdigkeit von Quellen, ist dabei aber auch selbst in die Kritik geraten – wegen einseitiger Betrachtung und unqualifizierter Mitarbeiter.
Content-Erstellung kĂĽnftig fĂĽr KI statt Menschen optimiert
Der ehemalige OpenAI-Forscher Andrej Karpathy prognostiziert einen fundamentalen Wandel in der Content-Erstellung. Er geht davon aus, dass große Sprachmodelle zur universellen Schnittstelle für Textinhalte werden und künftig Content primär für KI-Systeme und nicht mehr für Menschen optimiert wird.
Als konkretes Beispiel nennt Karpathy die aktuelle Dokumentationspraxis. Statt Dokumentationen als HTML-Seiten für Menschen aufzubereiten, sollten diese künftig aus einer einzigen Projektdatei bestehen, die für das Kontextfenster eines LLMs optimiert ist. Die größere Herausforderung sieht der Experte bei Informationen, die in Formaten wie Webseiten, PDF-Dateien oder Videos gespeichert sind. Diese Formate stammen aus der "Vor-LLM-Ära" und erschweren die Optimierung von Content für KI-Systeme.
Es gibt bereits erste Initiativen für KI-optimierte Webstandards, wie den Vorschlag "llms.txt". Ähnlich wie "robots.txt" für Suchmaschinen soll dieser Standard KI-Systeme zur maschinenlesbaren Version einer Webseite leiten, während Menschen weiterhin die HTML-Version nutzen.
Xbox Copilot hilft beim Computerspielen
Microsoft will mit Künstlicher Intelligenz Menschen beim Computerspielen unterstützen. "Neue Spieler, wie ich, können von Computerspielen eingeschüchtert werden", sagt Microsofts Fatima Kardar. Sie hat verschiedene Spiele ausprobiert, "aber sie schnell verworfen, weil das zu nichts führt", gesteht die Managerin im Xbox Podcast. Ihr Lösungsansatz ist nicht etwa besseres Spieldesign, sondern Künstliche Intelligenz: Der Copilot for Gaming soll dabei helfen, schneller zu spielen, durch Coaching besser zu werden sowie "sozialere" Spielerfahrungen zu machen. Außerdem soll er die Zeit für Installation und Setup verkürzen, sodass der Spaßeffekt eher eintritt. Das beginnt bei der personalisierten Empfehlung bestimmter Xbox-Spiele, geht über Erinnerungen daran, wo man in einem Spiel unterbrochen hat, und reicht bis zum "Erhalt von Verbindungen mit Freunden".
"Wir möchten das Spielerlebnis nicht ruinieren", betont Kardar, die in Microsofts Xbox-Abteilung den Bereich Spiele-KI leitet. Daher soll sich der Copilot for Gaming nicht aufdrängen, aber im richtigen Moment zur Seite stehen. Los geht es für Xbox Insider auf mobilen Endgeräten. "Es wird viel KI kommen", kündigt Kardar an. Auf der Game Developer Conference (GDC) werde diese Woche einiges an KI-Angeboten zu sehen sein.
(igr)