KI-Update kompakt: Google Deepmind, Anthropic Jailbreak, AMD, ChatGPT-WhatsApp
Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
- Isabel GrĂĽnewald
- The Decoder
Google Deepmind rĂĽstet sich gegen listige AGIs
Google Deepmind hat Version 2.0 seines Frontier Safety Framework veröffentlicht. Dieses Regelwerk soll schwerwiegende Risiken durch fortgeschrittene KI-Modelle eindämmen - insbesondere solche, die versuchen könnten, menschliche Kontrolle zu unterwandern. Das Framework definiert sogenannte "Critical Capability Levels" - Schwellenwerte, ab denen KI-Modelle ohne zusätzliche Sicherheitsmaßnahmen ernsthafte Gefahren darstellen könnten.
Es konzentriert sich auf zwei Hauptrisikobereiche: Erstens den Missbrauch von KI-Systemen, etwa für CBRN-Angriffe (das sind chemische, biologische, radiologische und nukleare Waffen) oder Cyberattacken. Und zweitens das Risiko, dass KI-Systeme aktiv versuchen könnten, ihre menschliche Kontrolle zu unterwandern. Laut dem Framework soll ein automatisiertes Überwachungssystem eingesetzt werden, sobald ein Modell manipulative Fähigkeiten entwickelt (wie z.B. das Befolgen von Anweisungen zur vorzutäuschen). Dieses System soll die Gedankenketten der KI in kritischen Anwendungen überwachen. Für den Fall, dass ein Modell so fortgeschritten ist, dass es diese Überwachung umgehen könnte, forscht Google Deepmind bereits an weiteren Sicherheitsmaßnahmen.
Google kippt Verbote für die militärische Verwendung von KI
Google hat seine ethischen Richtlinien für Künstliche Intelligenz aktualisiert und dabei Verpflichtungen entfernt, die Technologie nicht für Waffen oder Überwachung einzusetzen. Die Führungskräfte erklärten dies laut Washington Post damit, dass KI inzwischen weit verbreitet sei und Unternehmen aus demokratischen Ländern auch Regierungs- und Sicherheitskunden bedienen müssten. Mit seinen bisherigen Einschränkungen für den Einsatz von KI im Bereich der nationalen Sicherheit war Google ein Außenseiter unter den führenden KI-Entwicklern. Konkurrenten wie OpenAI, Microsoft und Amazon kooperieren bereits mit dem US-Militär bzw. mit militärischen Zulieferern.
2018 hatte Google seine KI-Prinzipien erstmals veröffentlicht, nachdem Mitarbeiterinnen und Mitarbeiter gegen einen Vertrag mit dem Pentagon protestiert hatten. Tausende Beschäftigte unterzeichneten einen offenen Brief mit der Aussage, dass Google nicht im Kriegsgeschäft tätig sein sollte. Als Reaktion darauf verlängerte Google den Vertrag damals nicht.
Anthropic will Jailbreak-Schutz auf die Probe stellen
Anthropic hat ein Filtersystem entwickelt, das Antworten auf unzulässige KI-Anfragen an das Sprachmodell Claude verhindern soll. Bei der Entwicklung griff Anthropic auf das bereits vorhandene Constitutional-AI-System zurück. Diese sogenannte Verfassung enthält Regeln in natürlicher Sprache, aus denen hervorgeht, welche Anfragen zulässig sind und welche nicht. Auf dieser Grundlage generierte Anthropic 10.000 Test-Prompts. Diese wurden in den Stil von Anfragen umgewandelt, mit denen bereits zuvor unzulässige Anfragen erfolgreich beantwortet wurden, und um Formulierungen für neuartige Jailbreak-Versuche ergänzt.
Im internen Test von Anthropic soll die mit dem Filtersystem geschützte Version 95 Prozent der unzulässigen Anfragen blockiert haben, erklärte Anthropic. Nun sind die Nutzerinnen und Nutzer aufgefordert, die Filter zu testen. Dafür sollen sie versuchen, von Claude acht Fragen zu chemischen Waffen beantwortet zu bekommen. Das Unternehmen will so das Sprachmodell einem Stresstest unter Realbedingungen unterziehen und mit den zusätzlichen Daten die Erkenntnisse der internen Tests und des Bug-Bounty-Programms ergänzen. Über ein Feedback-Formular können Nutzerinnen und Nutzer gefundene Schwachstellen im Filtersystem an das Unternehmen melden.
KI beschert jetzt auch AMD Rekordzahlen
AMD hat den Geschäftsbericht fürs Jahr 2024 veröffentlicht. Der zeigt: Auch AMD verdient mittlerweile gut an KI. Fast 26 Milliarden US-Dollar Umsatz sind es im Jahr 2024. Etwa 1,6 Milliarden Dollar bleiben als Netto-Gewinn. Einen signifikanten Anteil macht inzwischen KI aus. Nach Anlaufschwierigkeiten verkaufte AMD mittlerweile hohe Stückzahlen der MI300-Serie. Mehr als 5 Milliarden Dollar brachten die Beschleuniger vergangenes Jahr ein.
AMD hinkt dem Weltmarktführer Nvidia zwar weiter hinterher, hat inzwischen aber Beschleuniger als weiteres Standbein etabliert. AMDs Jahresumsatz entspricht aktuell nur einem einzelnen Nvidia-Quartal. Intel ist dagegen abgeschlagen. Der Hersteller verkauft keine KI-Beschleuniger in nennenswerten Mengen und hat erst kürzlich die nächste Generation eingestampft.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
OpenEuroLLM soll KI in der EU unabhängiger und vielfältiger machen
Im weltweiten Wettbewerb um leistungsfähige Systeme mit Künstlicher Intelligenz schickt Europa mit OpenEuroLLM ein weiteres Projekt ins Rennen. Dahinter steht ein Konsortium aus 20 europäischen Forschungseinrichtungen, Unternehmen und Hochleistungsrechenzentren (EuroHPC). Ziel ist es, auf Open-Source-Basis eine Familie leistungsfähiger, mehrsprachiger Large Language Models (LLMs) für kommerzielle, industrielle und öffentliche Dienste aufzubauen.
ByteDance kann Menschen jetzt fotorealistisch animieren
Der TikTok Mutterkonzern ByteDance hat ein neues Framework namens OmniHuman-1 vorgestellt. Damit lassen sich aus Bild- und Audiobeispielen Videos generieren. Das System erzeugt aus einem Referenzbild und einem Audioclip, etwa einem Songschnipsel, kurze Videos. Ob ByteDance die Technologie auf seinen Plattformen einsetzen wird, ist noch unklar.
OpenAI erweitert ChatGPT-WhatsApp-UnterstĂĽtzung
OpenAIs ChatGPT ist jetzt mit erweiterten Funktionen in WhatsApp verfügbar. Nutzerinnen und Nutzer können Bilder hochladen, um den Kontext für ChatGPTs Antworten zu verbessern. Beispielsweise kann man Fotos von Pflanzen oder Schildern senden und ChatGPT um Identifizierung oder Übersetzung bitten. Auch Sprachnachrichten werden unterstützt. Der ChatGPT-Zugang über WhatsApp ist kostenlos. Nutzende können demnächst aber auch ihre ChatGPT Plus-, Free- oder Pro-Konten verknüpfen.
MagentaTV entfernt Serie mit KI-Synchronisation
Die Deutsche Telekom hat eine polnische Serie mit KI-generierter Synchronisation aus ihrem MagentaTV-Angebot entfernt. Das berichtet das Medienmagazin DWDL. Es geht um die polnische Viaplay-Produktion "Murderesses", die in der deutschen Fassung KI-Stimmen für die Synchronisation benutzt. Im Abspann wird das israelische KI-Unternehmen Deepdub als für die Synchronisation verantwortliche Firma genannt. Dem Publikum fiel laut DWDL die schlechte und monotone Synchronisation der Polizei-Serie auf. Als das Medienmagazin bei der Deutschen Telekom nachfragte, entfernte sie die Serie am Montag aus ihrem Angebot – "zum Zweck der Qualitätskontrolle und Klärung", schreibt DWDL. Warum der Telekom die schlechte KI-Synchronisation nicht schon vorher auffiel, ist nicht bekannt. Schließlich entschied sich das Unternehmen dazu, die Serie künftig ausschließlich im polnischsprachigen Original mit deutschen Untertiteln auf MagentaTV anzubieten. Auf dem Viaplay-Kanal bei Prime Video bleibt die Serie mit KI-Synchronisierung allerdings weiter online.
(igr)