Befolgt Anweisungen „substanziell besser“: Anthropic gibt Opus 4.7 frei

Das KI-Modell Claude Opus 4.7 soll Anweisungen besser und vor allem wörtlich befolgen. Der Vorgänger werde überall übertroffen, aber nicht das beste KI-Modell.

vorlesen Druckansicht 47 Kommentare lesen
Anthropic steht auf einem Smartphone, im HIntergrund Claude.

(Bild: Stockinq / Shutterstock.com)

Lesezeit: 3 Min.
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

Anthropic hat mit Claude Opus 4.7 sein jüngstes KI-Modell freigegeben, das in verschiedenen Benchmarks angeblich nur von dem unter Verschluss gehaltenen Claude Mythos Preview übertroffen wird. Gegenüber dem Anfang Februar veröffentlichten Vorgänger stelle das Update aber eine „deutliche Verbesserung“ dar, verspricht das KI-Unternehmen. So würden Nutzer und Nutzerinnen jetzt auch ihre schwersten Coding-Aufgaben „vertrauensvoll“ an die Technik abgeben, eine stringente Kontrolle sei nicht mehr nötig. Das KI-Modell erledige „komplexe, langwierige Aufgaben mit Sorgfalt und Beständigkeit“, befolge Anweisungen genaustens und entwickle Methoden, um Ergebnisse vor der Ausgabe zu überprüfen. Zudem könne es Bilder in höherer Auflösung verarbeiten.

Als zentrale Verbesserungen verweist Anthropic darauf, dass Claude 4.7 „substanziell besser“ darin sei, Anweisungen zu befolgen. Interessant sei, dass das KI-Modell dadurch bei Prompts, die früher funktioniert haben, nun unerwartete Ergebnisse zeigen könne: „Opus 4.7 befolgt die Anweisungen wörtlich.“ Deshalb sollten solche Anweisungen überprüft werden. Das neue KI-Modell sei zudem besser darin, Finanzdaten zu analysieren, könne professionellere Präsentationen erstellen und einzelne Aufgaben besser verzahnen. Zudem könne das aktualisierte Opus den auf dem Dateisystem basierenden Speicher effizienter nutzen. Über mehrere Sitzungen würden dadurch weniger Kontextinformationen benötigt.

Zur Freigabe des neuen KI-Modells weist Anthropic noch darauf hin, dass Opus 4.7 Text besser verarbeiten könne. Das habe aber Einfluss auf den Verbrauch von Tokens, weshalb je nach Input bis zu einem Drittel mehr davon nötig sein können. Auch bei anderen Aufgaben könne die verbesserte Performance dafür sorgen, dass mehr Token benötigt werden, als das vorher der Fall gewesen sei. Nutzer und Nutzerinnen könnten das aber steuern, etwa „indem sie das Modell dazu auffordern, sich prägnanter auszudrücken“. In einem Leitfaden haben die Verantwortlichen solche und andere Tipps für die Migration zusammengetragen, die dafür sorgen sollen, dass sich der Token-Verbrauch im Endeffekt trotzdem verringern würde.

Videos by heise

Die Freigabe von Opus 4.7 erfolgt gerade einmal gut eine Woche nach der Vorstellung eines KI-Modells, das so gefährlich sein soll, dass es nicht öffentlich gemacht werden könne. Vor allem weil Claude Mythos Preview bislang unerreicht gut darin sein soll, Sicherheitslücken in Software zu finden und auszunutzen, wird das Modell ausschließlich Firmen zur Verfügung gestellt, die an IT-Sicherheit arbeiten. In einer Auflistung von Benchmark-Ergebnissen zeigt Anthropic jetzt, dass Mythos Opus 4.7 in allen schlägt, teilweise aber auch nur knapp. Bei der Reproduktion von Sicherheitslücken ist Opus 4.7 derweil sogar etwas schlechter als der Vorgänger.

(mho)