Anthropic veröffentlicht Claude Sonnet 4.6 – das kann alles besser

Mit einem Kontextfenster von einer Million Token kommt Claude Sonnet in Version 4.6 heraus. Der kostenlose Chatbot nutzt 4.6 standardmäßig.

vorlesen Druckansicht 3 Kommentare lesen
Die Buchstaben AI kreisen über einem Smartphone und Laptop.

(Bild: Family Stock/Shutterstock.com)

Lesezeit: 2 Min.

Laut Anthropic ist die neueste Version von Claude Sonnet die bisher leistungsfähigste Version. Das gilt demnach für die Fähigkeiten beim Coding, beim Computer Use, beim Reasoning, bei agentischen Aufgaben und der Wissensarbeit sowie im Design. Neu ist das Kontextfenster von einer Million Token.

Claude Sonnet 4.6 wird zunächst als Beta veröffentlicht – wie auch die vergangenen Versionen. Für Menschen, die den kostenlosen Chatbot von Anthropic nutzen, wird es das Standardmodell. Auch mit Pro-Abo wird Claude künftig auf Sonnet 4.6 zurückgreifen. Dabei ist Sonnet nach wie vor das mittlere Modell der Claude-Modellfamilie. Haiku ist besonders schnell und kosteneffizient, Opus ist das leistungsstärkste Modell für komplexe Aufgaben. Den von Anthropic veröffentlichten Benchmarks zufolge liegt Sonnet 4.6 nun allerdings von den Testergebnissen zwischen Opus 4.5 und Opus 4.6. Wie immer kann die Erfahrung in der Praxis je nach Aufgabe und Bedarf von den Ergebnissen aus den Benchmarks abweichen.

Dabei ist Sonnet deutlich kostengünstiger. Es gibt sogar neue Funktionen für Entwickler, die Token sparen sollen. Dazu gehört eine Kontextverdichtung, die ältere Chatverläufe kürzer zusammenfassen soll.

Claude Opus 4.6 wurde erst vergangene Woche veröffentlicht. Tatsächlich können die umfangreichen Aufgaben auch schnell hohe Kosten verursachen. Anthropic schreibt, Opus sei bei besonders „tiefem Reasoning“ nach wie vor das Modell der Wahl – wenn man mehrere Agenten koordinieren wolle oder beim Codebase-Refactoring.

Im Blogbeitrag hebt Anthropic besonders Claude Sonnets Computer Use hervor. Gemeint ist die Bedienung von regulärer Software, fast so wie ein Mensch sie nutzt – ohne dass Anwendungen explizit für KI nutzbar gemacht wurden. Im Benchmark OSWorld, der genau diese Fähigkeit testet, erfüllt die neue Claude-Version laut Anthropic 72,5 Prozent der Aufgaben. Zu diesen gehört etwa die Bedienung von LibreOffice, Chrome und VS Code. Die Vorgängerversion Claude Sonnet 4.5 erreicht 61,4 Prozent.

Videos by heise

Computer Use ist allerdings auch besonders anfällig für Angriffe wie Prompt Injections, dazu zählen etwa versteckte Anweisungen auf Webseiten. Die neue Version von Sonnet soll deutlich besser gewappnet sein, als der Vorgänger – Angriffe sollen erkannt werden und freilich möglichst umgangen. Gelöst ist das Problem aber damit nicht.

(emw)