Claudes Computer Use kommt in Cowork und Code
Computer Use nennt Anthropic die Funktion seines KI-Chatbots Claude, einen Computer zu bedienen wie ein Mensch. Das wird erweitert.
Anthropic steht auf einem Smartphone, im HIntergrund Claude.
(Bild: Stockinq/Shutterstock.com)
Claudes Computer Use ist künftig auch für Cowork und Code verfügbar. Das bedeutet, der KI-Chatbot von Anthropic kann damit auch in diesen beiden Modi einen Computer bedienen, wie es auch ein Mensch machen würde – und Dokumente öffnen, den Browser sowie Developer-Tools nutzen.
Dabei ist Computer Use nicht grundsätzlich neu. Die Funktion hat es im regulären Chatbot bereits gegeben. Nun wird sie erweitert. Zugriff haben zunächst alle Menschen mit einem Pro- oder Max-Abonnement. Eine weitere Einschränkung: Nur in der macOS-Desktop-App funktioniert Computer Use in Cowork und Code. Windows soll bald folgen. Freilich handelt es sich um eine „early research preview“ – mit diesem Zusatz sichern sich alle KI-Unternehmen grundsätzlich ab, da KI-Anwendungen fehleranfällig sind.
Claude: Connector vor Computer Use
Bevor Claude auf Computer Use zugreift, versucht der Chatbot die sogenannten Connectors zu nutzen. Das sind direkte Verbindungen zu anderen Diensten wie etwa Gmail, Google Drive, Slack und mehr. Erst wenn es keinen Connector gibt, startet Computer Use. Dann ist Claude in der Lage, den Browser zu bedienen – das beschränkt sich laut Beitrag offenbar auf Chrome. Zudem kann Claude all das nutzen, was auf dem Bildschirm zu sehen ist. Dafür macht der Chatbot Screenshots, das KI-Modell verarbeitet diese dann.
Anthropic erklärt auch, dass Claude immer die schnellste Lösung nutzen wird. Im Supportartikel nennt das Unternehmen als Beispiel, dass eine Nachricht bei Slack zu verschicken via Connector nur wenige Sekunden dauere und Computer Use dafür deutlich länger benötige. Bevor Computer Use anspringt, fragt Claude grundsätzlich nach der Erlaubnis.
Ähnliche Funktionen gibt es auch bei anderen Anbietern. OpenAI hat etwa den Operator und ChatGPT Agent in petto. Beides sind agentische Fähigkeiten, die ebenfalls den Computer nutzen können, wie es auch ein Mensch tun würde. Microsofts Copilot kann sogenannte Actions ausführen – das sind Aufgaben, die im Hintergrund erledigt werden und für die beispielsweise Eingabefelder ausgefüllt werden müssen oder Ähnliches, wozu das KI-Modell etwa eine Webseite verarbeiten oder andere Anwendungen verstehen können muss. In Copilot Studio gibt es zudem Tests mit der ebenfalls „Computer Use“ genannten KI-Funktion. Google testet „Computernutzung“ durch Gemini seit einiger Zeit.
Risiken von Computer Use
Alle Anbieter haben gemeinsam, dass sie vor der Nutzung warnen. Laut Anthropic ist Claude darauf trainiert, riskante Aufgaben zu erkennen. Dazu sollen auch Prompt Injections gehören. Das sind versteckte Anweisungen an KI-Chatbots, die für den eigentlichen Nutzer unerwünschtes Verhalten hervorrufen. Aber: Auch Claude kann unter Umständen nicht alle Angriffsversuche erkennen.
Videos by heise
Da „Computer Use“ Screenshots macht, warnt Anthropic auch, dass man gegebenenfalls auf alle Informationen achten sollte, die zu sehen sind. Grundsätzlich soll Claude keinen Aktienhandel und keine Anlagegeschäfte ausführen, niemals sensible Daten irgendwo eintragen und keine Bilder von Gesichtern erfassen.
Anthropic verweist auch darauf, dass man keine Bankdaten zur Verfügung stellen sollte. Cowork hat außerdem ein Gedächtnis, das heißt, was einmal dem Chatbot mitgeteilt wurde, bleibt gespeichert. Cowork läuft mit Computer Use nicht in einer abgesicherten Umgebung.
(emw)