ChatGPT Agent: Reasoning und Action-Modell kombiniert

Ein KI-Agent, der denken, entscheiden und vor allem auch handeln kann: ChatGPT Agent ist in Deutschland verfügbar.

vorlesen Druckansicht 60 Kommentare lesen
Man tippt auf Tastatur, darüber schwebt ChatGPT-Schriftzug

(Bild: CHUAN CHUAN/Shutterstock.com)

Update
Stand:
Lesezeit: 3 Min.

OpenAI hat mehrere seiner Modelle vereint: Heraus kam der ChatGPT Agent. Er ist eine Mischung aus dem Operator, der mit Webseiten interagieren kann, Deep-Research für die tiefe Auseinandersetzung mit Themen, und ChatGPT für die Konversationsfähigkeit. Das heißt, der neue Agent übernimmt selbstständig Aufgaben und nutzt dafür eine Art virtuellen Computer. Was er konkret kann: einen freien Termin im Kalender finden, ein Restaurant mit gewünschter Speisekarte und Preisklasse heraussuchen und sogleich einen Tisch reservieren.

Der ChatGPT Agent greift auf eine Reihe von Tools zu, sogenannte Connectors. Auf diese kann ChatGPT bereits seit Längerem zugreifen. Dazu gehören Google Drive, GitHub, SharePoint und weitere. Eine Liste aller Connector hat OpenAI auf seiner Webseite gesammelt, dort ist auch zu sehen, welche bisher nicht in der EU verfügbar sind. Während die Connector Zugriff auf das Gedächtnis, die Memory genannte Funktion, haben dürfen, soll der ChatGPT Agent diese Informationen noch nicht nutzen können. Dazu seien erst noch weitere Sicherheitsprüfungen nötig, sagt OpenAI auf Nachfrage. Memory ist in Deutschland standardmäßig ausgestellt, die Funktion kann sich bisherige Anfragen merken und beantwortet neue Anfrage mit Bedacht auf dieses Wissen.

Möchte man den neuartigen Agenten nutzen, greift man auf die bekannte Bedienoberfläche zurück. Dort findet er sich in der Modellauswahl. Man gibt einen Prompt ein und beschreibt seinen Wunsch, also etwa im Fall des Beispiels, das OpenAI bei einem Media Briefing zeigt: Man fordert ChatGPT auf, den Kalender zu nutzen und ein Restaurant zu finden, das beispielsweise indisches Essen anbietet. In einem Fenster innerhalb des Dialogfeldes erscheint dann der Denkprozess, diesen kann man also überwachen. Ebenso muss man das Ergebnis gegebenenfalls absegnen. Kreditkartendaten werden nicht einfach für ein neues Paar Schuhe genutzt, ohne dass es den entsprechenden Auftrag auch wirklich gibt.

Videos by heise

Da es nicht zwingend nur ein Restaurant mit indischem Essen in einer Stadt gibt, erscheint am Ende des Prozesses etwa eine Tabelle mit einer Übersicht, welche Restaurants geeignet wären. Natürlich kann man den Prozess auch verfeinern und zusätzliche gewünschte Details prompten.

Weitere Beispiele, die OpenAI für den Einsatz des ChatGPT Agent nennt: "Finde eine japanisch angelehnte Vintage-Samsara-Lampe für unter 200 US-Dollar bei Etsy. Priorisiere qualitativ hochwertige Bilder und gute Bewertungen des Verkäufers." Oder: "Suche bei LinkedIn alle Entwickler in New York City, die mehr als zehn Jahre Arbeitserfahrung haben und bei Unternehmen angestellt sind, die wachsen." Die Aufgaben können aber auch deutlich komplexer sein und Börsenwerte umfassen oder Preislisten und Abomodelle von verschiedenen Produkten auswerten.

OpenAI stellt klar, dass es sich um erste Gehversuche des Agenten handelt und daher Fehler möglich sind – wie üblich bei KI. Die System Card mit weiteren Informationen zum ChatGPT Agent wird noch veröffentlicht. Darin erklärt OpenAI auch die Sicherheitsvorkehrungen.

Update

Der ChatGPT Agent ist ab sofort auch in der EU verfügbar. Zugang haben Pro-, Plus- und Team-Nutzer.

(emw)