OpenAI bietet mit Operator einen KI-Agenten für fast alle Tätigkeiten im Web an
Der Operator kann selbstständig Dinge im Web suchen und bestellen. Der KI-Agent ist noch eine Vorschau und zunächst US-Abonnenten von ChatGPT Pro vorbehalten.
(Bild: Vasin Lee/Shutterstock.com)
OpenAI hat eine frühe Version seines ersten KI-Agenten veröffentlicht. Der sogenannte "Operator" kann typische Aufgaben im Internet durchführen, wie etwas herausfinden oder suchen und daraufhin Bestellungen aufgeben. Für kritische Aktionen, wie Zahlungsinformationen eingeben, die Bestellung bestätigen oder eine Nachricht senden, ist aber das Eingreifen des Nutzers erforderlich. Bislang ist der Operator nur Abonnenten von ChatGPT Pro in den USA zugänglich. Die Entwickler versprechen eine breitere Verfügbarkeit in den nächsten Wochen, wobei es laut OpenAI-Chef Sam Altman in Europa noch dauern kann.
Der Operator benutzt das Web wie ein Mensch. Der KI-Agent hat dafür seinen eigenen Browser (in der Cloud), mit dem er interagiert, tippt, klickt und scrollt. Das ist transparent für den Nutzer, die einzelnen Schritte werden visuell dargestellt und der Mensch kann jederzeit übernehmen. Momentan ist der Operator noch eine sogenannte "research preview", quasi eine frühe Entwicklerversion. Um den KI-Agenten lernen zu lassen, stellt OpenAI ihn jetzt einer begrenzten Nutzergruppe zur Verfügung. Immerhin verlangt die Firma 200 Dollar für ein Abo von ChatGPT Pro.
GPT-4o und neues KI-Modell CUA als Basis
Operator basiert auf einem neuen KI-Modell namens "Computer-Using Agent" (CUA). Dieser CUA nutzt die Bildverarbeitungsfähigkeiten von GPT-4o und kombiniert sie mit Reasoning durch bestärkendes Lernen. Der KI-Agent ist speziell auf die Bedienung grafischer Benutzeroberflächen trainiert, aber Fehler sind zum aktuellen Zeitpunkt nicht auszuschließen. Sollte der Operator stecken bleiben, übergibt er die Kontrolle an den Nutzer. So verweigert der KI-Agent etwa das Aufrufen von unsicheren Webseiten und bleibt dann stehen. Auch benötigt der Operator den Anwender zum Einloggen und für Zahlungsinformationen.
Videos by heise
OpenAI kooperiert bereits mit Internet-Unternehmen wie DoorDash, Instacart, OpenTable, StubHub und Uber, sodass der Nutzer diese im Operator direkt auswählen kann, um etwa Lebensmittelbestellungen abzusetzen, einen Tisch im Restaurant zu reservieren, Eintrittskarten zu kaufen und eine Fahrt zu bestellen. Der Anwender kann dem KI-Agenten aber auch überlassen, welchen Anbieter er für die gewünschte Aufgabe als geeignet erachtet.
Datenschutz und Sicherheit
OpenAI verspricht, dass bei der Nutzung des KI-Agenten möglicherweise eingegebene sensible Informationen wie Login- oder Kreditkartendaten nicht protokolliert werden. Zudem ist der Operator nach Angaben von OpenAI darauf trainiert, Banktransaktionen oder kritische Entscheidungen wie etwa auf eine Bewerbung abzulehnen. Allerdings gibt OpenAI zu, dass die KI etwa die Bestätigung einer Bestellung dem Menschen überlassen "sollte". Das ist also vorgesehen, aber nicht garantiert.
Der Operator soll aus Interaktionen mit Menschen lernen, aber Nutzer können unterbinden, dass die eigenen Aufträge für das Training der KI verwendet werden. Das lässt sich in den Einstellungen von ChatGPT abstellen. Zudem kann der Anwender alle Konversationen mit dem KI-Agenten löschen, ebenso wie der Browser-Verlauf des Operator. OpenAI hat den Operator auch auf bösartige Webseiten trainiert. Sollten etwa mögliche Betrugsversuche erkannt werden, stoppt der KI-Agent seine Arbeit und weist den Nutzer darauf hin.
Zwar ist der Operator momentan nur für Abonnenten von ChatGPT Pro in den USA verfügbar, aber OpenAI plant, den KI-Agenten bald auf Plus-, Team- und Enterprise-Nutzer auszuweiten. Auch sollen die Fähigkeiten zukünftig in ChatGPT integriert werden, wenn OpenAI den Operator für ausreichend sicher erachtet und dieser für mehr Anwender gleichzeitig geeignet ist. Zudem ist geplant, das CUA-Modell per API zur Verfügung zu stellen, damit Entwickler eigene KI-Agenten erstellen können.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
(fds)