OpenAI stellt deep research vor: Noch ein neuer KI-Agent
Noch ein neuer KI-Agent von OpenAI ist spezialisiert auf großangelegte Recherchen. deep research soll 26 Prozent im Last Exam schaffen.
(Bild: Shutterstock/ioda)
Der neue KI-Agent von OpenAI heißt deep research. Er soll vor allem für großangelegte Recherchen gut sein. Dazu nutzt deep research das erst vor kurzem veröffentlichte Modell o3. Das gibt es seit zwei Tagen auch in einer mini-Version. So langsam gehören in das Portfolio von OpenAI so viele Modelle, Agenten und Abonnements, dass man leicht den Überblick verlieren kann, was wozu gut ist.
Grundsätzlich dreht sich bei OpenAI alles um ChatGPT. deep research ist ein Agent, der in dem Chatbot steckt. Laut Blogbeitrag kann er eine "mehrschichtige Recherche im Internet bewältigen und komplexe Aufgaben" dafür übernehmen. Der Agent benötige nur Dutzende Minuten, um das zu erledigen, wofür ein Mensch viele Stunden brauche. Nicht eingerechnet ist die menschliche Kontrollzeit, die sich an eine KI-Recherche anschließt. Denn wie alle KI-Anbieter immer wieder betonen, brauche es schließlich einen sogenannten Human-in-the-Loop, also einen Menschen, der alles absegnet. Auch OpenAI erklärt, dass deep research halluzinieren könne, sagt aber, das passiere im Vergleich zu anderen Modellen weniger.
Videos by heise
deep Research basiert auf einer Version des angekündigten Modells o3, das fürs Browsen im Internet und die Datenanalyse optimiert wurde. OpenAI wäre nicht OpenAI, wenn sie nicht im Blogbeitrag ihr allgegenwärtiges Ziel ansprechen würden: "deep Research stellt einen bedeutenden Schritt auf dem Weg zur Entwicklung einer AGI da, von der wir glauben, dass sie die wissenschaftliche Forschung vorantreiben wird."
deep reseach absolviert Last Exam
Nutzen lässt sich deep research über das reguläre Eingabefeld in ChatGPT in der Web-Version, allerdings nur für Menschen mit einem kostenpflichtigen Konto. OpenAI schreibt als Beispiel, man könne ChatGPTs neuen KI-Agenten dafür nutzen, einen Vergleich der Streamingdienste zu erstellen. Nicht unbedingt die Aufgabe, die man sich unter einer wissenschaftlichen Recherche als Erstes vorstellt. Die Beantwortung einer solchen Frage soll zwischen 5 und 30 Minuten dauern. Entsprechend hoch dürften die Kosten aufseiten von OpenAI sein. Noch ist der Output auf Text beschränkt, Bilder und Grafiken sollen folgen.
OpenAI schreibt, deep research sei ideal für lange Recherchen, bei denen die Genauigkeit und Zitation besonders wichtig sei. GPT-4o hingegen sei das Modell der Wahl, wenn es um multimodale Konversationen in Echtzeit gehe. Der neue KI-Agent sei zudem in der Lage, 26,6 Prozent der Fragen im Benchmark Humanity's Last Exam zu beantworten. Dieser fokussiert auf wissenschaftliche Themen, laut der Entwickler haben vorherige Modelle nur höchstens zehn Prozent erreichen können. GPT-4o liegt bei 3,3 Prozent, o3-mini-medium erreicht 10,5 Prozent und o3-mini-high 13 Prozent, schreibt OpenAI.
Ein ebenfalls kürzlich vorgestellter KI-Agent von OpenAI heißt Operator. Auch er soll im Internet Sachen herausfinden und zusätzlich Aufgaben übernehmen können. Gibt man ihm seine Kreditkartendaten, kann er auch Bestellungen aufgeben.
(emw)