Wie OpenAI ChatGPT entwickelt hat: Ein exklusives Gespräch mit den Machern

Wie fühlt es sich an, einer der Entwickler hinter dem extrem erfolgreichen KI-Textgenerator zu sein? MIT Technology Review durfte exklusiv nachfragen.

In Pocket speichern vorlesen Druckansicht 33 Kommentare lesen
Logo von Open AI

Logo von Open AI.

Lesezeit: 18 Min.
Von
  • Will Douglas Heaven
Inhaltsverzeichnis

Als OpenAI Ende November 2022 mit erstaunlich wenig Aufsehen sein neuestes Produkt ChatGPT veröffentlichte, hatte das in San Francisco ansässige KI-Unternehmen eher geringe Erwartungen. Was sollte schon passieren? Ganz bestimmt war niemand bei OpenAI auf einen viralen Mega-Hit vorbereitet. Doch der kam dann doch – und was für einer. Seither sind die KI-Experten dabei, ihrem eigenen Erfolg hinterherzuhecheln und gleichzeitig Kapital aus diesem zu schlagen.

Eine "Forschungsvorschau" sollte es sein, hieß es intern, wie OpenAI-Policy-Expertin Sandhini Agarwal erzählt. Man habe es als eine Art Vorgeschmack auf eine ausgefeiltere Version einer zwei Jahre alten Technologie gesehen – und, noch wichtiger, als Versuch, künftige Fehler vorab zu beheben, indem man erst einmal Feedback von der Öffentlichkeit sammelt. "Wir wollten das nicht als großen grundlegenden Fortschritt verkaufen", sagt auch Liam Fedus, Wissenschaftler bei OpenAI, der an ChatGPT mitgearbeitet hat.

Um mehr über den Chatbot zu erfahren – wie es entstanden ist, wie OpenAI es seit seiner Veröffentlichung aktualisiert hat und wie die Macher über ihren Erfolg denken – konnte MIT Technology Review mit vier Personen sprechen, die an der Entwicklung einer Anwendung beteiligt waren, die in kürzester Zeit zu einer der beliebtesten Internet-Apps aller Zeiten wurde. Neben Agarwal und Fedus sprachen wir mit John Schulman, einem der Mitbegründer von OpenAI, und Jan Leike, OpenAIs Leiter des sogenannten Alignment-Teams, das sich mit dem Problem befasst, KI dazu zu bringen, das zu tun, was die Nutzer von ihr erwarten (und nichts anderes).

In den Gesprächen kam schnell das Gefühl auf, dass OpenAI selbst immer noch vom Erfolg seiner "Forschungsvorschau" ChatGPT überrascht ist. Doch mittlerweile hat die KI-Firma die Gelegenheit beim Schopfe gepackt und treibt die Technologie voran, indem sie überwacht, wie Millionen von Menschen ChatGPT nutzen. Gleichzeitig wird versucht, die schlimmsten Probleme mit dem Chatbot möglichst sofort zu lösen, wenn sie auftauchen.

Seit dem Start im November hat OpenAI ChatGPT bereits mehrere Male aktualisiert. Die Forscher verwenden beispielsweise eine Technik namens "Adversarial Training", um ChatGPT daran zu hindern, sich von Nutzern zu "schlechtem Verhalten" verleiten zu lassen – also so, wie sich das OpenAI nicht wünscht. Damit wird gegen das sogenannte Jailbreaking vorgegangen, das versucht, den Chatbot Dinge sagen zu lassen, die eigentlich verboten sind.

Bei dieser Arbeit treten mehrere Chatbots gegeneinander an: Eine Instanz spielt den Angreifer und attackiert eine Opfer-Instanz mit Text (im ChatGPT-Sprachgebrauch: Prompts), der sie dazu zwingen soll, die eigentlich einprogrammierten Beschränkungen zu überwinden und unerwünschte Antworten zu geben. Erfolgreiche Angriffe werden den Trainingsdaten von ChatGPT hinzugefügt – in der Hoffnung, dass das System lernt, sie zu ignorieren.

OpenAI hat außerdem ein Milliardeninvestment von Microsoft erhalten und eine Allianz mit der global operierenden Unternehmensberatung Bain abgeschlossen. Letztere soll generative KI-Modelle auch in Marketingkampagnen für Kunden der Consultants bringen, darunter Coca-Cola. Außerhalb von OpenAI hat ChatGPT einen gigantischen Hype ausgelöst: Es gibt einen Run auch auf andere große KI-Sprachmodelle, viele Start-ups und sehr viel Risikokapital.