Künstliche Intelligenz: Sprachmodell GPT-3 ohne Warteliste verfügbar

OpenAI gibt das Sprachmodell nun öffentlich frei, nachdem das Unternehmen einen eigenen Sicherheitsprozess eingeführt hat, der Missbrauch verhindern soll.

In Pocket speichern vorlesen Druckansicht 17 Kommentare lesen

(Bild: sdecoret / shutterstock.com)

Lesezeit: 4 Min.
Inhaltsverzeichnis

Das auf Machine Learning ausgelegte Unternehmen OpenAI stellt den Zugriff auf seine öffentliche API nun ohne Warteliste zur Verfügung. Damit können sich alle Interessierten für die Schnittstelle zum Sprachmodell GPT-3 registrieren, sofern sie aus den richtigen Ländern kommen. Die Programmier-KI Codex, die auf GPT-3 aufsetzt, steht ebenfalls öffentlich über die API bereit.

OpenAI hat nun aus eigener Sicht genügend Sicherheitsmaßnahmen umgesetzt, die den Missbrauch des Sprachmodells verhindern sollen. GPT-3 gilt als extrem leistungsstarker Sprachgenerator, der aber wie alle Machine-Learning-Modelle sein Wissen aus menschlichen Eingaben zieht.

Damit übernimmt das Modell in seinen Texten nicht nur das grammatische Wissen der Menschen, sondern auch deren Vorurteile. Dieser Bias ist insgesamt ein Problem in Machine-Learning-Anwendungen. Bereits 2018 hatte Amazon sein ML-gestütztes Bewertungssystem für Bewerbungen eingestampft, weil es Bewerberinnen gegenüber männlichen Anwärtern benachteiligt hatte.

Eine Analyse von GPT-3 kam Anfang des Jahres zu der Schlussfolgerung, dass das Modell tief verankerte Vorurteile gegen Muslime hege. Diese hatte es aus den unzähligen Texten aus dem Internet übernommen, die zum Training des Modells dienten.

Zu den Sicherheitsmaßnahmen gehört ein Content-Filter, der derzeit noch Betastatus hat und Texte als safe, sensitive oder unsafe einstuft. Darüber hinaus finden sich in der Dokumentation empfohlene Vorgehensweisen für den sicheren Umgang mit der API.

Schließlich hat OpenAI Richtlinien für den Einsatz der API veröffentlicht, die in gewisser Weise ein Ampelsystem vorgeben – von Anwendungen, die nahezu immer Zustimmung finden, über vom Einzelfall abhängige Evaluierungen bis hin zu untersagten Anwendungen. Zu Letzteren gehören unter anderem Applikationen, die automatisierte Tweets oder Instagram-Posts erstellen oder in anderer Weise Inhalte auf sozialen Medien teilen. Auch der Einsatz der API mit dem Zweck, politische Entscheidungen zu beeinflussen, ist tabu.

Richtlinien gab es bereits während der nicht öffentlichen Phase. Im September musste ein Entwickler seinen GPT-3-Chatbot abschalten, weil er gegen die Regeln von OpenAI verstoßen hatte und unter anderem weder einen Filter noch Überwachungstechniken gegen missbräuchliche Themen eingebunden hatte.

Grundsätzlich steht die API nun allen Entwicklerinnen und Entwicklern offen, sofern sie nicht aus den falschen Ländern kommen. Statt einer Tabuliste hat OpenAI eine Liste der "Supported Countries" veröffentlicht. Dass Nordkorea, Iran, Afghanistan und China auf der Liste fehlen, war zu erwarten, und die Abwesenheit von Russland verwundert ebenfalls kaum. Auch die Ukraine ist nicht auf der Positivliste, dafür aber der Irak und explizit separat aufgeführt der Heilige Stuhl.

Neben GPT-3 öffnet OpenAI laut der Übersichtsseite zur API auch die Schnittstelle zu dem Modell Codex, das natürliche Sprache in Code übersetzt. Es ist die Grundlage für GitHub Copilot und war im August in die private Beta gestartet. Auf der Codex-Projektseite ist allerdings immer noch die Warteliste verlinkt.

OpenAI entstand 2015 als Forschungsprojekt, zu den Gründern gehörte Elon Musk. Anfangs veröffentlichte die Organisation viele Projekte im Bereich Reinforcement Learning. Das Sprachmodell GPT-3, das als Akronym für Generative Pre-trained Transformer 3 steht, brachte OpenAI breite Aufmerksamkeit. 2019 verabschiedete sich OpenAI vom reinen Non-Profit-Business und investiert inzwischen selbst in Start-ups im Bereich Machine Learning – zuletzt mit 100 Millionen US-Dollar.

Derweil entwickeln andere Unternehmen Alternativen zu GPT-3. Microsoft und Nvidia haben im Oktober das Megatron-Turing Natural Language Generation Model (MT-NLG) vorgestellt, und das deutsche Unternehmen Aleph Alpha setzt auf ein multimodales Modell, das als europäische Antwort auf GPT-3 gilt. Derweil ist GPT-4 bereits in Arbeit, das wohl wie der Vorgänger ein reines Textmodell werden soll.

Weitere Details zur Öffnung der API lassen sich dem OpenAI-Blog entnehmen. Wer GPT-3 nutzen möchte, muss zunächst einen Account anlegen. OpenAI hat eine Reihe von Beispielanwendungen bereitgestellt, die als Starthilfe dienen sollen.

(rme)