Freie API für GPT-3: Türöffner für Fake-News und Vorurteile?

Die gigantische Sprach-KI GPT-3 ist ab sofort über ein API verfügbar. GPT-3 schreibt angefangene Texte stilsicher weiter. Das birgt allerdings einige Gefahren.

In Pocket speichern vorlesen Druckansicht 13 Kommentare lesen
Künstliche Intelligenz als Hilfswissenschaftler: KI revolutioniert die Forschung

(Bild: Phonlamai Photo/Shutterstock.com)

Lesezeit: 2 Min.

Das KI-Unternehmen OpenAI hat bereits 2020 ein unglaublich großes neuronales Netz namens „Generative Pre-trained Transformer 3“ (GPT-3) vorgestellt. Das Netz nutzt 175 Milliarden Parameter und hat beim Training terabyteweise Texte aus dem gesamten Internet gelesen.

GPT-3 verblüfft seitdem Experten mit stilsicheren und fehlerfreien Texten in mehreren Sprachen, einschließlich Programmiersprachen. Jetzt ist der Zugriff auf GPT-3 für die Allgemeinheit freigegeben.

So arbeiten Transformer

Transformer sind neuronale Netze, die Sequenzen als Eingabe lesen und neue Sequenzen ausgeben können. Beim Berechnen der Ausgabe können sie ihre Aufmerksamkeit auf bestimmte Teile der Eingabe richten und dabei lernen, eine interne Vektor-Repräsentation der Bedeutung der Eingabe gezielt an den Kontext anzupassen. Sie ähneln den älteren Long-Short-Term-Memory-Netzen (LSTM), lassen sich aber parallel berechnen und besser skalieren.

Der nächstliegende Anwendungsfall einer solchen KI ist Sprache: Sätze sind Sequenzen aus Wörtern, die die Transformer lesen. Die Ausgabe ist Wort für Wort ein neuer Satz. Ein solches Sprachmodell wird darauf trainiert, einen angefangenen Text weiterzuschreiben, indem es stets das beste nächste Wort berechnet.

Externen Programmierern gewährte OpenAI bislang nur selten Zugriff auf das Sprachmodell. Die Zurückhaltung begründete das Unternehmen damit, dass ein so gutes Sprachmodell leicht für Fehlinformationskampagnen, Spam oder Betrug missbraucht werden kann. Doch nun hat OpenAI intern genügend Sicherheitsmaßnahmen eingebaut, dass das Risiko für Missbrauch der KI nach Meinung des Unternehmens akzeptabel gering ist.

Die Registrierung für das API ist jetzt öffentlich und ohne Warteliste freigegeben. Programmierer, die GPT-3 in ihren Anwendungen nutzen möchten, müssen Richtlinien zustimmen, die zum Beispiel Betrug und politische Einflussnahme untersagen sowie die erlaubten Anwendungsgebiete beschränken. Für viele Diktaturen ist der Zugriff ganz gesperrt. Ein Content-Filter stuft Texte als "safe", "sensitive" oder "unsafe" ein.

Für den Zugriff auf GPT-3 zahlt man pro Wort. Die hohen Preise ergeben sich aus der immensen Rechenleistung, die GPT-3 verschlingt.

Bezahlt wird der API-Zugriff pro 1000 Wörter oder Satzzeichen (Tokens) mit Preisen zwischen 0,08 und 6 US-Cent, je nachdem, welche Variante der KI man nutzt.

Ein Sprachmodell gegen unethische Verwendung abzusichern ist so schwierig, dass trotzdem mit Missbrauch zu rechnen ist. Anfang dieses Jahres haben Forscher bereits nachgewiesen, dass GPT-3 aus seinen Trainingsdaten Vorurteile über Muslime gelernt hat, die es auch in eigenen Texten wiedergibt.

Das Replizieren von Vorurteilen aus dem Datensatz ist ein Problem, mit dem fast alle Sprach-KIs zu kämpfen haben. Da GPT-3 aber eloquenter schreibt als viele kleine neuronale Netze, sind seine Texte nur sehr schwer als das Werk einer Maschine erkennbar. Eine Quellenprüfung für Texte im Internet wird also immer wichtiger, auch weil GPT-3 nicht allein bleiben wird.

Das deutsche Start-up Aleph Alpha arbeitet bereits an einem ähnlich großen Sprachmodell, genauso wie Microsoft und Nvidia, die ihrem Netz den einschüchternden Namen "Megatron-Turing Natural Language Generation Model" (MT-NLG) gegeben haben – Megatron ist ein Bösewicht aus dem Transformers-Franchise.

c't Ausgabe 26/2021

In c’t 26/2021 zeigen wir, wie der Umstieg von Windows 10 auf 11 in wenigen Mausklicks gelingt – und wie Sie höhere Hürden nehmen, etwa wenn Ihr PC die Harware-Anforderungen nicht erfüllt. Außerdem haben wir auf sechs Doppelseiten handverlesene Geschenketipps der c't-Redaktion zusammengetragen und schlaue Saugbots mit Objekterkennung getestet. Ausgabe 26/2021 finden Sie ab dem 3. Dezember im Heise-Shop und am gut sortierten Zeitschriftenkiosk.

(pmk)