Für das Weltwissen: OpenAI Partner Programm will deine Daten

Um die Welt noch besser zu verstehen und abzubilden, will OpenAI Daten von Organisationen – Open-Source oder als private Datensets.

In Pocket speichern vorlesen Druckansicht 14 Kommentare lesen

(Bild: OpenAI Blogbeitrag)

Lesezeit: 3 Min.

KI-Sprachmodelle haben bekanntlich noch reichlich Schwächen und Lücken. OpenAI will diese ausmerzen, indem sie weitere Daten in das Training der Modelle fließen lassen. Nicht zuletzt soll das auch dabei helfen, eine Artificial General Intelligence (AGI) zu entwickeln, also eine umfassende starke KI. Die Daten sollen quasi gespendet werden. OpenAI meint, das käme auch den Spendern zugute.

Um ein Open-Source-Archiv aufzubauen, sucht OpenAI Partner, die Daten frei zur Verfügung stellen – beziehungsweise unter Open-Source-Lizenz. Das Datenset soll dann für jedermann öffentlich verfügbar sein. OpenAI möchte damit neben den eigenen geschlossenen Systemen auch neue Open-Source-Modelle trainieren. Im Blogbeitrag heißt es: "Wir glauben, Open-Source wird eine wichtige Rolle im KI-Ökosystem spielen."

Eine weitere Möglichkeit ist es, "private Datasets" an OpenAI zu überreichen. Auch mit diesen möchte OpenAI seine proprietären KI-Modelle anreichern – inklusive der Foundationmodelle und des Finetunings sowie der anpassbaren Modelle. OpenAI geht explizit darauf ein, was mit den privaten Daten und jenen geschieht, die nicht veröffentlicht werden sollen. Diese, so heißt es im Blogbeitrag, können quasi herausgefiltert werden. Aber nicht so, dass sie gar nicht mehr vorhanden sind, sondern nur insofern, als sie nicht als solche wieder ausgegeben werden. Grundsätzlich sei es nämlich laut OpenAI wichtig, möglichst alle Informationen der gesamten Welt einfließen zu lassen. Auch die privaten Daten sollen der KI helfen, ein "besseres Verständnis der Welt zu bekommen".

"Insgesamt suchen wir Partner, die uns helfen wollen, KI beizubringen, unsere Welt zu verstehen, um für alle maximal hilfreich zu sein. Gemeinsam können wir in Richtung einer AGI gehen, die der gesamten Menschheit zugutekommt." In dem Blogbeitrag geht es in keinster Weise um eine Vergütung der zur Verfügung gestellten Daten, oder anderweitige Partnerprogramme. OpenAI meint hingegen, dass jeder davon profitieren würde, wenn er seine Daten in die Modelle fließen lässt. So könne die KI ein entsprechendes Verständnis entwickeln.

Diese Argumentation erinnert schlussendlich auch an Google. Wer seine Inhalte für Google sperrt, muss damit rechnen, deutlich weniger gefunden zu werden und auf Zugriffe verzichten zu müssen. Google möchte das Wissen der gesamten Welt bündeln und wiedergeben können. Gleichzeitig verdient Google mit Werbung zwischen den Suchergebnissen und auf den Webseiten Geld. Dieser Umstand ist Teil mehrerer Prozesse, bei denen es konkret sogar um die Aufspaltung Googles geht.

OpenAI möchte mit dem Partnerprogramm offensichtlich große und kleine Organisationen und Partner ansprechen. Sie schreiben beispielsweise: "Deine Inhalte für KI-Modelle zur Verfügung zu stellen, kann auch dabei helfen, dass die KI deine Domain besser versteht." Als Beispiel für hilfreichen Daten-Input nennen sie die Zusammenarbeit mit der isländischen Regierung, die Daten zur Verfügung stellte, damit GPT-4 die Sprache besser versteht.

Zuletzt hatte OpenAI angekündigt, dass zahlende Kunden eigene GPTs entwickeln können, diese Bots sollen dann in einem Store verfügbar gemacht werden – das Konzept erinnert an App Stores. Um einen GPT zu entwickeln, sind explizit keine Programmierkenntnisse erforderlich. Das soll freilich im natürlichen Konversationsstil mit ChatGPT funktionieren.

(emw)