OpenAI engagiert Programmierer, um ChatGPT im Coden zu verbessern

Weil die Code-Skills von ChatGPT nicht besonders ausgereift sind, sollen Aushilfen die KI trainieren. Derweil läuft ein Rechtsstreit um Copilot bei Github.

In Pocket speichern vorlesen Druckansicht 15 Kommentare lesen
Chatgpt,Chat,With,Ai,Or,Artificial,Intelligence.,Young,Businessman,Chatting

(Bild: CHUAN CHUAN/Shutterstock.com)

Lesezeit: 3 Min.

OpenAI soll 1000 Menschen angestellt haben, um ChatGPT beim Lernen, vor allem dem Coden, zu unterstützen. Diese Aufgabe beherrscht der Chatbot offensichtlich noch nicht besonders gut. Gleichzeitig läuft ein Verfahren gegen Microsoft, OpenAI und Github. Es geht um den Umgang mit Daten von Github, die von der gemeinsamen Programmierhilfe Copilot genutzt werden – was eine Urheberrechtsverletzung darstellen soll, meint ein Anwalt und Programmierer. Die Unternehmen wehren sich.

Über die neuen Mitarbeiter berichtet Semafor. Wobei es sich nicht um Festangestellte, sondern Aushilfen handelt, die OpenAI helfen sollen, ChatGPT auch in Sachen Programmieren zu verbessern. Bereits seit sechs Monaten liefen die Engagements zum Teil. Es handelt sich um Remote-Stellen, die auch in Osteuropa und Lateinamerika besetzt werden.

Etwa 60 Prozent der Mitarbeiter kümmerten sich darum, Daten zu kennzeichnen, die ChatGPT zum Training nutzen soll. Dabei handelt es sich um die generelle Auswahl an Informationen – von etwa Bildern, Videos und Texten. Die übrigen 40 Prozent sollen explizit Programmierer sein, die die KI mit eben jenen Informationen und Aufgaben füttern.

OpenAI nennt seine explizit für Code zuständige KI Codex. Auf dieser baut der Copilot auf, die Programmierhilfe, die sie gemeinsam mit Microsoft und Github kostenpflichtig anbieten. Sie kann natürliche Sprache in Code umwandeln.

Nun ist und wird Codex vor allem mittels Daten aus Github trainiert. Zudem soll auch Copilot Code auswerfen, der direkt übernommen wird – ohne dabei auf die Quelle zu verweisen. Das allerdings verletzt gegebenenfalls Open-Source-Lizenzmodelle und damit die Rechte der jeweiligen Programmierer. Darauf beruht eine Sammelklage, die der Rechtsanwalt Matthew Butterick in San Francisco eingereicht hat.

Laut Reuters haben Microsoft, OpenAI und Github nun eine Stellungnahme eingereicht, in der sie schreiben, dass die Vorwürfe nicht haltbar seien: Der Klage fehle ein Beweis, dass es zu einem persönlichen Schaden gekommen sei, und sie basiere auf "hypothetischen Vorkommnissen". Copilot kopiere keinen Code, sondern erstelle diesen neu. Zudem helfe Copilot Entwicklern mit seinen Vorschlägen für Code. Eine Anhörung ist für Mai angesetzt.

Microsoft hat erst kürzlich bekannt gegeben, weitere Milliarden in OpenAI zu investieren. Die beiden Unternehmen kooperieren bereits seit langem. Github ist ein Tochterunternehmen von Microsoft.

Die Frage nach dem Urheberrecht bei Inhalten, die von einer KI erzeugt wurden, stellt sich nicht nur beim Code. Auch bei Bildern gibt es bereits Rechtsstreitigkeiten. Beispielsweise verklagt Getty Images den Bildgenerator StabilityAI. Es geht sowohl um die Rechte an den Bildern, mit denen die KI trainiert wurde, als auch jene an den Bildern, die generiert werden.

Siehe auch:

(emw)