OpenAI und Midjourney: Inhalte von Wordpress.com und Tumblr für KI-Training

Auch Automattic will mit nutzergenerierten Inhalten Geld machen und sie fürs KI-Training freigeben. Wer das nicht will, muss tätig werden.

In Pocket speichern vorlesen Druckansicht 6 Kommentare lesen
Lupe auf der Website Wordpress.com

(Bild: Postmodern Studio/Shutterstock.com)

Lesezeit: 3 Min.

Das US-Unternehmen Automattic will Inhalte von Wordpress.com und Tumblr standardmäßig für KI-Training freigeben. Das hat zuerst das Online-Magazin 404 Media berichtet, bevor Automattic dann selbst Stellung genommen hat. Darin versichert das Unternehmen, dass Wünsche auf eine Nichtteilnahme ("Opt-out") respektiert würden. Abgesehen davon schreibt das Unternehmen, dass Gespräche mit "ausgewählten KI-Unternehmen" geführt würden. Dabei handelt es sich laut 404 Media um OpenAI – die Entwickler des Textgenerators ChatGPT – und die Entwickler des gleichnamigen Bildgenerators Midjourney. Bei den Vorbereitungen wurden demnach viel zu viele Inhalte für die Weitergabe an die KI-Firmen freigegeben.

404 Media zitiert einen Produktmanager von Automattic mit der intern geäußerten Kritik, dass sich unter den ursprünglich für die Weitergabe an Midjourney und OpenAI vorgesehenen Daten Inhalte befunden haben, die ausgeschlossen werden müssten. Die Rede war demnach von nicht öffentlichen Beiträgen auf öffentlichen Blogs, gelöschten oder gesperrten Beiträgen, verschiedenen privaten Inhalten und Inhalte, für deren Veröffentlichung Geld gezahlt wurde und an denen man nicht die benötigten Rechte habe. Ob sie bereits an die KI-Firmen geschickt wurden, ist demnach unklar. Gleichzeitig werden die Pläne auch bei Automattic so kritisch gesehen, dass ein Angestellter seine Fotos von Tumblr gelöscht hat, um eine Nutzung für das KI-Training zu verhindern.

Offenbar als Reaktion auf den Bericht hat Automattic ein Statement veröffentlicht, in dem der Umgang mit den Inhalten der Nutzer und Nutzerinnen erklärt wird. Dort heißt es, dass es großen KI-Firmen gegenwärtig untersagt werde, sie für das KI-Training zu benutzen. Wer nicht möchte, dass eigene Inhalte weitergegeben werden, kann dies in den Einstellungen deutlich machen. Bei den Partnerschaften würden alle Opt-outs respektiert. Außerdem wolle man einen Schritt weitergehen und die Unternehmen regelmäßig informieren, für welche Inhalte solch ein Opt-out nachgetragen wurde. Die Firmen würden dann "gebeten", diese Inhalte aus dem Trainingsmaterial zu entfernen. Bei Automattic "glaubt" man laut 404 Media, dass sie sich daran halten werden. Eine rechtliche Verpflichtung gibt es wohl nicht.

Automattic ist mit dem Schritt nur das letzte Unternehmen in einer immer länger werdenden Liste von Plattformbetreibern, die mit der Freigabe von benutzergenerierten Inhalten für KI-Training Geld verdienen wollen. Reddit etwa bekommt von Google jährlich 60 Millionen US-Dollar dafür. Unter den jeweiligen Nutzern und Nutzerinnen, um deren Inhalte es geht, stößt das nicht unbedingt auf Zustimmung. Auch an dem Schritt von Automattic gibt es nun Kritik, die wird etwa auf Reddit oder unter dem Mastodon-Beitrag von 404 Media geäußert. Betroffen sind von der Weitergabe nur Blogs, die auf Wordpress.com gehostet werden. Wie groß der Widerstand ist, wird man bei Automattic daran sehen, wie viele Nutzer und Nutzerinnen vom zugesicherten Recht auf Opt-out Gebrauch machen.

(mho)