Raubkopien für KI-Training: Meta nutzt BitTorrent – haben aber "nicht geseedet"

Um an immense Datenmengen für das KI-Training zu kommen, hat Meta ganze Schattenbibliotheken heruntergeladen – per BitTorrent. Illegal sei das nicht gewesen.

vorlesen Druckansicht 72 Kommentare lesen
Meta-Logo und -Schriftzug auf Smartphone, das auf Tastatur liegt.

(Bild: JarTee/Shutterstock.com)

Lesezeit: 2 Min.
close notice

This article is also available in English. It was translated with technical assistance and editorially reviewed before publication.

In einem Rechtsstreit um die Frage, ob Meta KI-Modelle mit urheberrechtlich geschützten Büchern trainiert hat, hat der Facebook-Konzern die Beschaffung der Inhalte per BitTorrent zwar eingestanden, besteht aber jetzt darauf, diese aber nicht selbst publiziert zu haben. Man habe Vorkehrungen getroffen, um die heruntergeladenen Daten nicht zu "seeden", heißt es in einem bei Gericht eingereichten Statement. Gleichzeitig hat ein Manager von Meta aber bereits vor Gericht ausgesagt, dass man beim Download der Terabyte an Daten die Einstellungen so konfiguriert habe, "dass nur die kleinstmögliche Menge an Seeding passiert". Ganz verhindern konnte man das demnach also nicht.

In dem von Sarah Silverman, Richard Kadrey und Christopher Golden angestrengten Verfahren geht es um den Vorwurf, dass Meta für das Training der KI-Modelle Llama unter anderem Daten von LibGen genutzt hat. Diese Schattenbibliothek gewährt kostenfreien Zugriff auf urheberrechtlich geschützte Literatur, in Deutschland wird der Zugriff darauf per DNS-Sperre blockiert. Laut den Klagenden geht es um Terabyte an Daten. Ein Meta-Manager hat den Download des LibGen-Katalogs per BitTorrent auch bereits eingestanden, alternative Wege seien zu langsam gewesen. Indem das Seeding minimiert beziehungsweise verhindert wurde, seien mögliche Rechtsverletzungen verhindert worden, argumentiert der US-Konzern jetzt.

Videos by heise

Ob Meta mit der Strategie vor Gericht durchkommt, ist noch nicht abzusehen. Der Konzern will darlegen, dass Downloads per Torrent nicht an sich illegal sind, selbst wenn es um Inhalte von Sammlungen wie LibGen geht. Man habe lediglich Daten von einem "bekannten Online-Speicher" bezogen, die über BitTorrent öffentlich verfügbar waren. Dass man sich bei Meta durchaus bewusst war, dass das Vorgehen problematisch sein dürfte, zeigt ein Zitat, das bereits vor Gericht zitiert wurde. Ein Angestellter meinte demnach intern: "Das Nutzen von Tauschbörsen an einem Unternehmens-Laptop fühlt sich nicht richtig an." Auch die Versuche, das "Seeden" zu verhindern, passen dazu.

(mho)