Copyright-Sammelklage gegen Anthropic
Ein erheblicher Teil der Trainingsdaten für Anthropics KI bestehe aus illegal kopierten Büchern. Diesen Vorwurf erheben Buchautoren in den USA.​
Drei Buchautoren haben Klage gegen den KI-Anbieter Anthropic PBC erhoben. Die Urheber werfen Anthropic vor, systematisch und rechtswidrig copyright-geschĂĽtzte BĂĽcher zu kopieren und diese dann zum Training KĂĽnstlicher Intelligenzen zu missbrauchen. Damit verletze das Unternehmen US-Copyright.
Die Klageschrift verweist auf ein von Anthropic-Mitarbeitern verfasstes Paper vom Dezember 2021, wonach 32 Prozent eines riesigen Trainingsdatensatzes aus "internet books" bestehe, was ein Codewort für illegal aus dem Internet geladene Bücher sei. Die Kläger beantragen die Zulassung als Sammelklage im Namen aller Autoren von Büchern, die beim US Copyright Office registriert sind und von Anthropic ohne Lizenz kopiert worden sind. Auf der Liste der Forderungen stehen eine Unterlassungsverfügung, Schadenersatz, Abschöpfung der Bereicherung, Verfahrenskosten und Zinsen. Entscheiden sollen Geschworene.
Anthropic hat noch nicht auf die Klage reagiert. Die drei Klage führenden Autoren heißen Andrea Bartz, Charles Graeber und Kirk Wallace Johnson. Sie haben ihre Klage Bartz et al v Anthropic PBC am US-Bundesbezirksgericht für das Nördliche Kalifornien erhoben (Az. 3:24-cv-05417). Am selben Gericht ist seit Juni eine Copyright-Klage von Musikverlagen gegen Anthropic anhängig (Az. 3:24-cv-03811). Die Verlage zeihen Anthropic der massenhaften und unerlaubten Nutzung fremder Liedtexte für Training und Ausgabe des generativen KI-Modells Claude. Dieses Verfahren heißt Concord Music Group et al v Anthropic PBC und wurde ursprünglich am US-Bundesbezirksgericht für das Mittlere Tennessee eingebracht (Az. 3:23-cv-01092), inzwischen aber nach Kalifornien verlagert.
In den USA sind mehr als zwei Dutzend ähnliche Klagen wegen Copyrightverletzung durch KI-Betreiber anhängig; bekannt sind Klagen gegen Alphabet, Bloomberg, Google, Meta Platforms, Microsoft, Mosaic ML, Nvidia, OpenAI, Ross Intelligence und Stability AI. Hauptschauplätze sind die US-Bundesbezirksgerichte für das Nördliche Kalifornien sowie das Südliche New York. Zwei artverwandte Verfahren erheben zwar keine Vorwürfe nach dem US Copyright Act, werfen KI-Betreibern aber vor, fremde Werke in anderer Weise unrechtmäßig zum Training ihrer generativen KIs zu haben. In einem Verfahren geht es um das Scraping von Youtubevideos (Millette v. OpenAI, Az. 3:24-cv-04710, Nördliches Kalifornien), im anderen um den behaupteten Missbrauch der Aufnahmen von Synchronsprechern (Lehrman v. Lovo, Az. 1:24-cv-03770, Südliches New York).
(ds)