Meta bläst KI-Training mit Daten unter DSGVO vorerst ab

Irlands Datenschutzbehörde forderte den Zuckerberg-Konzern auf, Daten von Instagram und Facebook vorerst nicht für das Algorithmen-Training einzusetzen.

In Pocket speichern vorlesen Druckansicht 26 Kommentare lesen
Meta-Logo und Kopf eines weiblichen Roboters

Meta verzichtet vorerst auf KI-Daten aus der EU.

(Bild: Below the Sky/Shutterstock.com)

Lesezeit: 4 Min.
Von
  • Falk Steiner

Der US-amerikanische Plattformbetreiber Meta stoppt bis auf Weiteres das Training seiner KI-Modelle mit Daten aus der EU. Damit kommt das Unternehmen einer Aufforderung durch die irische Datenschutzaufsicht nach - die das Vorhaben erst absegnen wollte, nach Protesten nun aber weiteren Gesprächsbedarf sieht.

Meta, Betreiber von Facebook, Instagram, Threads und Whatsapp, hat am Freitag bekannt gegeben, dass es vorläufig doch nicht seine großen Sprachmodelle mit den Daten aus Facebook und Instagram trainieren werde. "Wir sind enttäuscht von der Aufforderung der Irish Data Protection Commission (DPC Ireland) als federführender Aufsichtsbehörde für die Europäischen Aufsichtbehörden, das Training unserer LLMs mit den geteilten Inhalten unserer erwachsenen Nutzer von Instagram und Facebook zu verschieben", heißt es in einem Update der Firma zu einer vor vier Tagen veröffentlichten Beschreibung des Vorhabens. Bereits im März habe man die Aufsichtsbehörden über die Pläne informiert, gibt Meta an.

Das Zuckerberg-Imperium wähnte sich bereits auf gutem Weg, mit der großen Menge an Nutzerdaten aus EU und Europäischem Wirtschaftsraum, dem Geltungsbereich der DSGVO, arbeiten zu dürfen. 260,7 Millionen EU-Bürger würden monatlich Facebook nutzen, hatte die Firma mit Stand April in ihrem Transparenzbericht zum DSA angegeben. 264,3 würden jeden Monat auf Instagram zugreifen, davon 44 Millionen aus Deutschland. Mit den Unmengen an Inhalten will Meta nun seine KI-Angebote füttern: Llama etwa, aber auch der so getaufte Meta AI-Assistant. Die Firma argumentiert damit, dass nur mit den EU-Daten eine Anpassung auf die hiesigen Gegebenheiten möglich sei, außerdem hätten Google und OpenAI ebenfalls bereits EU-Daten dafür genutzt.

Meta sieht sich dabei selbst als Musterschüler: Daten, die von Profilen Minderjähriger stammen, würden konsequent aussortiert, Direktnachrichten zwischen den Nutzern nicht für das Training genutzt. Mehr als zwei Milliarden Benachrichtigungen seien seit dem 22. Mai an die Nutzer gegangen, um diese über die Pläne zu informieren und mit einem Widerspruchsformular gegen die Nutzung der eigenen Daten Einspruch einlegen zu können. Von den Nutzungsmöglichkeiten hinge aber auch ab, ob die EU tatsächlich KI nutzen könne oder ob sie nur als Zuschauer auf die KI-Innovationen im Rest der Welt schauen wolle, während dieser davon profitiere. Meta wolle, dass die Europäer Teil dieser Möglichkeiten würden.

Meta argumentiert, dass die Datenverarbeitung für das KI-Training keine gesonderte Einwilligung für diese Form der Datenverarbeitung benötige. Sie sei als "legitimes Interesse" im Sinne der Datenschutzgrundverordnung zulässig. Datenschutzaktivisten wie die österreichische Organisation NOYB sehen das anders - und hatten deshalb Beschwerde auch bei weiteren Datenschutzaufsichtsbehörden außerhalb Irlands gegen Metas Pläne eingereicht. Auch das Opt-Out-Formular sei unzureichend, hatte die von Max Schrems gegründete Organisation bereits vor Wochen kritisiert.

Die irische Datenschutzaufsicht hat die Ankündigung Metas begrüßt, die Nutzung vorerst abzublasen. "Die Entscheidung fiel nach intensiven Diskussionen zwischen DPC und Meta", teilt die Behörde mit. Man werde die Diskussion mit der Firma zusammen mit anderen europäischen Aufsichtsbehörden fortsetzen. Was genau den Sinneswandel bei der DPC auslöste, erklärte die Behörde am Freitag nicht.

Ob es Meta tatsächlich um das wirtschaftliche und gesellschaftliche Wohlergehen in der EU geht, ist kaum zu prüfen. Ein ganz anderer Grund für die Pläne zur großflächigen Datenauswertung für das LLM-Training könnte in einem Problem liegen, auf das alle großen KI-Modell-Entwickler derzeit zulaufen: Schon in wenigen Jahren könnten die Trainingsdaten für die riesigen Modelle knapp werden. Was sich 2022 noch als recht abstraktes Problem am Horizont abzeichnete, hat sich laut erst im April 2024 veröffentlichten Einschätzungen von Wissenschaftlern weiter verschärft.

(nie)