Warum der Widerspruch bei Meta nur bedingt hilfreich ist
Die irische Datenschutzbehörde hat bestätigt, dass Metas Vorgehen rechtens ist. Der Widerspruch hilft nur bedingt.
(Bild: mundissima/Shutterstock.com)
Meta möchte ab dem 27. Mai 2025 die öffentlichen Daten der Nutzer ihrer Plattformen für das Training der eigenen KI-Modelle nutzen. Heißt: Was ohnehin jeder andere Mensch auf dieser Welt sehen kann, soll dann in das KI-Training wandern. Man kann dagegen noch bis zum 26. Mai Widerspruch einlegen. Wie viel der wirklich bringt, ist allerdings fraglich.
Zunächst mal kann es natürlich nicht schaden, Widerspruch einzulegen. Ein KI-Modell vergisst schließlich nicht und es lässt sich ganz einfach in den eigenen Einstellungen unter Datenschutz erledigen. Dort gibt es zwar ein Eingabefeld, in dem man den Widerspruch begründen kann, das muss man aber nicht mal.
Wer jedoch keinen Widerspruch einlegt, dessen öffentliche Beiträge, also Fotos bei Instagram, Posts bei Facebook und Co. werden genutzt. Dass dieses Vorgehen okay ist, hat nun auch die irische Datenschutzbehörde (DPC) bestätigt. Meta hatte mit dieser direkt besprochen, was sie vorhaben und wie sie vorgehen wollen. Es wundert daher nicht, dass es grünes Licht gibt. Auf Bitten der DPC soll Meta auch Verbesserungen vorgenommen haben, etwa wenn es um die Identifikation von Personen geht.
Dennoch versuchen Verbraucherschutzorganisationen und auch die Datenschutzorganisation Noyb dagegen vorzugehen.
Auch OpenAI nutzt frei verfügbare Daten
Man muss klarstellen, Meta wird keine privaten Nachrichten mitlesen oder gar für das KI-Training nutzen. WhatsApp-Chats, Instagram Direktnachrichten, das bleibt Ende-zu-Ende-verschlüsselt und geheim. Ausnahme machen die Gespräche, die Nutzer künftig mit Metas KI-Chatbot Meta AI führen. Er lässt sich beispielsweise auch in Gruppenchats aktivieren. Diese Teile der Konversation gelten dann als öffentlich und werden von Meta für das Training genutzt. Das machen Google und OpenAI besser: Hier gibt es die Möglichkeit, Gespräche mit den jeweiligen Chatbots zu führen, deren Inhalte nicht an das Unternehmen dahinter fließen.
Videos by heise
Für die öffentlichen Beiträge auf Instagram und Facebook gilt allerdings, dass auf diese auch OpenAI, Google und Anthropic oder ein chinesisches KI-Unternehmen wie Alibaba und wer weiß noch zugreifen und sie für das Training der eigenen KI-Modelle nutzen könnten. Wenn wir also Meta die Nutzung untersagen, heißt das noch lange nicht, dass niemand Gebrauch von diesen Daten macht. OpenAI hat mehrfach betont, dass sie alle frei verfügbaren Inhalte des Internets nutzen, um ihre Modelle zu trainieren. Der Videogenerator Sora dürfte unter anderem mit Videos von Instagram trainiert worden sein. Da auch Youtube-Videos genutzt worden sein sollen, hatte sich Google über dieses Vorgehen beschwert. Meta kann das technisch nicht verhindern, aber in den Nutzungsbedingungen festlegen, dass die Daten der Nutzer nicht von anderen verwendet werden dürfen.
Ob Meta dies getan hat und weitere Maßnahmen ergreift, haben wir erfragt. Die Antwort wird ergänzt, sobald wir sie bekommen. Wir haben auch OpenAI nach der Datennutzung von öffentlichen Beiträgen von Meta-Plattformen gefragt.
US-Recht für alle Beiträge
Dann wäre da das Problem, dass auch Beiträge, die jemand aus der EU verfasst hat, weltweit verfügbar sind. In den USA ist es erlaubt, die Beiträge für das KI-Training zu nutzen. Man müsste also Beiträge aus der EU so kennzeichnen, dass ein Crawler weiß, dass er diese nicht nutzen darf. Es sei denn, man beruft sich darauf, dass man es doch darf, weil man nämlich in den USA handelt – was die KI-Unternehmen machen können. Man müsste also in einem nächsten Schritt festlegen, Beiträge aus der EU dürfen sonst nicht mehr in den USA sichtbar sein.
Aber: Ganz hoffnungslos ist es alles nicht. Die DSGVO sieht nämlich vor, dass Daten über eine Person beispielsweise richtig gestellt werden können müssen. Auch gibt es das Auskunftsrecht, bei dem ein EU-Bürger das Recht hat, zu erfahren, welche Daten von ihm bekannt sind und genutzt werden. Beides ist mit aktuell gängigen KI-Modellen kaum möglich. Das betrifft dann jedoch nicht nur Meta, sondern alle KI-Modelle.
Meta sagt übrigens, man müsse die Daten der EU-Bürger nutzen, weil es sonst keine KI-Modelle gäbe, die den hiesigen Sprachen und der Kultur gerecht würden. Trainiere man KI-Modelle ausschließlich auf US-amerikanischen Daten, wäre wahrscheinlich alles sehr überschwänglich, aufregend und großartig. Man muss sich also gegebenenfalls fragen, ob man die Vorzüge von KI nutzen oder seine Daten schützen möchte. Auch das betrifft freilich nicht bloß Meta, sondern auch OpenAI, Google und Co.
(emw)