Private Bilder aus Krankenakte unerlaubt als Trainingsdaten für KI verwendet

Eine Künstlerin hat Bilder aus ihrer privaten Krankenakte in der Bilddatenbank LAION gefunden, die zum Training von KI-Modellen dient. Vieles ist rätselhaft.

In Pocket speichern vorlesen Druckansicht 23 Kommentare lesen

(Bild: Michkasova Elena / Shutterstock.com)

Update
Lesezeit: 2 Min.

Eine KI-Künstlerin aus Kalifornien hat herausgefunden, dass private Bilder aus ihrer Krankenakte aus dem Jahr 2013 in einem KI-Trainingssatz von LAION verwendet werden. Mit solchen Daten trainieren Text-zu-Bild-Generatoren wie Stable Diffusion und DALL-E . Dazu hatte sie ein Bild von sich bei der dafür angelegten Seite https://haveibeentrained.com hochgeladen und fand dort Bilder, die ihr damaliger Arzt 2013 in ihrer Krankenakte hinterlegt hatte; mit ihrem Namen waren die Bilder nicht verknüpft. Nachdem dieser 2018 gestorben war, fanden diese ihren Weg ins Internet, ohne ihre vorherige Zustimmung. Damals hatte sie unterschrieben, dass niemand anderes die Bilder sehen darf. Ein Link aus der "multimodalen" Datensammlung von LAION – einem offenen, multimodalem Datensatz zum Trainieren von KI zu Forschungszwecken – verwies jedoch auf das Bild. LAION-Datensätze sind als Indizes für das Internet zu verstehen: Sie listen die URLs zu den Originalbildern gemeinsam mit den verknüpften ALT-Texten auf.

Der Forscher Zack Marshall kommentiert, dass er und seine Kollegen bereits Untersuchungen zu derartigen Fällen angestellt haben. So sei "bei mehr als 70 Prozent der in medizinischen Fachzeitschriften veröffentlichten Fallberichte mindestens ein Bild aus dem Paper in Google Images zu finden". Marshall vermutet, dass ihr Arzt das Bild wahrscheinlich in einer medizinischen Fachzeitschrift veröffentlicht hatte. Gegenüber dem US-Medium Ars Technica sagte Lapine, dass das Bild wohl aus den Akten ihres verstorbenen Arztes entwendet wurde und anschließend im Internet landete. Ars Technica hatte noch weitere ähnliche Patientenbilder in dem Datensatz gefunden.

Da LAION nicht selbst über die Bilder verfügt, sondern lediglich auf diese verweist, sind die Betreiber der verlinkten Seiten juristisch verantwortlich. Unklar ist, welches Recht hier gilt. Die Mitarbeiter befinden sich in verschiedenen Ländern. In Deutschland besteht vermutlich die Pflicht, die Links auf rechtswidrige Inhalte – nachdem die Verantwortlichen Kenntnis darüber erlangen – zu entfernen.

Update

Beschreibung der Bilddatenbank LAION als Bild-Text-Index präzisiert. LAION verweist auf Bilder und erschließt CLIP-gefilterte Bild-Text-Paare. Die Bilder sind andernorts im Netz gespeichert, worauf der Index per Link verweist.

(mack)