Googles Algorithmen stufen Ziffern als Copyright-Verletzung ein
In simplen Nummern erkennt Google Drive Urheberrechtsverletzungen. Sogar eine Textdatei mit lediglich der Ziffer 1 wurde gesperrt. Fehlermeldung unmöglich.
Googles Algorithmen laufen Amok. Nach reihenweise falscher Auswertung von QR-Codes geraten nun harmlose Dateien auf Google Drive ins Visier: Wie mehrere Wissenschaftler berichten, sperrt Google automatisch Textdateien, die lediglich Ziffern enthalten. Sei es die Ziffer 1 oder die Zahl 500 – bei Google kann das verboten sein.
Aufgefallen ist das der Professorin Emily Dolson von der Michigan State University in East Lansing, Michigan. Die Informatikerin und Evolutionsbiologin erforscht Evolutionsprozesse. Dabei fallen Daten an, die sie mit Kollegen oder Studierenden teilt – bisweilen über ihr privates Google-Drive-Konto. Bass erstaunt war Dolson, als sie von Google informiert wurde, dass eine ihrer Dateien gegen die Nutzungsbedingungen verstoße: "Ihre Datei 'output04.txt' hat Inhalte, die die Copyright-Richtlinien Google Drives verletzen. Daher könnten manche Features zu dieser Datei eingeschränkt worden sein."
Tatsächlich enthielt die Textdatei nichts anderes als die Ziffer 1. Sonst war darin nichts gespeichert. Trotzdem hatte der Algorithmus die Datei gesperrt – Dolsons Studierende konnten nicht mehr darauf zugreifen. Auch die beste künstliche Intelligenz (KI) mag sich irren. Also warum meldet Dolson den Fehler nicht an Google, sodass die harmlose Datei überprüft und freigegeben werden kann?
Überprüfung nicht vorgesehen
Ganz einfach: Google erlaubt das nicht. "Eine Überprüfung kann für diese Einschränkung nicht beantragt werden", schreibt der Datenkonzern ausdrücklich in seiner Mitteilung. Friss oder stirb.
"Ähem, Google Drive, geht es Euch gut? Diese Datei enthält buchstäblich eine einzelne Zeile mit der Ziffer '1'", ging Dolson in der Nacht auf Montag über Twitter an die Öffentlichkeit. Tausende User antworteten, hunderte verbreiteten das Beispiel eines menschenfeindlichen Systems weiter. Unter anderem nahm Chris Jefferson, Mathematiker und KI-Forscher der schottischen St.-Andrews-Universität, den Faden auf: Er begann, selbst simple Textdateien mit Ziffern auf Google Drive hochzuladen, nämlich die Zahlen von -1000 bis 1000, jeweils in einer eigenen Textdatei.
Tatsächlich trudelten nach einer Stunde die ersten Warnungen über angebliche Copyright-Verletzungen ein: "Ich habe Beanstandungen wegen der Zahlen 500, 833, 174, 285, 302, 186, 451, 336, 173, 266, 448, 289, 120, 643 und 556 erhalten", berichtete Jefferson heise online, "Die kamen von 22:21 bis 23:02 Uhr. Da bin ich paranoid geworden und habe alle Zifferndateien gelöscht." Denn sonst, so fürchtete der Forscher, würde Googles KI ihn womöglich als Serientäter bei Urheberrechtsverletzungen einstufen und sein Konto löschen.
Dateien schwer zu finden
Alle Dateien zu löschen war aber gar nicht so einfach, da Google die fälschlich als illegal gebrandmarkten Dateien nicht mehr anzeigte, selbst beim Zugriff über Jeffersons eigenes Handy. Nur von dem Computer, von dem aus er die Dateien hochgeladen hatte, konnte er sie in seinem Google Drive noch sehen und löschen.
Jefferson hat heise online seine Dateien zur Verfügung gestellt – KI-sicher komprimiert per E-Mail übermittelt. Wir haben die Dateien überprüft und können bestätigen, dass sie nichts anderes als jeweils eine Nummer enthalten.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmmung wird hier eine externe Umfrage (Opinary GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Opinary GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Für die Betroffenen sind solche Fälle nicht nur ärgerlich und momentan hinderlich. Das System merkt sich die angeblichen Verstöße und greift bei angeblichen Wiederholungstätern gerne zu härteren Maßnahmen, als nur die einzelne Datei zu sperren – bis hin zur endgültigen Zugangssperre für jegliche Nutzung.
Warum verweigert Google die Überprüfung?
Wir haben Google Deutschland in der Nacht auf Dienstag gefragt, warum Betroffene ausdrücklich keine Möglichkeit erhalten, bei Fehleinstufung eine Überprüfung einzuleiten, und wie die Filtersysteme lernen sollen, wenn die Fehler nicht gemeldet werden können. Über eine etwaige Antwort werden wir hier berichten.
Dienstagabend hat sich ein Google-Mitarbeiter auf Twitter gemeldet. Er habe das Google-Drive-Team verständigt, das nun an der Behebung des Fehlers arbeite. Neu hochgeladene Zifferndateien sollen fortan unbehelligt bleiben, die Freigabe bereits gesperrter Dateien werde noch etwas dauern. Unsere eigenen Versuche scheinen das zu bestätigen: heise online hat selbst auf einem neu eingerichteten Google-Konto 20.001 Zifferndateien hochgeladen, von -10000 bis 10000, und diese Dateien per Link sowie per Ordnerfreigabe geteilt. Unser Testkonto hält Google Drive nicht für einen Urheberrechtsverletzer.
Auf Twitter haben sich inzwischen weitere Wissenschaftler mit verwandten Problemen gemeldet. Beispielsweise beklagte der französische Solarphysiker Éric Buchlin, dass YouTube ein Video einer Sonneneruption sperrt. Vermeintlich verstößt es gegen Copyright – tatsächlich stammt es von der NASA, deren Werke grundsätzlich gemeinfrei sind. Bei YouTube selbst fand der Wissenschaftler nur Textbausteine. Auf Twitter reagierte YouTube vor drei Wochen und versprach damals, die Sperre zu überprüfen. Geholfen hat das laut Buchlin nicht.
(ds)