Zahlen, bitte! 2,2 Milliarden Seiten, oder: Von Daten-Jägern und -Sammlern
Wissen und Informationen werden in der dritten industriellen Revolution digital. Das summiert sich zu großen Zahlen.
Anfang März 2017 begann Wikileaks mit der Veröffentlichung einer enormen Anzahl von Programmen, Source-Code-Archiven, Analysen und Dokumenten, die alle zusammen "Vault 7" genannt wurden. In 25 Teilen wurde praktisch das gesamte technische Wissen derjenigen CIA-Abteilungen veröffentlicht, die sich mit der Infiltration in fremde Rechner und Netzwerke beschäftigten.
In der vergangenen Woche wurde ein Brief des US-Senators Ron Wyden veröffentlicht, der im Anhang in Auszügen den Schadensbericht enthielt, den finalen "Wikileaks Task Force Report" vom Oktober 2017. In diesem Report finden sich Zahlen mit einer erstaunlichen Spannbreite: Das an Wikileaks geschickte Material soll demnach zwischen 180 Gigabyte und 34 Terabyte groß sein. Eigens für die Politik wurde die Angabe umgerechnet: "Das entspricht ungefähr zwischen 11,6 Millionen und 2,2 Milliarden Seiten in Microsoft Word".
Vergleiche, hinkend oder auch nicht
Der Mensch ist von Natur aus ein Jäger und Sammler. Als solcher hat er gelernt, mit Vergleichsmaßstäben bei Mengen oder Entfernungen zu arbeiten. Diese Form von Umrechnungen werden auch von Journalisten genutzt, um den Lesern Sachverhalte zu verdeutlichen. Wir schreiben dann, dass die Raumstation ISS die Größe eines Fußballfeldes hat, oder dass in Südamerika in jeder Minute drei Fußballfelder voller Regenwald vernichtet werden. Mitunter soll bei Flächenangaben auch die Umrechnung in Saarländer zu jeweils 2569,69 Quadratkilometern helfen. Aber was macht man mit den 180 Gigabyte und 34 Terabyte, die Senator Ron Wyden erwähnte – einmal davon abgesehen, das die enorme Spanne eher davon kündet, dass die CIA keine Ahnung hat, wie viele Daten wirklich entwendet wurden? Auch die 446 Milliarden Dokumente der Wayback Machine aus dem letzten "Zahlen, bitte!" verlangen nach einem Vergleichsmaßstab.
Für den Wikileaks-Report wurden die Zahlen in Microsoft Word-Seiten umgerechnet, vermutlich, weil die Leser des Berichtes sich unter einer Word-Seite etwas vorstellen können. Solide ist das nicht, denn Vault 7 enthält nur 8761 Dokumente als Word- oder PDF-Dateien, die CIA-Operationen beschreiben oder etwa neuen Agenten lustig zu lesende Anweisungen zur Hand geben, wie man sich in Frankfurt bei der Ankunft in Deutschland verhält. Der weitaus größte Teil der Leaks besteht aus Source-Code und umfangreichen Spähprogrammen, was die Beschreibung als Github für Malware gut zusammenfasst. Die Menge an Dateien und Informationen übertrifft das, was Edward Snowden an Journalisten herausgab, um das Vielfache. Praktisch wurde anno 2017 der gesamte Werkzeugkasten der CIA vor der Weltöffentlichkeit ausgekippt. So gesehen ist die Umrechnung von 34 Terabyte in 2,2 Milliarden Word-Seiten eine Verharmlosung ähnlich wie die im Münsteraner Kinderporno-Skandal. Dort wurden 400 Terabyte an schlimmsten Videos und Bildern sichergestellt. Letzte Woche sprach der nordrhein-westfälische Innenminister Herbert Reul von einem gigantischen "Datengebirge" und rechnete den Fund in "2,6 Milliarden DIN-A4-Seiten oder 520.000 Aktenschränke" um.
Mangelhafte Überwachung
Im Fall von Vault 7 wurde der US-amerikanische IT-Spezialist Joshua Schulte überführt, verhaftet und in 10 Punkten angeklagt. Das Verfahren vor einem Geschworenengericht endete im März 2020 mit einer faktischen Niederlage der US-Regierung. Schulte wurde für schuldig befunden, falsche Angaben von Gericht und vor den FBI-Ermittlern gemacht zu haben. In zehn weiteren Klagepunkten konnten sich die Geschworenen nicht einigen, etwa in der Frage, ob überhaupt ein Diebstahl vorliegt, wenn das Software-Entwicklungs-Netzwerk (DevLAN) der CIA nicht durch Passwörter und andere Sicherheitsmaßnahmen geschützt ist. Deshalb auch die Spannbreite der Größenangabe, wie die Ermittler im "Wikileaks Task Force Report" schreiben: "Wir können keine genauen Angaben über die Größe des Verlusts machen, weil das DevLAN zu dieser Zeit über kein Monitoring der Nutzer-Aktivitäten oder über andere existierende Sicherheitsmaßnahmen verfügte." Auch der Nachweis, wie Schulte die Daten auf 60 bei ihm gefundene Datenträger kopierte und an Wikileaks weiterleitete, überzeugte vor Gericht nicht. Vielleicht wäre da der Bandbreitenrechner des Newstickers nützlich gewesen.
Zum Schluss sei in der Tradition der Fußballfelder auf eine Umrechnung des weltweiten Datenbestandes verwiesen. Er soll im Jahr 2019 bei 33.000 Exabytes gelegen haben. In einem Blog der US-Firma Varonis machte man sich an die Umrechnung, bei der die Breite eines menschlichen Haares einem Terabyte entsprechen sollte. Somit kam man auf 38.500.000 Meter oder eben 301.960 (in diesem Fall) Football-Felder. Ob das die Sache anschaulicher macht, darf jeder selbst entscheiden. Vielleicht ist es schon ein Fortschritt, wenn das Weltwissen nicht in Microsoft Word-Seiten umgerechnet wird.
Ein notwendiges Postskriptum
Die Veröffentlichung von Vault 7 durch Wikileaks geschah unter den Augen der Trump-Regierung. Wenige Tage nach der Veröffentlichung bezeichnete der damalige CIA-Direktor und heutige US-Außenminister Mike Pompeo Wikileaks als "feindlichen nichtstaatlichen Geheimdienst", den es zu schließen gelte. Als Kopf dieses "Geheimdienstes" gilt Wikileaks-Gründer Julian Assange, dessen Auslieferung von der Regierung Trump betrieben wird. Assange ist deshalb in einem britischen Gefängnis inhaftiert und wartet auf das eigentliche Auslieferungsverfahren, dass durch das Coronavirus verzögert wird. Obwohl die Ansteckungsgefahr im Gefängnis hoch ist, wird die Fluchtgefahr durch die britische Justiz als sehr hoch eingeschätzt. Gegen diese Behandlung protestieren zahlreiche Organisationen und fordern die Freilassung von Assange.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmmung wird hier eine externe Umfrage (Opinary GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Opinary GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
(jk)