Offshore-Leaks: Wie 86 Journalisten aus 46 Ländern 260 Gigabyte an Daten durchforsteten

Um die große Menge an Informationen über ein Netzwerk von Steuerhinterziehern auszuwerten, baute das Internationale Konsortium für investigative Journalisten das spezielle Suchsystem Interdata sowie ein eigenes Nachrichtenzentrum auf.

In Pocket speichern vorlesen Druckansicht 95 Kommentare lesen
Lesezeit: 4 Min.

260 Gigabyte an Daten über Strippenzieher und Nutznießer von zehn weltweit verstreuten Steueroasen hatte ein anonymer Hinweisgeber Gerard Ryle, dem Leiter des Internationalen Konsortiums für investigative Journalisten (ICIJ), vor über einem Jahr auf einer Festplatte zugespielt. Darauf waren rund 2,5 Millionen Dateien, darunter über 2 Millionen E-Mails und zahlreiche Text-, PDF-, Bilder- und Kalkulationsdateien. 86 Pressevertreter aus 46 Ländern machten sich in einer bislang einzigartigen Gemeinschaftsoperation "Offshore-Leaks" daran, das Material mit modernsten Data-Mining-Techniken zu analysieren.

Die beteiligten Medien, zu denen hierzulande die Süddeutsche Zeitung und der NDR gehören, haben am Donnerstag erste Ergebnisse veröffentlicht. Einblicke in die Arbeit der Kooperationspartner und die verwendeten informationstechnischen Lösungen gibt ein Hintergrundartikel von Duncan Campbell auf der ICIJ-Webseite. Der britische Reporter, der vor 13 Jahren das Spionagenetzwerk Echelon ins Bewusstsein einer größeren Öffentlichkeit hievte, beschreibt darin den Aufbau eines gesonderten Suchsystems mit dem Namen Interdata. Dabei handle es sich um ein "Free-Text-Retrieval"-Programm, das jede in dem Datensalat vorkommende Zahl sowie jedes Wort und jeden Namen indexiert und für komplexe, in Millisekunden ausgeführte Suchanfragen erschlossen habe.

Nur so sei es möglich gewesen, die Kernfrage: "Wer wusste wann was?" zu beantworten, erläutert Campbell. Verwendet wurden auch die kommerziellen Auswertungsprogramme Nuix und dtSearch, die dem Konsortium teils kostenfrei überlassen worden seien. Programmierer aus Deutschland, Großbritannien und Costa Rica haben sie angepasst. Außerdem wurde ein eigenes Zentrum zum Nachrichtenaustausch in Europa errichtet.

Über Interdata haben die Beteiligten bislang über 28.000 Online-Suchanfragen vorgenommen und über 53.000 Dokumente heruntergeladen, führt der Datenjournalismus-Manager des ICIJ aus. Zuvor mussten viele nicht maschinenlesbare Dokumente eingescannt und mit OCR-Software algorithmisch durchsuchbar gemacht werden. Dadurch sind einige wichtige Papiere wie Pässe oder Erklärungen über Kontrollstrukturen einzelner Firmen entdeckt worden. Zudem mussten viele Dubletten aussortiert werden. Mit einem Spezialprogramm wurden allein die gefundenen Namen und Adressen überprüft und ihren unterschiedlichen Schreibweisen auf die Spur gekommen. Mit einer weiteren eigens entwickelten Anwendung wurden Personen und Firmen mit den zugehörigen Ländern in Verbindung gebracht, auch wenn geografische Angaben gefehlt haben.

Die originalen Datenbanken wurden innerhalb von drei Monaten wieder rekonstruiert. Dabei wurde festgestellt, dass die gängigen gesetzlichen Auflagen zum Eintrag von Eigentümern spezieller Fonds oder Finanzgesellschaften nicht eingehalten wurden. Mit viel Geduld und Hartnäckigkeit kamen die Analysten aber immer wieder verdeckt eingetragenen Namen sowie komplexeren Schemen, um Reichtümer zu verstecken, auf die Spur. Insgesamt seien bislang 122.000 Offshore-Firmen, knapp 12.000 Mittelmänner und 130.000 Einträge zu Geschäftsführern, Verwaltern und Kunden ans Licht gekommen. Zu den bekanntesten Personen gehört der verstorbene Gunter Sachs. Seine Anwälte streiten aber ab, er sei in unsaubere Finanzgeschäfte verwickelt gewesen.

Insgesamt war die dem Konsortium überlassene Datensammlung Campbell zufolge größer und unstrukturierter als die US-Botschaftsdepeschen, die Wikileaks 2010 veröffentlichte. Wikileaks hält dagegen, dass ihr Stratfor-Coup über fünf Millionen Dokumente enthalten habe und so doppelt so umfangreich gewesen sei.

Für den Netzaktivisten Daniel Domscheit-Berg zeigt die vom ICIJ betriebene Art der Datenauswertung, dass es seit den Fehlern von Wikileaks eine Lernkurve gegeben habe: "Das ist das, wo wir hin müssen: Weg vom Hype und hin zu einer professionellen und richtig strukturierten Aufbereitung von Leaks", sagte der Informatiker der dpa. Ein solches Projekt dürfe nicht von einer einzelnen Person abhängen. Der frühere Wikileaks-Sprecher und Openleaks-Gründer erwartet, dass Datenjournalisten und Analyseexperten künftig "Hand in Hand zusammenarbeiten und dann viel schlagfertiger sind als beide für sich".

Der in das Offshore-Projekt seit einem Jahr involvierte Hamburger Datenjournalist Sebastian Mondial enttäuschte derweil Erwartungen von Politikern wie Bundesfinanzminister Wolfgang Schäuble (CDU), dass der Steuerdatensatz bald den Behörden übergeben werde. Das ICIJ wolle das Material nicht veröffentlichen, da damit auch unbeteiligten Dritten großer Schaden zugefügt werden könne, erklärte er. Im Gegensatz zu Wikileaks werde Geheimhaltung und Quellenschutz Vorrang geben. Generell gäben die Daten einen "einmaligen Einblick in das Offshore-Business" mit seinen Zentren British Virgin Islands, Malaysia oder Singapur und auch in Bereiche, "von denen man nur vermuten kann, wie sie funktionieren und was sie für Auswirkungen haben". (anw)