Personenbezogene Daten DSGVO-konform maskieren

Nach der DSGVO sollen Unternehmen personenbezogene Daten anonymisiert verarbeiten. Die Tools Apache Ranger und BlueTalon maskieren Daten in Big-Data-Umgebungen.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Personenbezogene Daten DSGVO-konform maskieren
Lesezeit: 13 Min.
Von
  • Ramon Wartala
Inhaltsverzeichnis

Bei der Verarbeitung personenbezogener Daten gelten strenge Regeln: Zum einen sieht die Datenschutz-Grundverordnung (DSGVO) das Prinzip der Datenminimierung vor. Zum anderen müssen die Daten von EU-Bürgern bei ihrer Verarbeitung so unkenntlich gemacht werden, dass keine Rückschlüsse auf konkrete Personen möglich sind.

iX-TRACT
  • Maskierung bietet Unternehmen eine Möglichkeit, personenbezogene Daten zu pseudonymisieren oder zu anonymisieren, um so DSGVO-Konformität zu gewährleisten.
  • Die Maskierung kann statisch oder dynamisch erfolgen. Beide Ansätze haben Vor- und Nachteile.
  • Die beiden Tools Apache Ranger und BlueTalon bieten Maskierungsfunktionen für Big-Data-Umgebungen auf Basis von Hadoop.
Mehr zur Datenschutz-Grundverordnung

In den meisten Unternehmen werden Daten nicht zentral, sondern in vielen abteilungsspezifischen Datenbanken gespeichert und verwaltet. Selbst kleine Firmen haben heutzutage oft eine Vielzahl von Datenbanken. Das Problem dabei: Es existiert keine zentrale Stelle, an der man eine Anonymisierung oder Pseudonymisierung der Daten vornehmen kann. Stattdessen muss die Unkenntlichmachung in jedem einzelnen System entweder beim Import oder später beim konkreten Zugriff erfolgen.

Einige Firmen sind in den letzten Jahren dazu übergegangen, die Daten ihrer verschiedenen Systeme zentral an einem Ort – in einem Data Lake – zu speichern. Im Gegensatz zum klassischen Data Mart aus dem Data-Warehousing, der nur die für den speziellen Business Case nötigen Daten vorhält, speichert der Datensee alle Daten auch in Rohform ab. Das schafft neue Möglichkeiten, denn wer alle Daten permanent zur Verfügung hat, kann sich immer wieder neu entscheiden, welche er für die Realisierung eines bestimmten Anwendungsfalls heranzieht. Kostengünstige Systeme wie Hadoop in Verbindung mit Cloud-Speicherlösungen haben den Paradigmenwechsel begünstigt, indem sie die Vormachtstellung teurer und proprietärer Data-Warehouse-Systeme infrage gestellt haben.

Immer mehr Wissen. Das digitale Abo für IT und Technik.






Immer mehr Wissen. Das digitale Abo für IT und Technik.