Talend aktualisiert quelloffene Datenqualitäts-Tools

Talends Werkzeuge zur Überprüfung und Verbesserung der Datenqualität in verschiedenen Datenquellen bieten in der neuen Version 3.2 unter anderem die Möglichkeit, Überprüfungsregeln flexibler zu gestalten.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Alexandra Kleijn

Datenintegrationsspezialist Talend hat sowohl Talend Open Profiler als auch Talend Data Quality in der Preview-Version 3.2.0 "Milestone 2" freigegeben. Die beiden Tools zur Datenanalyse dienen dazu, möglichen Problemen bei Datenintegrationen oder -Migrationen bereits im Vorfeld auf die Schliche zu kommen. Sie nehmen dazu die Daten bestehender Datenquellen wie Datenbanken unter die Lupe. Während der Open Profiler unter der unter der GPLv2 zum freien Download bereitsteht, handelt es sich bei Data Quality um ein kommerziell lizensiertes Angebot, das neben dem Profiler auch ein Werkzeug zur Datenbereinigung ("Data Cleansing") als auch das Tool "Data Enrichment" (Anreicherung von Datensätzen mit ergänzenden Informationen) beinhaltet.

Neu in beiden Varianten ist unter anderem die Möglichkeit, selbst Regeln für die Qualitätsüberprüfung zu erstellen. Durch erweitertes Data-Profiling sowie durch den Einsatz von Fuzzy-Logik soll es zudem einfacher sein, Dubletten aufzuspüren. Ein "Pattern Finder" erkennt Muster in Datensätzen und kann dadurch zum Beispiel ans Tagelicht bringen, dass Anwender ein Kommentarfeld für die Angabe eines Handynummers benutzt haben. Die beiden Tools ergänzen Talends Hauptprodukte, die freie Datenintegrationssuite Open Studio sowie das kommerzielle Pendant Talend Integration Suite (akl)