Jaspersoft analysiert Daten aus NoSQL-Datenbanken

Jaspersoft bietet für seine BI-Software Konnektoren zum Zugriff auf Daten an, die in Hadoop-Clustern, diversen NoSQL-Datenbanken sowie den MPP-Analysedatenbanken von Netezza, Vertica und EMC Greenplum gespeichert sind.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Dr. Oliver Diedrich

Jaspersoft bietet für seine BI-Software Konnektoren zum Zugriff auf Daten an, die in Hadoop-Clustern, diversen NoSQL-Datenbanken sowie den MPP-Analysedatenbanken von Netezza, Vertica und EMC Greenplum gespeichert sind. Auf Hadoop-Cluster greift Jaspersoft über den SQL-Aufsatz Hive zu, wobei sowohl die Speicherung im HDFS-Dateisystem als auch in der HBase-Datenbank unterstützt wird. An NoSQL-Datenbanken unterstützt die BI-Software Cassandra, MongoDB, Riak, HBase, CouchDB, Neo4J, Infinispan, VoltDB, Redis und VMware GemFire.

Für Jaspersoft stehen diese Techniken zur verteilten Speicherung großer Datenmengen für einen "Big-Data-Trend", bei dem Datenmengen im Tera- und Petabyte-Bereich gespeichert werden, die sich mit traditionellen SQL-Datenbanken nur mit hohem technischem und finanziellem Aufwand in den Griff kriegen lassen. Mit den neuen Konnektoren, die größtenteils als Open Source frei verfügbar sind, möchte Jaspersoft auch die Flexibilität seiner BI-Software unterstreichen.

NoSQL-Datenbanken speichern Daten nicht in Form von Tabellen und Relationen, sondern dokumentenorientiert (CouchDB, MongoDB), in Form von Graphen und Knoten (Neo4J) oder Schlüssel-Wert-Paaren (Redis, Riak) oder spaltenorientiert (Cassandra, HBase). Um eine hohe Skalierung zu erreichen, geben sie meist weniger starke Konsistenzgarantien als relationale Datenbanken. Der Name "NoSQL" rührt daher, dass diese Datenbanken in der Regel nicht über SQL abgefragt werden.

(odi)