DataStax Enterprise 5 hat eine Graphdatenbank an Bord

Durch die Integration von DSE Graph bietet die NoSQL-Datenbank nun vier Datenmodelle, die einheitlich in Cassandra persistiert werden. Neu ist zudem ein über das Web nutzbares Werkzeug zum visuellen Erstellen von Abfragen.

In Pocket speichern vorlesen Druckansicht
DataStax Enterprise 5 hat eine Graphendatenbank an Bord
Lesezeit: 3 Min.
Von
  • Rainald Menge-Sonnentag

DataStax hat Version 5 ihrer auf Apache Cassandra aufbauenden NoSQL-Datenbank DataStax Enterprise (DSE) angekündigt. Damit hält erstmals das Konzept der Graphdatenbanken Einzug, bei denen die Datenstruktur aus Knoten und Kanten besteht. Der Aufbau eignet sich besonders zur Darstellung von Korrelationen unter anderem in sozialen Netzen oder auch beim Erkennen von Betrugsmustern.

Im April hatte das Unternehmen DataStack Enterprise Graph vorgestellt. Die Graphdatenbank setzt unter anderem auf das Graph-Computing-Framework Apache TinkerPop und die darin enthaltene Abfragesprache Gremlin. 2015 hatte DataStax mit Aurelius die Firma hinter der Open-Source-Datenbank Titan übernommen, die wiederum die Grundlage für DSE Graph bildet.

Im Kern von DataStax Enterprise sitzt unverändert Apache Cassandra. DSE 5 bietet ein sogenanntes Multi-Model-Konzept. Das heißt, dass die Daten wahlweise als Schlüssel-Wert-Paare, tabellarisch, als Dokumente beziehungsweise in JSON oder eben als Graph vorliegen dürfen und gleichermaßen in Cassandra persistiert werden. Durch den einheitlichen Unterbau funktionieren die verfügbaren kommerziellen DSE-Erweiterungen unabhängig vom verwendeten Modell. Die DataStax-Enterprise-Treiber unterstützen die unterschiedlichen Abfragesprachen wie Gremlin und die Cassandra Query Language (CQL).

DataStax Studio hilft bei der Erstellung von Abfragen in Gremlin.

(Bild: DataStax)

Eine weitere Neuerung ist das Web-basierte Werkzeug DataStax Studio zum visuellen Erstellen von Queries. Version 1.0 ist zunächst nur auf Gremlin ausgelegt, aber künftigen Releases sollen auch für CQL und die APIs von DSE Search und DSE Analytics funktionieren.

Zu den weiteren nennenswerten Neuerungen gehört DSE Advanced Replication zur Umsetzung einer Hub-and-Spoke-Architektur. Die unter anderem in IoT-Anwendungen zum Einsatz kommt und bei denen zahlreiche Außenstellen ihre Daten an eine zentrale Datensammlung schicken. DSE Tiered Storage will bei einer effizienteren Datenspeicherung helfen, indem es die aktuellen Daten auf SSDs ablegt und ältere, auf die keine oder nur wenige Zugriffe erfolgen, auf Festplatten verschiebt. DSE Multi-Instance ermöglicht mehrere Instanzen von Data Stax Enterprise auf einem Host und verwaltet die verfügbaren CPU- und Speicherressourcen.

Schließlich gibt es einige neue Security-Funktionen: Administratoren können nun nicht nur die Daten selbst, sondern zusätzlich unter anderem die Commit-Logs von Cassandra und Solr sowie die Suchindizes verschlüsseln. Beim rollenbasierten Zugriff erweitert DSE die in Cassandra 2.2 eingeführte RBAC (Role Based Access Control) um LDAP- und Active-Directory-Support.

Die umfangreiche Liste der Neuerungen findet sich im Blog-Beitrag, der DataStax Enterprise 5.0 ankündigt. Demnach wird die Version ab dem 28. Juni 2016 verfügbar sein.

Siehe dazu auf heise Developer:

(rme)