DataStax bündelt Hadoop und Hive mit Cassandra

Der Anbieter kommerzieller Dienstleitungen rund um die NoSQL-Datenbank Apache Cassandra stellt ein Softwarepaket aus den Apache-Projekten Cassandra, Hadoop und Hive vor.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 1 Min.
Von
  • Alexander Neumann

DataStax, ein Anbieter kommerzieller Dienstleitungen rund um die NoSQL-Datenbank Apache Cassandra, hat eine Softwaredistribution veröffentlicht, die die Apache-Projekte Hadoop und Hive mit der hochskalierenden, spaltenorientierten Datenbank koppelt. Cassandra wurde ursprünglich von Facebook entwickelt und ist unter anderem bei Digg, Twitter und Reddit im Einsatz. Die Firmengründer von DataStax waren zuvor Angestellte des Social-Plattform-Betreibers.

Das Brisk genannte Paket aus Datenbank mit geringer Latenzzeit, Hadoops MapReduce-Implementierung zur Analyse und Verarbeitung großer Datenmengen sowie dem Warehouse-Projekt Hive soll sich für viel besuchte Webseiten eignen oder solchen Anwendungen, die nahezu in Echtzeit agieren müssen.

Die initiale Brisk-Version besteht aus Hadoop 0.20.2, Hive 0.7 und Cassandra 0.7.4, allerdings ersetzt sie das Hadoop File System (HDFS) der MapReduce-Implementierung mit einer CassandraFS genannten Schnittstelle. Brisk wird noch bis Anfang Mai unter der Apache-Lizenz verfügbar sein. (ane)