JBoss Data Grid 7 hat eine Schnittstelle zu Apache Spark

Die Verbindung zum Big-Data-Framework ist für Version 1.6 vorgesehen, aber nicht für Spark 2. Daneben enthält Data Grid die Java 8 Stream API und bietet eine Anbindung an Datenaustauschformate von Hadoop.

28.07.2016, 11:53 Uhr

Lesezeit: 1 Min.

Developer

Von

Rainald Menge-Sonnentag

Red Hat hat für Version 7 der verteilten In-Memory-Datenbank JBoss Data Grid (JDG) vor allem die Anbindungen zu anderen Big-Data-Systemen erweitert. Dazu gehört unter anderem die Anbindung an Resilient Distributed Datasets (RDD) und DStreams (diskretisierte Streams) aus Apache Spark. Damit wird Red Hats NoSQL-Datenbank zur Datenquelle für Apaches Big-Data-Framework. Die Integration bezieht sich auf Spark 1.6 – zur Zusammenarbeit mit der frisch veröffentlichten Version 2.0 gibt es noch keine Angaben.

Zur Anbindung an Hadoop und an die dafür existierenden Werkzeuge unterstützt JDG die generischen Map-Reduce-Interfaces InputFormat und OutputFormat. Das Einbinden des Cassandra Cache Store ermöglicht das Persistieren von Einträgen auf Apache Cassandra.

Java, C++, C# und Node.js

JBoss Data Grid 7 bringt zudem eine verteilte Version der Stream API von Java 8 mit. Die Clients zur Kommunikation mit dem Server über das systemeigene TCP-Protokoll Hot Rod sind für verschiedene Sprachen erhältlich. Die Varianten für C++ und C# hat das Team um zusätzliche Funktionen wie TLS/SSL-Verschlüsselung ergänzt. Neu hinzugekommen ist der Hot-Rod-Client für Node.js zur Anbindung des serverseitigen JavaScript an die verteilte NoSQL-Datenbank.

Weitere Details stehen im Entwickler-Blog von Red Hat. JBoss Data Grid ist für Mitglieder der Red Hat Developer Community verfügbar, das eine kostenlose Registrierung erfordert. (rme)