JBoss Data Grid 7 hat eine Schnittstelle zu Apache Spark
Die Verbindung zum Big-Data-Framework ist für Version 1.6 vorgesehen, aber nicht für Spark 2. Daneben enthält Data Grid die Java 8 Stream API und bietet eine Anbindung an Datenaustauschformate von Hadoop.
Red Hat hat für Version 7 der verteilten In-Memory-Datenbank JBoss Data Grid (JDG) vor allem die Anbindungen zu anderen Big-Data-Systemen erweitert. Dazu gehört unter anderem die Anbindung an Resilient Distributed Datasets (RDD) und DStreams (diskretisierte Streams) aus Apache Spark. Damit wird Red Hats NoSQL-Datenbank zur Datenquelle für Apaches Big-Data-Framework. Die Integration bezieht sich auf Spark 1.6 – zur Zusammenarbeit mit der frisch veröffentlichten Version 2.0 gibt es noch keine Angaben.
Zur Anbindung an Hadoop und an die dafür existierenden Werkzeuge unterstützt JDG die generischen Map-Reduce-Interfaces InputFormat und OutputFormat. Das Einbinden des Cassandra Cache Store ermöglicht das Persistieren von Einträgen auf Apache Cassandra.
Java, C++, C# und Node.js
JBoss Data Grid 7 bringt zudem eine verteilte Version der Stream API von Java 8 mit. Die Clients zur Kommunikation mit dem Server über das systemeigene TCP-Protokoll Hot Rod sind für verschiedene Sprachen erhältlich. Die Varianten für C++ und C# hat das Team um zusätzliche Funktionen wie TLS/SSL-Verschlüsselung ergänzt. Neu hinzugekommen ist der Hot-Rod-Client für Node.js zur Anbindung des serverseitigen JavaScript an die verteilte NoSQL-Datenbank.
Weitere Details stehen im Entwickler-Blog von Red Hat. JBoss Data Grid ist fĂĽr Mitglieder der Red Hat Developer Community verfĂĽgbar, das eine kostenlose Registrierung erfordert. (rme)