EMC macht Hadoop fit für den Unternehmenseinsatz

Für die Big-Data-Analyse in Unternehmen kombiniert EMC die Greenplum-Datenbank mit Apache Hadoop und den Netzwerkspeichersystemen von Isilon – mit integrierter Unterstützung für HDFS.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 2 Min.

(Bild: EMC)

Die Kombination von EMC-Isilon Scale-out-NAS-Systemen mit integrierter Unterstützung für das Hadoop-Dateisystem (HDFS) und der Greenplum Analytics-Plattform soll Unternehmen den Einstieg in die gezielte Big-Data-Analyse erleichtern – und Vertriebspartnern neue Marktchancen eröffnen. Denn die Nummer eins unter den weltweiten Storage-Herstellern will sich nicht allein auf das Speichern von Daten beschränken, sondern Kunden die Möglichkeit eröffnen, insbesondere auch die in den verteilten, unstrukturierten Daten enthaltenen Informationen nutzbringend für die Geschäftsprozesse zu erschließen. Das "Big Data"-Framework Apache Hadoop, das seit kurzem in Version 1.0 vorliegt, wurde speziell zur Entwicklung skalierbarer, verteilter Anwendungen zur Analyse großer Datenmengen (Big Data) ausgelegt.

In typischen Installationen mit Direct-Attached-Storage (DAS) bringt die Open-Source-Lösung jedoch das Problem mit sich, dass der NameNode zum Single-Point-of-Failure wird, wenn die Hadoop-Instanzen nicht geclustert werden. EMC hat deswegen nun die Unterstützung für HDFS in die Isilon-NAS-Systeme integriert, so dass alle für die Hadoop-Umgebung benötigten Daten zentral auf einem skalierbaren Speicher zusammengeführt und abgesichert werden können. Zudem werden die Daten dadurch auch über Standard-Protokolle wie NFS, CIFS oder FTP zugänglich. Mit Greenplum HD stellt EMC nun eine eigene Apache Hadoop-Implementierung bereit, die nicht nur den kompletten Hadoop-Stack inklusive HDFS, MapReduce, Hive, Pig, Hbase und Zookeeper mitbringt, sondern neben der Anbindung an Isilon OneFS auch eine Datenbank für die Big-Data-Analyse beinhaltet – bei Bedarf sogar als vorkonfigurierte Data Computing Appliance (DCA).

EMC-Partnern stehen die neuen Lösungskomponenten ab sofort zur Verfügung. Die Greenplum- und Isilon-Produkte wurden ausgiebig auf ein reibungsloses Zusammenspiel getestet – der Vertrieb von expliziten Bundles mit eigener SKU (Stock Keeping Unit) ist jedoch nicht vorgesehen. Die Komponenten für eine Hadoop-Installation müssen einzeln über die autorisierten Distributionspartner geordert werden. (map)