Hadoop-Distribution von Cloudera in dritter Auflage
Der Hadoop-Spezialist Cloudera CDH 3 (Cloudera's Distribution of Hadoop version 3) freigegeben, eine Plattform zur Verwaltung und Analyse groĂźer Datenmengen.
Der Hadoop-Spezialist Cloudera hat CDH 3 (Cloudera's Distribution of Hadoop version 3) freigegeben, eine Plattform zur Verwaltung und Analyse groĂźer Datenmengen, die auf Apache Hadoop aufsetzt. Hadoop ist eine an Googles MapReduce-Implementierung angelehnte Open-Source-Software zur parallelen Datenspeicherung und -verarbeitung.
CDH enthält neben Hadoop die auf Hadoop aufsetzende SQL-Datenbank Hive und die Programmiersprache Pig. Neu in Version 3 sind unter anderem die Spaltendatenbank HBase, Apache Zookeeper und Whirr sowie Hue, ein Browser-Forntend für Hadoop. Die Performance soll sich deutlich gesteigert haben – laut Cloudera laufen kleine MapReduce-Jobs bis zu drei Mal schneller. Weitere Informationen findet man in der Liste der Neuerungen. (odi)