Big Data: Apache Drill 1.2 kennt weitere Analysefunktionen

Apache Drill 1.2 ist ab sofort Bestandteil der Hadoop-Distribution von MapR. Es bietet neue Analysefunktionen und ist tiefer in Hive integriert.

In Pocket speichern vorlesen Druckansicht
Big Data: Apache Drill 1.2 kennt weitere Analysefunktionen

(Bild: Apache.org)

Lesezeit: 1 Min.

Etwa ein Jahr, nachdem Drill zum Top-Level-Projekt der Apache Software Foundation wurde, und fünf Monate nach dem Erscheinen von Version 1.0 veröffentlicht das Team Version 1.2 des Open-Source-Frameworks zur Datenanlyse, das von Googles Dremel inspiriert ist. Eine der wichtigsten Neuerung ist die Erweiterung der ANSI-SQL-konformen Analyse- und Window-Funktionen, darunter LEAD, LAG, AVG, COUNT und PERCENT_RANK.

Drill 1.2 ist zudem besser in das Hadoop Data Warehouse Apache Hive integriert. Dadurch können Firmen in einem Cluster gleichzeitig Hive für ETL (extract, transform, and load) und Drill für interaktive Abfragen einsetzen. Das Lesen von HBase- und Hive-Tabellen optimiert ein Parquet-Reader, der den Hive Serializer/Deserializer (SerDe) ersetzt. Zudem wollen die Entwickler die grundsätzliche Performance unter anderem durch eine neue Metadata-Caching-Technik erhöht haben.

Die Übersicht über die Neuerungen und Fehlerkorrekturen stehen in den Release Notes. Apache Drill 1.2 ist ab sofort Bestandteil der Hadoop-Distribution von MapR. Der separate Download ist von der Apache-Site möglich. (rme)