Big Data: Apache Drill in Version 1.0 veröffentlicht

Das Ende vorigen Jahres zum Top-Level-Projekt der Apache Software Foundation ernannte Drill findet sich in der neuen Version bereits in der Hadoop-Distribution von MapR Technologies.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Big Data: Apache Drill in Version 1.0 veröffentlicht
Lesezeit: 1 Min.
Von
  • Alexander Neumann

Das Big-Data-Projekt Apache Drill ist nun in Version 1.0 veröffentlicht worden. Außerdem hat Hadoop-Distributor MapR Technologies das neue Release der Schema-freien SQL Query Engine für Hadoop und NoSQL-Datenbanken in seine Distribution aufgenommen. Mit dem Sprung auf die Version 1.0 wollen die Entwickler die Produktreife des Open-Source-Projekts zum Ausdruck bringen

Drill ist von Googles Analysewerkzeug Dremel inspiriert und hilft sowohl bei der Analyse als auch beim Einsatz von Batch-Prozessen und ihrer Pipelines mit schnellen und umfangreichen Berechnungen. Die Software besteht aus einem Abfrage-Layer (mit Abfragesprache, Parser und Ausführungsplaner), einer Ausführungs-Engine für die Abfragepläne, geschachtelten Datenformaten zur Datenablage und einem skalierbaren Datenquellen-Layer.

Der Schwerpunkt des Abfrage-Layers liegt auf der Drill-eigenen Abfragesprache DrQL. Außerdem wird Standard-SQL unterstützt, sodass Entwickler ihre SQL-Kenntnisse mit dem Werkzeug nutzen können. Der Datenquellen-Layer setzt auf Hadoop auf, es werden also dort die Daten abgelegt und Hadoops Dateisystem und HBase samt deren Datenformate genutzt. (ane)