Big Data: Apache Drill in Version 1.0 veröffentlicht
Das Ende vorigen Jahres zum Top-Level-Projekt der Apache Software Foundation ernannte Drill findet sich in der neuen Version bereits in der Hadoop-Distribution von MapR Technologies.
- Alexander Neumann
Das Big-Data-Projekt Apache Drill ist nun in Version 1.0 veröffentlicht worden. Außerdem hat Hadoop-Distributor MapR Technologies das neue Release der Schema-freien SQL Query Engine für Hadoop und NoSQL-Datenbanken in seine Distribution aufgenommen. Mit dem Sprung auf die Version 1.0 wollen die Entwickler die Produktreife des Open-Source-Projekts zum Ausdruck bringen
Drill ist von Googles Analysewerkzeug Dremel inspiriert und hilft sowohl bei der Analyse als auch beim Einsatz von Batch-Prozessen und ihrer Pipelines mit schnellen und umfangreichen Berechnungen. Die Software besteht aus einem Abfrage-Layer (mit Abfragesprache, Parser und Ausführungsplaner), einer Ausführungs-Engine für die Abfragepläne, geschachtelten Datenformaten zur Datenablage und einem skalierbaren Datenquellen-Layer.
Der Schwerpunkt des Abfrage-Layers liegt auf der Drill-eigenen Abfragesprache DrQL. Außerdem wird Standard-SQL unterstützt, sodass Entwickler ihre SQL-Kenntnisse mit dem Werkzeug nutzen können. Der Datenquellen-Layer setzt auf Hadoop auf, es werden also dort die Daten abgelegt und Hadoops Dateisystem und HBase samt deren Datenformate genutzt. (ane)