Databricks holt BI und SQL auf den Data Lake

Mit SQL Analytics komplettiert das Unternehmen seine Lakehouse-Architektur, die die Leistung von Data Warehouses mit dem Tempo von Data Lakes kombiniert.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 2 Min.
Von
  • Matthias Parbel

Databricks kündigt SQL Analytics an, den noch fehlenden Baustein in seiner sogenannten Lakehouse-Architektur, die die individuellen Vorteile von Data Lakes und Data Warehouses vereinen soll. Zentrale Elemente im Lakehouse-Paradigma sind Databricks' Delta Lakes, ein offenes Format, das Pattern für Datenqualität, Verarbeitungsgeschwindigkeit und strukturierte Transaktionen (Atomicity, Consistency, Isolation, Durability – ACID) bereitstellt, und die zur Jahresmitte vorgestellte Delta Engine, die Abfragen der kuratierten Data Lakes beschleunigen soll. SQL Analytics baut auf beiden Komponenten auf.

Während Unternehmen für Machine-Learning- und Data-Science-Anwendungen bevorzugt auf die überwiegend unstrukturierten Daten in Data Lakes zurückgreifen, setzen klassische Business-Intelligence-Werkzeuge und SQL die strukturierte, performante Datenhaltung im Data Warehouse voraus – in der Regel allerdings verbunden mit höheren Kosten. Mit dem Ziel, Unternehmen ein ansprechendes Preis-Leistungsverhältnis für alle Datenanwendungen offerieren zu können, schlägt Databricks' Lakehouse-Architektur für die Datenanalyse in der Cloud die Brücke zwischen der traditionellen BI-Welt und gegenwärtigen ML-Anwendungen.

Der Ansatz von Databricks konkurriert mit Cloud Data Warehouses wie sie unter anderen AWS, Google und Microsoft anbieten. Anhand getrennter Datenverarbeitung (Compute) und Datenspeicherung (Storage) versprechen die Cloud Data Warehouses auch bei größeren Datenmengen raschere Abfrageergebnisse. Mit den Delta Lakes und der Delta Engine legt Databricks nun eine gemeinsame Zugriffsebene über die Datenspeicher, die Unternehmen mehr Flexibilität verschaffen soll.

SQL Analytics wartet mit einer eigenen Oberfläche für Abfragen und die Visualisierung von Ergebnissen auf, die sich individuell konfigurieren lassen. Über native Konnektoren erstellt SQL Analytics aber auch die direkte Anbindung an weit verbreitete BI-Tools wie Tableau, Qlik und Microsoft Power BI, sodass Anwender den neuen Dienst in bestehende BI-Workflows integrieren können.

Databricks stellt Kunden den neuen Dienst ab sofort im Rahmen seiner Unified Data Analytics Platform zur Verfügung. Weitergehende Informationen zu SQL Analytics finden sich auf der Homepage des Anbieters.

(map)