Databricks bringt den Data Lake auf die Google Cloud Platform

Anwender können die Lakehouse-Plattform künftig erstmals in einer vollständig containerisierten Cloud-Umgebung nutzen.

In Pocket speichern vorlesen Druckansicht 2 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Matthias Parbel

Mit seiner sogenannten Lakehouse-Architektur, die Vorteile von Data Lakes und Data Warehouses vereinen soll, will Databricks Unternehmen eine zentrale Daten- und Analyseplattform zur Verfügung stellen. Sie soll sowohl den Anforderungen traditioneller Business-Intelligence- und SQL-Werkzeuge wie auch moderneren Machine-Learning- und Data-Science-Anwendungen gerecht werden. Die Lakehouse-Plattform wird Anwendern künftig auch in der Google Cloud offenstehen – und das erstmals in einer vollständig containerisierten Cloud-Umgebung, wie beide Anbieter nun bekannt gaben.

Während mit Azure Databricks und Databricks on AWS bereits zwei Cloud-Implementierungen weltweit einsatzbereit sind, soll die Integration mit der Google Cloud Platform (GCP) in Kürze abgeschlossen und voraussichtlich ab dem zweiten Quartal generell verfügbar sein. Durch die containerisierte Bereitstellung auf Basis der Google Kubernetes Engine (GKE) stehen Databricks-Nutzern auch sämtliche Dienste der vollständig verwalteten Betriebsumgebung bereit – etwa für die Bereiche Security und Compute wie auch Netzwerkrichtlinien.

Darüber hinaus eröffnen eine Reihe von Konnektoren Anwendern die rasche Integration weiterer Google-Dienste wie BigQuery, Cloud Storage und Pub/Sub. So haben Databricks-Nutzer unter anderen die Möglichkeit ihre Lakehouse-Analysefunktionen um die plattformweit verfügbaren BigQuery-Optionen zu erweitern und übergreifende Analysen innerhalb der GCP anzustoßen. In Databricks erstellte Datenworkflows lassen sich gemeinsam mit den in BigQuery und Cloud Storage aufbereiten Datensätzen außerdem für das Modelltraining auf Googles AI Platform verwenden.

Weitergehende Informationen zur engeren Kooperation von Databricks und Google Cloud hält die gemeinsame Ankündigung bereit. Details zur Integration der Lakehouse-Plattform in GCP sowie zu den verfügbaren Features finden sich auf der Homepage von Databricks.

(map)