Künstliche Intelligenz: Nvidias RAPIDS bekommt mit BlazingSQL eine SQL-Engine

Das Open-Source-Projekt BlazingSQL ist eine GPU-beschleunigte, für die Integration in RAPIDS entwickelte SQL-Engine.

In Pocket speichern vorlesen Druckansicht
Künstliche Intelligenz: Nvidias RAPIDS bekommt mit BlazingSQL eine SQL-Engine
Lesezeit: 2 Min.
Von
  • Rainald Menge-Sonnentag

Das Unternehmen BlazingSQL hat die gleichnamige Software als Open-Source-Projekt freigegeben. Die SQL-Engine ist auf den Einsatz auf Nvidias RAPIDS-Ökosystem ausgelegt. Mit der Offenlegung des Projekts auf GitHub unter der Apache-2-Lizenz möchten die Macher die Weiterentwicklung beschleunigen und die Engine einer breiteren Basis von Nutzern und Entwicklern in die Hände geben.

BlazingSQL erweitert die RAPIDS-Plattform um den Zugriff über SQL-Abfragen.

(Bild: BlazingSQL)

Nvidia hatte RAPIDS im Oktober vergangenen Jahres vorgestellt. Die Open-Source-Plattform baut auf CUDA auf und ist als Grundlage für das Erstellen von Ende-zu-Ende-Pipelines zur Datenanalyse vorgesehen. RAPIDS verwendet Apache Arrow zur Datenhaltung und nutzt die Library cuDF zum Laden, Aggregieren, Filtern und Verbinden der Daten.

BlazingSQL ist eine SQL-Schnittstelle zu cuDF mit erweiterten Funktionen, die besonders auf große Datenmengen und Data-Science-Anwendungen ausgelegt sind. Die Ergebnisse der SQL-Abfragen sind GPU-DataFrames (GDF). Entwickler können sie direkt aus beliebigen RAPIDS-Librarys zur Datenanalyse auslesen und weiterverarbeiten. Externe Datenquellen wie Amazon S3 lassen sich über einzelne Codezeilen anbinden.

Erklärtes Ziel von BlazingSQL ist vor allem die einfachere Verwaltung der Daten. Entwickler können die bekannte SQL-Syntax und Semantik statt komplexer cuDF-Funktionsaufrufe verwenden. Außerdem sollen SQL-Optimierungswerkzeuge die Verarbeitungsgeschwindigkeit verbessern. Schließlich ermöglicht die SQL-Engine die direkte Anbindung an Data Lakes in der Cloud oder dem Rechenzentrum.

Weitere Details lassen sich dem Blogbeitrag zur Open-Source-Legung der Engine entnehmen. Ursprünglich hatte BlazingSQL den Namen BlazingDB, aber das Unternehmen hat sich zur Umbenennung entschieden, da die ursprüngliche Bezeichnung irreführend war. Schließlich handelt es sich bei BlazingSQL nicht um eine Datenbank, sondern um eine SQL-Engine. Der Sourcecode von BlazingSQL ist auf GitHub zu finden. (rme)