GitLab arbeitet an Tool für Datenwissenschaftler
Meltano ist als Open-Source-Produkt für den gesamten Datenlebenszyklus gedacht, vom Laden der Daten bis zur ihrer Analyse.
- Alexander Neumann
Die Macher des Versionsverwaltungswerkzeugs GitLab arbeiten an einem neuen Tool, das den Lebenszyklus von Data-Science-Projekten unterstützen soll. Meltano ist ein Open-Source-Projekt, das entwickelt wird, um die Verarbeitung von Daten in Einklang mit den Geschäftsprozessen zu bringen, so die Entwickler in einem Beitrag.
Der Name Meltano steht für Modell, Extrahieren, Laden, Transformieren, Analysieren, Notebook und Orchestrieren. Das Projekt zielt darauf ab, eine vollständige Lösung für Datenteams zu sein, will also den gesamten Data Science Lifecycle adressieren und bietet hierfür Werkzeuge zur Versionskontrolle, Continuous Integration, Continuous Delivery und zum Review. Meltano soll losgelöst von GitLab angeboten werden. Es wird als komplettes Paket für Datenwissenschaftler angepriesen, GitLab hingegen als komplettes Paket für Softwareentwickler.
Das Ziel von Meltano ist es, die Analysefunktionen für alle zugänglich zu machen, nicht nur für Datenprofis. So präsentiert es diese in einem lesbaren Format für Businessanwender, damit diese Vorhersagen auf Basis der Daten machen können. So sollen sich viele offenbar sonst übliche Schritte und Werkzeuge vermeiden lassen.
Derzeit unterstützt das Tool nur PostgreSQL. Geplant ist aber auch, schon bald mit Support für den Data Warehouse Snowflake aufzuwarten. GitLab weiß, dass es eine Vielzahl von Datenbanktypen unterstützen muss, und lädt deswegen zu Beiträgen aus der Open-Source-Community ein, um dieses Ziel zu erreichen. Auf der Projektseite stehen schon einige Produkte, die Meltano gut zu Gesicht stehen würden. (ane)