Kubeflow: Die Machine-Learning-Werkzeugkiste für Kubernetes erreicht Version 1.0

Mit Kubeflow sollen Entwickler künftig einfacher Machine-Learning-Workflows auf der Container-Orchestrierung Kubernetes ausrollen können.

In Pocket speichern vorlesen Druckansicht
Kubeflow: Die Machine-Learning-Werkzeugkiste für Kubernetes erreicht Version 1.0

(Bild: Shutterstock.com)

Lesezeit: 2 Min.
Von
  • Björn Bohn

Das Projekt Kubeflow hat den Sprung auf die erste Hauptversion vollzogen. Mitarbeiter von Google, Microsoft, IBM und Cisco sind unter anderem an dem Open-Source-Angebot beteiligt. Es handelt sich bei Kubeflow um ein Toolkit, dass zahlreiche Aufgaben im Machine-Learning-Umfeld auch im Zusammenspiel mit der Container-Orchestrierung Kubernetes ermöglichen soll.

Mit der nun vorliegenden Version 1.0 sollen Werkzeuge zum Entwickeln, Bauen, Trainieren und Deployen von Machine-Learning-Modellen zum Einsatz bereit sein. Das Projekt erblickte im Rahmen der Kubecon USA im Dezember 2017 das Licht der Cloud-nativen Welt.

Im Kern umfasst Kubeflow mehrere Werkzeuge, die verschiedene Aufgaben des Machine Learning bewältigen sollen. Als stabil gelten nun das zentrale Dashboard, das Entwicklern einen Überblick über die ausgerollten Kubeflow-Komponenten in einem Cluster geben soll. Dort können sie auch neue Jupyter Notebooks aufsetzen und den jeweiligen Notebooks die benötigten Ressourcen für die Entwicklung zuweisen. Wie bei vielen Data Scientists und Machine-Learning-Anwendern üblich sind die Jupyter Notebooks ein zentraler Baustein für die Entwicklung der Applikationen.

Ebenfalls als stabil gelten der Tensorflow Operator TFJob und der PyTorch Operator. Sie bauen auf dem ursprünglich von CoreOS entwickeltem Prinzip der Operator auf, das Applikationen nativ in Kubernetes einbindet. Sie sollen sich vor allem um das verteilte Trainieren der Modelle kümmern. Das sei mit Kubernetes einfach möglich und würde der Art und Weise entsprechen, wie Google selbst Machine-Learning-Modelle trainiert.

Außerdem umfasst Kubeflow mit kfctl ein Command-line Interface (CLI), das die Deployment-Aufgaben übernimmt. Entwickler können so Kubeflow einem bestehenden Kubernetes-Cluster zu ordnen. Zu guter Letzt gilt auch der Profile-Controller als stabil, der sich um das Verwalten mehrerer Nutzer kümmern soll.

Der Aufbau von Kubeflow

(Bild: Kubeflow)

Im Blogbeitrag zum Release gehen die Entwickler auf die anstehenden Entwicklungen von Kubeflow ein. Die Tools Pipelines, Metadata und Katib liegen momentan noch als Beta vor und sollen als Nächstes auf Version 1.0 springen.

Sie erlauben die Definitionen von Workflows (Pipelines), das Tracking von Datasets und Modellen (Metadata) sowie ein Tuning von Hyper-Parametern (Katib). Im Einsatz haben Kubeflow wohl unter anderem Unternehmen wie Volvo, One Technologies und diverse amerikanische Banken. (bbo)