Python-basiertes Framework: Mit Streamlit schneller zum Data-Science-Prototyp

Data Scientists müssen für Prototypen schnell Daten visualisieren können. Streamlit wandelt Jupyter-Notebooks in Web-Apps auch ohne tieferes Frontend-Know-how.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Lesezeit: 12 Min.
Von
  • Ramon Wartala
Inhaltsverzeichnis

Streamlit ist eine Open-Source-Python-Bibliothek, mit der sich schnell Web-Apps für Data Science und maschinelles Lernen erstellen lassen. Nutzerinnen und Nutzer benötigen dafür keine Frontend-Kenntnisse. 2018 gestartet, steht Streamlit kurz vor der Version 1.0.

Der Begriff Datenprodukt umfasst Daten, ihr KI-Modell und die Darstellung der Ergebnisse. Beim Entwickeln von Datenprodukten sind neben den eigentlichen Fachabteilungen auch andere Abteilungen wie IT, Verkauf oder Marketing involviert. Um schneller Hypothesen überprüfen zu können, erstellen fachübergreifende Teams in kurzen agilen Sprints Prototypen in Form von Minimum Viable Products (MVP). Angelehnt an Googles Design Sprints, etablieren sich solche Data Sprints immer mehr, in denen die Teams innerhalb von drei bis fünf Tagen einen Prototyp vom Konzept bis zur Implementierung realisieren.

Doch gerade bei Datenprodukten zeigt sich die heterogene Systemwelt eines Unternehmens. So liegen die Daten in der Regel in gut gesicherten Enterprise-Datenbanksystemen, die das Marketing nicht so ohne Weiteres nutzen kann, da es Vorschriften der DSGVO berücksichtigen muss. Für datenwissenschaftliche Fragestellungen verwendete Daten werden meist innerhalb von Sandbox-Umgebungen implementiert. Um die Ergebnisse zu visualisieren, kommen neben Excel auch Werkzeuge wie Tableau, Google Data Studio oder Microsoft Power BI zum Einsatz, da diese eine webbasierte Schnittstelle mitbringen. Die Fachabteilung kann die Daten dann selbst aggregieren.

Immer mehr Wissen. Das digitale Abo für IT und Technik.






Immer mehr Wissen. Das digitale Abo für IT und Technik.