iX Special 2023
S. 66
Werkzeuge
Data Science

Mit scikit-learn Modelle erstellen

Wer schnell in das Thema Machine Learning einsteigen will, findet in scikit-learn ein verlässliches Werkzeug. Die Python-Bibliothek eignet sich zum Aufbereiten von Daten und hilft auch beim Entwickeln und Trainieren erster Modelle.

Von Alina Dallmann

Die Machine-Learning-Bibliothek scikit-learn ist in der Python-Welt weit verbreitet. Sie hilft beim Lösen verschiedener Probleme und ist primär für tabellarische Daten ausgelegt. Das Verarbeiten von Text- und Bilddaten ist aber ebenfalls möglich. scikit-learn bietet eine einheitliche Schnittstelle für verschiedene Arten von Datentransformationen und Machine-Learning-Algorithmen. Dies ermöglicht Interessierten eine steile Lernkurve und gibt ihnen zudem die Möglichkeit, verschiedene Verfahren zu testen, um sich schrittweise einem passenden Ergebnis anzunähern.

Die Bibliothek wird in der Praxis überwiegend für statistische Verfahren verwendet. Darüber hinaus bietet sie eine Möglichkeit zum Trainieren neuronaler Netze, ist für diesen Bereich jedoch eher für schnelle Tests und einfache Architekturen und weniger für komplexe Anwendungen geeignet. Für beide Anwendungsgebiete gibt es umfangreichere Frameworks und Bibliotheken – TensorFlow oder PyTorch (siehe „Einstieg in PyTorch“ ab Seite 50) für neuronale Netze, oder StatsModels für anspruchsvollere statistische Verfahren. Aber scikit-learn vereint alles einsteigerfreundlich unter einem Dach und ermöglicht es, komplette Workflows abzubilden.

Kommentieren