Data Science fĂĽr Einsteiger: Mit einem Datensatz Vorhersagen treffen

In Handys, Smartwatches und Unternehmen schlummern Daten. Mit Python gewinnen Sie informative Vorhersagen aus dem Datenschatz. Wir schaffen einen Einstieg.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 21 Kommentare lesen

(Bild: Erstellt mit Midjourney / Collage durch heise online)

Lesezeit: 18 Min.
Von
  • Lea Reinhart
Inhaltsverzeichnis

Programme speichern oft hunderte Daten über Sie. Wie viele Schritte Sie diesen Monat gegangen sind, welche Tage Sie schlecht schliefen oder wie sich Ihre Mietkosten veränderten – all diese Informationen tummeln sich in JSON-, Excel- oder etwa Textdateien. Es braucht nur Techniken, um aus den Daten kleine Aha-Erlebnisse zu destillieren. Und genau diese Techniken bietet Data Science an.

heise+ Kompakt

Mit Python und einem Datensatz können Sie Vorhersagen treffen.

Im Artikel lernen Sie, Daten zu analysieren und maschinelles Lernen (ML) anzuwenden.

Sie steigen dafĂĽr in Python-Bibliotheken fĂĽr Data Science ein: Pandas, Scikit-learn, Matplotlib und Seaborn.

Mehr zu Data Science / Datenanalyse

Data Science ist die Wissenschaft, Daten zu analysieren und zu interpretieren. Data Scientists helfen Unternehmen etwa dabei, fundierte Geschäftsentscheidungen zu treffen. Die Programmiersprache Python hat sich dank seiner umfangreichen Bibliotheken und Nutzerfreundlichkeit zur führenden Sprache für Data Scientists entwickelt. Mit Python lassen sich auch statistische Modelle mit Daten trainieren – das sogenannte maschinelle Lernen (ML). Data Scientists benutzen diese Technik, um Vorhersagen zu treffen.

Der Artikel eignet sich für Programmierer, die bereits etwas Wissen in Python gesammelt haben und nun in Data Science einsteigen möchten. Der Artikel erklärt grundlegende Konzepte der Datenwissenschaft und des maschinellen Lernens: die Korrelationsanalyse und die lineare Regression. Wir werden dafür mit Python einen Datensatz zum Immobilienmarkt aus: den California Housing Datensatz. Darauf wenden wir die Python-Bibliothek Scikit-learn an und trainieren ein Modell, um herauszufinden, welcher Faktor den Wohnungspreis antreibt – und so erschafft ein Python-Skript neue Erkenntnisse.

Das war die Leseprobe unseres heise-Plus-Artikels "Data Science für Einsteiger: Mit einem Datensatz Vorhersagen treffen". Mit einem heise-Plus-Abo können sie den ganzen Artikel lesen und anhören.