Datenvisualisierung mit Jupyter-Notebooks: Korrelationsanalysen mit Geodaten

02.02.2021 08:00 Uhr Prof. Stefanie Scholz, Dr. Christian Winkler

Jupyter-Notebooks gehören zum Grundgerüst vieler Data-Science-Analysen. Zusammenhänge zwischen Daten lassen sich mit Heatmaps und thematischen Karten erkunden.

Der erste Teil dieser Artikelserie beschäftigte sich mit dem Aufbereiten eines Datensets, das über Transformationen geeignete Daten für beispielhafte Analysen liefert [1] [1]. Um diese Daten zu visualisieren, kamen Zeitreihen, Balkendiagramme, Histogramme, Boxplots und Violinplots zum Einsatz.

In diesem Teil geht es um Korrelationen und Geodaten. Korrelationsanalysen machen Zusammenhänge zwischen Variablen sichtbar. Für die Darstellung eignen sich Heatmaps und Scatterplots. Geodaten sind gut in Form von Karten abzubilden. Das Paket GeoPandas erleichtert die Arbeit mit Geodaten in Python und erweitert die von pandas verwendeten Datentypen, um räumliche Operationen zu ermöglichen.

Der bereits im ersten Teil des Artikels genutzte DataFrame von Eurostat stellt neben dem Konsumentenvertrauen noch weitere Indikatoren bereit. Daraus erwächst die Frage, ob diese Indikatoren voneinander unabhängig sind oder ob es eine Beziehung zwischen ihnen gibt.

URL dieses Artikels:
https://www.heise.de/-5034536

Links in diesem Artikel:
[1] https://www.heise.de/ratgeber/Data-Science-Datenvisualisierung-mit-Jupyter-Notebooks-4994377.html