Datenvisualisierung mit Jupyter-Notebooks: Korrelationsanalysen mit Geodaten

Jupyter-Notebooks gehören zum Grundgerüst vieler Data-Science-Analysen. Zusammenhänge zwischen Daten lassen sich mit Heatmaps und thematischen Karten erkunden.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
Lesezeit: 8 Min.
Von
  • Prof. Stefanie Scholz
  • Prof. Christian Winkler
Inhaltsverzeichnis

Der erste Teil dieser Artikelserie beschäftigte sich mit dem Aufbereiten eines Datensets, das über Transformationen geeignete Daten für beispielhafte Analysen liefert. Um diese Daten zu visualisieren, kamen Zeitreihen, Balkendiagramme, Histogramme, Boxplots und Violinplots zum Einsatz.

In diesem Teil geht es um Korrelationen und Geodaten. Korrelationsanalysen machen Zusammenhänge zwischen Variablen sichtbar. Für die Darstellung eignen sich Heatmaps und Scatterplots. Geodaten sind gut in Form von Karten abzubilden. Das Paket GeoPandas erleichtert die Arbeit mit Geodaten in Python und erweitert die von pandas verwendeten Datentypen, um räumliche Operationen zu ermöglichen.

Der bereits im ersten Teil des Artikels genutzte DataFrame von Eurostat stellt neben dem Konsumentenvertrauen noch weitere Indikatoren bereit. Daraus erwächst die Frage, ob diese Indikatoren voneinander unabhängig sind oder ob es eine Beziehung zwischen ihnen gibt.