Wer mit großen Datenmengen arbeitet, muss vor allem verstehen, was sie bedeuten. Dabei hilft es, die Daten zu visualisieren. Die Industrie hat dafür kommerzielle Tools wie Tableau oder Power BI geschaffen. Aber es gibt auch viele kostenlose Alternativen. Eine davon ist das Python-Tool PyGWalker.
PyGWalker funktioniert nahtlos mit Dataframes der Pandas-Bibliothek – das ist die wohl bekannteste Python-Bibliothek, um mit großen Datenmengen effizient zu arbeiten. PyGWalker bietet eine umfassende Palette von Visualisierungswerkzeugen, mit denen Nutzer komplexe Datenstrukturen in leicht verständliche Diagramme verwandeln. So lassen sich etwa schnell Balkendiagramme, Streudiagramme und Karten erstellen, um Zusammenhänge in den Daten zu erkennen. Farben, Formen und Beschriftungen sind individuell anpassbar, um die Diagramme etwa in Präsentationen zu nutzen.
In diesem Artikel zeigen wir anhand von verschiedenen Beispielen, wie man mit PyGWalker umgeht und Diagramme erzeugt. Erst erstellen wir ein einfaches Linien-Diagramm anhand von Covid-Daten aus einer Excel-Datei und passen es dann individuell an. Anschließend zeigen wir, wie man Daten von einem Server lädt und beispielsweise Erdbeben auf einer Karte ansprechend visualisiert. Ein grundlegendes Verständnis von Python, Jupyter Notebook und Pandas Dataframes setzt dieser Artikel voraus.
Immer mehr Wissen. Das digitale Abo für IT und Technik.
Nur bis zum 31. Mai: heise+ 1 Jahr für nur 1,90 pro Woche lesen. Unbegrenzter Zugriff auf alle heise+ Artikel inklusive allen Digital-Magazinen.Länger lesen, mehr sparen: heise+ 1 Jahr lang für nur 1,90 € pro Woche lesen und brandaktuelles IT- und Tech-Wissen sichern. Zugriff auf alle heise+ Artikel inklusive der Digital-Magazine. Nur bis zum 31. Mai!