Python für Datenanalysen: Effiziente Aufbereitung von Rohdaten mit pandas

Die Aufbereitung von Rohdaten macht bei Datenanalysen einen Großteil des Aufwands aus. Die Bibliothek pandas bringt dafür Datenstrukturen und Funktionen mit.

Artikel verschenken

1

22.02.2022, 08:00 Uhr

Lesezeit: 20 Min.

iX Magazin

Von

Wadim Wormsbecher

Python für Datenanalysen: Effiziente Aufbereitung von Rohdaten mit pandas
Datenverarbeitung
Speicher sinnvoll belegen
Daten mit pandas filtern
Werte in DataFrames ersetzen
Mit DataFrames rechnen
Fazit

Artikel in iX 3/2022 lesen

Eine besonders beliebte Bibliothek für die Datenanalyse mit Python ist pandas. Sie bietet einen einfachen und dabei sehr effizienten Weg, Daten zu analysieren und zu verwerten. pandas selbst baut auf NumPy auf, einer Bibliothek, die eine hocheffiziente Arithmetik in Python implementiert. So kann NumPy mit Vektoren und Matrizen rechnen und nicht nur mit einzelnen Zahlen. Dies erlaubt eine gewaltige Steigerung der Recheneffizienz. NumPy führt die Berechnungen nicht in Python aus, sondern in C-Code und umgeht so viele Nachteile von reinem Python.

Im folgenden Beispiel kommt als IDE ein Jupyter-Notebook in Google Colab zum Einsatz. Wer lieber lokal arbeitet, sollte beachten, dass sich die pandas-Versionen teilweise stark voneinander unterscheiden. Dieser Artikel arbeitet mit Python 3.7.12 und pandas 1.1.5. Letzteres besitzt diverse Abhängigkeiten und es gilt, darauf zu achten, dass sie mit installiert werden, was in der Regel automatisch klappt.

Die Beispiele in diesem Artikel nutzen den Datensatz "Customer Personality Analysis" von kaggle.com. Dank der Lizenz Creative Commons CC0 1.0 darf er beliebig genutzt werden. Es handelt sich um Personendaten einer fiktiven Marketingkampagne.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

Der Wärmepumpen-Inverter: Darum regelt er selten unter 20 Prozent herunter

Der Inverter regelt die Kompressor-Drehzahl, um die Wärmeproduktion an den Bedarf anzupassen. Doch wie funktioniert das und warum kann er nicht auf 0 regeln?

KI-Grafik: Real gewordener OpenClaw-Bot arbeitet mit Schraubenschlüssel in der Hand am System.

OpenClaw im Selbstversuch: Erste Schritte mit dem Super-KI-Agenten

OpenClaw macht aus LLMs eigenständige Helfer: Sie senden Mails, schreiben Skripte und erledigen komplexe Aufgaben. Wir haben das in sicherer Umgebung probiert.

Das Aufmacherbild ist im Comic-Stil gehalten und zeigt, wie ein einfacher, kleiner Gartenzaun Brett für Brett durch einen wesentlich höheren ersetzt wird.

Windows 11: Die wichtigsten Handgriffe für besseren Datenschutz

Wer Windows 11 benutzt, sollte einen Blick in die Datenschutzoptionen werfen – um sie zu verbessern, aber auch um zu verstehen, was alles einstellbar ist.

Das Aufmacherbild ist im Comicstil gehalten. Es zeigt ein Hochbeet in einem Garten. Im Beet sind Pflanzen im Raster angeordnert, sodass es ans Winodws-Startmenü erinnert.

Windows 11: Wissenswertes zu Startmenü und Taskleiste

Startmenü und Taskleiste von Windows 11 haben einen miesen Ruf: Sie sind unübersichtlich und voller Werbung. Mit ein paar Handgriffen werden beide effizienter.

Ducati Monster im Fahrbericht – Wiedergeburt des Kassenschlagers?

Die Monster ist Ducatis erfolgreichstes Bike. 2021 verschreckte ein radikaler Bruch bei Design und Technik viele Fans. Ein Facelift soll das jetzt richten.

Vorsicht, Kunde: Ausgebremst bei der Deutschen Glasfaser

Wer einen Tarif mit versprochenen 1000 Mbit/s bezahlt, kann erwarten, dass er diese Bandbreite auch erhält. Bei der DG ist das nicht selbstverständlich.