Mit Python und Pandas die eigenen Einkaufsdaten analysieren

Wer einen Datensatz selbst auswertet, bekommt Einblicke ins eigene Einkaufsverhalten, Erfahrung in der Datenanalyse und ein unterhaltsames Programmierprojekt.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht
, Bild: Albert Hulm

(Bild: Bild: Albert Hulm)

Lesezeit: 14 Min.
Von
  • Lars Hupel
Inhaltsverzeichnis

Mit Beginn der Pandemie haben viele ihr Einkaufsverhalten umgestellt: Statt wie früher mit Einkaufszettel und Anonymität gewappnet den Supermarkt zu betreten, nutzt man heutzutage den bequemen Lieferdienst. Der erlaubt alle Produkte in heimischer Ruhe auszusuchen und bei Folgebestellungen ganz einfach frühere Produkte erneut in den Warenkorb zu legen. Die dabei anfallenden Daten – samt Zahlungsmethoden – bewahrt der Supermarkt fein säuberlich auf.

Dabei kommt schnell einiges zusammen, denn anders als in großen Onlineshops wie Amazon oder Zalando kauft man bei Lebensmittelhändlern Produkte oft wiederholt und mit hoher Frequenz. Nicht selten wird zwei- bis dreimal pro Monat oder öfter ein Warenkorb geliefert, der zu beachtlichen Teilen aus den immer gleichen Produkten besteht.

Programmieren in Python

Manche Onlinehändler bieten löblicherweise einen Datenexport an – etwa die Supermarktkette Rewe. Im Folgenden erklären wir anhand des Rewe-Beispiels, wie man so einen Datenexport analysiert und die Datenqualität verbessert. Die konkreten Daten sind spezifisch für die Einkäufe eines einzelnen Kunden, ihre Zeitpunkte und den Händler, aber die allgemeine Vorgehensweise kann man breit anwenden – sofern man an die Daten kommt.

Immer mehr Wissen. Das digitale Abo für IT und Technik.






Immer mehr Wissen. Das digitale Abo für IT und Technik.