Python: Reverse-Engineering von Supermarkt-Apps

In unserer Inspektion der eigenen Einkaufsdaten erforschen wir mit Python die APIs des Supermarktes anhand von Browser- und App-Analysen.

Lesezeit: 15 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 10 Beiträge
, Albert Hulm

(Bild: Albert Hulm)

Von
  • Lars Hupel
Inhaltsverzeichnis

Der Onlineshop der Supermarktkette Rewe bietet einen Export der eigenen Einkaufsdaten – das ist praktisch für neugierige Datenanalysten: Mit Python und Werkzeugen wie Jupyter Notebooks und der Bibliothek Pandas kann man diese Daten untersuchen. Im Artikel "Mit Python und Pandas die eigenen Einkaufsdaten analysieren" haben wir bereits gezeigt, wie man dabei einiges über die eigenen Einkaufsvorlieben im Speziellen und über Datenanalyse im Allgemeinen lernt.

Programmieren in Python

Beidem sind allerdings Grenzen gesetzt, denn – so nerdfreundlich ein Datenexport im JSON-Format auch ist – letztlich steht in dem Datensatz wenig mehr als auf den Kassenzetteln. Insbesondere fehlen Produktgruppen oder -kategorien und Artikelnummern, die Artikel eindeutig und händlerübergreifend identifizieren. Erstere würden beispielsweise erlauben, Gemüseeinkäufe mit den Ausgaben für Snacks zu vergleichen. Über letztere könnte man Produkte auch in externen Datenbanken finden oder Preise mit denen der Mitbewerber vergleichen.

Grundsätzlich liegen diese Daten vor; wie praktisch jeder andere Onlineshop sortiert auch Rewes Website die eigenen Produkte in Kategorien. Einen eindeutigen Barcode mit der Global Trade Item Number (GTIN) findet man ohnehin auf fast jedem Produkt. Die GTIN wird umgangssprachlich oft noch als "EAN" (für European Article Number) bezeichnet.