Bild: Albert Hulm Marktanalyse Supermarkt-Apps und -APIs seziert Viele Webdienste bieten interessante Datenquellen, halten damit aber hinterm Berg. Wer weiß, wie’s geht, kann jedoch auch undokumentierte Quellen finden und mit Python anzapfen. Im zweiten Teil unserer Inspektion der eigenen Einkaufsdaten erforschen wir die APIs des Supermarktes anhand von Browser- und App-Analysen. Von Lars Hupel

c't kompakt Die Schnittstellen von Online-Services sind häufig nicht dokumentiert.

Mit den passenden Analysewerkzeugen findet man mehr Informationen, als Anbieter direkt preisgeben.

Etwas Python-Code hilft dann dabei, die Schnittstellen anzusprechen.

Der Onlineshop der Supermarktkette Rewe bietet einen Export der eigenen Einkaufsdaten – das ist praktisch für neugierige Datenanalysten: Mit Python und Werkzeugen wie Jupyter Notebooks und der Bibliothek Pandas kann man diese Daten untersuchen. In Ausgabe 09/2022 haben wir gezeigt, wie man dabei einiges über die eigenen Einkaufsvorlieben im Speziellen und über Datenanalyse im Allgemeinen lernt [1].

Beidem sind allerdings Grenzen gesetzt, denn – so nerdfreundlich ein Datenexport im JSON-Format auch ist – letztlich steht in dem Datensatz wenig mehr als auf den Kassenzetteln. Insbesondere fehlen Produktgruppen oder -kategorien und Artikelnummern, die Artikel eindeutig und händlerübergreifend identifizieren. Erstere würden beispielsweise erlauben, Gemüseeinkäufe mit den Ausgaben für Snacks zu vergleichen. Über letztere könnte man Produkte auch in externen Datenbanken finden oder Preise mit denen der Mitbewerber vergleichen.