Datenanalyse mit Python: Erste Schritte mit Pandas – Fussballdaten auswerten

Pandas ist die Standard-Bibliothek für alle, die mit Python Daten verarbeiten möchten. So lässt sich auch die erste Bundesligasaison einfach analysieren.

Lesezeit: 17 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 5 Beiträge
Von
  • Marvin Strathmann
Inhaltsverzeichnis

Wer Daten mit Python ver- oder bearbeiten möchte, kommt kaum um die Bibliothek Pandas herum. Sie ist gewissermaßen der Goldstandard für Python, wenn es um strukturierte Informationen geht.

Wie groß die Ursprungsdaten sind, spielt für Pandas keine Rolle: Die Bibliothek kommt mit CSV-Dateien zurecht, dem Excel-Format von Microsoft und auch mit großen Datenmengen in einer JSON-Datei. Dabei ist es egal, ob Sie ein kleines oder großes Datenprojekt angehen möchten, Pandas vereinfacht in der Regel immer den Umgang mit Daten jeder Art.

Mehr zu Python

Wir erklären in diesem Artikel die grundlegenden Konzepte, mit denen Pandas arbeitet: die Series und den Dataframe. Außerdem zeigen wir, wie man sich freie Fußballdaten aus dem Netz holt und so etwa die erste Bundesligasaison 1963/64 analysiert. Grundlegende Python-Kenntnisse sind dafür hilfreich, Sie sollten also schon einmal Bibliotheken mit Pip installiert haben.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

  • Zugriff auf alle Inhalte von heise+
  • exklusive Tests, Ratgeber & Hintergründe: unabhängig, kritisch fundiert
  • c't, iX, MIT Technology Review, Mac & i, Make, c't Fotografie direkt im Browser lesen
  • einmal anmelden – auf allen Geräten lesen - monatlich kündbar
  • erster Monat gratis, danach monatlich 12,95 €
  • Wöchentlicher Newsletter mit persönlichen Leseempfehlungen des Chefredakteurs
GRATIS-Monat beginnen Jetzt GRATIS-Monat beginnen Mehr Informationen zu heise+