Daten verarbeiten mit Python: Pandas-Bibliothek für SQL-Umsteiger

Mit der Bibliothek Pandas verarbeiten Sie kleine und große Datenmengen mit Python. Wer SQL-Befehle gewöhnt ist, wird sich sehr schnell mit Pandas anfreunden.

Lesezeit: 5 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 2 Beiträge
Von
  • Arnd Scharpegge
Inhaltsverzeichnis

Wenn Sie mit der Skriptsprache Python Daten ver- und bearbeiten wollen, bietet sich die Programmierbibliothek Pandas an. Sie ist ein Alleskönner für Python, wenn es um Daten geht. Dabei ist es egal, ob es sich um eine kleine CSV-Datei oder einen sehr großen Datenbestand handelt. Für jede Aufgabe gibt es eine Lösung.

Dieser Artikel soll Ihnen den Einstieg in Pandas vereinfachen. Sie sollten Vorkenntnisse in SQL und Python mitbringen und es gewohnt sein, strukturiert mit Daten zu arbeiten. Am Ende zählt das Ergebnis, nicht die Programmiersprache und deren Tools. Pandas vereinfacht den Umgang mit Daten und kann mit vielen Ein- und Ausgabequellen umgehen.

In diesem Artikel werden Sie mit Daten einer SQL-Tabelle arbeiten – nur halt nicht mit SQL-, sondern mit Python-Befehlen. Sie werden Daten laden, Spalten einschränken, Zeilen auf Werte hin filtern, deren Ausgaben ordnen und sie anschließend als neue Tabelle speichern. Danach werden Sie noch Daten gruppieren und mit diesen Daten rechnen.

Immer mehr Wissen. Das digitale Abo für IT und Technik.

  • Zugriff auf alle Inhalte von heise+
  • exklusive Tests, Ratgeber & Hintergründe: unabhängig, kritisch fundiert
  • c't, iX, Technology Review, Mac & i, Make, c't Fotografie direkt im Browser lesen
  • einmal anmelden – auf allen Geräten lesen - monatlich kündbar
  • erster Monat gratis, danach monatlich 9,95 €
  • Wöchentlicher Newsletter mit persönlichen Leseempfehlungen des Chefredakteurs
GRATIS-Monat beginnen Jetzt GRATIS-Monat beginnen Mehr Informationen zu heise+