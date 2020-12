Datenvisualisierung mit Jupyter-Notebooks, Teil 1 Wie verwandelt Stefanie Scholz, Christian Winkler Jupyter-Notebooks eignen sich zusammen mit Python für das Visualisieren von Daten. Sie kommen daher häufig in den Bereichen Data Science und Datenanalyse zum Einsatz.

iX-tract Jupyter Notebook ist eine Open-Source-Webanwendung zur Erstellung digitaler Dokumente, die auch Programmcode enthalten und ausführen können.

Die daraus generierten Jupyter-Notebooks werden häufig mit Python und der Bibliothek pandas zur Datenanalyse und -visualisierung eingesetzt.

Abhängig vom Verwendungszweck und der Art der Daten bieten sich verschiedene Formen der Visualisierung wie Zeitreihen, Balkendiagramme, Histogramme, Boxplots und Violinplots an. Die gewählte Darstellung muss die korrekte Interpretation der Daten unterstützen.

Als Datenbasis für die Beispiele im Artikel dienen Verbrauchererhebungsdaten von Eurostat, dem statistischen Amt der Europäischen Union.

Für die Datenanalyse und Statistik (neudeutsch: Data Science) hat sich in den letzten Jahren neben R mehr und mehr die Kombination aus der Programmiersprache Python und Jupyter Notebook zum interaktiven Analysieren und Visualisieren als Plattform etabliert. Die Bibliothek pandas erlaubt dabei die einfache Verarbeitung auch großer Datenmengen und leistungsfähige Transformationen zwischen unterschiedlichen Formaten und Darstellungen. Mithilfe von GeoPandas gelingt es auch, Geodaten in den gängigen Formaten zu lesen und in pandas zu nutzen.

pandas integriert Matplotlib und erlaubt damit viele Visualisierungsvarianten mit nur einem einzigen Befehl. Das Python-­Ökosystem hat hier noch deutlich mehr zu bieten, etwa das auf Matplotlib aufbauende seaborn. Beide Varianten finden im Artikel Verwendung, daneben gibt es weitere wie Plotly oder Bokeh.