Data Storytelling: Datenerkenntnisse sichtbar machen

Im Kontext einer Geschichte erscheinen die Erkenntnisse von Datenanalysen leichter verständlich und nachvollziehbarer. Ein Zuviel oder Zuwenig an Information birgt dabei jedoch die Gefahr der Verzerrung – sowohl für den Erzähler als auch den Zuhörer.

Lesezeit: 14 Min.
In Pocket speichern
vorlesen Druckansicht Kommentare lesen 4 Beiträge
Data Storytelling: Datenerkenntnisse sichtbar machen
Von
  • Tatjana Borovikov
  • Olga Mordvinova
Inhaltsverzeichnis

Große Datenmengen über beinahe jeden Aspekt unseres Lebens zu erfassen und zu analysieren ist dank der Entwicklung der Informationstechnologie kein Problem mehr. Aus den Daten werden Fakten – in der Regel numerisch repräsentiert –, die als Entscheidungsvorlagen für unsere Handlungen dienen. Doch damit allein ist der Job eines Datenexperten oder Data Analyst noch nicht getan, denn die menschliche Wahrnehmung ist weniger darauf ausgelegt, nackte Zahlen zu erfassen. Vielmehr ist sie auf das Verarbeiten von zusammenhängenden Informationen, also Geschichten, spezialisiert.

Das wird an einem Experiment von Rob Walker und Joshua Glenn deutlich, bei dem die beiden Journalisten den Zusammenhang zwischen dem monetären Wert eines Objekts und seiner Darstellung untersuchten. In der Studie entwickelten Schriftsteller Geschichten über einhundert gewöhnliche Gegenstände, die anschließend bei eBay zum Verkauf standen. Das Experiment bescherte den Verkäufern wirtschaftlichen Erfolg: Die Erlöse waren 28-mal höher als die Investition. Vor allem aber zeigte das Ergebnis die hohe Anziehungskraft der Geschichten. Das Storytelling erhöhte den persönlichen Wert eines Gegenstandes für den Interessenten – und damit auch den Preis, den er zu zahlen bereit war.

Eine Reihe der im Experiment verkauften Gegenstände aus der Kategorie "Talisman" (Abb. 1)

Fügt man Datenauswertungen in ein Szenario ein und verbindet sie zu einer Geschichte, dann erreichen die ermittelten numerischen Ergebnisse die Zielgruppe besser. Im Kontext von Nutzer- und Fachszenarien – bestehend aus Datenanalyse, Datenvisualisierungen und textuellen Elementen – nennt sich diese Vorgehensweise Data Storytelling. Ziel der Methode ist es, dem Empfänger die Bedeutung hinter den Daten klar zu machen und ihn zum Handeln zu motivieren. Durch Geschichten erhalten die Datenanalysen auch eine emotionale Komponente, die den Daten eine Stimme verleiht.

Data Storytelling vereint drei Komponenten: Daten, Visualisierung und Narrativ (Abb. 2)

Der Unterschied zwischen der Präsentation eines Datensatzes und dem Erzählen einer Geschichte liegt in der Effektivität. Durch geschickte Auswahl des Bild- und Textmaterials erhält eine Geschichte emotional gefärbte Inhalte und Details. Bei der Verarbeitung im Gehirn aktivieren sie komplexe neuronale Prozesse, die eine verstärkte emotionale Reaktion hervorrufen. Dadurch werden Geschichteninhalte schneller übertragen und sind leichter zu merken als nüchterne Zahlen und Fakten.

Eine spannende Geschichte verbindet Erzähler und Zuhörer unbewusst durch neuronale Kopplung (Neural Coupling). Sie ermöglicht es den Zuhörern, die gehörten Worte in virtuelle Erfahrungen zu verwandeln. So aktivieren beispielsweise Duftwörter wie Vanille oder Zimt die Geruchszentren des Gehirns, während der Satz "Unseren Käufern gefällt die weiche abgerundete Form des Produkts" das Tastsinnzentrum der Zuhörer anspricht.

Im Rahmen einer Studie an der Universität Princeton konnte Uri Hassen Belege für das sogenannte Mirroring zeigen: während des Geschichtenerzählens sind demnach sowohl beim Sprecher als auch beim Zuhörer dieselben Bereiche des Gehirns aktiviert. Dabei durchlebt das Gehirn der Zuhörer die beschriebenen emotionalen Ereignisse und produziert Dopamin, das die Aufnahme von Informationen zusätzlich fördert.

Geschichtenerzählen regt im menschlichen Gehirn Mechanismen an, die nicht nur die Informationsaufnahme beschleunigen – sie führen auch dazu, dass sich diese Informationen schneller einprägen. (Abb. 3)

Das Konzept des Geschichtenerzählens ist nicht neu, es bewährt sich bereits seit Jahren im Umfeld von Medien und Marketing. Heute weiß man es auch in Projekten zu nutzen, in denen die Erkenntnisse von Datenanalysen im Mittelpunkt stehen. Ein Beispiel ist der datengetriebene Journalismus, eine moderne, durch die Analyse von Massendaten unterstützte Art der Berichterstattung.

Bereits 2009 startete The Guardian als erste große Nachrichtenorganisation eine Initiative, um öffentlich zugängliche Datenquellen in die Berichterstattung zu integrieren. Durch interaktive Darstellungen lassen sich Nachrichten auf eine individuelle Art konsumieren. Ein nennenswerter Vertreter dieser Methode in Deutschland ist die Berliner Morgenpost, die ihren Lesern einen interaktiven und explorativen Nachrichtenblock bietet, wie das Beispiel zum Rekordsommer 2018 zeigt.

Daten stärker in den Kontext des Nutzers zu stellen, findet auch in Massendaten-Anwendungen, insbesondere in den Bereichen Analyse und künstliche Intelligenz (KI) immer häufiger Einzug, wie in einem Projekt von Sandra Nieves zur Untersuchung der Ursachen und Verbreitung von Waldbränden in Portugal. Die Visualisierung der Kernaussage, nämlich das Ausmaß der Katastrophe, zeigt, wie sich eine Zahl durch Text und Bild leichter verständlich und einprägsamer gestalten lässt.

Waldbrände in Portugal in 2017: Das Ausmaß der Katastrophe (Abb. 4)

Jede gute Geschichte – auch eine, die als sogenannte Data Story der Vermittlung von Daten dient – ist kontextgerecht aufbereitet und strukturiert, hat einen klaren Fokus und bedient sich erzählerischer und visueller Mittel, die für die Zielgruppe leicht verständlich sind. Wie in einer gewöhnlichen Geschichte fungieren einzelne Teile des Datenbestandes beziehungsweise die gewonnenen Erkenntnisse als Protagonisten, während die anderen den Rahmen für den Handlungsverlauf bilden.

Daten als Hauptfiguren einer Data Story (Abb. 5)

(Bild: The Guardian Datablog)

Beim Aufbau der Handlung kommt auch im Data Storytelling oft die bewährte Drei-Akt-Struktur zum Einsatz: Exposition, Konfrontation und Auflösung des Konflikts. Der Anfang der Geschichte schildert das Thema der Untersuchung und die Ausgangssituation. Dazu gehören der Kontext der Analyse, die Beschaffenheit der Daten, die angewandten Methoden und die Herausforderungen.

Im zweiten Akt, der Zuspitzung des Konflikts, stehen die Thesen beziehungsweise die Hauptfrage der Untersuchung. Die Auflösung präsentiert schließlich die gewonnenen Erkenntnisse mit Handlungsempfehlungen und Entscheidungsvorlagen. Neben dem einfachen Schema mit drei Akten lassen sich beim Storytelling auch komplexere Strukturen nutzen, wie etwa Gustav Freytags fünfteiliges Pyramidenmodell [1] oder die Heldenreise nach Joseph Campbells [2].

Handlungsverlauf in drei Akten, angepasst für eine Data Story (Abb. 6)

Die Zielgruppe einer Data Story ist der mit Abstand wichtigste Aspekt, wenn es gilt, die Geschichte und deren kontextuellen Rahmen zu entwickeln. In der Geschäftswelt versteht man unter dem Kontext den eigentlichen Datenanalyseauftrag mit seinem speziellen Ziel und Zweck sowie die Perspektive der Zielgruppe. Der Geschichtenerzähler versetzt sich also in die Lage sowohl des Auftraggebers als auch des Betrachters der Analyse und geht auf deren Ausgangssituation und Bedürfnisse ein.

Um einen entsprechenden Fluss der Geschichte aufzubauen, sollte sich der Erzähler die folgenden Fragen stellen: Wer soll meine Botschaft hören? Wie viel Vorwissen ist dabei vorhanden? Was genau soll ich dem Empfänger vermitteln? Welche Daten untermauern meinen Standpunkt und auf welche Art? Im Kontext eines Unternehmens sind dabei das Verständnis der zu analysierenden Geschäftsdaten und die Schlussfolgerungen auf das Unternehmen zu übertragen.

Der Einfluss des Kontexts ist im Projekt der Autorinnen zur Visualisierung der Onlinenutzung in Deutschland zu erkennen, die auf Studien der ARD basiert (PDF der Onlinestudie). Ziel war es, zu verstehen und darzustellen, wie viel Zeit Internetnutzer in Deutschland online verbringen und womit sie diese Zeit füllen.

Dem Aufbau der Geschichte liegt eine Zielgruppe zugrunde, die selbst gerne mit den Daten interagiert. Um die Effektivität zu erhöhen, umfasst der Fragenkatalog visualisierte Antworten. Ein Dialog in natürlicher Sprache soll den Zugang zum Datentool erleichtern und den Unterhaltungsfaktor steigern. Die Kombination von Nutzerinteraktionen mit fließenden Animationen verstärkt bei den Anwendern das Gefühl von einem sich entwickelnden Dialog.

Data Story zur Onlinenutzung in Deutschland 2017, geleitet durch gezielte natürlichsprachige Fragen (Abb. 7)

Visualisierung im Data Storytelling verbindet textuelle Elemente und Daten zu einem narrativen Fluss. Dabei helfen Fokus und visuelle Hierarchien, ein einprägsames Bild zu schaffen. Durch gezieltes Setzen des Fokus in der Story lässt sich die Aufmerksamkeit des Empfängers lenken – beispielsweise durch Hervorhebung der zentralen Botschaft.

Abbildung 8 stellt zwei unterschiedliche Darstellungsarten der Daten zur Internetnutzung in den letzten 17 Jahren gegenüber. Während links ein klassisches Liniendiagramm lediglich die Standardeinstellungen verwendet, ist auf der rechten Seite die Kernaussage herausgearbeitet. Die Aufmerksamkeit des Betrachters richtet sich auf den zuletzt stark geschrumpften Abstand zwischen Frauen und Männern.

Vergleich zwischen Datenvisualisierung mit und ohne Fokus (Abb. 8)

Fokus lässt sich darüber hinaus durch Unterschiede und Kontraste in der Darstellung der Objekte erzeugen. Das Gehirn nimmt diese Eigenschaften unbewusst wahr, bevor die eigentliche Analyse der Informationen stattfindet – im Fachjargon ist dabei von präattentiver Wahrnehmung die Rede [4]. Diese Eigenschaft lässt sich nutzen, um die wichtigsten Informationen auf den ersten Blick erkennbar und einprägsam darzustellen. In der Visualisierung vertraut man dazu auf bestimmte Attribute wie Farbe, Helligkeit, Bewegung sowie räumliche Positionierung oder Gruppierung.

Beispiele von präattentiven visuellen Attributen der Wahrnehmung, adaptiert nach Stephen Few (Abb. 9)

(Bild: Stephen Few [3])

Die hierarchische Gliederung der visuellen Informationen unterstützt die präattentive Wahrnehmung. Das Wichtigste rückt in den Mittelpunkt und wird schneller erfasst. Eine visuelle Hierarchie definiert, welche visuellen Objekte die Aufmerksamkeit des Empfängers zuerst auf sich ziehen [4]. Ein Paradebeispiel ist die Darstellung unterschiedlicher Teile eines Textes mittels verschiedener Schriftgrößen: Überschriften sind groß, wichtige Stellen fett formatiert.

Weist das Informationsdesign keine visuelle Hervorhebung auf, so folgt das Auge des Benutzers einem vorhersehbaren Lesepfad, beispielsweise von links nach rechts. Die folgenden grundlegenden visuellen Merkmale lassen sich gezielt nutzen, um die Wahrnehmung der Informationen zu steuern [5]:

  • Position: Je weiter oben, desto wichtiger und je weiter links, desto größer die Wahrscheinlichkeit, dass das Wort gelesen und wahrgenommen wird. Schlüsselinformationen sollten aus der Leserichtung ausbrechen und am besten auf der linken Seite stehen.
  • Größe: Größere Elemente ziehen mehr Aufmerksamkeit auf sich.
  • Farbe: Helle Farben ziehen mehr Aufmerksamkeit auf sich als dunklere oder gedämpfte.
  • Kontrast: Dramatisch kontrastierende Farben fallen leichter ins Auge.
  • Ausrichtung: Ein Element, das sich von der Ausrichtung der anderen abhebt, erregt mehr Aufmerksamkeit.
  • Wiederholung: Wiederholte Stile erwecken den Eindruck des Zusammenhanges der Inhalte.
  • Nähe: Eng beieinander platzierte Elemente erwecken den Eindruck des Zusammenhangs.
  • Weißraum: Freier Platz hebt das Element in dessen Mitte hervor.

Die Visualisierung setzt die Waldbrandsituation in Portugal in Bezug zur Bevölkerungsdichte. (Abb. 10)

(Bild: Sandra Nieves)

Abbildung 10 zeigt ein Beispiel für den Einsatz von visuellen Hierarchien. Die Visualisierung verknüpft unterschiedliche Datensätze, um daraus Aufschluss über einen möglichen Zusammenhang zwischen Waldbränden und Bevölkerungsdichte zu gewinnen. Eine Verbindung ist auf den ersten Blick ersichtlich. Die rot eingefärbten Gebiete der Waldbrände ziehen durch die Farbe, ihre Intensität und die Größe der Flächen sofort die Aufmerksamkeit des Betrachters auf sich. Als nächstes springt der Blick auf die blauen Punkte der dicht besiedelten Regionen.

Anschließend bewegen sich die Augen des Betrachters zwischen den beiden Visualisierungen hin und her, um die Zusammenhänge zu analysieren. Schließlich folgt ein Blick auf die Überschrift, die Legende und die anderen Details. Die Karte dient damit als Ausgangspunkt für weitere Nachforschungen und regt neue Fragen bei den Betrachtern an.

Jede Data Story basiert auf Daten. Noch bevor es an die Analyse und die Präsentation der Ergebnisse geht, sind die zugrundeliegenden Daten genauer zu betrachten. Denn oft beginnen hier bereits die Probleme: Die Rohdaten sind inhomogen. Sie liegen in unterschiedlichen Strukturen vor oder haben keinen einheitlichen Informationsgehalt.

In vielen Fällen sind auch die Herkunft und Validität unsicher oder ein Datensatz ist unvollständig. Einige Informationen lassen sich ohne Einschränkung direkt für Analysen und Data Storys verwenden. Doch enthalten die Ergebnisse Interpretationen, die für die Zielgruppe der Geschichte nicht selbstverständlich sind.

Basiert die präsentierte Entscheidungsgrundlage auf einem geringeren Datenbestand als erforderlich? Hat man bei der Interpretation der Daten auf eine bestimmte Hypothese hingearbeitet? In solchen Fällen ist es ratsam, dies gleich am Anfang der Geschichte klarzustellen, um eine Fehlinterpretation auf Seiten der Zuhörer zu vermeiden.

Schlechte Datenqualität kann die Glaubwürdigkeit der Data Story enorm beeinträchtigen, beispielsweise bei zu vielen Lücken in einer Zeitreihe – egal ob visualisiert oder interpoliert. Ein weiteres Beispiel aus dem Umfeld des Internet der Dinge (IoT) ist die Interpretation von Nullwerten: Handelt es sich um einen tatsächlich gemessenen Wert, liegt ein Übermittlungsfehler vor oder ist der Sensor inaktiv? Ohne eine genaue Spezifikation und Validierung sind solche Daten für eine aussagekräftige Story ungeeignet.

Die Methode des Data Storytelling kann Datenexperten dabei unterstützen, Erkenntnisse von Datenanalysen individuell und nachvollziehbar zu vermitteln. Doch kann sich dies auch nachteilig auswirken: Zum einen fällt es Menschen schwer, ohne begleitende Informationen zwischen Korrelationen und Kausalitäten zu unterscheiden. Eine ungeschickte Darstellung der Informationen führt im Zweifelsfall sogar zu den falschen Schlussfolgerungen.

Zum anderen wird jede Geschichte aus einem bestimmten Blickwinkel erzählt. Obwohl Daten und deren Analyse eine recht genaue Grundlage bieten, unterliegt jeder Mensch, sowohl der Erzähler als auch der Zuhörer, seinen eigenen kognitiven Verzerrungen (Bias). Die häufigsten Verzerrungen [6] entstehen durch ein Zuviel oder Zuwenig an Information, zu starken oder zu schwachen Fokus oder hohen Handlungsdruck.

Der Erzähler muss sich darüber im Klaren sein und versuchen, mögliche Verzerrungen zu vermeiden. Auch der Zuhörer sollte sich seiner eigenen Verzerrung bewusst sein und im Hinterkopf behalten, dass Data Storytelling manipulativ sein kann, um bewusst in die Irre zu führen. Das ist aber eine ganz andere Geschichte.

Tatjana Borovikov
ist UX-Design-Experte bei SAP und freiberuflicher strategischer Design Advisor mit mehr als 15 Jahren praktischer Erfahrung in verschiedenen Designbereichen. Sie treibt Innovationsprojekte voran, die von der Gestaltung zukünftiger Anwendererfahrungen und Visionen über die Zusammenarbeit mit Kunden bis hin zu innovativen Arbeitsmethoden im Unternehmen reichen.

Olga Mordvinova
ist Gründerin und CEO von incontext.technology GmbH, eines Softwareentwicklungsunternehmens mit Fokus auf daten-zentrierte Produkte, KI und den Einsatz von Open-Source-Technologien. Seit über 15 Jahren arbeitet sie in der Softwareentwicklung und Forschung in den Bereichen daten-intensives Rechnen, verteilte Systeme, Information Retrieval und Business Analytics.

  1. Freytag, Gustav (2003). "Die Technik des Dramas", Berlin.
  2. Joseph Campbell "Hero with a Thousand Faces", London 1993.
  3. Stephen Few's "Tapping the Power of Visual Perception", 2004.
  4. Stephen Few "Show Me the Numbers: Designing Tables and Graphs to Enlighten" 2004.
  5. Cole Nussbaumer."Storytelling with Data: A Data Visualization Guide for Business Professionals" von Knaflic, 2015.
  6. Rüdiger F. Pohl (Hrsg.): Cognitive Illusions: Intriguing Phenomena in Thinking, Judgement and Memory. 2. Auflage. Routledge, London (UK) 2017.

(map)