30. März 2021 von Ralf Schmidt
Fallen der Daten-Visualisierung. Oder: Warum Torten nicht nur schlecht für die Figur sind – Teil 1
„Die höheren Infektionszahlen können einfach mit der höheren Anzahl an Tests erklärt werden“ – solche und ähnliche Aussagen haben sicherlich alle von uns in den letzten Monaten gehört und verdeutlichen zweierlei: Zum einen hat die Pandemie uns alle zu (Hobby-)Daten-Analysten werden lassen, zum anderen scheint die Interpretation von selbst klaren Kennzahlen alles andere als trivial zu sein. Eine entscheidende Rolle bei der Interpretation von Daten spielt ihre Darstellung. Für mich Grund genug, mal etwas genauer die Tücken der Datenvisualisierung zu beleuchten.
Die Flut an Informationen, mit der wir beständig konfrontiert sind, macht es notwendiger denn je, Daten so darzustellen, dass ihre Botschaft effektiv und intuitiv vermittelt wird. Wo und wann immer möglich, sollten wir also darauf achten, den durchaus beachtlichen Fähigkeiten unseres Denkapparats auch gerecht zu werden, anstatt ihn durch unklare und fehlleitende Darstellungen zu verwirren.
Doch das ist nur die eine Seite. Auf der anderen Seite stehen diejenigen, die aufgrund der Daten Entscheidungen treffen wollen. Auch für sie gilt es, wachen Blickes die Entwicklung von Geschäftszahlen, Kundenstimmung oder des Marktumfeldes zu studieren. Ganz nach dem Motto „Traue keiner Statistik, die du nicht selbst gefälscht hast“ kann schon die Art der Darstellung der exakt gleichen Daten ganz unterschiedliche Interpretationen provozieren. Wohl demjenigen also, der in diesem Kontext ein grundlegendes Verständnis für die eigene Wahrnehmung hat und sich nicht nur auf seine Intuition verlassen muss.
Das Problem mit den Winkeln
Eines der bekanntesten und doch wenig umgesetzten Beispiele betrifft das Kreisdiagramm, oft auch als Tortendiagramm bezeichnet. Kreisdiagramme erfreuen sich großer Beliebtheit, obwohl Menschen denkbar schlecht darin sind, Winkel zu „lesen“ und zu ordnen. Nehmen wir das folgende Beispiel:
Wem gelingt es auf den ersten Blick, bei allen drei Diagrammen jeweils das größte Segment zu bestimmen? Selbst wenn es möglich ist, wir können die Größenverhältnisse nicht intuitiv erfassen. Ein ganz anderes Bild ergibt sich, wenn die Daten stattdessen als Balkendiagramme dargestellt sind:
Hier erkennen wir sofort, welcher Balken der kleinste und welcher der größte ist. Der Übersichtlichkeit und dem Verständnis ist also viel mehr Sorge getragen, wenn auf das Kreisdiagramm zu Gunsten eines Balkendiagramms verzichtet wird. Ein weiteres Problem ergibt sich, wenn bestimmte Kategorien nicht gezeigt werden sollen. Dann besteht das Kreisdiagramm aus Segmenten, deren prozentuale Anteile sich nicht auf 100 summieren.
Zwei Y-Achsen und ihre Folgen
Während bei Kreisdiagrammen das Erfassen der Information problematisch sein kann, ist es im nächsten Fall die Interpretation des Dargestellten. Es geht um Linien-Diagramme mit zwei unterschiedlichen y-Achsen. Sie liefern eine hervorragende Möglichkeit, viele Informationen in einer einzelnen Grafik darzustellen und den Mehrwert, die Verläufe beider Kurven direkt visuell vergleichen zu können. Wenn jedoch beide Y-Achsen unterschiedliche Größenordnungen besitzen, kann das schnell zu Fehlschlüssen führen.
Die gezeigte Grafik vermittelt sofort den Eindruck, dass sich das deutsche Bruttoinlandsprodukt parallel zu dem der gesamten Welt entwickelt und dem gleichen zeitlichen Muster folgt. Doch hier ist Vorsicht geboten! Sowohl die Größenordnung als auch der dargestellte Bereich beider Kurven ist grundverschieden. In Wahrheit ist es so, dass der Anstieg der blauen Kurve über den gezeigten Verlauf 80 Prozent beträgt, der der roten Kurve aber nur 40 Prozent. Um diesen Unterschied deutlich zu machen, müssen beide Y-Achsen zumindest bei null beginnen.
Nun wird sehr viel deutlicher, dass die blaue Kurve stärker steigt als die rote. Doch auch diese Art der Darstellung verwirrt unser intrinsisches Bestreben, Objekte in Beziehung zu setzen. Es wird also mehr als einmal passieren, dass Betrachtende zu dem Schluss kommen: Anfangs ist das deutsche Bruttoinlandsprodukt höher gewesen und 2011 wurde es dann von dem der Welt überholt. Auch dieser Schlussfolgerung kann mit einer anderen Darstellungsweise ein Riegel vorgeschoben werden:
Durch die Verwendung einer indexierten Skala als y-Achse können beide Kurven weiterhin in einer Grafik dargestellt werden, ohne Kompromisse bei der Verdeutlichung der Unterschiede in der zeitlichen Entwicklung zu machen.
Y-Achsen – Runde 2
Teil des skizzierten Problems bei der Verwendung von zwei Y-Achsen war die Darstellung der Kurven in unterschiedlichen Wertebereichen. Das führt uns direkt zur nächsten heiß debattierten Frage der Datendarstellung: Darf man die Y-Achse unterbrechen/stauchen oder ist es „Good practice“ den gesamten Bereich darzustellen? Die Antwort ist natürlich ein klares „Jein“, aber wir wollen trotzdem ein Beispiel besprechen, in dem die Nutzung eines Ausschnitts stark die Botschaft der Darstellung beeinflusst. Schauen wir uns das folgende Balkendiagramm an:
Wahnsinn, was für ein Erfolg! Die Verkäufe sind förmlich explodiert und die Entwicklung zeigt steil nach oben… Das ist zumindest der Eindruck, der entsteht. Doch wir müssen beachten, dass die Y-Achse nur Werte zwischen 80 und 150 abbildet, das heißt, eigentlich sind alle Balken unten abgeschnitten. Schauen wir uns doch die Verkaufszahlen mal an, ohne die Balken abzuschneiden:
Ja, natürlich ist immer noch ein positiver Trend zu sehen – aber die Dynamik ist eine komplett andere. Ganz generell gilt, dass mit der Höhe der Balken eine Aussage transportiert wird, und deshalb auch der gesamte Balken zu sehen sein sollte. Bei Liniendiagrammen, bei denen der Fokus oft auf der relativen Entwicklung liegt, ist es eher vertretbar, die Y-Achse zu Zwecken der besseren Veranschaulichung zu stauchen.
Fazit
Die Beispiele verdeutlichen, dass eine gute Darstellung mehr umfasst als nur die Auswahl der Farben. In unserem Bestreben, klare Erkenntnisse zu vermitteln, sollten wir es dem Betrachter so einfach wie möglich machen, die korrekten Schlüsse aus einer Darstellung zu ziehen. Doch „gut“ und „richtig“ sind natürlich keine absoluten Maßstäbe und was in einem Fall gut ist, muss in einem anderen noch lange nicht angemessen sein. Es geht daher darum, eine bewusste Entscheidung für oder gegen eine bestimmte Darstellungsweise zu fällen. Und über diese lässt sich natürlich trefflich diskutieren – gern auch bei einem Stück Torte.