Suchen...
Generic filters
Exact matches only
Search in title
Search in excerpt
Search in content

Vergleichbare Skalierung von Zeitreihen

PDF Download

Liebe Datenanalysten,

Mitte Februar berichteten Zeitungen und Wirtschaftsmagazine über das „Chart of Doom“, das „Diagramm des Untergangs“. In Internetforen und sozialen Medien wurde es schnell verbreitet und aufgeregt diskutiert – denn es schien nichts Gutes zu verheißen: In den Jahren 1928 bis 1930 habe sich der Dow Jones praktisch genauso verhalten wie heute. Damit, so suggeriert die Grafik, stehe der nächste große Börsen-Crash unmittelbar bevor. Wer geübt ist im Umgang mit Diagrammen, durchschaut den Trick schnell: Wieder einmal ist es eine Frage der Skalierung, ob die Kursverläufe ähnlich erscheinen oder nicht. Zugegeben, die Daten, um die es geht, sind schwierig. In den Zwanzigern bewegte sich der Dow Jones von 200 auf 380, in unserer Zeit von 12.500 auf 16.500. Solche immensen Größenunterschiede sind ein Problem für die Darstellung. Mit DeltaMaster wäre es nicht zu so viel Aufregung gekommen: DeltaMaster skaliert richtig – und das auch bei schwierigen Daten. Die Methode dafür heißt vergleichbare Skalierung und sie ist patentiert. In dieser Ausgabe der DeltaMaster clicks! stellen wir sie vor und zeigen, wie man mit den analytischen Mitteln von DeltaMaster dem trügerischen Diagramm auf die Schliche kommt.

Herzliche Grüße
Ihr Team von Bissantz & Company

 

Im Februar 2014 geisterte das „Chart of Doom“ durchs Internet und durch die Presse. Das Diagramm zeigt zwei übereinander liegende Zeitreihen. Beide geben die Entwicklung des Dow Jones wieder, die eine in den Jahren 1928 bis 1930, die andere in den Jahren 2012 bis 2014. Die Linien verlaufen nahezu deckungsgleich. Die erste Reihe endet mit einem plötzlichen und dramatischen Einbruch: dem Schwarzen Dienstag, dem Beginn einer jahrelangen weltweiten Wirtschaftskrise. Die zweite Zeitreihe ist ein bisschen kürzer als die Linie aus den Zwanzigern. Sie endet unmittelbar in unserer Gegenwart, auf hohem Niveau. Die Ähnlichkeit der Linienverläufe legt die Frage nahe: Wie wird es weitergehen? Wird sich die Geschichte wiederholen, wird sich der Dow Jones verhalten wie einst in den Zwanzigern – und steuern wir damit schnurstracks auf eine neue Weltwirtschaftskrise zu, auf Massenarbeitslosigkeit, auf Krieg?

Eine denkwürdige Parallele - Ähnlichkeiten vor dem großen Crash von 1929 und heute sind frappierend

Quelle: www.welt.de/124946802, 18. Februar 2014.

Das Diagramm wurde aus ganz unterschiedlichen Blickwinkeln diskutiert. Die wirtschaftspolitischen Rahmenbedingungen wurden ins Feld geführt, von selbsterfüllenden Prophezeiungen war zu lesen, die Wahl der Zeitabschnitte stand zur Debatte (es mag ja Phasen gegeben haben, in denen der Dow Jones ebenfalls wie heute verlief, die aber nicht in einem Crash endeten). Als Datenanalysten und DeltaMaster-Anwender lassen wir uns auf solche Überlegungen gerne einmal ein – aber zuerst fragen wir: Ist das Diagramm überhaupt integer? Stellt es die Entwicklungen richtig dar? Wenn nicht, kann es kaum eine ernst zu nehmende Botschaft vermitteln.

Wir sind dem „Chart of Doom“ auf den Grund gegangen. Mit DeltaMaster ist es schnell als Fälschung zu identifizieren. Um das Ergebnis vorwegzunehmen: Bei vergleichbarer Skalierung, wie in der Abbildung rechts, kann von einer Ähnlichkeit keine Rede mehr sein.

Chart of Doom bei vergleichbarer Skalierung

In diesen DeltaMaster clicks! zeigen wir, wie wir dazu vorgegangen sind – und nehmen den Fall zugleich als Anschauungsobjekt, um Ihnen einige spezielle Funktionen der Zeitreihenanalyse vorzustellen.

Ein erster Verdacht

Schon eine einfache Überschlagsrechnung erhärtet den Verdacht, dass mit dem Diagramm etwas nicht stimmt. Achten Sie einmal auf die Y-Achsen im „Chart of Doom“: Links ist der Ausschnitt von 200 bis 350 dargestellt, das entspricht einer Spanne von 75 Prozent (150/200). Der Ausschnitt rechts reicht von 13.000 bis 16.000, das entspricht einer Spanne von 23 Prozent (3.000/13.000). 75 Prozent links, 23 Prozent rechts, Faktor 3 – für Zeitreihenvergleiche ist das ein gewaltiger Unterschied.

Selbst ist der Datenanalyst

Wie so oft, wenn man Datendarstellungen aus den Medien überprüfen möchte, galt es zunächst, die Daten zu beschaffen. Das war in diesem Fall nicht schwierig: Historische Aktienkurse sind im Internet leicht zu bekommen. Wir speicherten die Werte zunächst in einer Excel-Datei. Eine wichtige Vorarbeit war, die Datumsangaben der Kurswerte anzugleichen: Damit DeltaMaster Zeitreihen übereinander legen kann, müssen sie den gleichen Zeitraum abdecken. Daher verschoben wir die Werte der Gegenwart in die Vergangenheit und kennzeichneten in einer zusätzlichen Spalte, ob ein Wert in die Zwanziger Jahre oder in die Gegenwart gehört.

Auf diese Excel-Datei konnten wir direkt mit dem DeltaMaster-TableWizard zugreifen, um ein relationales Analysemodell aufzubauen. Dieses wiederum überführten wir mit dem DeltaMaster-CubeWizard in einen OLAP-Würfel. Das gewährleistet größtmögliche Flexibilität für die Analyse. Die Abbildung zeigt die wesentlichen Bestandteile unseres Modells. Es kommt mit einem Analysewert („Dow Jones“) und drei Dimensionen aus: der Zeitachse („Periode“), der Periodenansicht und dem Satzartschalter „Reihe“, der zwischen „1928-1930“ und „2012-2014“ differenziert, wie oben erwähnt. In unserer Untersuchung haben wir die Periodenansicht am Ende gar nicht benötigt. Sie in den Cube aufzunehmen, ist trotzdem ratsam – gerade bei Fallstudien weiß man ja nie, wohin die Analyse führt und ob man nicht doch eine Hilfsdimension brauchen wird, zum Beispiel für Vorperiodenvergleiche, Kumulationen oder rollierende Durchschnitte und Ähnliches.

multidimensionale Analyse mit dem DeltaMaster-CubeWizard

In den DeltaMaster clicks! 01/2013 ist ausführlich beschrieben, wie man auf tabellarische Daten in Excel mit dem TableWizard zugreift und daraus mit dem CubeWizard multidimensionale Analysemodelle erstellt.

Ein Diagramm, zwei Reihen

Als erstes wollten wir sehen, ob unsere Daten die gleiche Ähnlichkeit im Linienverlauf aufweisen wie bei dem unseligen „Chart of Doom“.

Um mehrere Kennzahlen in der Zeitreihenanalyse untersuchen zu können, wenden wir das Verfahren im Modus Miner an; der Modus Analyzer unterstützt nur eine Kennzahl. Unser Analysemodell bedingt, dass in der Zeitreihenanalyse nicht zwei Analysewerte darzustellen sind, sondern einer, der aber für unterschiedliche Dimensionselemente. Dazu geht man wie folgt vor: Im Fenster Sicht wählt man das erste Element aus, zum Beispiel „1928-1930“, und im Fenster Analyse die gewünschte Kennzahl, in unserem Fall „Dow Jones“. Lässt man die Analyse berechnen, zeichnet DeltaMaster die erste Reihe ins Diagramm. Nun ändert man die Sicht und wählt das nächste Element aus, „2012-2014“, und lässt die Analyse ein weiteres Mal berechnen. Dadurch wird eine zweite Reihe in das Diagramm gezeichnet. Auf diese Weise erzeugt man also mehrere Reihen in einer Zeitreihenanalyse, ohne Filterwerte anlegen zu müssen: indem man sukzessive die relevanten Elemente in der Sicht auswählt und die Analyse jeweils neu berechnet.

Zeitreihenanalyse im Modus Miner

Schließlich passten wir die Analyse so an, dass sie dem „Chart of Doom“ entspricht: Die zweite Reihe für die Kursentwicklung von 2012 bis 2014 legten wir auf die zweite Y-Achse und wählten eine Skalierung von Minimum bis Maximum (beides Optionen im Kontextmenü und im Menü Ich möchte). Und tatsächlich, mit diesen Einstellungen ergibt sich in DeltaMaster ein ganz ähnliches Bild. Wir waren beruhigt: Offenbar verwendeten wir die gleichen Daten.

angepasste Analyse des Chart of Doom

Die Darstellung in DeltaMaster liefert bereits einen Hinweis darauf, dass man es mit tückischen Daten zu tun hat: An der rechten oberen Ecke zeigt DeltaMaster einige Kenngrößen zu den Linien an, nämlich die Differenz zwischen dem größten und dem kleinsten Wert der Reihe („max-min“) und die Differenz zwischen Anfangs- und Endwert der Reihe („?“), beide jeweils absolut und relativ (bezogen auf das Minimum bzw. auf den Startwert).

Die Anzeige dieser Kenngrößen lässt sich in den Eigenschaften (Kontextmenü oder Menü Ich möchte) einzeln aktivieren und deaktivieren. Den entscheidenden Hinweis liefert die Differenz zwischen Minimum und Maximum: eine „Amplitude“ von 32 Prozent bei der einen Reihe und von 89 Prozent bei der anderen, das passt nicht gut zusammen – und nicht gut zusammen in ein Diagramm. Nach der eingangs erwähnten Überschlagsrechnung hatten wir das schon geahnt, jetzt haben wir es nachgewiesen.

Selektion: Absolute Differenz zwischen Anfangs- und Endwert ausweisen, Relative Differenz zwischen Anfangs- und Endwert ausweisen, Absolute Differenz zwischen Minimum und Maximum ausweisen und Relative Differenz zwischen Minimum und Maximum ausweisen

Zwei Diagramme, eine Analyse: Small Multiples

Das Problem an der Darstellung sind die sehr unterschiedlichen Abschnitte der Y-Achse. Sie in einem Diagramm unterzubringen, links und rechts, führt dazu, dass die Reihen nicht mehr vergleichbar sind, weil gleiche Steigungen für unterschiedliche relative Änderungen stehen. Die Lösung ist, jede Reihe in einem eigenen Diagramm darzustellen, die Diagramme vergleichbar zu skalieren und dann nebeneinander zu stellen. Das leistet das Verfahren Small Multiples, das im Modus Miner-Expert zur Verfügung steht. Weitere Hinweise und Anwendungsbeispiele zu Small Multiples finden Sie in den DeltaMaster clicks! 12/2008, 11/2010 und 11/2012.

Voraussetzung für Small Multiples ist eine Analysevorlage; darin ist die Konfiguration des jeweiligen Analyseverfahrens gespeichert. In unserem Fall empfiehlt sich eine logarithmische Skalierung zwischen Minimum und Maximum: Der Logarithmus bewirkt, dass gleiche relative Veränderungen in einer Reihe als gleiche Steigungen abgebildet werden, unabhängig davon, auf welchem Niveau die Veränderung stattfindet (siehe DeltaMaster clicks! 07/2010). Die Beschränkung auf den Bereich zwischen Minimum und Maximum verbessert die Differenzierung der Darstellung (und, ganz wichtig, anders als bei Säulen verletzt ein „Abschneiden“ der Achsen nicht die gebotene Proportionalität).

Skalierung 0 bis Maximum, Minimum bis Maximum, linear oder logarithmisch

Diese Konfiguration speichern wir als Analysevorlage (Menü Einstellungen im Fenster Analyse). Bei der Zeitreihenanalyse kann nur ein Analysewert in der Analysevorlage berücksichtigt werden.

Als Analysevorlage speichern im Menü Einstellungen

Nun steht die Analysevorlage als zu wiederholender Baustein für Small Multiples zur Verfügung. Als Iterationstyp wählen wir Elemente und mit dem entsprechenden Link die beiden Satzartschalter „1928-1930“ und „2012-2014“ aus.

Zeitreihenanalyse

Nach einem ersten Berechnen dieser Small-Multiples-Analyse lässt sich im Menü Einstellungen die Skalierung justieren. Hier finden wir die vergleichbare Skalierung – eine patentierte Darstellung, die das Problem löst.

Vergleichbar skalieren im Menü Einstellungen

Die folgende Abbildung zeigt die Dow-Jones-Verläufe in einem Small-Multiples-Bericht mit vergleichbarer Skalierung. Diese sorgt dafür, dass die Steilheit der Verläufe ihre Dynamik richtig wiedergibt. Gleich steile Verläufe bedeuten gleich starke relative Veränderungen. Dazu müssen die Y-Achsen-Ausschnitte passend gewählt werden – und das macht DeltaMaster automatisch.

Small-Multiples-Bericht mit vergleichbarer Skalierung

Besonders deutlich wird das Prinzip, wenn man die „WSJ-Variante“ wählt. In dieser Darstellung fügt DeltaMaster Hilfslinien ein, die die prozentualen Veränderungen markieren: Eine Änderung von 200 auf 300 entspricht einer Zunahme um 50 Prozent, von 300 auf 400: 33 Prozent, von 400 auf 500: 25 Prozent usw. Die Hilfslinien verlaufen in allen Kacheln gleich und betonen dadurch die Vergleichbarkeit. Eine ähnliche Darstellung mit Hilfslinien findet sich regelmäßig im Wall Street Journal (WSJ), daher der Name der Variante.

WSJ-Variante

Wert-los, aber nicht wertlos

Eine Alternative, mit extremen Größenunterschieden umzugehen, ist die Normierung auf einen gemeinsamen Startzeitpunkt. Dazu wählt man im Diagramm den gewünschten Zeitpunkt aus und lässt DeltaMaster über den entsprechenden Eintrag im Kontextmenü die Darstellung danach normieren.

Normierung nach 02.04.1928

Auch das nimmt dem „Chart of Doom“ schnell den Schrecken, sehen die Entwicklungen doch deutlich anders aus. Der Nachteil beim Normieren ist: Die absoluten Werte sind nicht mehr sichtbar – anstelle der Dow-Jones-Notierungen enthält das Diagramm nur noch Indexwerte. Daher raten wir im Allgemeinen zu anderen Formaten, wie zur vergleichbaren Skalierung mit Small Multiples.

Chart of Doom mit Normierung auf einen gemeinsamen Startzeitpunkt