CiAgICA8IS0tIExpbmtlZEluIC0tPgogICAgPHNjcmlwdCB0eXBlPSJ0ZXh0L2phdmFzY3JpcHQiPgogICAgICAgIF9saW5rZWRpbl9wYXJ0bmVyX2lkID0gIjEyMzUwNzMiOwogICAgICAgIHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyA9IHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyB8fCBbXTsKICAgICAgICB3aW5kb3cuX2xpbmtlZGluX2RhdGFfcGFydG5lcl9pZHMucHVzaChfbGlua2VkaW5fcGFydG5lcl9pZCk7CiAgICA8L3NjcmlwdD48c2NyaXB0IHR5cGU9InRleHQvamF2YXNjcmlwdCI+CiAgICAgICAgKGZ1bmN0aW9uKCl7dmFyIHMgPSBkb2N1bWVudC5nZXRFbGVtZW50c0J5VGFnTmFtZSgic2NyaXB0IilbMF07CiAgICAgICAgICAgIHZhciBiID0gZG9jdW1lbnQuY3JlYXRlRWxlbWVudCgic2NyaXB0Iik7CiAgICAgICAgICAgIGIudHlwZSA9ICJ0ZXh0L2phdmFzY3JpcHQiO2IuYXN5bmMgPSB0cnVlOwogICAgICAgICAgICBiLnNyYyA9ICJodHRwczovL3NuYXAubGljZG4uY29tL2xpLmxtcy1hbmFseXRpY3MvaW5zaWdodC5taW4uanMiOwogICAgICAgICAgICBzLnBhcmVudE5vZGUuaW5zZXJ0QmVmb3JlKGIsIHMpO30pKCk7CiAgICA8L3NjcmlwdD4KICAgIDxub3NjcmlwdD4KICAgICAgICA8aW1nIGhlaWdodD0iMSIgd2lkdGg9IjEiIHN0eWxlPSJkaXNwbGF5Om5vbmU7IiBhbHQ9IiIgc3JjPSJodHRwczovL3B4LmFkcy5saW5rZWRpbi5jb20vY29sbGVjdC8/cGlkPTEyMzUwNzMmZm10PWdpZiIgLz4KICAgIDwvbm9zY3JpcHQ+CiAgICA8IS0tIEVuZCBMaW5rZWRJbiAtLT4KICAgIA==
Generic filters
Exact matches only
Search in title
Search in excerpt
Search in content

Zeitliche Vergleiche mit gleitenden Durchschnitten

PDF Download

Liebe Datenanalysten,

eine wichtige Grundlage für Managemententscheidungen sind die längerfristigen Entwicklungen und Trends, die das Tagesgeschäft prägen und die, umgekehrt, vom Tagesgeschäft ausgeprägt werden. Sie zu erkennen, ist keine einfache Aufgabe, besonders dann nicht, wenn sich das Geschäft unstet und flatterhaft von Tag zu Tag oder durch den Tag bewegt. Daten, die im Minuten- oder Stundenrhythmus erfasst werden, ergeben häufig unruhige Muster, deren Grundlinie nur schwer auszumachen ist. Eine Möglichkeit, damit umzugehen, sind Trendgeraden. Sie machen sich recht rigide ans Werk: Das Auf und Ab des betrachteten Zeitraums dampfen sie auf eine schnurgerade Linie ein. Wer behutsamer glätten möchte, findet vielleicht in rollierenden Durchschnitten eine Lösung – und bestimmt in diesen DeltaMaster clicks! einige nützliche Hinweise dazu.

Herzliche Grüße
Ihr Team von Bissantz & Company

 

Interessant wird ein Wert erst durch den Vergleich mit einem oder mehreren anderen Werten. Besonders aufschlussreich und fast immer möglich ist der zeitliche Vergleich: Wie steht es um Umsatz, Absatz, Auftragseingang, Auslastung usw. heute, wie stand es darum früher? In diesen DeltaMaster clicks! möchten wir Ihnen eine spezielle Variante des zeitlichen Vergleichs vorstellen: den gleitenden Durchschnitt. Damit lassen sich „unruhige“ Zeitreihen mit großen, stochastischen Schwankungen glätten, ohne dass Ausreißer den Blick auf die Gesamtentwicklung beeinträchtigen. Weiter unten diskutieren wir, in welchen Fällen sich diese Betrachtungsweise anbietet und wann man besser davon absieht. Beginnen wollen wir damit, wie man in DeltaMaster gleitende Durchschnitte definiert und mit ihnen arbeitet.

Start und Ende variabel, Länge konstant

Unter einem gleitenden (rollierenden) Durchschnitt verstehen wir einen Durchschnitt, der sich aus den Werten eines Zeitraums mit konstanter Länge und variablem Start- bzw. Endzeitpunkt errechnet. Einbezogen werden also nicht beispielsweise die Werte von Januar bis Dezember eines bestimmten Jahres, sondern die der letzten 12 Monate vom jeweils aktuellen Monat aus gesehen. Der „aktuelle“ Monat könnte zum Beispiel derjenige sein, der im Fenster Sicht ausgewählt ist.

Gleitende Durchschnitte definieren

Ein gleitender Durchschnitt lässt sich in DeltaMaster am einfachsten als Zeitanalyseelement definieren (siehe DeltaMaster clicks! 08/2007), typischerweise in einer Hilfsdimension, die speziell für Zeitvergleiche vorgesehen ist („Periodenansicht“, „Zeitarten“, „Time Utility“ oder Ähnliches). Um ein Zeitanalyseelement hinzuzufügen, wählen Sie im Dimensionsbrowser dieser Dimension den entsprechenden Befehl aus dem Kontextmenü oder dem Menü Ich möchte.

Zeitanalyseelement hinzufügen im Dimensionsbrowser

Im Editor für Zeitanalyseelemente (siehe Abbildung auf der nächsten Seite) wählen Sie anschließend den Berechnungstyp Abfrage (Mitte links) sowie die gleitenden Aggregationen (unten rechts). Außer dem Mittelwert kann auch die Summe als Aggregationsfunktion ausgewählt werden, ebenso das Minimum, das Maximum, die Standardabweichung, die Varianz sowie diejenige Aggregation, die in der OLAP-Datenbank für den Analysewert vorgesehen ist, auf den das Zeitanalyseelement angewendet wird. Wir beschränken uns im Folgenden auf den Mittelwert.

Als weiteren Parameter stellen Sie ein, auf welcher Ebene der Zeithierarchie die Größen erfasst werden sollen. Falls Sie gleitende Mittelwerte auf mehreren Ebenen berechnen möchten, etwa für Stunden und für Tage, erzeugen Sie für jede gewünschte Ebene ein eigenes Zeitanalyseelement.

Außerdem legen Sie fest, wie viele Zeitpunkte in den Durchschnitt einfließen sollen, also die Länge des gewünschten Zeitraums, beispielsweise 3 Monate. Der aktuelle Monat (bzw. das Referenzelement, siehe unten) wird dabei mitgezählt. Drei Monate bedeutet demnach: der aktuelle Monat, der vorherige Monat und der vorvorherige Monat. Je länger der Zeitraum, desto stärker ist im Allgemeinen die „Dämpfung“ und desto weniger fallen Ausreißer ins Gewicht.

Selektion der Abfrage als Berechnungstyp und Selektion der Gleitenden Aggregationen im Editor für Zeitanalyseelemente

Als Referenzelement (unten links) wählen Sie das Element für die aktuelle Periode („aktuell“, „current“, „laufend“, „Ist“ oder Ähnliches).

Die Definition des neuen Zeitanalyseelements schließen Sie ab, indem Sie sich einen Namen vorschlagen lassen (Link rechts oben im Dialog, neben dem Eingabefeld für den Namen). In den Namensvorschlag fügt DeltaMaster automatisch Platzhalter für den ersten und den letzten betrachteten Monat ein – im Beispiel „{pp2}“ für den vorvorherigen Monat („Previous Period“ mit Abstand 2) und „{cp}“ für den aktuellen Monat („Current Period“). Diese Platzhalter werden in Cockpits und Berichten automatisch durch den jeweils gültigen Zeitpunkt ersetzt. Das macht Cockpits und Berichte besser verständlich und erspart das spätere Aktualisieren der Beschriftung. Natürlich können Sie den Vorschlag ändern oder überschreiben und stattdessen einen eigenen Namen eingeben, wie bei allen Zeitanalyse- und anderen berechneten Elementen. Wenn Sie das Symbol für den Durchschnitt als Sonderzeichen einfügen möchten, wählen Sie den entsprechenden Befehl aus dem Kontextmenü des Eingabefeldes für den Namen.

Die optionale Beschreibung dient nicht nur der Dokumentation, sondern sie kann wie ein Alias anstelle des eigentlichen Namens in Auswahllisten angezeigt werden, damit dieses Element in solchen Listen einfacher zu finden ist. Dazu wählen Sie im Dimensionsbrowser in den Hierarchieeigenschaften (Menü Ich möchte) aus, dass DeltaMaster für berechnete Elemente die Beschreibung anstatt des Namens in Auswahllisten anzeigen soll.

In der Abbildung auf der nächsten Seite haben wir das neue Element in eine Umsatzstatistik über die letzten drei Monate eingesetzt. Darin hängen alle Ergebnisse und Beschriftungen allein von der aktuellen Periode ab.

Für Sie als DeltaMaster-Anwender ist mit dem reinen Ausweis des Mittelwerts aber noch lange nicht Schluss – im Gegenteil: Jetzt geht die Analyse erst richtig los! Im Modus Analyzer und Miner können Sie die Durchschnittswerte an weitere Analyseverfahren übergeben.

Zwei andere, besonders häufige Anwendungsfälle stellen wir im Folgenden vor: die Ermittlung der Abweichung des aktuellen Werts vom Durchschnitt und die Visualisierung des gleitenden Durchschnitts als Sparkline.

Umsatzstatistik der Kunden für die Monate November 2009, Dezember 2009 und Januar 2010 und Drei-Monats-Durchschnitt

Vom Durchschnitt abweichen

Um zu untersuchen, wie der aktuelle Wert vom laufenden Durchschnitt abweicht, definieren wir ein weiteres berechnetes Element in derselben Dimension („Periodenansicht“, „Zeitarten“, „Time Utility“ oder Ähnliches). Gefragt ist nun eine einfache Abweichung – die zwischen dem aktuellen Wert und dem Durchschnitt. Daher genügt es, über den Dimensionsbrowser ein berechnetes Element hinzuzufügen; den Editor für Zeitanalyseelemente benötigen wir nicht mehr.

Berechnetes Element hinzufügen

Im Editor für berechnete Elemente wählen Sie aus, welches Element von welchem anderen Element abzuziehen ist. Die Sonderzeichen im Feld für den Namen lassen sich wiederum bequem über das Kontextmenü dieses Eingabefeldes einfügen.

Editor für berechnete Elemente: Auswahl Aktuelle Periode zu Drei-Monats-Durchschnitt

Ergänzen wir die Abweichung in unserem Bericht, so wird schnell erkennbar, mit welchen Kunden im Moment weniger Umsatz erzielt wurde als „in letzter Zeit“. Diese Abweichung lässt sich natürlich wie gewohnt an weitere Analyseverfahren übergeben oder etwa mit der Pivot-Navigation (siehe DeltaMaster clicks! 10/2007) aufgliedern, um den Dingen auf den Grund zu gehen.

Umsatzstatistik der Kunden für die Monate November 2009, Dezember 2009 und Januar 2010, Drei-Monats-Durchschnitt und der Abweichung zum Durchschnitt

Überdurchschnittliche Sparklines

Zur Auseinandersetzung mit gleitenden Durchschnitten sind Sparklines wie geschaffen. Vielfach arbeitet man mit gleitenden Durchschnitten ja gerade deswegen, weil man kurzfristige, unsystematische Vorgänge im Tagesgeschehen ausfiltern möchte, um die größeren Trends und Bewegungen dahinter zu erkennen. Und um diese zu erkennen, zu vergleichen und zu bewerten, haben sich Sparklines bestens bewährt.

In der Abbildung haben wir den zuvor gezeigten Bericht reduziert auf die Spalten für den aktuellen Wert und den Drei-Monats-Durchschnitt. Die eingeblendeten Sparklines laufen über 12 Monate und sind etwas größer formatiert als in den Standardvorgaben (20 Pixel hoch, 3 Pixel breit; zu Größeneinstellungen siehe auch DeltaMaster clicks! 04/2011).

Bericht mit Sparklines

Um die Wirkung des rollierenden Durchschnitts noch deutlicher zu veranschaulichen, haben wir einzelne Sparklines herausgegriffen und vergrößert. Man sieht: Kleinere „Lücken“ in der Sparkline werden geschlossen, herausragende Säulen eingeebnet, Verläufe harmonisiert.

einzelne vergrößerte Sparklines

Wohlgemerkt: In der Sparkline der Durchschnittswerte steht jede kleine Säule für einen Durchschnittswert. Die letzten Säulen (jeweils ganz rechts) stehen für den Durchschnitt der Monate November 2009 bis Januar 2010, wie in der Spaltenüberschrift angegeben. Die vorletzten Säulen stehen für den Durchschnitt von Oktober bis Dezember 2009, die vorvorletzten für den Durchschnitt von September bis November 2009 usw.

Wenn Sie den von DeltaMaster vorgeschlagenen Namen übernommen bzw. die entsprechenden Platzhalter verwendet haben, können Sie den jeweiligen Zeitraum als „Tooltipp“ für jede einzelne Säule abrufen, zusammen mit dem jeweiligen Wert.

Tooltipp für jede einzelne Säule

Durchschnitt ohne aktuell

In vielen Anwendungen lautet die Anforderung, den Durchschnitt ohne die aktuelle Periode zu berechnen, damit der Vergleichswert (der Durchschnitt) nicht durch den aktuellen Wert beeinflusst wird. Dazu ist in der Definition des Zeitanalyseelements nur eine Änderung erforderlich:

Als Referenzelement wählen Sie nicht die aktuelle Periode, sondern die Vorperiode.

Die Vorperiode ist meistens ebenfalls ein Zeitanalyseelement und in der Analysesitzung bereits definiert, da diese Vergleichsart regelmäßig ein wichtiger Bestandteil von Berichten, Cockpits und Analysen ist. Sollte die Vorperiode noch nicht definiert sein, legen Sie sie zuvor als weiteres Zeitanalyseelement an.

Die Änderung des Referenzelements sollte sich auch im Namen des Zeitanalyseelements widerspiegeln, damit man immer erkennen kann, welchen Zeitraum das Element beschreibt. Im automatisch vorgeschlagenen Namen wird das Referenzelement derzeit nicht beachtet – der Name ist also von Hand anzupassen: Das „{cp}“ für die aktuelle Periode ändern Sie in „{pp1}“ für die Vorperiode. Auch der Startzeitpunkt verschiebt sich um 1; für eine Spanne von drei Monaten ändern Sie also das vorgeschlagene „{pp2}“ in „{pp3}“. Mit dieser Anpassung stimmen Beschriftungen und die tatsächlich verarbeiteten Werte wieder überein.

Editor für Zeitanalyseelemente mit Vorperiode als Referenzelement

Ruhe bewahren

Mit gleitenden Durchschnitten arbeitet man, um stark schwankende Messwerte mit einfachen Mitteln zu glätten. Trends sind so besser zu erkennen: Die oftmals unsystematischen und hektischen Schwankungen im Tagesgeschäft werden „beruhigt“, sodass der Blick wieder frei wird auf die größeren Entwicklungen, die sich womöglich dahinter abzeichnen. Im Allgemeinen sind gleitende Durchschnitte vor allem dann eine Option, wenn die Werte in kurzen Intervallen erfasst werden, zum Beispiel im Minuten-, Stunden- oder Tagesrhythmus. Das findet man häufig in operativen Unternehmensbereichen wie der Produktion, dem Service, der Lager- oder der Transportlogistik. So unterliegen etwa Fertigungsaufträge, Qualitätsdaten oder Kommissioniermengen kurzfristigen, stochastischen Schwankungen, die für Managemententscheidungen unerheblich, ja hinderlich sein mögen. Vielmehr wird es in vielen (aber sicher nicht in allen!) Fällen genügen, über ein Durchschnittsniveau zu räsonieren; schließlich rechtfertigt nicht jeder „Peak“ eine Anpassung des gesamten Fertigungs- oder Logistiksystems. Wegen ihrer beruhigenden Wirkung greift man auch in einigen Prognoseverfahren gerne auf gleitende Durchschnitte zurück. Dennoch: Vieles spricht dafür, zunächst und vor allem die tatsächlichen, „echten“ Werte zu zeigen und den Durchschnitt, die Abweichungen davon oder die zeitliche Entwicklung des Durchschnitts nur ergänzend mitzuliefern, zur Einordnung und als Interpretationshilfe.

In anderen Situationen hingegen sind Durchschnittsbetrachtungen schwierig. So führt die Glättung über mehrere Zeitpunkte dazu, dass positive wie negative Ausreißer eingeebnet werden und nicht mehr so deutlich zu erkennen sind (das ist ja der Sinn der Übung). Wer an den Ausreißern interessiert ist, wer die Extremwerte und Lücken analysieren möchte, der kommt mit dem Durchschnitt allein nicht weit. Dafür kann es hilfreich sein, die Abweichung zum Durchschnitt (siehe oben) zu betrachten und mit Sparklines zu visualisieren.

Von gleitenden Durchschnitten ist abzuraten, wenn es um längere Zeiträume geht, zum Beispiel um Quartale oder gar Jahre. Hier sollte man besser mit den originären, nicht „verschnittenen“ Werten arbeiten: Bei so langen Zeiträumen ist es gut möglich, dass größere Ausschläge eben doch einer gewissen Systematik folgen. Bei stärker verdichteten Werten sorgt schon die Verdichtung für etwas Nivellierung. Für kumulierte Werte eignet sich der rollierende Durchschnitt gar nicht, da die Daten ansonsten ein weiteres Mal „kumuliert“ würden.