Statistisches Denken vs. statistische Rituale II

Was macht statistisches Denken aus? Es ist von der Anwendung des gesunden Menschenverstands nicht weit entfernt, wie man an der Fortsetzung des Supermarktbeispiels sieht.

Wenn Bella über Datenvisualisierung hirnt, dann kommt es ihr auf jedes Pixel an. Dabei praktiziert sie die Kunst des Weglassens. Erst wenn weiteres Weglassen Datenwerte zerstören würde, ist eine Grenze erreicht, die nicht überschritten werden darf. Ähnliche Fragen stellen sich für die Statistisierung unserer Darstellungen. Am Beispiel vom Supermarkt und der Margarine haben wir gesehen: Rohdatenwerte weglassen behindert den Erkenntnisprozess ungemein. Der Grenznutzen zusätzlicher statistischer Maße hingegen ist eher gering, das Signifikanztesten sogar meist kontraproduktiv.

Greifen wir das Beispiel nochmals auf. Welche Überlegungen können wir anstellen?

Alle Werte und Mittelwert

Ich habe lediglich Umsätze von 5 Tagen in drei Supermärkten. Auf den Verkauf wirken eine ganze Menge anderer Einflussfaktoren ein, die ich nicht kontrollieren kann und die mir vielleicht auch nicht bewusst sind. Egal, was ich aus den Daten ableite, es wird von großer Unsicherheit geprägt sein.
Die Größenordnung der Tagesumsätze je Supermarkt kann ich mit Hilfe des Mittelwerts charakterisieren. (Alternativ gäbe es vor allem den Median, er wird weniger stark von Ausreißern beeinflusst.)
Die Mittelwerte unterscheiden sich. Aha.
Würden sie sich dramatisch unterscheiden, wäre ich ein bisschen misstrauisch. Warum sollte eines der Instrumente plötzlich schlagartig wirksam sein. Der Stein der Weisen wird eher selten gefunden.
Die größte Streuung weisen die Werte für den Probierstand auf. Nochmal Aha. Am Probierstand stehen Menschen, sie sind wahrscheinlich unterschiedlich gut in der Lage diesen Job zu machen. Ich werde als nächstes mit den Filialleitern sprechen, um herauszufinden, wer an welchem Stand war.
Die größere Streuung der Werte um den Mittelwert für den Probierstand signalisiert mir, dass sich die zu erwartenden Resultate unzuverlässiger einstellen werden.
Die Ergebnisse sind sehr interessant. Sie rechtfertigen es, meine Versuche fortzusetzen. Ich werde überlegen, wie ich den persönlichen Einfluss auf die Wirksamkeit des Probierstands reduzieren kann. Zum Beispiel könnte ich die Versuche mit Standpersonal fortsetzen, das weder besonders gute noch schlechte Ergebnisse bringt.

In diesen Überlegungen spiegelt sich sehr deutlich, was statistisches Denken ausmacht. Maße der deskriptiven Statistik (Mittelwert, Median) dienen dazu, Datenphänomene kompakt zu beschreiben. Die Schwankungsbreite der Werte wird als Unsicherheit verstanden – ganz unabhängig davon, ob man sie dazu in Streuungsmaße überführt. Besonderes Augenmerk wird den extremen Werten („Ausreißer“) gewidmet. Im Vordergrund stehen fundamentale Probleme des Messens und Vergleichens. Auf inferenzstatistische Methoden hingegen kann hier ohne Erkenntniseinbuße verzichtet werden. Denn: die entscheidenden Schlüsse müssen wir schon selbst ziehen.

Veranstaltungs-Tipp

Statistisches Denken vs. statistische Rituale II

Über den Autor

Veranstaltungs-Tipp

Letzte Blogartikel