CiAgICA8IS0tIExpbmtlZEluIC0tPgogICAgPHNjcmlwdCB0eXBlPSJ0ZXh0L2phdmFzY3JpcHQiPgogICAgICAgIF9saW5rZWRpbl9wYXJ0bmVyX2lkID0gIjEyMzUwNzMiOwogICAgICAgIHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyA9IHdpbmRvdy5fbGlua2VkaW5fZGF0YV9wYXJ0bmVyX2lkcyB8fCBbXTsKICAgICAgICB3aW5kb3cuX2xpbmtlZGluX2RhdGFfcGFydG5lcl9pZHMucHVzaChfbGlua2VkaW5fcGFydG5lcl9pZCk7CiAgICA8L3NjcmlwdD48c2NyaXB0IHR5cGU9InRleHQvamF2YXNjcmlwdCI+CiAgICAgICAgKGZ1bmN0aW9uKCl7dmFyIHMgPSBkb2N1bWVudC5nZXRFbGVtZW50c0J5VGFnTmFtZSgic2NyaXB0IilbMF07CiAgICAgICAgICAgIHZhciBiID0gZG9jdW1lbnQuY3JlYXRlRWxlbWVudCgic2NyaXB0Iik7CiAgICAgICAgICAgIGIudHlwZSA9ICJ0ZXh0L2phdmFzY3JpcHQiO2IuYXN5bmMgPSB0cnVlOwogICAgICAgICAgICBiLnNyYyA9ICJodHRwczovL3NuYXAubGljZG4uY29tL2xpLmxtcy1hbmFseXRpY3MvaW5zaWdodC5taW4uanMiOwogICAgICAgICAgICBzLnBhcmVudE5vZGUuaW5zZXJ0QmVmb3JlKGIsIHMpO30pKCk7CiAgICA8L3NjcmlwdD4KICAgIDxub3NjcmlwdD4KICAgICAgICA8aW1nIGhlaWdodD0iMSIgd2lkdGg9IjEiIHN0eWxlPSJkaXNwbGF5Om5vbmU7IiBhbHQ9IiIgc3JjPSJodHRwczovL3B4LmFkcy5saW5rZWRpbi5jb20vY29sbGVjdC8/cGlkPTEyMzUwNzMmZm10PWdpZiIgLz4KICAgIDwvbm9zY3JpcHQ+CiAgICA8IS0tIEVuZCBMaW5rZWRJbiAtLT4KICAgIA==
Generic filters
Exact matches only
Search in title
Search in excerpt
Search in content

Selfservice: Heiß serviert


Manchmal möchte man gegebene Daten aus dem Stand schnell aufbereiten und ansprechend visualisieren. Mit DeltaMaster ist dies kein Hexenwerk!

Das Statistische Bundesamt vermeldete in der Pressemitteilung Nr. 460 vom 27.11.2018, dass die Studierendenzahlen einen neuen Höchststand erreicht hätten.

Schön ist, dass die Daten der einzelnen Bundesländer unter dem genannten Link in einer Tabelle dargestellt werden. Weniger schön ist die gleichförmige Art der Visualisierung, die keinerlei Strukturierung aufweist und deshalb eine Blickverlaufslenkung zu den interessanten Zahlenwerten vermissen lässt.

Wie wir nun demonstrieren werden, ist mit DeltaMaster eine eingängige und überzeugende Visualisierung auch bei Ad-hoc-Analysen möglich.

Um die Daten in DeltaMaster zu bekommen, nutzen wir den Selfservice mit Microsoft Excel SQL Selfservice als Datenquelle. Dazu müssen die Daten zunächst in ein Excel-File gelangen:

Daten per Copy-and-paste in Excel angekommen

Daten per Copy-and-paste in Excel angekommen

Per simplem Copy-and-paste markieren wir die Tabelle auf der Webseite und legen sie in einem leeren Excel-Blatt ab. Schauen wir uns die Tabelle etwas genauer an:

Importierte Tabelle in Excel

Importierte Tabelle in Excel

Was fällt hier alles auf?

  • In einer einfach zugänglichen Datenquelle hätten wir vier Spaltenköpfe “Land”, “Geschlecht”, “Jahr” und “Anzahl Studierende” und jede vorkommende Kombination bekäme einen Zeileneintrag. Hier haben wir es mit einer kreuztabellarischen Darstellung zu tun.
  • Erschwerend kommt hinzu: Die Spaltenköpfe sind sogar nach Semester und Geschlecht geschachtelt!
  • Die Zeit verläuft von rechts nach links.
  • Detaillierte Zahlen sind nur für die weiblichen Studierenden genannt. Was ist mit den männlichen Studierenden passiert?
  • Manche Zahlen sind aus den anderen ableitbar wie z. B. die Summenzeile für Deutschland oder die prozentuale Abweichung zum Vorjahr.

Entfernen wir somit die ableitbaren Spalten und Zeilen, die Kommentarzeile und den Link aus der Spaltenüberschrift (bzw. die störende 1, die aus einer Fußnote resultiert), sodass wir die folgende Excel-Tabelle als Ausgangspunkt in DeltaMaster verwenden können:

Excel-Tabelle startklar für DeltaMaster

Excel-Tabelle startklar für DeltaMaster

Über den Datenquellendialog wählen wir unter Microsoft Excel/SQL Selfservice die Excel-Tabelle aus:

Anklinken an die Excel-Quelle

Anklinken an die Excel-Quelle

Wir arbeiten rein relational, es wird kein Cube erstellt werden. Die Excel-Datei darf hier sogar geöffnet bleiben!

Nun geht es weiter zum Präparieren:

Einstellen des relevanten Datenbereichs

Einstellen des relevanten Datenbereichs

DeltaMaster versucht automatisch, den relevanten Datenbereich zu ermitteln. Es lassen sich aber auch manuell Grenzen korrigieren. Dazu klickt man zuerst auf eine Zelle und dann auf einen der drei farbigen Punkte, die im Rahmen verankert sind:

  • Hiermit wird die erste interessante Zelle links oben markiert. Mögliche Kommentare oberhalb oder links dieser Zelle werden ignoriert!
  • Markiert das erste Element aus der Zeilendimension.
  • Markiert den Beginn der Spaltendefinitionen (nur anzuwenden bei Kreuztabellenstruktur).

Falls es Kommentare unterhalb der Daten geben sollte, führt ein Einfügen einer Leerzeile dazu, dass auch diese ignoriert werden.

Nun gelangen wir zum Modellierungsdialog und deklarieren Dimensionen und Analysewerte. Anfangs sieht das aus wie im oberen Teil der folgenden Abbildung:

Deklaration von Dimensionen und Analysewerten

DeltaMaster legt automatisch Sortierungsspalten für die Dimensionen auf der Spaltenachse (Jahr und Geschlecht) an, falls erwünscht ist, dass die Elemente einer Dimension in DeltaMaster in der gleichen Reihenfolge wie in der Ausgangstabelle erscheinen.

Bei Geschlecht macht es hier aber keinen Unterschied und beim Jahr wollen wir, dass 2017 vor 2018 erscheint. Wir können also auf den Einsatz der angebotenen Sortierspalten verzichten.

Dass wir den Namen von “Spalte” auf “Jahr” ändern, hat den zu begrüßenden Nebeneffekt, dass diese Dimension dann automatisch – wie unter dem Logik-Reiter ersichtlich – als Zeitdimension vorkonfiguriert ist und wir somit von einer Vorjahresperiode sprechen können.

Die Wertespalte ist leer, das sollte nicht sein! Eine Inspektion der Excel-Datei ergibt hier ein die Tausender abtrennendes Sonderzeichen, das nicht korrekt erkannt und verarbeitet wird. Wir markieren eines dieser Zeichen und löschen alle auftretenden Fälle mit Suchen und Ersetzen durch ein leeres Feld und speichern ab. Mit F9 erscheinen dann in DeltaMaster auch die Zahlenwerte.

Die bisherigen und die weiteren Schritte schauen wir uns am besten in dem gleich anschließenden Video an. Außer einigen kosmetischen Namensänderungen und Formatierungen wird noch ein berechnetes Element “männlich” angelegt, damit wir auch die Entwicklung dieser Gruppe beurteilen können.

YouTube

Mit dem Laden des Videos akzeptieren Sie die Datenschutzerklärung von YouTube.
Mehr erfahren

Video laden

PGlmcmFtZSBzcmM9Imh0dHBzOi8vd3d3LnlvdXR1YmUtbm9jb29raWUuY29tL2VtYmVkL0twbkEyWkZWc2hvIiB3aWR0aD0iNzgwIiBoZWlnaHQ9IjQzOSIgZnJhbWVib3JkZXI9IjAiIGFsbG93ZnVsbHNjcmVlbj0iYWxsb3dmdWxsc2NyZWVuIj48L2lmcmFtZT48L3A+

In weniger als vier Minuten von einer potenziell interessanten Tabelle im Web zu einer aussagekräftigen Darstellung

Letztendlich können wir über die Magic Buttons einen vergleichenden Bericht für die gesamte Studierendenschaft, zusätzlich auch getrennt nach Geschlechtern, generieren, wobei sich Small Multiples über Elemente als ausgesprochen nützlich erweisen, da dann noch später zwischen einer individuellen Skalierung pro Spalte und einer globalen Skalierung gewählt werden könnte.

Alternativ hätte auch eine kompaktere einfache Grafische Tabelle erstellt werden können, mit einer fix eingestellten globalen Skalierung.

Mit Betonung der prozentualen Änderungen durch Bissantz’Numbers ergibt sich nach weniger als vier Minuten ab Beginn der Datenanbindung eine Grafische Tabelle, die im Gegensatz zur Ausgangstabelle auch Angaben über die Männer enthält und deren Essenz durch die Verwendung von Bissantz’Numbers viel deutlicher zum Ausdruck gebracht wird (klicken Sie bitte auf die Grafik für eine vergrößerte Darstellung!):

Blickverlaufslenkung durch Bissantz’Numbers

Hier reicht im Gegensatz zur Originaltabelle eine Zehntelsekunde, um zu erkennen, dass in der Gesamtbetrachtung der größte prozentuale Zuwachs mit + 3.4 % in Schleswig-Holstein stattgefunden hat – und hierzu tragen beide Geschlechter gleichermaßen bei.

Die Originaltabelle gibt auch nicht her, dass im Saarland nur für weibliche Studierende ein markanter Zuwachs mit + 4.3 % erfolgt ist, während die Männer mit – 2.4 % einen deutlichen Rückgang erleiden mussten.

Schließlich wäre noch erwähnenswert, dass in Mecklenburg-Vorpommern die männlichen Anzahlen mit – 2.6 % ebenfalls stark abgenommen haben.

Als allgemeiner Trend lässt sich ablesen, dass die prozentualen Entwicklungen bei den Männern fast immer unterhalb derjenigen der Frauen liegen.