Was haben Schweißroboter und medizinische Studien gemeinsam? - Modellierung von Ereignisfolgen

Seit der Einführung der Sparklines wissen wir, dass für die Interpretation von Daten auch die historische Entwicklung zu betrachten ist. Dies ist möglich, da Datenerhebungen immer mit einem Zeitstempel oder einem Zeitbezug verbunden sind und dieser auch in den Datenbanken festgehalten wird. Beides zusammen führt dazu, dass wir Daten zunächst einmal der Zeitdimension zuordnen. Möglicherweise übersieht man dabei jedoch, dass in den Daten nicht eine zeitliche Folge von Datenpunkten, wie z. B. Tagesumsätze oder tägliche Lagerbestände abgebildet ist, sondern eine sich wiederholende Folge von Ereignissen, die zu beliebigen Zeitpunkten beginnen kann.

Beispiel 1:

In einer medizinischen Studie werden 100 Patienten jeweils sieben Mal behandelt. Vor Beginn jeder Behandlung wird ein Messwert aufgezeichnet. Untersucht werden soll nun die Veränderung des Messwertes in Abhängigkeit von den Behandlungen. Weiterhin sind Zusammenhänge mit Patientenmerkmalen und Behandlungsmerkmalen aufzudecken.

Die Daten enthalten neben Patientenmerkmalen, Behandlungsmerkmalen und Messwert auch den Zeitstempel der Behandlung. Die Behandlung der Patienten erfolgt typischerweise nicht gleichzeitig, es können sogar Patienten bereits die Studie abgeschlossen haben während andere noch am Anfang stehen. Schnell wird klar, dass die zeitliche Betrachtung der durchschnittlichen Veränderung der Messwerte über alle Patienten keine sinnvollen Erkenntnisse liefern kann.

Beispiel 2:

An Schweißrobotern werden nach jedem Schweißvorgang verschiedene Messwerte genommen, anhand deren die Abnutzung des Schweißkopfes ermittelt wird. Bei entsprechender Abnutzung müssen die Schweißköpfe nachgeschliffen oder sogar ersetzt werden. Durch optimale Einstellungen des Schweißroboters kann die Abnutzung minimiert oder zumindest etwas ausgeglichen werden. Überlegt man jetzt, was die Abbildung all dieser Messwerte, wenn auch geschickt aggregiert, auf einer Zeitdimension an Analysen ermöglicht, muss man zu der Erkenntnis kommen, dass hier andere Modellierungsansätze zu suchen sind.

Beiden Fällen gemeinsam ist, dass wir es hier mit Folgen von Ereignissen zu tun haben, deren Startzeitpunkt für die Analyse nur eine nebengeordnete Rolle spielt.

Für die Vergleichbarkeit der Folgen ist also eine Normierung auf einen gemeinsamen Startpunkt notwendig.

Bei der mehrdimensionalen Modellierung ist dies durch eine Dimension “Ereignisfolge” leicht möglich, wenn zunächst einmal Beginn und Ende der Folge definiert sind.

Für das Beispiel 1, besteht die Folge ganz klar aus den sieben aufeinanderfolgenden Messungen je Patient. Die Dimension Behandlungen enthält also die Elemente 1, 2, 3, 4, 5, 6 und 7.

Im Beispiel 2 haben wir es genaugenommen sogar mit drei unterschiedlichen Folgen zu tun. Zum einem mit den Schweißpunkten nach Austausch des Schweißkopfes, zum anderen mit den Schweißpunkten nach dem Nachschleifen des Schweißkopfes. Das Nachschleifen des Schweißkopfes selbst ist auch wieder eine Ereignisfolge die orthogonal zur zweiten Folge steht. Dies im Modell zu berücksichtigen wird dem Leser aber zur selbstständigen Vertiefung aufgegeben.

Modelliert wird hier also eine Dimension Schweißpunkte nach Austausch, die analog zum Beispiel 1 die Elemente 1 bis X enthält, wobei X der maximalen mit einem Schweißkopf durchführbaren Schweißvorgänge entspricht. Ist X sehr groß wie in der dem Beispiel zugrundeliegenden Anwendung mit X gleich 500, so ist es sinnvoll dieser Dimension eine oder mehrere Verdichtungsebenen mitzugeben. Bei der Analyse ist jedoch zu beachten, dass durch die vorgegebenen Intervalle möglicherweise interessante Entwicklungen verdeckt werden. Die Verdichtungsintervalle sind also hinreichend klein zu wählen und es sind immer auch Kontrollanalysen auf der Ereignisebene durchzuführen.

Analog dazu erfolgt die Dimension Schweißpunkte nach Nachschliff, die natürlich deutlich weniger Elemente enthält. Das Ergebnis der selbstständigen Vertiefung ergibt eine dritte Dimension Nachschleifpunkt nach Austausch mit den Elementen 0, 1 etc.

Jeder Schweißvorgang wird also auf den drei Dimensionen eingeordnet.

Folgende Aspekte sind bei der Modellierung und Analyse noch zu beachten:

Auf die echte Zeitdimension wollen wir in diesen Modellen nicht verzichten. Es bietet sich an, die Daten einer Folge immer anhand des Startzeitpunktes auf der Zeitachse anzuordnen. Damit lassen sich die durch die Folge analysierbaren Prozessveränderungen zeitlich beobachten. So kann beispielsweise die Betrachtung des 100ten Messpunktes über die Zeit Aufschluss über kontinuierliche oder auch plötzlich auftretende Veränderung des Abnutzungsprozesses geben.

In den beiden genannten Beispielen spielt die Zeitspanne zwischen den Ereignissen keine Rolle, weil sie entweder jeweils gleich ist (Beispiel 1), oder aber für den abgebildeten Prozess keine Rolle spielt (Beispiel 2). Sind jedoch unterschiedliche Zeitspannen zu berücksichtigen, kann dies in der Ereignisfolgedimension durch Elemente, die die Zeitspannen abbilden, erfolgen. Ggf. kann die Zeitspanne auch auf einer zusätzlichen Dimension abgetragen werden.

Falls es technisch möglich ist, sollte eine Falldimension in das Modell aufgenommen werden. Dies ermöglicht weitere Analysen, insbesondere dann, wenn mehrere Ereignisfolgen auf der Zeitdimension demselben Element zugeordnet sind.

Freitag, 10. September 2010

Veranstaltungs-Tipp

Meet the Experts 9. Juli 2025 Webinar: Selfservice mit DeltaMaster und Microsoft Excel

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar [...]

Anmeldung

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar.

Meet the Experts 15. Juli 2025 Webinar: DeltaMaster ETL

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Anmeldung

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Meet the Experts 23. Juli 2025 Webinar: Berichtserstellung mit DeltaMaster

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Anmeldung

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Über den Autor

Consulting

Die Bissantz-Consultants teilen ihr Wissen rund um Data-Warehouse-Projekte und Business-Intelligence-Lösungen – jede Woche ein neuer Beitrag. Auf die Würfel, fertig, los!

Letzte Blogartikel

Forschung Weinmost - Erntemengen und Erträge pro Hektar

Weinmost bildet die Grundlage für die in Deutschland kulturrelevanten Rot- und Weißweine. Wir nutzen DeltaMaster 6, um Auffälligkeiten bei [...]

mehr erfahren

Forschung Bundesliga-Tabelle 2024/25

Die Bundesliga-Tabelle nach Abschluss der Saison 2024/25 zeigt das altvertraute Bild: Der FC Bayern München liegt vorn! Was steckt wirklich [...]

mehr erfahren

Forschung Bevölkerungsbestand in Nürnberg

Den Bevölkerungsbestand einer Stadt können wir aus verschiedenen Blickwinkeln analysieren. Häufig variieren in den Stadtteilen Altersverteilung [...]

mehr erfahren

Forschung Kaltmieten in Deutschland

Kaltmieten bzw. Mieten im Allgemeinen sind in den letzten Jahren stetig gestiegen und stellen für viele Mieter den größten Posten der monatlichen [...]

mehr erfahren

Data Warehousing Unternehmensplanung und -konsolidierung auf Basis der Bissantz ERP Solutions

Dieser Beitrag erläutert, wie sich Prozesse der integrierten Unternehmensplanung und der Unternehmenskonsolidierung strukturiert gestalten [...]

mehr erfahren

Forschung Achsenelemente als Filter an Zielbericht zuweisen

Achsenelemente können mit dem neuesten Release von DeltaMaster in ihrer Gesamtheit als Filter an einen Zielbericht zugewiesen werden. Wir erklären [...]

mehr erfahren

Forschung Leistungsausgaben der gesetzlichen Krankenversicherung

Die Leistungsausgaben der gesetzlichen Krankenkassen steigen von Jahr zu Jahr. Als Folge haben im Januar 2025 etliche Krankenkassen erneut die [...]

mehr erfahren

Data Warehousing Partitionierung von Bewegungsdaten

Die Aktualisierung von Bewegungsdaten nimmt während der täglichen Aufbereitung einer SQL-Datenbank in der Regel den Großteil der benötigten [...]

mehr erfahren

Forschung Analyse von Verteilungen

Die Beschreibung von Verteilungen geht oft über die Angabe von Mittelwert und Standardabweichung hinaus. Wir erläutern, was sich bei den hierfür [...]

mehr erfahren

Data Warehousing Arbeitstagkalender

Zur Berechnung von Kennzahlen, die von der genauen Anzahl der Arbeitstage abhängen, ist es notwendig, diese im Modell korrekt abzubilden. Die [...]

mehr erfahren

Vorheriger Artikel

Maskerade im SQL-Server-Agent

Nächster Artikel

Dynamic Management Views für SSAS

Was haben Schweißroboter und medizinische Studien gemeinsam? - Modellierung von Ereignisfolgen

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Data Warehousing.

Nicolas Bissantz

Diagramme im Management