Measure Groups oder Cubes?

Einer der Grundsätze der OLAP-Modellierung ist die Zusammenfassung von Informationen gleicher Merkmalstiefe in gemeinsamen Speicherobjekten. Diese werden getreu der Vorstellung der Multidimensionalität betriebswirtschaftlicher Daten als Würfel (Cubes) bezeichnet. In einschlägiger Literatur findet sich meist die Forderung, Measures gleicher Dimensionalität und Granularität innerhalb eines Cubes zu organisieren. In der Folge entstehen in BI-Systemen meist mehrere Cubes, welche später unter Umständen miteinander zu verknüpfen sind, wenn Informationen aus unterschiedlichen Cubes über gemeinsame Merkmale (Dimensionen) zueinander in Beziehung gesetzt werden sollen. Beispielsweise ist für eine Kennzahl “Umsatz pro Mitarbeiter” der Dividend aller Wahrscheinlichkeit nach mit mehr und/oder anderen Merkmalen behaftet als der Divisor. Für den korrekten Zusammenhang sorgt dabei üblicherweise das OLAP-Datenbanksystem eigenständig, indem die Berechnung nur über gemeinsame Achsen durchgeführt wird. Das Ergebnis, gleichsam die Ober-/Vereinigungsmenge der Basiswürfel, wird je nach Produkt als HyperCube, Supercube, virtueller Cube, Linked Cube, Derived Cube oder ähnlich bezeichnet.

Microsoft führte in diesem Kontext mit SQL Server Analysis Services 2005 einen neuen Begriff ein: die Measure Group. Handelt es sich dabei lediglich um eine Begriffsverschiebung, ist also Microsofts Measure Group schlichtweg der Cube der klassischen OLAP-Lehre, und ersetzt der Cube in Analysis Services 2005/2008, der alle Measure Groups in sich kapselt, den früheren virtuellen Cube? Gilt demnach die Regel, Analysewerte gleicher Dimensionalität/Granularität in Measure Groups zu organisieren, und alle Measure Groups zu einem einzigen Cube zusammenzufassen? In welchen Situationen ist es sinnvoll oder erforderlich, mehr als einen Cube zu modellieren?

Dieser Artikel untersucht Vor- und Nachteile beider Ansätze im aktuellen Paradigma.

Grundlegende Betrachtungen

Die Sinnhaftigkeit der separaten Speicherung strukturell unterschiedlicher Daten in OLAP-Modellen ist unstrittig. Auf der dem OLAP-System meist zugrundeliegenden relationalen Data Warehouse ist das sogenannte Eintabellenschema ein seltener Trivialfall; in produktiven Szenarien sind meist mehrere Star- oder Snowflake-Schemata vorzufinden, in denen Daten vor allem aus speichertechnischen Erwägungen, d.h. entsprechend ihrer Merkmalszahl und -tiefe, zusammengefasst werden. In Einzelfällen können logische Aspekte zu einer Trennung strukturell gleicher Daten (z.B. GuV und Bilanz) führen. Der umgekehrte Fall der Zusammenführung strukturungleicher Daten dagegen ist in der Regel ein Symptom suboptimaler Modellierung.

Auf dieser Basis ist zu beurteilen, welche der gegebenen Alternativen – die Speicherung von Measure Groups in einem gemeinsamen Cube oder in separaten Cubes – aus technischer wie pragmatischer und administrativer Sicht optimal ist. Hierzu müssen unterschiedliche Aspekte betrachtet werden:

Auf welche Objekte greift der Endanwender bzw. die Clientsoftware zu?

Grundsätzlich “sehen” Frontends wie DeltaMaster über die üblichen Schnittstellen (ODBO, ADOMD.NET) den Cube, nicht einzelne Measure Groups. Einen Sonderfall bilden die sogenannten Perspectives: Diese sind Untermengen von Cubes, die in den Microsoft-Modellierungswerkzeugen (Business Intelligence Development Studio) durch einfaches An-/Abwählen von Objekten innerhalb eines Cubes (Measures, Measure Groups, Dimensionen, Hierarchien, Ebenen, Attribute) erzeugt werden. In Analogie zu der Paarung “SQL-View versus physikalische Tabelle” sind Perspectives virtuelle Ausschnitte aus Cubes und werden BI-Clients ebenfalls wie Würfel präsentiert.

Sollen also Daten aus mehreren Cubes miteinander verknüpft werden, muss diese Verknüpfung im Frontend stattfinden. Das verlagert einen Teil der Komplexität vom Server zum Client, erhöht den Netzwerktraffic und ist daher aus konzeptioneller Sicht wie auch aus Performancesicht suboptimal. DeltaMaster erlaubt darum zwar die Verwendung mehrerer Cubes innerhalb einer einzigen Analysesitzung, beschränkt jedoch ganz bewusst die Arbeit innerhalb eines Cockpits bzw. einer Analyse auf einen Quellcube, so dass die Zusammenführung von Daten aus unterschiedlichen Cubes lediglich in Form von Kombicockpits oder aber innerhalb eines Berichtsordners möglich ist. Diese Limitation wird von den meisten Anwendern negativ beurteilt werden. Aus dieser Hinsicht spricht also alles für die Verwendung eines einzigen Cubes, der dem Frontend als Gesamtsicht übertragen wird.

Was passiert bei der Verknüpfung von Daten unterschiedlicher Dimensionalität und/oder Granularität?

Grundsätzlich existieren hierzu zwei unterschiedliche Strategien: Der traditionelle Ansatz übernimmt Daten per Formel (Rule) aus Quellwürfeln in einen Zielwürfel. In einem derartigen System würden also so viele Basiswürfel modelliert, wie Kennzahlen unterschiedlicher Dimensionalität/Granularität existieren, und ein oder mehrere Analysewürfel nehmen Informationen via Rechenregeln aus den Basiswürfeln auf.

Microsofts Philosophie besteht seit Analysis Services 2000 darin, neben (Basis-)Cubes unter dem Namen “virtuelle Cubes” ein zweites Konstrukt anzubieten, das eine Obermenge über alle ausgewählten Quellobjekte (Cubes und deren Measures und Dimensionen) bildet, wobei serverseitig automatisch dafür gesorgt wird, dass ungültige Kombinationen (z. B. der Aufriss einer Measure aus Basiscube A nach einer Dimension, die nur in Basiscube B enthalten ist) keine Fehler oder falschen Ergebnisse verursachen, sondern wahlweise entweder die Gesamtsumme oder keine Werte angezeigt werden (“IgnoreUnrelatedDimensions”-Eigenschaft).

Dieses Konzept wurde in Analysis Services 2005 verworfen. Der frühere Cube, der Begriff für den primären OLAP-Datenspeicher für alle gleichartigen Objekte, heisst seitdem MeasureGroup, und ein Cube mit mindestens einer MeasureGroup entsteht im Modellierungsprozess automatisch. Die Notwendigkeit der nachträglichen manuellen Erstellung einer Gesamtsicht in Form eines virtuellen Cubes entfällt also. Es ist zu vermuten, dass diese Umkehrung der Denkweise aus der Einsicht resultiert, dass in der Mehrzahl der Fälle eine solche Gesamtbetrachtung wünschenswert ist. Auch im “neuen” (Gesamt-)Cube erfolgt die Verknüpfung aller in den beinhalteten Measure Groups enthaltenen Measures im Bedarfsfall automatisch entlang der gemeinsamen Achsen.

Die “Dimension-Measure-Matrix” zeigt die Verwendung der existierenden Dimensionen (Zeilen) in den einzelnen Measure Groups (Spalten) des Cubes. Die Granularität wird im Kreuzungspunkt durch den Namen des verwendeten Dimensionsattributs visualisiert (z. B. Product in Inventory Facts und Sales Facts, aber Product Subcategory im Budget).

Die Integration von Informationen ist in der Variante der Kombination von MeasureGroups in einem gemeinsamen Cube also per se gegeben. Umgekehrt können Informationen, die in getrennten Cubes gespeichert sind, über das Konzept der Linked Measure Groups in andere Cubes übernommen werden. Eine weitere Alternative stellt der LookupCube-Befehl in MDX dar.

Administrative Aspekte

Die physikalische Speicherung der (Bewegungs-)Daten erfolgt pro Measure Group, genau gesagt pro Measure Group in einer oder mehrerer Partitionen. Jede Partition hat ihren eigenen Speicherentwurf (MOLAP, ROLAP oder diverse hybride Zwischenstufen), und für jede Partition können optional individuelle Aggregationsentwürfe erstellt werden, die aus den Basisdaten in frei definierbarem Umfang (Zwischen-)Summen entlang der existierenden Attributkombinationen vorberechnen. Dieses Prinzip gilt unabhängig von der Entscheidung über die Speicherung der Daten in einem gemeinsamen oder separaten Cube. Dennoch empfiehlt Microsoft im Analysis Services Performance Guide, die Anzahl der Measure Groups pro Cube zu beschränken, gibt dabei jedoch keine allgemeingültige Obergrenze an.

Performancemessungen zeigen klare Vorteile bei Einzelcubes. Dieser Effekt resultiert vornehmlich aus der dabei entstehenden Speicherplatzersparnis (die jeweiligen Kennzahlen müssen nur entlang ihrer eigenen Achsen gespeichert werden) und ist erwartungsgemäß besonders stark, wenn die betroffenen Measure Groups nur wenige gemeinsame und gleichzeitig viele zusätzliche individuelle Merkmale haben. Dieses Szenario ist nach unseren Erfahrungen in der Praxis eher selten anzutreffen: Realistisch ist ein hoher Merkmalsüberschneidungsgrad der einzelnen Measure Groups, denn typische Merkmale wie Zeit, Wertart, Mandant oder Artikel stehen meist in Verbindung zu nahezu jeder Kennzahl.

Hinsichtlich der Pflege von Benutzerberechtigungen in Rollen sind Measure Groups völlig transparent. Mit anderen Worten: Die Bündelung der Measures in ihre Gruppen ist in den Dialogen zur Rollendefinition nicht sichtbar, und jede Measure kann separat an- oder abgewählt werden. Umgekehrt kann auch die Berechtigungspflege für mehrere Cubes innerhalb einer Rolle erfolgen. Der Berechtigungsaspekt ist demnach in Bezug auf die Entscheidung für einen oder mehrere Cubes neutral.

Die Administration von (MDX-)Skripten/Formeln kann bei der Aufteilung auf mehrere Cubes zu Redundanz und Mehrfachpflegeaufwand führen. Dieser Nachteil ist nicht ausschließlich theoretischer Natur: Beispielsweise serverseitige Skripte für Zeitanalyseelemente (Kumulation etc.) sind pro Cube zu pflegen, und bei Änderungen ist eine manuelle Synchronisierung erforderlich.

Zusammenfassung und Empfehlung

Aus unserer Erfahrung sind die Vorteile eines Single Cubes meist gewichtiger als etwaige Nachteile hinsichtlich Performance und/oder Administration:

Alle Inhalte der OLAP-Datenbank sind dem Anwender im Frontend ohne manuelle Nacharbeit und ohne funktionale Restriktionen aus einem Quellobjekt zugänglich.
Der Server sorgt für korrekte Ergebnisse im Falle der Kombination von Measures und Dimensionen ohne gemeinsamen Kontext in Abfragen und Rechenformeln.
Sämtliche erforderlichen Verknüpfungen finden im Backend statt.
Berechnungen und Skripte sind nur einmalig zu pflegen.

Freitag, 7. Mai 2010

OLAP

Veranstaltungs-Tipp

On-Demand-Webinar 2. Mai 2024 Webinar: DeltaMaster ETL

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Anmeldung

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

On-Demand-Webinar 7. Mai 2024 Webinar: Berichtserstellung mit DeltaMaster

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Anmeldung

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

On-Demand-Webinar 13. Mai 2024 Webinar: Reporting mit DeltaMaster

DeltaMaster-Berichte geben Signale, die unmissverständlich zeigen, wo gehandelt werden muss. Im Webinar zeigen wir Ihnen die drei leistungsfähigsten Methoden für die interaktive Ad-hoc-Analyse von [...]

Anmeldung

Über den Autor

Consulting

Die Bissantz-Consultants teilen ihr Wissen rund um Data-Warehouse-Projekte und Business-Intelligence-Lösungen – jede Woche ein neuer Beitrag. Auf die Würfel, fertig, los!

Letzte Blogartikel

Planung Vollständiges Wiederherstellungsmodell – Back-ups im Rhythmus der Planung

In diesem Beitrag soll eine spezifische Back-up-Strategie für eine DeltaMaster-Planungsumgebung beschrieben werden, die auf dem vollständigen [...]

mehr erfahren

Forschung Benutzerdefinierte Filter für Zielbericht zuweisen

Benutzerdefinierte Filter helfen im neuen Release von DeltaMaster, Verknüpfungen von Grafischen Tabellen zu Zielberichten flexibler anzulegen [...]

mehr erfahren

Bissantz News Wissen auf Abruf: das Bissantz Help Center

Viele Nutzer legen direkt in DeltaMaster und DeltaApp los und verstehen intuitiv, wie Berichte genutzt werden können. Wer lieber mit einer [...]

mehr erfahren

Forschung Steuereinnahmen der Länder

Steuereinnahmen der Länder - es war schon immer viel Fantasie im Spiel, wenn es um das Erfinden und Eintreiben von Steuern ging. Wie haben [...]

mehr erfahren

Forschung Studienanfänger und Studierende in Deutschland

Studienanfänger stehen jedes Jahr vor einer wichtigen Entscheidung: Welches der fast 300 Studienfächer entspricht den eigenen Neigungen und [...]

mehr erfahren

Data Warehousing Float – ein problematischer Datentyp

Dieser Beitrag zeigt, wie es bei relationalen Eingabeanwendungen zu Rundungsfehlern im Zusammenhang mit float kommen kann und wie man dies vermeidet [...]

mehr erfahren

Data Warehousing Reverse Engineering im Bissantz Application Designer

Dieser Beitrag stellt die neue Funktion des „Reverse Engineering“ im Bissantz Application Designer vor. Damit lassen sich bestehende relationale [...]

mehr erfahren

Forschung Neue Aggregationstypen in der DeltaApp

Der Aggregationstyp Summation ist bei hierarchischen Modellen im Bereich Business Intelligence vorherrschend: Der Gesamtumsatz ergibt sich beispielsweise [...]

mehr erfahren

Forschung Aufstiegs-BAföG in der DeltaApp

In einer sich schnell verändernden Welt ist lebenslanges Lernen unerlässlich. Mit dem Aufstiegs-BAfög werden bestimmte Fortbildungen unterstützt [...]

mehr erfahren

Bissantz News Daten- und Softwaresicherheit bei Bissantz

TISAX-Verlängerung und Penetrationstest-Zertifizierung Informationssicherheit hat bei Bissantz & Company höchste Priorität – deshalb werden [...]

mehr erfahren

Vorheriger Artikel

Verwenden von C# in den Formeln von DeltaMasters Flexreports

Nächster Artikel

Zeitarten

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Zur Speicherung der Einstellungen, die Sie in der Cookie-Leiste ausgewählt haben.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Microsoft Azure CDN
Anbieter	Microsoft Azure
Zweck	Das Cookie dient der Lastverteilung der Anfragen (Load-Balancing) durch Seitennutzer bei der Nutzung des Dienstes.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ARRAffinity,ARRAffinitySameSite
Cookie Laufzeit	Sitzung

Name	Polylang
Anbieter	Eigentümer dieser Website
Zweck	Speichert die aktuelle Sprache.
Cookie Name	pll_language
Cookie Laufzeit	1 Jahr

Name	cloud.bissantz.de
Anbieter	Bissantz
Zweck	Dieser Cookie dient der Erfassung der Position des Seitenbesuchers um eine möglichst effeziente und schnelle Zuteilung zu einem nahen Server zu ermöglichen.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ASLBSA,ASLBSACORS
Cookie Laufzeit	Sitzung

Name	UserLike (verwendet den Webfont Loader und das Google-API CDN)
Anbieter	https://www.userlike.com/de/
Zweck	Notwendig zur umfassenden Information, z. B. auch für Datenschutzfragen.
Datenschutzerklärung	https://www.userlike.com/de/terms#privacy-policy
Host(s)	userlike.com
Cookie Laufzeit	365 Tage

Akzeptieren	Google Tag Manager
Name	Google Tag Manager
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google zur Steuerung der erweiterten Script- und Ereignisbehandlung.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren	Facebook Pixel
Name	Facebook Pixel
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Cookie von Facebook, das für Website-Analysen, Ad-Targeting und Anzeigenmessung verwendet wird.
Datenschutzerklärung	https://www.facebook.com/policies/cookies
Cookie Name	_fbp,act,c_user,datr,fr,m_pixel_ration,pl,presence,sb,spin,wd,xs
Cookie Laufzeit	Sitzung / 1 Jahr

Akzeptieren	Google Optimize
Name	Google Optimize
Anbieter	Google
Zweck	Das Google Website-Optimierungstool ist eine kostenlos verfügbare Software zur Durchführung von A/B- und Multivariatentests im Webdesign.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de

Akzeptieren	Facebook
Name	Facebook
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Mit der Zustimmung können z. B. unsere Beiträge direkt in Ihrem Facebook-Profil geteilt werden und Sie erlauben Facebook, Informationen über Sie zu verarbeiten, damit Ihnen personalisierter Content angezeigt werden kann.
Datenschutzerklärung	https://www.facebook.com/privacy/explanation
Host(s)	.facebook.com
Cookie Laufzeit	730 Tage

Measure Groups oder Cubes?

Grundlegende Betrachtungen

Auf welche Objekte greift der Endanwender bzw. die Clientsoftware zu?

Was passiert bei der Verknüpfung von Daten unterschiedlicher Dimensionalität und/oder Granularität?

Administrative Aspekte

Zusammenfassung und Empfehlung

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Data Warehousing.