Immer diese Stammdaten, Teil 2

Willkommen zum zweiten Teil des Blogbeitrags über Änderungen von Stammdaten. Wie bereits im ersten Teil angekündigt, werden wir uns heute der Erweiterung der bisher bereits erstellten Transformation widmen. Zunächst ein kleiner Rückblick, was wir schon gemacht haben.

In Teil I haben wir im BI-Development Studio (kurz: BIDS) ein Paket mit einem integrierten Lookup-Task (deutsch: Suche) erstellt. Der Task verglich die Quelldaten bereits mit den vorhandenen Datensätzen in der Zieltabelle auf unserem SQL-Server und mit Hilfe eines kleinen Scripts am Ende des Datenflusses konnten wir neue Datensätze in die Tabelle mit aufnehmen. Darüber hinaus hatten wir den Lookup-Task bereits so konfiguriert, dass die Spalten „Position“ und „Gewicht“ bereits in einer Art „Überwachung“ (im BIDS sprechen wir hier von der Ausgabe für Suchübereinstimmungen) vorgehalten wurden. Zusätzlich hat das SQL-Script dann noch in die Zieltabelle das Importdatum eingetragen bzw. aktualisiert. Das war schon sehr schön, aber wir wollen noch mehr, oder?

Typische Fragen wie: „Wann wurde der Wert denn geändert?“ oder meist noch wichtiger „Was hat sich geändert?“ können wir unseren Kunden so leider noch nicht beantworten. Mit nur ein paar kleinen Änderungen an unserem Importprozess bringen wir auch hier Licht ins Dunkel. Und wie genau? Einfach weiterlesen und mitmachen, es lohnt sich.

Kurz noch einmal zur Datensituation: Uns liegt als .csv Datei der aktuelle Kader des fast neuen deutschen Handballmeisters THW Kiel (Sie sind aktuell noch immer ungeschlagen am 28. Spieltag der Saison mit derzeit 56:0 Punkten!) vor. Ziel soll es nun sein, dass unsere Transformation die Änderungen von Spalteninhalten und zusätzlich neben dem Importdatum auch ein Änderungszeitpunkt mit ausgibt; ein quasi „Abfallprodukt“ davon ist dann sogar eine gesamte Änderungshistorie.

Schauen wir uns jetzt die dafür notwendigen Schritte mal im Detail an. Zum Einsatz möchten wir hier einen neuen, zusätzlichen Transformationstask verwenden, den Conditional Split (deutsch: bedingtes Teilen).

Wir öffnen nun also unser vorhandenes DTSX-Paket, wechseln in die Ablaufsteuerung und ziehen einfach per Drag & Drop aus der Toolbox den Conditional Split Task in das Paket. Nun trennen wir das OLEDB-Ziel T_Import_THW_updates noch vom Lookup Task und setzen an die Stelle den neuen Conditional Split (kurz: Split). Zum Abschluss verbinden wir die freigewordene Ausgabe des Lookups mit dem Split. Unser Paket sollte jetzt wie folgt aussehen:

Via Doppelklick auf den Split kommen wir in die Konfiguration des Tasks. Der erscheinende Dialog bietet uns nun in einem 3-geteilten Fenster diverse Einstellungen für die unterschiedlichsten Abfrageprüfungen.

Da wir an dieser Stelle aus diesem Blogbeitrag keine Diashow machen möchten, beschreiben wir nun erst kurz, was für uns zu tun ist. Im Anschluss schauen wir uns dann das Ergebnis an. Ihr könnt natürlich gerne parallel schon einmal den Dialog öffnen.

Wir werden jetzt unserem Ziel entsprechend eine sog. Regel definieren, welche die bereits am Anfang des Artikels erwähnten beiden Spalten auf inhaltliche Änderungen prüft. Dafür ziehen wir uns aus dem oberen linken Bereich aus den Spalten per Drag & Drop die Spalte Gewicht in das untere Fenster an die Stelle Bedingung. Automatisch wird vom BIDS die Reihenfolge auf 1 gesetzt und ein Standardname für die Ausgabe vergeben. An die Bedingung hängen wir nun unseren Vergleichsoperator für „ungleich“ ( != ) und ziehen dann die Vergleichspalte hinzu. Um nun noch die Änderungen für die Spalte „Position“ mit in diese Regel aufzunehmen, ziehen wir uns aus dem rechten, oberen Bereich den Operator für ein logisches OR (Zeichenfolge: ||) dazu und wiederholen den ersten Abschnitt der Konfiguration. Abschließend ändern wir noch den Standardnamen der Ausgabe beispielsweise in „geaenderte Zeilen“. Schauen wir uns jetzt einmal gemeinsam unsere Regel an:

Wie angekündigt, sollten wir uns den gesamten Dialog noch einmal genauer in einer Übersicht anschauen:

Speziell der rechte, obere Bereich lässt schon erahnen, dass der Split Task eine Vielzahl von Regeleinstellungen zulässt. Beispielsweise lassen sich mit dem logischen AND Operator Prüfungen auf Feldkombinationen verwirklichen oder mit den Datumsfunktionen direkt ein Zeitintervall zwischen zu ladendem Quell- und Zieldatensatz als Kriterium für ein Update festlegen. Hier empfehlen wir: einfach mal durchstöbern.

Zurück zu unserer Transformation. Zum Abschluss der Konfiguration ziehen wir nun die Ausgabe des Split auf unser freigewordenes OLEDB-Ziel T_Import_THW_updates. In dem sich öffnenden Kurzdialog wählen wir einfach die zuvor von uns mit Namen belegte Ausgabe der geänderten Zeilen und bestätigen dies mit OK.

Damit ist die Konfiguration unseres Conditional Splits abgeschlossen. Sind wir jetzt wirklich schon fertig?

Nicht ganz, wir haben ja noch das „Abfallprodukt“ einer Änderungshistorie erwähnt. Dafür legen wir uns einfach auf Basis der T_Import_THW_updates per Script eine weitere Tabelle T_Import_THW_updates_history an. Anschließend nehmen wir noch ein paar kleinere Anpassungen an unserem bereits in Teil I erstellen SQL-Scripts vor und schon entsteht in dieser Tabelle unsere Historie, und das ganz von allein

Nun zum Ergebnis:

Führen wir also unser Projekt jetzt einmal aus – natürlich haben wir vorher in unserer Quelldatei diverse Änderungen vorgenommen.

Wer jetzt genau die Änderungen nachvollziehen will, der schaut einfach mal in die Historientabelle T_Import_THW_updates_history…

Und?

Schon genial, oder? Wir hoffen, es hat Spaß gemacht, und freuen uns auf das nächste Mal.

Freitag, 20. April 2012

SQL Conditional Split Deltalogik ETL inkrementelles Laden SSIS Stammdaten T-SQL

Veranstaltungs-Tipp

Meet the Experts 15. Juli 2025 Webinar: DeltaMaster ETL

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Anmeldung

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Meet the Experts 23. Juli 2025 Webinar: Berichtserstellung mit DeltaMaster

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Anmeldung

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Meet the Experts 29. Juli 2025 Webinar: Reporting mit DeltaMaster

DeltaMaster-Berichte geben Signale, die unmissverständlich zeigen, wo gehandelt werden muss. Im Webinar zeigen wir Ihnen die drei leistungsfähigsten Methoden für die interaktive Ad-hoc-Analyse von [...]

Anmeldung

Über den Autor

Consulting

Die Bissantz-Consultants teilen ihr Wissen rund um Data-Warehouse-Projekte und Business-Intelligence-Lösungen – jede Woche ein neuer Beitrag. Auf die Würfel, fertig, los!

Letzte Blogartikel

Forschung Weinmost - Erntemengen und Erträge pro Hektar

Weinmost bildet die Grundlage für die in Deutschland kulturrelevanten Rot- und Weißweine. Wir nutzen DeltaMaster 6, um Auffälligkeiten bei [...]

mehr erfahren

Forschung Bundesliga-Tabelle 2024/25

Die Bundesliga-Tabelle nach Abschluss der Saison 2024/25 zeigt das altvertraute Bild: Der FC Bayern München liegt vorn! Was steckt wirklich [...]

mehr erfahren

Forschung Bevölkerungsbestand in Nürnberg

Den Bevölkerungsbestand einer Stadt können wir aus verschiedenen Blickwinkeln analysieren. Häufig variieren in den Stadtteilen Altersverteilung [...]

mehr erfahren

Forschung Kaltmieten in Deutschland

Kaltmieten bzw. Mieten im Allgemeinen sind in den letzten Jahren stetig gestiegen und stellen für viele Mieter den größten Posten der monatlichen [...]

mehr erfahren

Data Warehousing Unternehmensplanung und -konsolidierung auf Basis der Bissantz ERP Solutions

Dieser Beitrag erläutert, wie sich Prozesse der integrierten Unternehmensplanung und der Unternehmenskonsolidierung strukturiert gestalten [...]

mehr erfahren

Forschung Achsenelemente als Filter an Zielbericht zuweisen

Achsenelemente können mit dem neuesten Release von DeltaMaster in ihrer Gesamtheit als Filter an einen Zielbericht zugewiesen werden. Wir erklären [...]

mehr erfahren

Forschung Leistungsausgaben der gesetzlichen Krankenversicherung

Die Leistungsausgaben der gesetzlichen Krankenkassen steigen von Jahr zu Jahr. Als Folge haben im Januar 2025 etliche Krankenkassen erneut die [...]

mehr erfahren

Data Warehousing Partitionierung von Bewegungsdaten

Die Aktualisierung von Bewegungsdaten nimmt während der täglichen Aufbereitung einer SQL-Datenbank in der Regel den Großteil der benötigten [...]

mehr erfahren

Forschung Analyse von Verteilungen

Die Beschreibung von Verteilungen geht oft über die Angabe von Mittelwert und Standardabweichung hinaus. Wir erläutern, was sich bei den hierfür [...]

mehr erfahren

Data Warehousing Arbeitstagkalender

Zur Berechnung von Kennzahlen, die von der genauen Anzahl der Arbeitstage abhängen, ist es notwendig, diese im Modell korrekt abzubilden. Die [...]

mehr erfahren

Vorheriger Artikel

Multilingualität in DeltaMaster-Anwendungen

Nächster Artikel

Transaction Log

Immer diese Stammdaten, Teil 2

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Data Warehousing.

Nicolas Bissantz

Diagramme im Management