Datentransformation mit Hilfe der PIVOT- und UNPIVOT-Komponente in SQL Server Integration Services (SSIS)

Im Artikel Über die Nutzung des PIVOT- und UNPIVOT-Operators wurde bereits beschrieben, wie mit Hilfe des PIVOT- und UNPIVOT-Operators Tabellen, in denen die Werte, die später als Kennzahlen analysiert werden sollen, von einer zeilen- in eine spaltenorientierte Struktur und zurück überführt werden können. Dabei liegen die Daten aber bereits in der Datenbank. Sollen die Daten jedoch gleich im „richtigen“ Format in der Datenbank gespeichert werden, müssen sie schon vor dem Import entsprechend umgewandelt werden. Bei der Nutzung des SQL-Servers als Datenbank-Managementsystem stehen für die Abbildung komplexer ETL-Prozesse die SQL Server Integration Services (SSIS) zur Verfügung. Hier befinden sich zur Lösung oben genannter Fragestellung die Datenflusskomponenten PIVOT und UNPIVOT. Dieser Artikel soll die Nutzung dieser beiden Datenflusskomponenten beim Import von Währungskursen aus einer Textdatei in eine Datenbank genauer beschreiben.

Die Datenflusskomponente UNPIVOT

Der folgende Screenshot stellt einen Ausschnitt einer Textdatei dar, in der sich Umrechnungskurse der jeweiligen Landeswährungen in die Währung Euro befinden. Die Besonderheit liegt darin, dass die Kurse zeilenweise zwar pro Tag, aber spaltenweise pro Quartal (FCS1 – FCS4) abgelegt sind.

Um die Umrechnungskurse datenbankseitig besser verarbeiten zu können, wäre es hilfreich, die Kurse in nur einer Spalte (Currency_Rate) und die Information über das Quartal in einer weiteren Spalte (Quarter_ID) zu speichern.

Beim Import der Daten mit Hilfe der SSIS wird im Datenflusstask zwischen der Quelldatei und der Zieltabelle die Datenflusskomponente UNPIVOT genutzt.

Im Transformations-Editor der UNPIVOT-Komponente (aufrufbar durch Anklicken des Eintrages „Bearbeiten“ im Kontextmenü der Komponente) müssen entsprechende Einstellungen getroffen werden, um die Daten in das gewünschte Format zu überführen.

Im oberen Bereich der verfügbaren Spalten muss zunächst unterschieden werden, welche Spalten 1:1 weitergegeben und welche Spalten umgewandelt werden sollen. Im gezeigten Beispiel sollen die Inhalte der Spalten Date, ISO_code und Country 1:1 weitergegeben werden. Dafür müssen Häkchen in der Spalte Pass-Through der entsprechenden Zeile gesetzt werden. Die Inhalte der Spalten FCS1 – FCS4 sollen in eine neue Spalte überführt werden. Dafür müssen Häkchen in der ersten Spalte der entsprechenden Zeile gesetzt werden. Anschließend muss im unteren Bereich unter „Zielspalte“ definiert werden, wie die Spalte heißen soll, in die die Kurse überführt werden sollen. Im gezeigten Beispiel wurde diese Spalte Currency_Rate benannt. In der Spalte Pivotschlüsselwert wird definiert, welche Quartalsinformation zum jeweiligen Kurs übergeben werden soll. Diese Information wird in der Spalte abgelegt, für die im Feld Name der Pivotschlüsselwert-Spalte angegeben wurde, im gezeigten Beispiel Quarter_ID.

Nach korrekter Einstellung im Transformations-Editor und der Definition des Datenflusszieles kann der Datenimport durch Ausführen des Datenflusstasks gestartet werden. Das Ergebnis der Umwandlung kann durch eine Abfrage der Zieltabelle zum Beispiel im SQL Server Management Studio begutachtet werden.

Die Datenflusskomponente PIVOT

Die Datenflusskomponente PIVOT kann genutzt werden, wenn Daten während des Imports in ein spaltenorientiertes Format umgewandelt werden müssen. Soll also folgende Quelldatei, welche im Wesentlichen dem Ergebnis des oben aufgeführten Transformationprozesses mit Hilfe der UNPIVOT-Datenflusskomponente entspricht, in ein spaltenorientiertes Format überführt werden,

müssen folgende Einstellungen im Datenflusstask vorgenommen werden. Zwischen der Quelldatei und der Zieltabelle wird die PIVOT-Datenflusskomponente platziert.

Anschließend muss der Transformationsprozess im erweiterten Editor der PIVOT-Datenflusskomponente detailliert definiert werden.

Die Einstellungen auf der Registerkarte Komponenteneigenschaften können in aller Regel standardmäßig übernommen werden. Auf der Registerkarte Eingabespalten werden dann die Spalten aktiviert, welche beim Import berücksichtigt werden sollen.

Danach wird auf der Registerkarte „Eingabe- und Ausgabeeigenschaften“ festgelegt, welche Spalten umgewandelt werden und wie diese heißen sollen.

Zunächst muss für jede Eingabespalte im Feld PivotUsage im Eigenschaftenfenster der jeweiligen Spalte deren Verwendung definiert werden. Im gezeigten Screenshot wird für die Spalte Date der Wert 1 definiert. Diese Einstellung bewirkt, dass der Inhalt der Spalte jedem Datensatz hinzugefügt wird, dabei werden Datensätze mit demselben Schlüssel zu einer Zeile zusammengefasst. Für die Spalten ISO_code und Country wird ebenfalls der Wert 1 im Feld PivotUsage definiert, denn auch die Inhalte dieser Spalten sollen in der Ausgabe bzw. Zieltabelle als Bestandteil eines eindeutigen Zeilenschlüssels enthalten sein. Würden diese Spalten bei der Transformation unberücksichtigt bleiben, würden die Kurse der einzelnen Länder auf einen Tageswert summiert werden, was wiederum zu falschen Umrechnungskursen führen würde.

Für die Spalte Quarter_ID wird im Feld PivotUsage der Wert 2 gesetzt. Mit diesem Wert wird die Pivotspalte definiert, d.h. aus jedem Spaltenwert wird eine Spalte erstellt.

Für die Spalte Currency_Rate wird im Feld PivotUsage der Wert 3 gesetzt. Dieser Wert bewirkt, dass die Inhalte diese Spalte bei der Transformation als Ergebnis in die Pivotspalten abgelegt werden.

Folgende Tabelle, die einen Auszug aus der SQL-Server Hilfe darstellt, beschreibt die einzelnen Optionen im Detail.

Ausgabespalten werden durch Anklicken des Buttons Ausgabe hinzufügen im unteren Bereich der Registerkarte Eingabe- und Ausgabeeigenschaften eingefügt. Auch hier müssen für jede Ausgabespalte spezielle Einstellungen vorgenommen werden.

Für die Ausgabespalten muss im Eigenschaftenfenster im Feld SourceColumn der Herkunftsbezeichner der Quellspalte angegeben werden. Den Herkunftsbezeichner findet man unter den entsprechenden Eingabespalten im Feld LineageID. Im folgenden Screenshot verweist die Ausgabespalte Date auf die Eingabespalte mit dem Herkunftsbezeichner (LineageID) = 115, was der Eingabespalte Date entspricht. Die Ausgabespalte ISO_code verweist auf die Eingabespalte ISO_code und die Ausgabespalte Country verweist auf die Eingabespalte Country.

Die Ausgabespalten FSC1 – FSC4 verweisen alle auf die Eingabespalte Currency_Rate mit der LineageID= 111. Zusätzlich zur SourceColumn muss bei diesen vier Ausgabespalten im Feld PivotKeyValue der Wert des jeweiligen Quartals (Q1 – Q4), welche in der Eingabespalte Quarter_ID vorkommen kann, angegeben werden.

Auch in diesem Fall kann nach korrekter Einstellung im erweiterten Editor der PIVOT-Datenflusskomponente und der abschließenden Definition des Datenflusszieles, der Datenimport durch Ausführen des Datenflusstasks gestartet werden. Das Ergebnis der Umwandlung kann ebenfalls durch eine Abfrage der Zieltabelle, zum Beispiel im SQL Server Management Studio, begutachtet werden.

Freitag, 22. Juli 2011

ETL SSIS

Veranstaltungs-Tipp

On-Demand-Webinar 22. April 2024 Webinar: Selfservice mit DeltaMaster und Microsoft Excel

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar [...]

Anmeldung

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar.

On-Demand-Webinar 2. Mai 2024 Webinar: DeltaMaster ETL

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Anmeldung

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

On-Demand-Webinar 7. Mai 2024 Webinar: Berichtserstellung mit DeltaMaster

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Anmeldung

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Über den Autor

Consulting

Die Bissantz-Consultants teilen ihr Wissen rund um Data-Warehouse-Projekte und Business-Intelligence-Lösungen – jede Woche ein neuer Beitrag. Auf die Würfel, fertig, los!

Letzte Blogartikel

Forschung Benutzerdefinierte Filter für Zielbericht zuweisen

Benutzerdefinierte Filter helfen im neuen Release von DeltaMaster, Verknüpfungen von Grafischen Tabellen zu Zielberichten flexibler anzulegen [...]

mehr erfahren

Bissantz News Wissen auf Abruf: das Bissantz Help Center

Viele Nutzer legen direkt in DeltaMaster und DeltaApp los und verstehen intuitiv, wie Berichte genutzt werden können. Wer lieber mit einer [...]

mehr erfahren

Forschung Steuereinnahmen der Länder

Steuereinnahmen der Länder - es war schon immer viel Fantasie im Spiel, wenn es um das Erfinden und Eintreiben von Steuern ging. Wie haben [...]

mehr erfahren

Forschung Studienanfänger und Studierende in Deutschland

Studienanfänger stehen jedes Jahr vor einer wichtigen Entscheidung: Welches der fast 300 Studienfächer entspricht den eigenen Neigungen und [...]

mehr erfahren

Data Warehousing Float – ein problematischer Datentyp

Dieser Beitrag zeigt, wie es bei relationalen Eingabeanwendungen zu Rundungsfehlern im Zusammenhang mit float kommen kann und wie man dies vermeidet [...]

mehr erfahren

Data Warehousing Reverse Engineering im Bissantz Application Designer

Dieser Beitrag stellt die neue Funktion des „Reverse Engineering“ im Bissantz Application Designer vor. Damit lassen sich bestehende relationale [...]

mehr erfahren

Forschung Neue Aggregationstypen in der DeltaApp

Der Aggregationstyp Summation ist bei hierarchischen Modellen im Bereich Business Intelligence vorherrschend: Der Gesamtumsatz ergibt sich beispielsweise [...]

mehr erfahren

Forschung Aufstiegs-BAföG in der DeltaApp

In einer sich schnell verändernden Welt ist lebenslanges Lernen unerlässlich. Mit dem Aufstiegs-BAfög werden bestimmte Fortbildungen unterstützt [...]

mehr erfahren

Bissantz News Daten- und Softwaresicherheit bei Bissantz

TISAX-Verlängerung und Penetrationstest-Zertifizierung Informationssicherheit hat bei Bissantz & Company höchste Priorität – deshalb werden [...]

mehr erfahren

Forschung Flächennutzung in Deutschland

Veränderungen verstehen: Wer Abweichungen und Verschiebungen seiner Kennzahlen auf den Grund gehen will, kann in DeltaMaster eine Vielzahl [...]

mehr erfahren

Vorheriger Artikel

Visual Rules

Nächster Artikel

Konten oder Measures?

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Zur Speicherung der Einstellungen, die Sie in der Cookie-Leiste ausgewählt haben.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Microsoft Azure CDN
Anbieter	Microsoft Azure
Zweck	Das Cookie dient der Lastverteilung der Anfragen (Load-Balancing) durch Seitennutzer bei der Nutzung des Dienstes.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ARRAffinity,ARRAffinitySameSite
Cookie Laufzeit	Sitzung

Name	Polylang
Anbieter	Eigentümer dieser Website
Zweck	Speichert die aktuelle Sprache.
Cookie Name	pll_language
Cookie Laufzeit	1 Jahr

Name	cloud.bissantz.de
Anbieter	Bissantz
Zweck	Dieser Cookie dient der Erfassung der Position des Seitenbesuchers um eine möglichst effeziente und schnelle Zuteilung zu einem nahen Server zu ermöglichen.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ASLBSA,ASLBSACORS
Cookie Laufzeit	Sitzung

Name	UserLike (verwendet den Webfont Loader und das Google-API CDN)
Anbieter	https://www.userlike.com/de/
Zweck	Notwendig zur umfassenden Information, z. B. auch für Datenschutzfragen.
Datenschutzerklärung	https://www.userlike.com/de/terms#privacy-policy
Host(s)	userlike.com
Cookie Laufzeit	365 Tage

Akzeptieren	Google Tag Manager
Name	Google Tag Manager
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google zur Steuerung der erweiterten Script- und Ereignisbehandlung.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren	Facebook Pixel
Name	Facebook Pixel
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Cookie von Facebook, das für Website-Analysen, Ad-Targeting und Anzeigenmessung verwendet wird.
Datenschutzerklärung	https://www.facebook.com/policies/cookies
Cookie Name	_fbp,act,c_user,datr,fr,m_pixel_ration,pl,presence,sb,spin,wd,xs
Cookie Laufzeit	Sitzung / 1 Jahr

Akzeptieren	Google Optimize
Name	Google Optimize
Anbieter	Google
Zweck	Das Google Website-Optimierungstool ist eine kostenlos verfügbare Software zur Durchführung von A/B- und Multivariatentests im Webdesign.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de

Akzeptieren	Facebook
Name	Facebook
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Mit der Zustimmung können z. B. unsere Beiträge direkt in Ihrem Facebook-Profil geteilt werden und Sie erlauben Facebook, Informationen über Sie zu verarbeiten, damit Ihnen personalisierter Content angezeigt werden kann.
Datenschutzerklärung	https://www.facebook.com/privacy/explanation
Host(s)	.facebook.com
Cookie Laufzeit	730 Tage

Datentransformation mit Hilfe der PIVOT- und UNPIVOT-Komponente in SQL Server Integration Services (SSIS)

Die Datenflusskomponente UNPIVOT

Die Datenflusskomponente PIVOT

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Data Warehousing.