Über die Nutzung des PIVOT- und UNPIVOT-Operators

Wie bereits im Blogbeitrag „Konvertierung von Excel-Kreuztabellen“ erwähnt, kommt es in BI-Projekten immer wieder vor, dass Quelldaten in einem Format zur Verfügung gestellt werden, welches das sofortige Weiterverarbeiten erschwert bzw. unmöglich macht. So trifft man häufig auf Tabellenstrukturen, in denen die Werte, die später als Kennzahlen analysiert werden sollen, nicht spaltenweise sondern zeilenweise abgelegt sind, d. h. die eigentlichen Werte sind in nur einer Spalte gespeichert und die restlichen Spalten beschreiben diese Werte. Folgende Abbildung zeigt eine solche Tabelle mit dem Namen „T_Import_Umsatz_Liste“.

Hier werden verschieden Kennzahlen zeilenweise aufgeschlüsselt nach Kunden, Periode und Produkten dargestellt. Um was für eine Kennzahl es sich jeweils handelt, ist aus der Spalte „KennzahlID“ ersichtlich. Für eine Weiterverarbeitung der Daten im ImportWizard wäre dieses Format ausreichend, die Kennzahlen im Modell werden dann als eigene Dimension abgebildet. Dies ist vor allem bei gleichartigen Daten sinnvoll, wie zum Beispiel bei Bilanz- oder GuV-Daten.

Möchte man die Kennzahlen jedoch explizit als Measures abbilden, müssen die Werte spaltenweise abgelegt sein. Auch für die Speicherung der Daten in den SQL Server Analysis Services (SSAS) wird dieses Format benötigt. Die folgende Abbildung zeigt die Daten der obigen Tabelle im gewünschten Format.

Der PIVOT-Operator

Bis zur Version 2005 des SQL Servers war bei der Nutzung des T-SQL Sprachschatzes das Umwandeln einer Tabelle mit einer flachen Ergebnismenge (Abbildung 1) in eine Kreuztabelle (Abbildung 2) eine echte Herausforderung. Hierfür nutze man oft verschachtelte Unterabfragen oder behalf sich mit temporären Tabellen. Seit der Version 2005 des SQL Servers steht nun der PIVOT-Operator zum Erstellen von Kreuztabellen zur Verfügung. Die Syntax lautet:

select
    <Spalte1>,
    <Spalte2>,
    <Spalte3>,
...

from
    <Quelltabelle>
PIVOT
(
    <Aggregatfunktion>(<Wertspalte>)
FOR <Kennzahlenspalte>
    IN (<Spaltenliste>)
    ) <Alias>

Umgesetzt auf unser obiges Beispiel würde das SQL-Statement folgendermaßen aussehen:

select
     KundeID,
     PeriodeID,
     ProduktID,
     Umsatz,
     Absatz,
     Kosten


from
     dbo.T_Import_Umsatz_Liste p
PIVOT
     (
sum(Wert)
FOR KennzahlID
IN (Umsatz,Absatz,Kosten)
) as pvt

Das Ergebnis der Abfrage wird in nachstehender Abbildung gezeigt:

Der PIVOT-Operator setzt den Inhalt der angegebene Spalte „KennzahlID“ um, indem er die eindeutigen Werte dieser Spalte (Umsatz, Absatz, Kosten) in Spalten der Ausgabe umwandelt und dabei, entsprechend des angegebenen Operators, die Werte aus der Spalte „Wert“ aggregiert. Die Aggregation der Daten hat den positiven Nebeneffekt, dass die Anzahl der Datensätze enorm reduziert werden kann.

Der UNPIVOT-Operator

Für den Fall, dass man eine Kreuztabelle in eine Tabelle mit einer flachen Ergebnismenge (zurück) verwandeln möchte, existiert ebenfalls seit der Version 2005 des SQL Servers der UNPIVOT-Operator. Seine Syntax lautet:

select
    <Spalte1>,
    <Spalte2>,
    <Spalte3>,
...

from
    <Quelltabelle>
UNPIVOT
    (
    <Wertspalte>
     FOR <Kennzahlenspalte>
     IN (<Spaltenliste>)
     ) <Alias>

Bezogen auf unser Beispiel lautet das SQL-Statement:

select
     KundeID,
     PeriodeID,
     ProduktID,
     KennzahlID,
     Wert
from
     dbo.T_Import_Umsatz_Kreuztabelle p
UNPIVOT
     (Wert FOR KennzahlID IN (Umsatz,Absatz,Kosten)) as pvt

Das Ergebnis der Abfrage wird in der folgenden Abbildung gezeigt, es entspricht der obigen Quelltabelle aus Abbildung 1:

Einschränkungen

Bei der Aggregation der Daten mit dem PIVOT-Operator werden Daten, welche den Wert NULL enthalten, bei der Berechnung der Aggregate nicht berücksichtigt. Das würde im obigen Beispiel kein Problem darstellen, da ein NULL-Wert zum Beispiel im Umsatz nicht zu Erhöhung des selbigen führen würde. Möchte man aber statt der Summe die Anzahl der Datensätze über die Funktion „Count“ ermitteln, hat das möglicherweise einen Einfluss auf das Ergebnis.

Eine weitere Einschränkung besteht hinsichtlich der Dynamik der Inhalte der Quelltabellen. Gemeint ist damit nicht eine Änderung der Datensatzanzahl, sondern das Hinzukommen weiterer Kennzahlen in der Spalte „KennzahlID“. Das hätte zur Folge, dass das SQL-Statement in der Spaltenliste entsprechend erweitert werden müsste, um eine zusätzliche Spalte mit dem Inhalt der neuen Kennzahl an die resultierende Kreuztabelle anzufügen.
Um das händische Anpassen des SQL-Statements zu vermeiden, könnte man eine Prozedur erstellen, welche den Inhalt der Kennzahlenspalte der Quelltabelle abfragt und anschließend dynamisch ein SQL-Statement erzeugt und in einer Sicht abspeichert.

Eine solche Prozedur könnte den folgenden Inhalt haben und wird hier unter dem Namen „P_BC_Create_Pivot_View“ gespeichert:

create proc [dbo].[P_BC_Create_Pivot_View](
@SourceTable varchar(100),-- Tabelle, welche umgewandelt werden soll
@DestinationView varchar(100),-- Name der zu erstellenden View
@MeasureColumnName varchar(50),-- Spalte der Kennzahlen
@ValueColumnName varchar(50)        -- Spalte der Beträge (Werte)
)as

Declare
@Column varchar(100),
@Measure varchar(100),
@sql_str_Column varchar(max),
@sql_str_Measure varchar(max),
@sql_str_exec varchar(max)

-- Spaltencursor
DECLARE Column_cursor CURSOR FOR
SELECT  col.Name from dbo.syscolumns col, dbo.sysobjects obj
WHERE   col.ID = obj.ID AND
obj.Name = @SourceTable AND
col.Name <> @MeasureColumnName AND
col.Name <> @ValueColumnName
OPEN Column_cursor
FETCH NEXT FROM Column_cursor INTO @Column
SET @sql_str_Column = ''
WHILE @@FETCH_STATUS = 0
BEGIN
set @sql_str_Column = @sql_str_Column + '

' + @Column + ','
FETCH NEXT FROM Column_cursor INTO @Column
END

CLOSE Column_cursor
DEALLOCATE Column_cursor

— temporäre Tabelle löschen

if exists (select * from dbo.sysobjects where name='_T_Temp_Measure')
drop table _T_Temp_Measure

— temporäre Tabelle anlegen

create table _T_Temp_Measure([Measure] [varchar] (100))
Declare @sql_str_temp varchar(4000)
set @sql_str_temp = 'Select distinct '+ @MeasureColumnName + ' from ' + @SourceTable+'
where ' + @MeasureColumnName + ' is not null'

— temporäre Tabelle füllen

insert into _T_Temp_Measure(Measure) exec(@sql_str_temp)

-- Measurecursor

DECLARE Measure_cursor CURSOR FOR
SELECT  Measure FROM _T_Temp_Measure
OPEN Measure_cursor
FETCH NEXT FROM Measure_cursor INTO @Measure
set @sql_str_Measure = ''
WHILE @@FETCH_STATUS = 0
BEGIN
set @sql_str_Measure = @sql_str_Measure + '

' + @Measure + ','
FETCH NEXT FROM Measure_cursor INTO @Measure
END
CLOSE Measure_cursor
DEALLOCATE Measure_cursor

— letztes Komma entfernen

set @sql_str_Measure = left(@sql_str_Measure, len(@sql_str_Measure)-1)

— Löschen der View, falls vorhanden

Declare @sql_str_drop varchar(100)
if exists (select * from dbo.sysobjects where name = @DestinationView)
Begin
set @sql_str_drop = 'drop view ' + @DestinationView
exec (@sql_str_drop)
End

— SQL zusammensetzen

SET @sql_str_exec =

'create view ' + @DestinationView + ' as

select' +
@sql_str_Column +
@sql_str_Measure + '
from

' + @SourceTable + '

PIVOT
(sum(' + @ValueColumnName + ') FOR ' + @MeasureColumnName + '
IN (' + @sql_str_Measure + ')) as pvt'

exec (@sql_str_exec)

Der Aufruf der Prozedur bezogen auf unser obiges Beispiel lautet:

[code lang="sql"]
exec P_BC_Create_Pivot_View
    @SourceTable = 'T_Import_Umsatz_Liste',
    @DestinationView = 'V_Import_Umsatz_Liste',
    @MeasureColumnName = 'KennzahlID',
    @ValueColumnName = 'Wert'

Als Ergebnis erhält man eine Sicht, welche das dynamisch erzeugte SQL-Statement enthält.

ALTER view [dbo].[V_Import_Umsatz_Liste] as


select
    KundeID,
    PeriodeID,
    ProduktID,
    Absatz,
    Kosten,
    Umsatz
from
    T_Import_Umsatz_Liste
PIVOT
(sum(Wert) FOR KennzahlID
IN (
    Absatz,
    Kosten,
    Umsatz)) as pvt

Die vorgestellten Scripte, inklusive der Beispieldatenbank, befinden sich auf der Blog-Seite.

Freitag, 16. Juli 2010

ETL SQL

Veranstaltungs-Tipp

On-Demand-Webinar 2. Mai 2024 Webinar: DeltaMaster ETL

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Anmeldung

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

On-Demand-Webinar 7. Mai 2024 Webinar: Berichtserstellung mit DeltaMaster

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

Anmeldung

Mit Bissantz-Lösungen können Berichtsredakteure in kürzester Zeit neue Berichte und Ad-hoc-Analysen erstellen. Wie das funktioniert, sehen Sie im Webinar!

On-Demand-Webinar 13. Mai 2024 Webinar: Reporting mit DeltaMaster

DeltaMaster-Berichte geben Signale, die unmissverständlich zeigen, wo gehandelt werden muss. Im Webinar zeigen wir Ihnen die drei leistungsfähigsten Methoden für die interaktive Ad-hoc-Analyse von [...]

Anmeldung

Über den Autor

Consulting

Die Bissantz-Consultants teilen ihr Wissen rund um Data-Warehouse-Projekte und Business-Intelligence-Lösungen – jede Woche ein neuer Beitrag. Auf die Würfel, fertig, los!

Letzte Blogartikel

Planung Vollständiges Wiederherstellungsmodell – Back-ups im Rhythmus der Planung

In diesem Beitrag soll eine spezifische Back-up-Strategie für eine DeltaMaster-Planungsumgebung beschrieben werden, die auf dem vollständigen [...]

mehr erfahren

Forschung Benutzerdefinierte Filter für Zielbericht zuweisen

Benutzerdefinierte Filter helfen im neuen Release von DeltaMaster, Verknüpfungen von Grafischen Tabellen zu Zielberichten flexibler anzulegen [...]

mehr erfahren

Bissantz News Wissen auf Abruf: das Bissantz Help Center

Viele Nutzer legen direkt in DeltaMaster und DeltaApp los und verstehen intuitiv, wie Berichte genutzt werden können. Wer lieber mit einer [...]

mehr erfahren

Forschung Steuereinnahmen der Länder

Steuereinnahmen der Länder - es war schon immer viel Fantasie im Spiel, wenn es um das Erfinden und Eintreiben von Steuern ging. Wie haben [...]

mehr erfahren

Forschung Studienanfänger und Studierende in Deutschland

Studienanfänger stehen jedes Jahr vor einer wichtigen Entscheidung: Welches der fast 300 Studienfächer entspricht den eigenen Neigungen und [...]

mehr erfahren

Data Warehousing Float – ein problematischer Datentyp

Dieser Beitrag zeigt, wie es bei relationalen Eingabeanwendungen zu Rundungsfehlern im Zusammenhang mit float kommen kann und wie man dies vermeidet [...]

mehr erfahren

Data Warehousing Reverse Engineering im Bissantz Application Designer

Dieser Beitrag stellt die neue Funktion des „Reverse Engineering“ im Bissantz Application Designer vor. Damit lassen sich bestehende relationale [...]

mehr erfahren

Forschung Neue Aggregationstypen in der DeltaApp

Der Aggregationstyp Summation ist bei hierarchischen Modellen im Bereich Business Intelligence vorherrschend: Der Gesamtumsatz ergibt sich beispielsweise [...]

mehr erfahren

Forschung Aufstiegs-BAföG in der DeltaApp

In einer sich schnell verändernden Welt ist lebenslanges Lernen unerlässlich. Mit dem Aufstiegs-BAfög werden bestimmte Fortbildungen unterstützt [...]

mehr erfahren

Bissantz News Daten- und Softwaresicherheit bei Bissantz

TISAX-Verlängerung und Penetrationstest-Zertifizierung Informationssicherheit hat bei Bissantz & Company höchste Priorität – deshalb werden [...]

mehr erfahren

Vorheriger Artikel

Kundenartikelbezeichnungen

Nächster Artikel

Datensuche in SAP-Systemen ohne ABAP Dictionary

Name	Borlabs Cookie
Anbieter	Eigentümer dieser Website, Impressum
Zweck	Zur Speicherung der Einstellungen, die Sie in der Cookie-Leiste ausgewählt haben.
Cookie Name	borlabs-cookie
Cookie Laufzeit	1 Jahr

Name	Microsoft Azure CDN
Anbieter	Microsoft Azure
Zweck	Das Cookie dient der Lastverteilung der Anfragen (Load-Balancing) durch Seitennutzer bei der Nutzung des Dienstes.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ARRAffinity,ARRAffinitySameSite
Cookie Laufzeit	Sitzung

Name	Polylang
Anbieter	Eigentümer dieser Website
Zweck	Speichert die aktuelle Sprache.
Cookie Name	pll_language
Cookie Laufzeit	1 Jahr

Name	cloud.bissantz.de
Anbieter	Bissantz
Zweck	Dieser Cookie dient der Erfassung der Position des Seitenbesuchers um eine möglichst effeziente und schnelle Zuteilung zu einem nahen Server zu ermöglichen.
Datenschutzerklärung	https://www.bissantz.de/datenschutz
Cookie Name	ASLBSA,ASLBSACORS
Cookie Laufzeit	Sitzung

Name	UserLike (verwendet den Webfont Loader und das Google-API CDN)
Anbieter	https://www.userlike.com/de/
Zweck	Notwendig zur umfassenden Information, z. B. auch für Datenschutzfragen.
Datenschutzerklärung	https://www.userlike.com/de/terms#privacy-policy
Host(s)	userlike.com
Cookie Laufzeit	365 Tage

Akzeptieren	Google Tag Manager
Name	Google Tag Manager
Anbieter	Google Ireland Limited, Gordon House, Barrow Street, Dublin 4, Ireland
Zweck	Cookie von Google zur Steuerung der erweiterten Script- und Ereignisbehandlung.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de
Cookie Name	_ga,_gat,_gid
Cookie Laufzeit	2 Jahre

Akzeptieren	Facebook Pixel
Name	Facebook Pixel
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Cookie von Facebook, das für Website-Analysen, Ad-Targeting und Anzeigenmessung verwendet wird.
Datenschutzerklärung	https://www.facebook.com/policies/cookies
Cookie Name	_fbp,act,c_user,datr,fr,m_pixel_ration,pl,presence,sb,spin,wd,xs
Cookie Laufzeit	Sitzung / 1 Jahr

Akzeptieren	Google Optimize
Name	Google Optimize
Anbieter	Google
Zweck	Das Google Website-Optimierungstool ist eine kostenlos verfügbare Software zur Durchführung von A/B- und Multivariatentests im Webdesign.
Datenschutzerklärung	https://policies.google.com/privacy?hl=de

Akzeptieren	Facebook
Name	Facebook
Anbieter	Meta Platforms Ireland Limited, 4 Grand Canal Square, Dublin 2, Ireland
Zweck	Mit der Zustimmung können z. B. unsere Beiträge direkt in Ihrem Facebook-Profil geteilt werden und Sie erlauben Facebook, Informationen über Sie zu verarbeiten, damit Ihnen personalisierter Content angezeigt werden kann.
Datenschutzerklärung	https://www.facebook.com/privacy/explanation
Host(s)	.facebook.com
Cookie Laufzeit	730 Tage

Über die Nutzung des PIVOT- und UNPIVOT-Operators

Der PIVOT-Operator

Der UNPIVOT-Operator

Einschränkungen

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Data Warehousing.