Update, Insert oder doch Merge? (Teil 1)

In diesem Blogbeitrag beschäftigen wir uns mit dem eher wenig bekannteren T-SQL Befehl “MERGE”, der bisher selten aktiv benutzt wird. Dabei gehört er schon seit SQL Server 2008 zum Standard.

Was macht nun der Befehl MERGE?

Laut Microsoft:

“Führt Einfüge-, Aktualisierungs- oder Löschvorgänge in einer Zieltabelle anhand der Ergebnisse eines Joins mit einer Quelltabelle aus. Sie können z. B. zwei Tabellen synchronisieren, indem Sie Zeilen in einer Tabelle anhand von Unterschieden, die in der anderen Tabelle gefunden wurden, einfügen, aktualisieren oder löschen.”

Das heißt kurz und bündig: UPDATE + INSERT = UPSERT = MERGE

Somit ist er perfekt geeignet für Ladeprozesse von Dimensionen in Data Warehouse bzw. BI Projekten. Genau dort benötigen wir ja sowohl ein INSERT als auch ein UPDATE für die Elemente der Dimensionen.

Wie wird MERGE angewendet?

Möglicherweise kommt es auf den ersten Blick ein wenig unübersichtlich vor:

MERGE
USING
ON
WHEN MATCHED THEN 
WHEN NOT MATCHED THEN ;

Wie liest man den Befehl MERGE?

Direkt nach dem MERGE folgt das “Ziel”, also die Tabelle, die wir synchronisieren wollen. Nachdem USING benutzt man die “Quelle”, die die Inhalte liefert. Z. B. die täglich zu liefernde Dimensionstabelle. Über das ON werden diese beiden verbunden (join). Für alle durch den join gefundenen Datensätze wird meist ein UPDATE ausgeführt. Dies passiert nach WHEN MATCHED THEN. Bei WHEN NOT MATCHED folgt die Aktion, wenn die Bedingung nicht erfüllt wurde. Meistens also ein INSERT.

Stellen wir uns also die Kundendimension mit zwei Attributen vor:

MERGE T_Dim_Kunde as kd
USING TMV_Import_Kunde as tmv
ON kd.KundeID = tmv.KundeID
WHEN MATCHED THEN
update set kd.KundeName = tmv.KundeName, kd.KundeVorname = tmv.KundeVorname
WHEN NOT MATCHED THEN
insert (KundeID, KundeName, KundeVorname)
values (tmv.KundeID, tmv.KundeName, tmv.KundeVorname);

Somit scheint es dann doch nicht so kompliziert zu sein. Allerdings kann dieser Befehl noch optimiert werden. Denn im Moment wird immer ein UPDATE ausgeführt, wenn “KundeID” gefunden wird. Es wäre jedoch sinnvoll diesen UPDATE nur dann zu aktivieren, wenn sich etwas an den Attributen geändert hat.
Wir brauchen sozusagen eine Zweiteilung der Bedingung, also wenn KundeID gleich ist und die Attribute ungleich sind. MERGE unterstützt dies, indem man das “WHEN MATCHED” erweitert.

MERGE T_Dim_Kunde as kd
USING TMV_Import_Kunde as tmv
ON kd.KundeID = tmv.KundeID
WHEN MATCHED
AND (kd.KundeName <> tmv.KundeName or kd.KundeVorname <> tmv.KundeVorname)
THEN
update set kd.KundeName = tmv.KundeName, kd.KundeVorname = tmv.KundeVorname
WHEN NOT MATCHED THEN
insert (KundeID, KundeName, KundeVorname)
values (tmv.KundeID, tmv. KundeName, tmv. KundeVorname);

Somit wird für eine deutliche Optimierung gesorgt. Im nächsten Blogbeitrag werden wir das Verhalten von MERGE bezüglich Historisierung von Attributen untersuchen.

Freitag, 23. Dezember 2011

ETL SQL

Veranstaltungs-Tipp

On-Demand-Webinar 1. Juli 2025 Webinar: Planung mit DeltaMaster

DeltaMaster ermöglicht die effektive Erfassung und Verarbeitung von Planzahlen mit unterschiedlichen Planungsansätzen, Simulationen, Planungshorizonten und Analyse-Funktionen. Sehen Sie selbst!

Anmeldung

DeltaMaster ermöglicht die effektive Erfassung und Verarbeitung von Planzahlen mit unterschiedlichen Planungsansätzen, Simulationen, Planungshorizonten und Analyse-Funktionen. Sehen Sie selbst!

Meet the Experts 9. Juli 2025 Webinar: Selfservice mit DeltaMaster und Microsoft Excel

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar [...]

Anmeldung

Mit Selfservice-BI lassen sich Managementinformationen ergänzen, z. B. aus Excel- oder Access-Dateien. Wie auf Basis einer Excel-Tabelle eine DeltaMaster-Anwendung entsteht, sehen Sie im Webinar.

Meet the Experts 15. Juli 2025 Webinar: DeltaMaster ETL

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Anmeldung

Mit DeltaMaster ETL genügt ein Knopfdruck, um ein relationales Modell und die darauf aufbauende OLAP-Datenbank in Microsoft SQL Server Analysis Services zu erzeugen. Sehen Sie selbst!

Über den Autor

Consulting

Die Bissantz-Consultants teilen ihr Wissen rund um Data-Warehouse-Projekte und Business-Intelligence-Lösungen – jede Woche ein neuer Beitrag. Auf die Würfel, fertig, los!

Letzte Blogartikel

Forschung Bundesliga-Tabelle 2024/25

Die Bundesliga-Tabelle nach Abschluss der Saison 2024/25 zeigt das altvertraute Bild: Der FC Bayern München liegt vorn! Was steckt wirklich [...]

mehr erfahren

Forschung Bevölkerungsbestand in Nürnberg

Den Bevölkerungsbestand einer Stadt können wir aus verschiedenen Blickwinkeln analysieren. Häufig variieren in den Stadtteilen Altersverteilung [...]

mehr erfahren

Forschung Kaltmieten in Deutschland

Kaltmieten bzw. Mieten im Allgemeinen sind in den letzten Jahren stetig gestiegen und stellen für viele Mieter den größten Posten der monatlichen [...]

mehr erfahren

Data Warehousing Unternehmensplanung und -konsolidierung auf Basis der Bissantz ERP Solutions

Dieser Beitrag erläutert, wie sich Prozesse der integrierten Unternehmensplanung und der Unternehmenskonsolidierung strukturiert gestalten [...]

mehr erfahren

Forschung Achsenelemente als Filter an Zielbericht zuweisen

Achsenelemente können mit dem neuesten Release von DeltaMaster in ihrer Gesamtheit als Filter an einen Zielbericht zugewiesen werden. Wir erklären [...]

mehr erfahren

Forschung Leistungsausgaben der gesetzlichen Krankenversicherung

Die Leistungsausgaben der gesetzlichen Krankenkassen steigen von Jahr zu Jahr. Als Folge haben im Januar 2025 etliche Krankenkassen erneut die [...]

mehr erfahren

Data Warehousing Partitionierung von Bewegungsdaten

Die Aktualisierung von Bewegungsdaten nimmt während der täglichen Aufbereitung einer SQL-Datenbank in der Regel den Großteil der benötigten [...]

mehr erfahren

Forschung Analyse von Verteilungen

Die Beschreibung von Verteilungen geht oft über die Angabe von Mittelwert und Standardabweichung hinaus. Wir erläutern, was sich bei den hierfür [...]

mehr erfahren

Data Warehousing Arbeitstagkalender

Zur Berechnung von Kennzahlen, die von der genauen Anzahl der Arbeitstage abhängen, ist es notwendig, diese im Modell korrekt abzubilden. Die [...]

mehr erfahren

Forschung Personenverkehr mit Bussen und Bahnen in der DeltaApp

Für den Personenverkehr spielen Busse und Bahnen eine wichtige Rolle. Das Statistische Bundesamt stellt hierzu interessante Daten zur Verfügung [...]

mehr erfahren

Vorheriger Artikel

Für Präsentationszwecke: Daten kräftig durchmischen

Nächster Artikel

MDX Profiler

Update, Insert oder doch Merge? (Teil 1)

Veranstaltungs-Tipp

Über den Autor

Schlagwörter

Letzte Blogartikel

Mehr aus Data Warehousing.

Nicolas Bissantz

Diagramme im Management