ETL (extract, transform, load)

Unter einem ETL-Prozess versteht man den Datenflussprozess in ein Data Warehouse oder ein verwandtes System. Bei diesem Prozess werden Daten aus den Quellsystemen extrahiert, umgewandelt, integriert und in das Zielsystem geschrieben.

Der ETL-Prozess (Extract, Transform, Load) kennzeichnet die drei klassischen Schritte zu Befüllung eines Data Warehouses:

  1. Extraktion: Die Daten werden aus einem oder mehreren Quellsystemen in das ETL-System geladen.

  2. ETL-Prozess: 
   Extraktion, Transformation, Ladung

    ETL-Prozess: Extraktion, Transformation, Ladung

  3. Transformation: Die Daten werden im ETL-System umgewandelt. Dabei kann es sich sowohl um technische Umwandlungen wie beispielsweise der Änderung der Datentypen, aber auch um fachliche Umwandlungen wie z.B. von Berechnungen und Aggregationen, handeln.

  4. Load: Die Daten werden aus dem ETL-System ins Data Warehouse geladen.
In modernen ETL-Prozessen unterscheidet man noch weitere Aufgaben, die in einem ETL-Prozess wahrgenommen werden:

1. Data Cleansing (Datenbereinigung)

2. Qualitätsicherung

3. Historisierung

4. Vor-Aggregation

5. Cube- und Datamart-Generierung

6. Stammdaten-Management

7. Benachrichtigung per E-Mail, usw.

8. Logging und Änderungsverfolgung.

Informationen zum Artikel
Deutsch: Extraktion-Transformation-Lade-Prozess
Englisch: extract, transform, load - ETL
Veröffentlicht: 18.08.2017
Wörter: 142
Tags: #Management
Links: Aggregation, Data Warehouse, Datenflussprozess, Datentyp, E-mail (electronic mail)