Transformation

Der Begriff Transformation wird hier im Kontext mit Datenstrukturen behandelt. Die Transformation ist der zentrale Teil in einer Extract, Transform, Load (ETL). Hier werden die Daten aus dem Quellsystem in die Form umgewandelt, wie sie vom Zielsystem benötigt wird. Bei der Übertragung von Daten von einem System ins ein anderes, also bei einem Datenfluss-Prozess, ist es fast immer nötig eine Transformation durchzuführen.


Im einfachsten Fall handelt es sich um eine einfache, technische Transformation, z.B. um eine Anpassung des Datentyps. Es gibt aber auch sehr komplexe, mehrstufigen Transformationen. Einige Beispiele sind:

  1. Datentypenumwandlung: Die Daten werden aus dem Datentyp des Quellsystems in den Datentyp des Zielsystems umgewandelt. Dabei kann z.B. auch eine 1 in ein "Yes" und ein 0 in ein "No" umgewandelt werden.
  2. Einfache Umformungen: Z.B. können von einem Textfeld nur die ersten 10 Zeichen weitergereicht werden.
  3. Einfache Formeln: Z.B. wird die Gewinnmarge berechnet, die im Quellsystem nicht direkt vorhanden ist, aber aus der Formel "Verkaufspreis - Deckungsbeitrag" errechnet wird.
  4. Mapping: In den Quellsystemen nicht zusammenhängende Daten werden über Mapping einander zugeordnet. Z.B. wird die geographische Position des Wohnorts eines Kunden, dem Kunden zugeordnet.
  5. Integration: Daten aus verschiedenen Quellsystemen werden miteinander abgeglichen und verknüpft, z.B. die Daten aus dem Buchhaltungssystem und dem Auftragsbearbeitungssystem.
  6. Qualitätssicherung: Daten werden auf ihre Qualität überprüft und korrigiert. Z.B: werden die manuell im Vorsystem erfassten Adressen, mit Daten aus offiziellen Adressverzeichnissen abgeglichen.
  7. Filterung: Nicht benötigte Daten werden herausgefiltert. Z.B. werden fertige Aufträge aus den Auftragsbestandsdaten herausgefiltert.
  8. Aggregation: Daten werden zusammengefasst um die Datenmenge zu reduzieren und auf die benötigte (geringere) Granularität zu bringen. Z.B: werden Detailpositionen einer Buchung auf die Hauptpositionen zusammengefasst.
  9. Verteilung: Daten werden auf Detailpositionen verteilt. Z.B. werden grobe Planzahlen auf einzelne Monate und Produkte verteilt.
  10. Relative und statistische Berechnungen: Aufgrund der Daten aus dem Quellsystem werden Vergleichswerte berechnet, z.B. der Prozentsatz der zufriedenen Kunden.
  11. KPI-Berechnungen ( Key Performance Indicator): Aus den Daten des Vorsystems werden KPI-Werte mit Soll- und Ist-Vergleichen und Zuständen ermittelt.
  12. Strukturelle Veränderung: Daten werden oft im Zielsystem in einer anderen Struktur benötigt als im Quellsystem. Z.B. werden relationale Daten in eine OLAP-Struktur überführt.

Informationen zum Artikel
Deutsch: Transformation
Englisch: transformation
Veröffentlicht: 21.12.2013
Wörter: 370
Tags: #Design
Links: Adresse, Anpassung, Daten, Datentyp, ETL (extract, transform, load)