Data-Profiling

Data Profiling ist eine Qualitätsbewertung für Daten. Bei diesem Prozess werden Daten analysiert und nach ihrer Struktur, Konsistenz und Eindeutigkeit bewertet. Mit dem Data Profiling werden Datenprofile erstellt und dahingehend bewertet, ob sie sich für bestimmte Anwendungen eignen. Sie werden aufbereitet und können dann mit Metadaten in Massenspeichern gespeichert werden.

Der Prozess mit denen Datenprofile ermittelt werden sollen, vollzieht sich im mehreren Schritten: In der Integration der zu bewertenden Daten, in der anschließenden Analyse und der Bewertung der Daten. Datenprofile können durch diverse Kennwerte charakterisiert werden. So durch den Datentyp, die Beziehungen der Daten zueinander, die Abhängigkeiten untereinander oder die Häufigkeit des Auftretens.

Die mittels Data Profiling aufbereiteten Daten können mit Data Mining nach bestimmten Kriterien selektiert, ausgewertet und für entsprechende Anwendungen im Statistik-, Analyse- oder Business-Bereich eingesetzt werden. Mit dem Data Profiling geht darum festzustellen, ob sich die Daten für eine bestimmte Anwendung nutzen lassen.

Informationen zum Artikel
Deutsch: Data-Profiling
Englisch: data profiling
Veröffentlicht: 10.10.2019
Wörter: 156
Tags: Datenbanken
Links: Data Mining, Daten, Datentyp, Konsistenz, Massenspeicher