Datensee

Ein Data Lake, Datensee, dient der Speicherung großer und größter Datenmengen, wobei die Daten zuerst im Rohformat in einem Repository gespeichert werden. Datenseen eignen sich für die Big-Data-Analyse. Erst wenn die Daten in einer Anwendung eingesetzt werden, werden sie in das entsprechende Datenformat umgewandelt.


Ebenso wie Data Warehouses können in Data Lakes große Datenmengen gespeichert werden. Welches Konzept zum Einsatz kommt, ist eine Kostenfrage. Während Data Warehouses die Daten hierarchisch in Dateien und Ordnern speichern, arbeiten Data Lakes mit einer äußerst flachen Speicherarchitektur. In einem Data Lake können strukturierte und unstrukturierte, codierte und uncodierte, unformatierte und nicht validierte Daten abgelegt werden. Die Datenstrukturen sind solange nicht definiert, bis sie gebraucht werden.

Im Datensee werden die Daten unbearbeitet gespeichert, eindeutig gekennzeichnet und mit Metadaten versehen. Die Speicherung ist daher kostengünstiger als die in Data Warehouses, in dem die Daten in Dateien und Ordnern abgelegt werden. Bei der Datenanalyse und Zusammenstellung brauchen nur die Tags mit den Metadaten auf Zusammenhänge hin durchsucht werden. Die Anwender können über diverse Benutzerschnittstellen auf den Datensee zugreifen und ihre Daten zusammenstellen.

Informationen zum Artikel
Deutsch: Datensee
Englisch: data lake
Veröffentlicht: 17.04.2019
Wörter: 185
Tags: #Datenbanken
Links: Big Data Analyse, Data Warehouse, Datei, Daten, Datenanalytik