Datensee

Ein Data Lake, Datensee, dient der Speicherung großer und größter Datenmengen, wobei die Daten zuerst im Rohformat in einem Repository gespeichert werden. Datenseen eignen sich für die Big-Data-Analyse. Erst wenn die Daten in einer Anwendung eingesetzt werden, werden sie in das entsprechende Datenformat umgewandelt.

Ebenso wie Data Warehouses können in Data Lakes große Datenmengen gespeichert werden. Welches Konzept zum Einsatz kommt, ist eine Kostenfrage. Während Data Warehouses die Daten hierarchisch in Dateien und Ordnern speichern, arbeiten Data Lakes mit einer äußerst flachen Speicherarchitektur. Im Datensee werden die Daten unbearbeitet gespeichert, eindeutig gekennzeichnet und mit Metadaten versehen. Die Speicherung ist daher kostengünstiger als die in Data Warehouses. Bei der Datenanalyse und Zusammenstellung brauchen nur die Tags mit den Metadaten auf Zusammenhänge hin durchsucht werden. Die Anwender können über diverse Benutzerschnittstellen auf den Datensee zugreifen und ihre Daten zusammenstellen.

Informationen zum Artikel
Deutsch: Datensee
Englisch: data lake
Veröffentlicht: 12.03.2019
Wörter: 146
Tags: #Datenbanken
Links: Big Data Analyse, Data Lake, Data Warehouse, Datei, Datenanalytik