Data Lake

Die Bezeichnung Data Lake steht für einen extrem großen Datenspeicher in dem Rohdaten in ihrer ursprünglichen Form gespeichert werden können. Und zwar unabhängig von ihrer Struktur, dem Datenformat oder der Größe. In einem Data Lake können strukturierte und unstrukturierte, codierte und uncodierte, unformatierte und nicht validierte Daten abgelegt werden. Die Datenstrukturen sind solange nicht definiert, bis sie gebraucht werden.

Während Daten in einem Data Warehouse in Dateien und Ordnern abgelegt werden, arbeitet der Data Lake mit einer flachen Hierarchie, wobei jedes einzelne Datenelement eine eindeutige Kennung besitzt und mit Metatags markiert ist. Bei Suchanfragen kann in dem Data Lake nach den relevanten Daten gesucht werden.

Informationen zum Artikel
Deutsch: Data Lake
Englisch: data lake
Veröffentlicht: 15.12.2017
Wörter: 112
Tags: #Anwendungen der Informationstechnik
Links: Data Warehouse, Datei, Datenformat, Datensee, Hierarchie