Data Lakes

Ich habe eben zum ersten Mal seit mehreren Jahren wieder die Microsoft-Entwicklungsumgebung Visual Studio auf einem Rechner installiert (2017 Community Edition) und festgestellt, dass es etwas gibt, das sich "Data Lake nennt". Ja richtig, Datensee. Wollte ich einfach mal eben mitteilen, danke für eure Aufmerksamkeit.



Also von der Existenz von Data Lakes habe ich nicht im Zuge der Installation der IDE erfahren, sondern als ich mich danach durch die Visual Studio Oberfläche klickte um zu sehen was sich offensichtlich auf den ersten Blick verändert hat, seitdem ich das Ding das letze Mal produktiv genutzt habe (auf den ersten Blick nicht allzuviel.) Anscheinend handelt es sich bei einem solchen Datensee um einen Datenspeicherplatz, auf dem Daten in ihrem "natürlichen Format" gespeichert sind - also gerne Blobs oder Dateien. Ein Data Lake kann auch strukturierte Daten aus relationalen Datenbanken (also quasi in Spalten und Zeilen), halbstrukturierte Daten, oder in binärer Form vorliegende Daten enthalten. Binäre Daten wären zum Beispiel Bilddateien, Videos, oder Audio-Dateien, und semistrukturierte Daten etwa Formate wie JSON, XML, oder auch CSV-Dateien und Logfiles.