Das Lakehouse ist in MS Fabric der zentrale Datenspeicher für analytische Zwecke. In diesem Blogbeitrag möchte ich zeigen, daß die Anlage und Inbetriebnahme sehr, sehr einfach ist und keinerlei technisches Know-How braucht. MS Fabric und die darin verfügbaren Datenspeicher haben wir übrigens bereits hier und hier kurz vorgestellt.
1. Konzeptioneller Background in MS Fabric
Das Lakehouse ist der zentrale Datenspeicher für analytische Aufgaben in in OneLake und damit in MS Fabric – hier werden alle Daten für BI, KI und Datenanalyse als single-point-of-truth gesammelt. Das Lakehouse kombiniert die Vorteile eines Data Lake (offen, skalierbar, rohdatentauglich) und eines Data Warehouse (strukturierte, performante Abfragen) in einer einheitlichen Architektur. Die Daten werden im Delta- und Parquet-Format (= offene Standards) gespeichert, die gleichermaßen von Spark, SQL („SQL Endpoint“) und Power BI („Direct Lake“) gelesen werden können. Das Lakehouse steht für die Modernisierung klassischer Datawarehouse Architekturen hin zu offenen, cloud-basierten Modellen.

2. Erstes Lakehouse in MS Fabric anlegen
Als Voraussetzung brauchen wir einen Workspace mit einer aktiven MS Fabric Lizenz – die Anleitung dazu haben wir bereits hier beschrieben.

Das Lakehouse wird ganz einfach über den Button New Item in der Rubrik Store Data ausgewählt:

Danach einfach den Namen vergeben – Leerzeichen und Sonderzeichen sind leider derzeit nicht möglich:

Danach erfolgt bereits die Anlage, das dauert etwa 30 sec …

… und schon steht das fertige und natürlich noch leere Lakehouse zur Verfügung. Dabei ist bereits die Zweiteilung des Lakehouse in Tables (= strukturierte Daten) und Files (= unstrukturierte Daten) gut zu sehen:

Über den Selektor rechts oben kann die Sicht auf das Lakehouse auf den SQL analytics endpoint gewechselt werden …

… und die Objekte des Lakehouse aus einer SQL Perspektive („Datawarehouse“) betrachtet werden:

3. Objekte und Settings
Auf Workspace Ebene bildet das Lakehouse das Hauptobjekt und der SQL analytics endpoint das abhängige Objekt:

Die Settings des Lakehouse sind über das Zahnradsymbol einfach zu finden und sind derzeit auch noch recht überschaubar:

Die Settings des SQL analytics endpoint sind auf die gleiche Weise zu finden ebenfalls noch recht überschaubar:

Fazit
Das Lakehouse ist in maximal 1 Minute angelegt, es muß lediglich das Objekt „Lakehouse“ ausgewählt und ein Name vergeben werden. Manchmal bleibt die Navigation zwischen den Objekten stecken, dann muß nur kurz mal der Browser aktualisiert werden, damit wieder alles wie gehabt funktioniert.
Quellen
https://learn.microsoft.com/en-us/fabric/data-engineering/lakehouse-overview



