(Neue) Datenspeicher für Power BI in OneLake

Zuletzt wurde die "Fabric SQL database" als weiterer Datenspeicher in MS Fabric bzw. OneLake als Preview hinzugefügt. Das wirft die Frage auf, wie dieser neue Datenspeicher insbesondere im Verhältnis zu den ebenfalls SQL basierten Datenspeicher "Warehouse" und "Power BI Datamart" zu sehen ist.

OneLake Datenspeicher in Power BI Desktop

Die verfügbaren Datenspeicher von MS Fabric werden im Get Data Dialog von Power BI Desktop in der Rubrik "Microsoft Fabric" angeboten - der neue "Fabric SQL database" Datenspeicher ist aktuell noch nicht in der Liste enhtalten:

Der Datenspeicher "Dataflows Gen1" ist in der Gruppe "Power Platform" zu finden und ist bereits mit der Erweiterung "(Legacy)" versehen:

Das "SQL Server Tabular Model" wird über den Konnektor "SQL Server Analysis Services database" verbunden.

OneLake Datenspeicher in MS Fabric

MS Fabric und die OneLake Datenspeicher haben wir bereits hier vorgestellt. Die Liste der verfügbaren Datenspeicher ist hier aktuell und enthält auch bereits die neue "Fabric SQL Database":

Der "Dataflow Gen1" wird in der Gruppe "Prepare data" angeboten, da dieser Datenspeicher über die Power BI Lizenz und nicht über MS Fabric lizenziert wird:

Charakterisierung der aktuell verfügbaren Datenspeicher für Power BI

Aktuell sind diese Datenspeicher für Power BI mit folgender Kurzcharakterisierung verfügbar:

Quelle: https://learn.microsoft.com/en-us/fabric/get-started/decision-guide-data-store, ChatGPT und eigene Recherchen
* Power BI Pro / Premium-per-User / Premium
** Abhängig von der Speicherkapazität des zugehörigen Azure Data Lake Gen 2-Kontos oder den Limits der Kapazität der Power BI Premium-Lizenz

Power BI Semantic Model

Das Power BI Semantic Model ist der Standard-Datenspeicher für Power BI Anwendungen in rein Power BI orientierten Datenarchitekturen. Der Aufbau ist sehr anwenderfreundlich und unkompliziert in Power BI Desktop (= Power Queries + Datenmodell + Reports) möglich. Der Zugriff aus Power BI Report Anwendungen erfolgt im Live Connect Modus (=keine Adaptionen des Datenmodells) oder im Direct Query Modus (= Adaptionen des Datenmodells).

Lakehouse

Das Lakehouse ist eine Kombination aus einem "Data Lake" und einem "Datawarehouse" und damit ein hoch-skalierbarer Massendatenspeicher sowohl für unstrukturierte als auch strukturierte Daten. Der Zugriff aus Power BI erfolgt primär über den "Direct Lake" Modus.

Warehouse

Das Warehouse ist ein SQL basiertes Datawarehouse und damit ein Massendatenspeicher für strukturierte Daten ("Dimensionale Modellierung"). Der Zugriff aus Power BI erfolgt primär über den Direct Lake Modus.

Eventhouse / Kusto-DB

Das Eventhouse ist eine Datenbank zur Verarbeitung von Echtzeitdaten beispielsweise in IoT-Architekturen. Der Zugriff aus Power BI erfolgt primär über den Direct Lake Modus.

Fabric SQL database (preview)

Die neue SQL database ist eine vollwertige relationale SQL Datenbank mit dem Fokus auf Schreiboperationen. Ich gehe davon aus, daß die SQL database primär als Datenspeicher für die neue Writeback Funktion verwendet werden wird.

Power BI Datamart (preview)

Der Power BI Datamart ist eine leicht konfigurierbare relationale SQL Datenbank und war offenbar gedacht als "Access Datenbank in Power BI". Die Befüllung erfolgt über Power Query (in der Cloud), das dann die entsprechenden SQL Tabellen erzeugt und aktualisiert. Zusätzlich kann die relationale Datenbank aber auch über T-SQL bearbeitet werden und relationale Views angelegt werden. Weiters wird automatisiert ein Semantisches Modell angelegt, in dem die Tabellen der relationalen Datenbank zu einem Datenmodell verknüpt werden können und die Row-Level-Security (RLS) definiert wird. Der Zugriff aus Power BI (Desktop) erfolgt wahlweise auf die relationale Datenbank (Import Mode / Direct Query for SQL) oder auf das Semantische Modell (Live Connect / Direct Query for AS).

Dataflow Gen1

Den Dataflows Gen1 werte ich als eigenständigen Datenspeicher, da die Daten in einen Azure Data Lake gespeichert werden und der Zugriff auf diese Daten über den Dataflow erfolgt.

Dataflow Gen2

Der wesentliche Unterschied zwischen Dataflows Gen1 und Gen2 ist im Wesentlichen, daß bei den Gen2 Dataflows die Ausgabe (Lakehouse, Warehouse, Eventhouse, vermutlich auch SQL database) frei konfiguriert werden kann. Ich werte den Dataflow Gen2 daher nicht als eigenständigen Datenspeicher, da der Zugriff primär auf die Zieldatenbanken des Dataflows erfolgt.

SQL Server Tabular Model (on-premise)

Das on-premise Tabular Model ist eine lokale und grundsätzlich sehr leistungsfähige Implementierung eines Semantischen Modells. Der Zugriff erfolgt im Live Connect bzw. im Direct Query for AS Modus sowohl aus Power BI Report Anwendungen in der Cloud genauso wie aus dem Power BI Report Server.

Evaluierung

Lakehouse, Warehouse und Eventhouse sind professionelle analytische Datenspeicher mit dem Fokus auf performanter (lesender) Verarbeitung von Massendaten.

Die neue Fabric SQL database ist eine professionelle relationale Datenbank mit dem Fokus auf das Beschreiben mit Daten und ist - meiner Einschätzung nach - in Verbindung mit der neu angekündigten Writeback-Funktion in Power BI zu sehen.

Der Power BI Datamart wäre eine gute Sache, wenn das Instrument nicht seit 2,5 Jahren in Preview wäre und wichtige Features wie der inkrementelle Import nicht fehlen würde. Ich sehe aber gute Chancen, daß auch der Power BI Datamart fertig entwickelt wird, damit auch die Non-Fabric Anwender einen fortgeschrittenen Datenspeicher zur Verfügung haben werden.

Beim Dataflow Gen1 bin ich - ähnlich wie beim Datamart - optimistisch, daß das Instrument trotz der "(Legacy)" Benennung für Non-Fabric Anwender erhalten bleiben wird.

Das on-premise Tabular Model hat in den letzten Jahren mit der Entwicklung des Cloud Angebots rund um MS Fabric sicherlich an Bedeutung verloren, spielt aber in on-premise Architekturen insbesondere iVm dem Power BI Report Server immer noch eine wichtige Rolle.

Quellen

Recherchen in ChatGPT

https://www.sqlbi.com/blog/marco/2024/11/23/sql-database-in-fabric/

https://learn.microsoft.com/en-us/fabric/get-started/decision-guide-data-store

https://medium.com/@uzuntasgokberk/data-mart-data-flow-gen-1-bbbaf7eabe07

https://learn.microsoft.com/de-de/fabric/data-factory/dataflows-gen2-overview

Über den Autor

Blog auf Feedly abonnieren

Kategorien

Verwandte Beiträge

Power BI Camp - Präsenztrainings in Wien und Nürnberg!

Dashboarding mit Power BI, DAX & Datenmodellierung und Power Query. Drei Einzelmodule oder als ganze Trainingswoche - für Einsteiger und Fortgeschrittene!

Termine 2022

Wien: (7./8. Februar 2022)
und 25.-28 April 2022
Nürnberg: (14./15. Februar 2022)
und 9.-12. Mai 2022

Jetzt buchen und Rabatt sichern.

Jetzt buchen!

Leave a Replay

Schreibe einen Kommentar

Kostenlos zum Newsletter anmelden

Ihre Anfrage

Schicken Sie uns Ihre Fragen und Anregungen!