Zuletzt wurde die "Fabric SQL database" als weiterer Datenspeicher in MS Fabric bzw. OneLake als Preview hinzugefügt. Das wirft die Frage auf, wie dieser neue Datenspeicher insbesondere im Verhältnis zu den ebenfalls SQL basierten Datenspeicher "Warehouse" und "Power BI Datamart" zu sehen ist.
OneLake Datenspeicher in Power BI Desktop
Die verfügbaren Datenspeicher von MS Fabric werden im Get Data Dialog von Power BI Desktop in der Rubrik "Microsoft Fabric" angeboten - der neue "Fabric SQL database" Datenspeicher ist aktuell noch nicht in der Liste enhtalten:
Der Datenspeicher "Dataflows Gen1" ist in der Gruppe "Power Platform" zu finden und ist bereits mit der Erweiterung "(Legacy)" versehen:
Das "SQL Server Tabular Model" wird über den Konnektor "SQL Server Analysis Services database" verbunden.
OneLake Datenspeicher in MS Fabric
MS Fabric und die OneLake Datenspeicher haben wir bereits hier vorgestellt. Die Liste der verfügbaren Datenspeicher ist hier aktuell und enthält auch bereits die neue "Fabric SQL Database":
Der "Dataflow Gen1" wird in der Gruppe "Prepare data" angeboten, da dieser Datenspeicher über die Power BI Lizenz und nicht über MS Fabric lizenziert wird:
Charakterisierung der aktuell verfügbaren Datenspeicher für Power BI
Aktuell sind diese Datenspeicher für Power BI mit folgender Kurzcharakterisierung verfügbar:
Power BI Semantic Model
Das Power BI Semantic Model ist der Standard-Datenspeicher für Power BI Anwendungen in rein Power BI orientierten Datenarchitekturen. Der Aufbau ist sehr anwenderfreundlich und unkompliziert in Power BI Desktop (= Power Queries + Datenmodell + Reports) möglich. Der Zugriff aus Power BI Report Anwendungen erfolgt im Live Connect Modus (=keine Adaptionen des Datenmodells) oder im Direct Query Modus (= Adaptionen des Datenmodells).
Lakehouse
Das Lakehouse ist eine Kombination aus einem "Data Lake" und einem "Datawarehouse" und damit ein hoch-skalierbarer Massendatenspeicher sowohl für unstrukturierte als auch strukturierte Daten. Der Zugriff aus Power BI erfolgt primär über den "Direct Lake" Modus.
Warehouse
Das Warehouse ist ein SQL basiertes Datawarehouse und damit ein Massendatenspeicher für strukturierte Daten ("Dimensionale Modellierung"). Der Zugriff aus Power BI erfolgt primär über den Direct Lake Modus.
Eventhouse / Kusto-DB
Das Eventhouse ist eine Datenbank zur Verarbeitung von Echtzeitdaten beispielsweise in IoT-Architekturen. Der Zugriff aus Power BI erfolgt primär über den Direct Lake Modus.
Fabric SQL database (preview)
Die neue SQL database ist eine vollwertige relationale SQL Datenbank mit dem Fokus auf Schreiboperationen. Ich gehe davon aus, daß die SQL database primär als Datenspeicher für die neue Writeback Funktion verwendet werden wird.
Power BI Datamart (preview)
Der Power BI Datamart ist eine leicht konfigurierbare relationale SQL Datenbank und war offenbar gedacht als "Access Datenbank in Power BI". Die Befüllung erfolgt über Power Query (in der Cloud), das dann die entsprechenden SQL Tabellen erzeugt und aktualisiert. Zusätzlich kann die relationale Datenbank aber auch über T-SQL bearbeitet werden und relationale Views angelegt werden. Weiters wird automatisiert ein Semantisches Modell angelegt, in dem die Tabellen der relationalen Datenbank zu einem Datenmodell verknüpt werden können und die Row-Level-Security (RLS) definiert wird. Der Zugriff aus Power BI (Desktop) erfolgt wahlweise auf die relationale Datenbank (Import Mode / Direct Query for SQL) oder auf das Semantische Modell (Live Connect / Direct Query for AS).
Dataflow Gen1
Den Dataflows Gen1 werte ich als eigenständigen Datenspeicher, da die Daten in einen Azure Data Lake gespeichert werden und der Zugriff auf diese Daten über den Dataflow erfolgt.
Dataflow Gen2
Der wesentliche Unterschied zwischen Dataflows Gen1 und Gen2 ist im Wesentlichen, daß bei den Gen2 Dataflows die Ausgabe (Lakehouse, Warehouse, Eventhouse, vermutlich auch SQL database) frei konfiguriert werden kann. Ich werte den Dataflow Gen2 daher nicht als eigenständigen Datenspeicher, da der Zugriff primär auf die Zieldatenbanken des Dataflows erfolgt.
SQL Server Tabular Model (on-premise)
Das on-premise Tabular Model ist eine lokale und grundsätzlich sehr leistungsfähige Implementierung eines Semantischen Modells. Der Zugriff erfolgt im Live Connect bzw. im Direct Query for AS Modus sowohl aus Power BI Report Anwendungen in der Cloud genauso wie aus dem Power BI Report Server.
Evaluierung
Lakehouse, Warehouse und Eventhouse sind professionelle analytische Datenspeicher mit dem Fokus auf performanter (lesender) Verarbeitung von Massendaten.
Die neue Fabric SQL database ist eine professionelle relationale Datenbank mit dem Fokus auf das Beschreiben mit Daten und ist - meiner Einschätzung nach - in Verbindung mit der neu angekündigten Writeback-Funktion in Power BI zu sehen.
Der Power BI Datamart wäre eine gute Sache, wenn das Instrument nicht seit 2,5 Jahren in Preview wäre und wichtige Features wie der inkrementelle Import nicht fehlen würde. Ich sehe aber gute Chancen, daß auch der Power BI Datamart fertig entwickelt wird, damit auch die Non-Fabric Anwender einen fortgeschrittenen Datenspeicher zur Verfügung haben werden.
Beim Dataflow Gen1 bin ich - ähnlich wie beim Datamart - optimistisch, daß das Instrument trotz der "(Legacy)" Benennung für Non-Fabric Anwender erhalten bleiben wird.
Das on-premise Tabular Model hat in den letzten Jahren mit der Entwicklung des Cloud Angebots rund um MS Fabric sicherlich an Bedeutung verloren, spielt aber in on-premise Architekturen insbesondere iVm dem Power BI Report Server immer noch eine wichtige Rolle.
Quellen
Recherchen in ChatGPT
https://www.sqlbi.com/blog/marco/2024/11/23/sql-database-in-fabric/
https://learn.microsoft.com/en-us/fabric/get-started/decision-guide-data-store
https://medium.com/@uzuntasgokberk/data-mart-data-flow-gen-1-bbbaf7eabe07
https://learn.microsoft.com/de-de/fabric/data-factory/dataflows-gen2-overview