Was kann ein Cube eigentlich?

In diesem Blog wurde schon viel zum Thema Cubes und den Zugriff mit Excel 2010 publiziert. Immer wieder werde ich gefragt, was denn die wichtigsten Eigenschaften eines Cubes eigentlich sind und was der Unterschied zum “normalen Excel 2010″ ist. Dies auch im Hinblick auf die steigende Bedeutung von In-Memory Technologien wie PowerPivot und dem neuen TabularModel in SQL Server 2012.

Ein Cube, auch OLAP-Würfel oder multidimensionale Datenbank genannt, ist die in der Business Intelligence am weitesten verbreitete Technologie zur Aufbereitung von quantitativen Informationen ("Measures") in einem intuitiven betriebswirtschaftlichen Datenmodell ("Dimensionen"). Die Aktualisierung erfolgt dabei häufig aus einem strukturierten Datawarehouse oder auch direkt aus den operativen Quellsystemen.

Die Daten werden dabei als Elemente des multidimensionalen Cubes angeordnet, die Dimensionen des Würfels beschreiben die Daten (Kennzahl, Verantwortlicher, Kunde, Artikel, Datenkategorie, Dateneinheit, Zeit u.v.m.) und erlauben auf einfache Weise den Zugriff. Daten können über eine oder mehrere Achsen des Würfels ausgewählt werden ("Slice and Dice", "Pivotieren"):

Cubes sind also analytische Datenbanken für (betriebswirtschaftliche) Informationen. Die systematische Evaluierung kann anhand der folgenden 6 Hauptmerkmale erfolgen. Die Ausführungen bei den einzelnen Merkmalen beziehen sich auf die führende OLAP-Technologie SQL Server 2012 Analysis Services.

1. Performant

Ein Cube ist sehr viel performanter als relationale Abfragen und natürlich auch als excel-basierte Verknüpfungen, daher wurde auch die OLAP-Technologie Anfang der 1990er Jahre entwickelt. Cubes in der sogenannten MOLAP-Technologie sind wiederum performanter als solche auf Basis ROLAP-Technologie, Regular Dimensionen performanter als Parent-Child-Dimensionen. Reportingorientierte Cube Technologien wie SQL Server sind performanter als planungsorientierte, InMemory-basierte Systeme sind performanter als festplatten-basierte Technologien.

2. Multidimensional

Ein Cube ist multidimensional, das heißt, die Daten ("Measures") können nach beliebig vielen Dimensionen wie Kennzahl, Kostenstelle, Kostenträger, Kunde, Produkt, Datenkategorie, Dateneinheit, Datum, Uhrzeit und vieles mehr ausgewertet und dabei völlig frei angeordnet werden ("pivotieren", "Slice and Dice"). Die Auswertungsflexibilität ist also maximal bei Einsatz eines Cubes, jede Dimension und jeder Teil einer Dimension (Hierarchie, Level, Element, Attribut) kann völlig frei für Berichts- und Analysezwecke angeordnet werden - und zwar ohne spezielles Datenbank Know-How.

In SQL Server stehen die sogenannte Regular Dimension und die Parent-Child-Dimensionen als Architekturkonzepte zur Verfügung.

3. Hierarchisiert

Ein Cube hierarchisiert innerhalb der Dimensionen. Das heißt, es werden Kennzahlenbäume, Kostenstellenhierarchien, Artikelbäume, Kundenstrukturen und so weiter gebildet. Die Daten des Cubes ("Measures") werden automatisch addiert über sämtliche Stufen der Dimensionshierarchien, jedes Ergebnis auf jeder Hierarchiestufe kann auf Knopfdruck (sehr performant) abgefragt werden.

Dazu kommt, daß innerhalb einer Dimension beliebig viele parallele Hierarchien geführt werden können, beispielsweise zur gleichzeitigen Auswertung nach Kalenderjahr und Wirtschaftsjahr. Zusätzlich zu den Hierarchien stehen in jeder Dimension beliebig viele Attribute zur Verfügung, um weitere Eigenschaften der Dimensionselemente für Auswertungen bereitzustellen (beispielsweise für Farbe und Verpackungsgröße eines Artikels).

Ein (Master)Cube ist darüber hinaus in seinen Hierarchien zeitvariant. Das heißt, historische Strukturen - dort wo es managementrelevant ist - werden zeitraum-genau mit Gültigkeiten abgebildet ("Historisierung", "slowly-changing-dimensions").

Eine spezielle Form der Hierarchisierung ist die zusätzliche Abbildung von Berichten in Staffelform (bspw. Gewinn- und Verlustrechnung nach HGB, mehrstufige DB-Rechnung) innerhalb einer Dimension. Dies geschieht durch Defintion von sogenannten Named Sets ("flache Listen") von Ergebniselementen aus verschiedenen Hierarchiestufen.

4. Berechnet

Ein Cube führt Berechnungen durch - und zwar systematisch über die gesamte Datenmatrix des Cubes. Dazu gehören etwa die Preis-Ermittlung in der Dateneinheit-Dimension (aus Menge und Werten) oder die Berechnung von PLAN-IST-Abweichungen in der Datenkategorie-Dimension. Komplexer sind etwa die Währungsumrechnung auf Basis von Wechselkurstabellen oder die Berechnung von Menge x Preis.

Ein Cube führt auch komplexe Berechnungen in der Zeit-Dimension ("Zeitintelligenz") durch, beispielsweise zur Ermittlung von Year-to-Date, Veränderung gegenüber der Vorperiode, Rolling-12-Month-Average, Running-Total und vieles mehr. Weiters die Berechnung von sogenannten semi-additiven Measures, beispielsweise um gleichzeitig Fluss- und Bestandsgrößen im selben Cube intelligent kombinieren zu können ("Kontointelligenz").

Bei der Verwendung der Parent-Child-Dimensionsarchitektur können sogenannte Operatoren auf jedem Dimensionselement definiert werden, damit können auch Subtraktion, Multiplikation oder Division anstelle der regulären Addition über die Hierarchiestufen ausgeführt werden. Generell bieten planungsorientierte Cube-Technologien hier noch mehr Möglichkeiten zur Definition von Berechnungen und Abhängigkeiten ("Rules") gegenüber berichtsorientierten Cube-Technologien wie SQL Server.

5. Berechtigt

Ein Cube stellt ein ausgereiftes Berechtigungssystem bereit zur selektiven Berechtigung auf Cube-, Dimensions-, Element- und Datenpunktebene auch für sehr große Benutzerzahlen. Die Vergabe der Rechte erfolgt dabei für Lese-, Schreib- und Processingrechte und kann sowohl für einzelne Benutzer oder ganze Benutzergruppen erfolgen.

6. Beschreibbar

Ein Cube ist beschreibbar, das heißt, über ein geeignetes Frontend können (Plan-)Daten direkt auf den Cube erfasst werden ("Writeback"). Nicht jede OLAP-Technologie ermöglicht ein Rückschreiben in den Cube, in SQL Server ist dies aber jedenfalls möglich.

Als Frontend für die Datenerfassung in Echtzeit bietet Microsoft Excel 2010, der BI Markt bietet hier aber zahlreiche hochentwickelte Frontends zur effektiven Verwendung von beschreibbaren (SQL Server) Cubes im Planungsprozess.

Fazit

Cubes stehen als analytische Datenspeicher in Konkurrenz mit den weiteren Backend-Technologien InMemory Modelle, Spezialdatenbankenrelationale Datenbanken und normale Excel Tabellen. Verwenden Sie die oben vorgestellten 6 Hauptmerkmale zur strukturierten Evaluierung Ihrer konkret zur Auswahl stehenden Backend-Technologien um die beste Applikation für Ihr Unternehmen zu identifizieren.

Tipp: mehr Cube-Grundlagen gibt`s auf YouTube in den Beiträgen What is OLAP? und What are Dimensions and Measures?

Power BI Camp - Präsenztrainings in Wien und Nürnberg!

DAX & Datenmodellierung, Power Query und Dashboarding mit Power BI - als einzelnes Modul oder als ganze Trainingswoche!

Nürnberg 20. bis 24. April 2020
Wien 04. bis 08. Mai 2020
Early Bird!
Share on linkedin
Share on twitter
Share on facebook

Leave a Replay

Über den Autor

Blog auf Feedly abonnieren

Kategorien

Verwandte Beiträge

Kostenlos zum Newsletter anmelden

Ihre Anfrage

Schicken Sie uns Ihre Fragen und Anregungen!