Aspekte des physischen Entwurfs

Entwerfen Sie die physische Datenbank, nachdem Sie das Dimensionsmodell verifiziert haben. Entwickeln Sie Strategien zur Verarbeitung von Aggregation, Aggregationsnavigation, Indexierung und Partitionierung der Daten in Ihrem Dimensionsmodell.
Beim Entwerfen der physischen Datenbank erfassen Sie die folgenden Metadaten:
Wenn Sie den physischen Entwurf eines Dimensionsmodells erstellen, führen Sie die folgenden Schritte aus:
  1. Aggregationen für jede der Fakttabellen entwerfen
  2. Indizes zur Verbesserung der Leistung erstellen
  3. Tabellen im Modell partitionieren

Aggregationen entwerfen

Einfach ausgedrückt handelt es sich bei der Aggregation um den Prozess, bei dem Zusammenfassungsdaten aus Fakttabellensätzen auf Detailbasisebene berechnet werden. Aggregate stellen ein leistungsfähiges Tool dar, um die Abfrageverarbeitungsgeschwindigkeit bei dimensionalen Datamarts zu erhöhen. Die Aggregation wird vorrangig mithilfe der Attribute einer Dimension, die Teil einer Hierarchie sind, ausgeführt.

Jedes Attribut, das zu einer Hierarchie gehört, wird anderen Attributen der Hierarchie als über- oder untergeordnetes Element zugeordnet. Diese Beziehung zwischen übergeordnetem und untergeordnetem Element stellt unterschiedliche Zusammenfassungsebenen zur Verfügung. Die verschiedenen Zusammenfassungsebenen bieten dem Geschäftsbenutzer die Möglichkeit, im Bericht ein Drillup oder Drilldown durchzuführen. Stark zusammengefasste Daten werden schneller abgerufen als detaillierte Daten auf atomarer Ebene. Die Fakttabelle belegt in der Regel sehr viel Speicherplatz im Vergleich zu den zusammengefassten Daten.

Die geringste Aggregationsebene (bzw. die höchste Detailebene) wird als Basiseinheit der Fakttabelle bezeichnet. Die Granularität der Dimension wirkt sich auf den Entwurf des Datenspeichers und den Abruf der Daten aus.

Die Zusammenfassung detaillierter atomarer Fakttabellen verbessert die Abfrageleistung. Allerdings sind damit Kosten verbunden:
  • Speicher
  • Kosten zum Erstellen und Verwalten der Prozesse zur Verarbeitung der aggregierten Tabellen

Die Aggregation ist kein Ersatz für die Verkleinerung von großen, detaillierten Fakttabellen. Wenn die Daten in der Fakttabelle zusammengefasst werden, gehen die detaillierten Informationen in Form von Dimensionen und Kennzahlen oft verloren. Benötigt das Unternehmen detaillierte Daten aus einer zusammengefassten Fakttabelle, sind diese Daten nicht verfügbar. Der Benutzer muss dann die Details im OLTP-Quellensystem suchen, von dem die aggregierten Fakttabellendaten bereitgestellt wurden. Müssen vom Unternehmen die OLTP-Quellensystem zum Abrufen der Antworten verwendet werden, bewerten Sie die Notwendigkeit eines Dimensionsmodells neu.

Vermeiden Sie es, zusammengefasste Daten und detaillierte Daten zu mischen, indem Sie zusammengefasste Kennzahlen des laufenden Jahres mit den detaillierten Kennzahlen kombinieren. Die Kennzahlen des laufenden Jahres sind kumulativ. Wenn Sie die Datentypen mischen, können Rechenfehler auftreten.

Führen Sie zum Vorbereiten der Ergebnistabellen die folgenden Schritte aus:
  1. Ermitteln Sie alle Dimensionen und die zugehörigen Hierarchien aus dem atomaren Dimensionsmodell auf Basisebene. Diese Dimensionen und Hierarchien werden aus dem atomaren Dimensionsmodell auf Basisebene ermittelt.
  2. Ermitteln Sie alle möglichen Kombinationen dieser Hierarchieattribute, die vom Unternehmen zusammen für die Berichterstellung verwendet werden. Ermitteln Sie alle Attribute aus den Hierarchien, um festzustellen, welche Attribute häufig zusammen verwendet werden. Dieser Schritt ist besonders wichtig bei einer großen Anzahl von Dimensionen mit mehreren Hierarchien, die mehrere Attribute enthalten.
  3. Berechnen Sie die Anzahl der Werte eines jeden Attributs. Die Anzahl der Werte, die jedes Attribut hat, gibt an, ob das Attribut aggregiert ist. Beispiel: Wenn Sie ein Member auf niedriger Ebene einschließen, das viele Member umfasst, können Sie dieses Attribut löschen und ein Attribut auf höherer Ebene wählen, das weniger Werte aufweist.
  4. Überprüfen Sie die endgültige Gruppe der Attributkandidaten und erstellen Sie das aggregierte Dimensionsmodell.

Indizes erstellen

Sie können die Abfrageleistung durch Erstellen von Indizes verbessern. Weitere Informationen zu Indizes finden Sie unter Indizes.

Tabellen partitionieren

Wenn Sie eine Tabelle partitionieren, unterteilen Sie die Tabelle in Zeilen, Spalten oder beides. Eine in Spalten unterteilte Tabelle wird als vertikal partitioniert bezeichnet. Bei der Unterteilung in Zeilen wird sie als horizontal partitioniert bezeichnet. Die Partitionierung großer Fakttabellen führt zu einer verbesserten Leistung, weil einzelne Partitionen einfacher zu verwalten sind. Partitionieren Sie eine Tabelle auf der Basis der Transaktionsdatumsdimension in einem Dimensionsmodell. Beispiel: Wenn eine große Fakttabelle Milliarden von Zeilen enthält, wäre es von Vorteil, einen Monat Daten einer eigenen Partition zuzuweisen.

Durch die Partitionierung der Daten in einem Data-Warehouse erreichen Sie mehrere Ziele:
  • Bereitstellung eines flexiblen Zugriffs auf die Daten
  • Bereitstellung einfacher, effizienter Datenverwaltungsservices
  • Gewährleistung der Skalierbarkeit des Data-Warehouses
  • Ermöglichung der Portierbarkeit der Elemente des Data-Warehouses, sodass diese Elemente von mehreren Data-Warehouses gemeinsam genutzt oder einfach archiviert werden können
  • Verbesserung der Abfrageantwortzeiten
  • Vereinfachung der Wartung, da Partitionen leichter verwaltet werden können als große Tabellen

Feedback