Einfach ausgedrückt handelt es sich bei der Aggregation um den Prozess, bei dem Zusammenfassungsdaten aus Fakttabellensätzen auf Detailbasisebene berechnet werden. Aggregate stellen ein leistungsfähiges Tool dar, um die Abfrageverarbeitungsgeschwindigkeit bei dimensionalen Datamarts zu erhöhen. Die Aggregation wird vorrangig mithilfe der Attribute einer Dimension, die Teil einer Hierarchie sind, ausgeführt.
Jedes Attribut, das zu einer Hierarchie gehört, wird anderen Attributen der Hierarchie als über- oder untergeordnetes Element zugeordnet. Diese Beziehung zwischen übergeordnetem und untergeordnetem Element stellt unterschiedliche Zusammenfassungsebenen zur Verfügung. Die verschiedenen Zusammenfassungsebenen bieten dem Geschäftsbenutzer die Möglichkeit, im Bericht ein Drillup oder Drilldown durchzuführen. Stark zusammengefasste Daten werden schneller abgerufen als detaillierte Daten auf atomarer Ebene. Die Fakttabelle belegt in der Regel sehr viel Speicherplatz im Vergleich zu den zusammengefassten Daten.
Die geringste Aggregationsebene (bzw. die höchste Detailebene) wird als Basiseinheit der Fakttabelle bezeichnet. Die Granularität der Dimension wirkt sich auf den Entwurf des Datenspeichers und den Abruf der Daten aus.
Die Aggregation ist kein Ersatz für die Verkleinerung von großen, detaillierten Fakttabellen. Wenn die Daten in der Fakttabelle zusammengefasst werden, gehen die detaillierten Informationen in Form von Dimensionen und Kennzahlen oft verloren. Benötigt das Unternehmen detaillierte Daten aus einer zusammengefassten Fakttabelle, sind diese Daten nicht verfügbar. Der Benutzer muss dann die Details im OLTP-Quellensystem suchen, von dem die aggregierten Fakttabellendaten bereitgestellt wurden. Müssen vom Unternehmen die OLTP-Quellensystem zum Abrufen der Antworten verwendet werden, bewerten Sie die Notwendigkeit eines Dimensionsmodells neu.
Vermeiden Sie es, zusammengefasste Daten und detaillierte Daten zu mischen, indem Sie zusammengefasste Kennzahlen des laufenden Jahres mit den detaillierten Kennzahlen kombinieren. Die Kennzahlen des laufenden Jahres sind kumulativ. Wenn Sie die Datentypen mischen, können Rechenfehler auftreten.
Wenn Sie eine Tabelle partitionieren, unterteilen Sie die Tabelle in Zeilen, Spalten oder beides. Eine in Spalten unterteilte Tabelle wird als vertikal partitioniert bezeichnet. Bei der Unterteilung in Zeilen wird sie als horizontal partitioniert bezeichnet. Die Partitionierung großer Fakttabellen führt zu einer verbesserten Leistung, weil einzelne Partitionen einfacher zu verwalten sind. Partitionieren Sie eine Tabelle auf der Basis der Transaktionsdatumsdimension in einem Dimensionsmodell. Beispiel: Wenn eine große Fakttabelle Milliarden von Zeilen enthält, wäre es von Vorteil, einen Monat Daten einer eigenen Partition zuzuweisen.