Etape 4 : Identification des mesures

Lors de cette étape du cycle de conception du modèle dimensionnel, vous pouvez identifier les mesures et le type des mesures incluses dans le modèle dimensionnel.

Pour plus d'informations sur les mesures, voir Mesures.

Lorsque vous définissez les mesures, vous collectez les métadonnées suivantes :
Lorsque vous identifiez les mesures du modèle dimensionnel, procédez comme suit :
  1. Identifiez les mesures correspondant au grain de la table.
  2. Identifiez les types de mesure du modèle.
  3. Si la table n'est pas une table de faits qui cumule des totaux annuels, vérifiez qu'il n'y a pas de mesures Cumul à ce jour incluses dans la table de faits.
  4. Si la table est une table de faits basée sur des événements, déterminez comment les événements doivent être traités.
  5. Prévoyez l'évolution de la table de faits.

Identification des mesures correspondant au grain

Lorsque vous concevez les mesures d'un modèle, vous pouvez identifier les mesures correspondant au grain de chaque niveau du modèle. Lorsque vous avez identifié le grain du modèle dimensionnel, vous avez identifié des mesures préliminaires. Vous pouvez identifier d'autres mesures détaillées en examinant la définition du grain. Par exemple, si vous disposez de mesures détaillées, comme le coût de chaque produit ou le coût de fabrication par produit, vous identifiez toutes les mesures restantes du modèle.

Identification des types de mesure

Identifiez les types de mesure utilisés dans le modèle dimensionnel. Chaque mesure d'une table de faits doit être associée à une règle d'agrégration (ou de dérivation) par défaut.

Identification du mode de traitement des mesures Cumul à ce jour

Les mesures Cumul à ce jour sont des valeurs numériques correspondant à un total cumulé entre le début de l'année et la date du jour. Vous devez vous assurer que ces mesures ne sont pas incluses dans une table de faits avec les articles ligne au niveau atomique.

Supposons qu'une table de faits stocke les données des ventes de l'année 2005. Les ventes de chaque mois s'ajoutent et vous additionnez les ventes réalisées pour générer les totaux cumulés à ce jour. Si vous créez un fait Cumul à ce jour, tel que Ventes_$$_cumulées_à_ce_jour et que vous demandez ce fait en août 2005, vous obtenez la somme de toutes les ventes réalisées jusqu'en août 2005.

Les créateurs de modèles dimensionnels peuvent inclure des mesures Cumul à ce jour agrégées au sein de la table de faits pour améliorer les performances et réduire la complexité lorsque ce type de requête est créé. Pour éviter la confusion, vous devez calculer ces mesures dans l'application de rapport.

Traitez les mesures Cumul à ce jour en utilisant les méthodes suivantes :
  • Applications OLAP
  • Fonctions SQL dans des vues ou des procédures mémorisées

Spécification du mode de traitement des événements

Si la table est une table de faits basée sur des événements, vous devez déterminer comment les événements sont traités.

Les tables de faits de type événement sont utilisées pour enregistrer des événements, tels que les clics effectués dans une page Web ou la présence du personnel ou des étudiants. Les événements ne donnent pas toujours lieu à des mesures. Si vous traitez des scénarios basés sur des événements dans lesquels il n'y pas de mesures, utilisez des tables de faits de type Evénement contenant des pseudo-faits ou des faits inexistants.

Prenez en compte les éléments suivants pour une table de faits basée sur des événements :
  • Les tables de faits basées sur des événements contiennent généralement des pseudo-faits ou ne contiennent aucun fait.
  • Utilisez des pseudo-faits pour effectuer les opérations de comptage.
  • Une table de faits sans faits basée sur des événements ne comporte que des clés externes et ne contient pas de faits. Utilisez les clés externes pour effectuer les opérations de comptage.

Prévision de la croissance de la table de faits

Prévoyez la taille et l'évolution de la table de faits pour déterminer comment vous pouvez adapter les performances du modèle dimensionnel.

Vous pouvez évaluer la taille et l'évolution de la table des faits en effectuant l'une des tâches suivantes :

Comprendre l'activité
Par exemple, supposons qu'un commerce de détail génère un chiffre d'affaires brut de 100 millions de dollars. Supposons également que le prix moyen d'un article est 2 dollars. Pour calculer le nombre d'articles dont vous avez besoin, divisez le chiffre d'affaires brut par le prix moyen d'un article :
100000000 / 2 = 50000000 lignes
Cinquante millions de lignes sont insérées dans le schéma en étoile pour le processus métier Ventes de détail, au niveau de ce grain.
Effectuer des calculs dans une perspective technique
Déterminez la taille des clés externes, des dimensions dégénérées et des mesures. Multipliez ces colonnes par le nombre de lignes qui peuvent être insérées en supposant que tous les produits sont vendus dans tous les magasins, tous les jours. Par exemple, dans le processus métier Ventes de détail, vous effectuez les opérations suivantes :
  1. Calculez le nombre de lignes au sein de chaque dimension :
    Dimension Période : 4 lignes
    Dimension Date : 365 lignes pour 1 an
    Dimension Produit : 100 lignes (100 produits)
    Dimension Magasin : 2 lignes (2 magasins)
    Dimension Client : 1000000 clients
    Dimension Fournisseur : 50 fournisseurs
    Dimension Employé : 10 employés
  2. Calculez le niveau de base des enregistrements de fait en multipliant le nombre de lignes de chaque dimension. Utilisez les valeurs collectées à l'étape précédente :
    4 * 365 * 100 * 2 * 1000000 * 50 * 10 = 730000000 lignes
    Remarque : Ce nombre peut être plus élevé que prévu. Il s'applique uniquement si chaque produit est vendu dans chaque magasin par chaque employé à chaque client.
  3. Calculez l'augmentation maximale de la table de faits :
    Nombre de clés externes : 8
    Nombre de dimensions dégénérées : 1
    Nombre de mesures : 8
    Supposons que la table de faits utilise 4 octets pour une colonne INTEGER et calculez la taille d'une seule ligne :
    (8 + 1 + 8) * 4 octets = 68 octets
    Calculez l'augmentation maximale des données sur une seule année pour le modèle dimensionnel :
    730000000 lignes * 68 octets = 45 Go

Commentaires en retour