Zones de stockage de données
Le RIDW contient trois zones de stockage de données :
Nom de table | Objet de la table |
---|---|
SYS_CONFIG | Contient des informations de configuration système, comme le type de calendrier pour la dimension de date. |
ETL_INFO | Contient des informations de configuration ETL (extraction, transformation et chargement), comme un planning ETL (quotidien, hebdomadaire ou mensuel) |
Deux colonnes de contrôle supplémentaires sont également ajoutées : ISSOFDELETED et REC_DATETIME.
Clés de substitution
Les clés de substitution sont les clés primaires créées par le processus ETL. Elles sont nécessaires pour corriger des différences entre les formats de clés primaires provenant des différentes sources. Dans toute table extraite, RIDW crée ses propres clés primaires et retient la clé d'origine dans les colonnes EXTERNAL_KEY1 ou EXTERNAL_KEY2. Les clés de substitution sont des entiers basés sur 0.
Tables de classification
Il s'agit de tables représentant des artefacts communément utilisés ; il peut s'agir de projets, de demandes, d'exigences, de tâches, d'activités et de composants. Elles sont reconnaissables par leur nom qui contient le mot "CLASSIFICATION". Toutes les tables de classification ont un type d'enregistrement prédéfini qui représente une compréhension commune de l'artefact. C'est le processus ETL qui gère la conversion de tables extraites en tables de classification.
Enregistrement factice
Toutes les tables de classification et d'artefact contiennent une ligne factice identifiable par une valeur de clé primaire de -1. Les lignes factices prennent en charge la normalisation des données en cas de valeurs NULL pour les contraintes référentielles définies.
La zone de fait et de dimension implémente une conception de schéma en étoile qui représente un ensemble de tables des faits, de dimensions et de traçabilité historique. Une table des faits contient les mesures ou 'faits' d'un processus métier particulier. Par exemple, si une gestion de projet est un processus que vous souhaitez mesurer, la table des faits correspondante pourrait très bien contenir le nombre d'exigences. Les tables de dimension contiennent des attributs permettant de contraindre et de grouper des données lors de l'exécution de requêtes de création d'entrepôts de données. Si un nombre d'exigences est une table des faits, vous pourriez alors vouloir utiliser un type d'exigence comme dimension.
Conventions de conception
Les noms des tables de dimension commencent par "D_" et disposent de clés de substitution permettant d'identifier des enregistrements. Les noms des tables des faits débutent pas "F_", tandis que des tables qui fournissent une vue historique sur des mesures trouvées dans les tables des faits débutent par "H_". La clé primaire est généralement une combinaison d'une clé de substitution de la mesure et de la clé de substitution de l'artefact ayant contribué à la mesure. Les noms de tables des faits avec "F_C_" sont équivalents à leur table des faits relatives à des tendances d'origine, sauf qu'ils ne stockent que l'instantané le plus récent des données, mais leurs homologues accumulent des données pour permettre des études de tendances au fil du temps. Le magasin de données ciblé comprend également un ensemble de vues offrant une fenêtre sur le magasin de données opérationnel ce qui permet d'obtenir davantage de détails ou de fournir des rapports de liste.
Colonnes de contrôle
Toutes les tables des faits disposent d'une colonne qui référence la dimension de date D_DATE. Pour des tables de tendance, la date qui figure dans ce contexte indique la date à laquelle l'instantané des données a été pris. Pour les autres tables des faits, la date reflète l'occurrence d'un événement comme la création d'un enregistrement. Vous pouvez référencer l'instantané des données pour indiquer une base 'par jour', 'par semaine' ou 'par mois' selon la valeur stockée dans la table SYS_CONFIG de la zone de configuration. D'autres colonnes de contrôle incluent la colonne REC_DATEIME, qui fait office de tampon d'enregistrement pour l'insertion ou la mise à jour d'un enregistrement.
Enregistrement d'indicateur de type NULL
A l'instar du magasin de données opérationnel, les tables de dimension contiennent une ligne d'indicateur de type NULL identifiable par une clé primaire de -1. Ceci représente la valeur NULL pour des tables avec contraintes.