Maîtrise de données

Les entreprises utilisent souvent plusieurs outils pour gérer les informations des projets. La maîtrise de données consiste au mappage de nombreux projets disparates en une même entité commune. L'échantillon de catalogue définit une infrastructure préfabriquée permettant de simplifier l'implémentation ETL pour la maîtrise de données.
Si vous utilisez RequisitePro pour gérer des exigences, ClearQuest pour gérer des demandes de changement et ClearCase pour gérer un code source, vous pouvez mapper le projet RequisitePro. Voici quelques exemples de maîtrise de données :

Implémentation de la maîtrise de données via des fichiers XML data configuration

Les tables de mappage de dimensions permettent de définir les règles de mappage des dimensions d'une source de données à une autre. Il existe deux types de tables de mappage de dimensions : Les tables de mappage de dimensions peuvent être regroupées dans des catégories de mappage de dimensions. Si vous utilisez vos catégories de groupe de ressources pour regrouper des sources de données ayant la même structure de données, vous pouvez également utiliser une catégorie de mappage de dimensions pour regrouper des tables de mappage de dimensions définies pour la même dimension commune. Les travaux ETL peuvent interroger les tables de mappage de dimensions associées à la catégorie et charger toutes les informations de mappage automatiquement.

Lors de la définition des mappages dans des fichiers XML data configuration, vos interrogez des informations du pilote ODBC XML. La table système System.DIMENSIONMAPPINGS permet d'interroger des informations sur les tables de mappage de dimensions disponibles. Toutes les tables de mappage des dimensions sont sous le schéma DimensionMappings. La structure est identique pour toutes les tables, c'est-à-dire une valeur_source et une valeur_cible. Vous pouvez les utiliser pour interroger les mappages de valeurs.

Implémentation d'une maîtrise de données dans le processus ETL

Dans les artefacts d'entrepôt de données relatifs à la dimension commune, seuls les artefacts ayant un comportement de maître (cible du mappage) ou les artefacts n'ayant pas été mappés à d'autres artefacts apparaissent dans le magasin de données opérationnel. D'autres artefacts associés à la dimension commune sont directement liés à l'artefact cible de l'artefact d'origine. Par exemple, si un projet de gestion unifiée des changements (UCM) RI est mappé à un projet ClearQuest Insight, seul le projet ClearQuest Insight apparaît dans la table PROJECT, et les activités gestion unifiée des changements (UCM) qui appartiennent au projet UCM RI seront directement liées au projet ClearQuest Insight dans l'entrepôt de données. Pour chacune des dimensions communes, y compris PROJECT, RELEASE, ITERATION, PRODUCT, COMPONENT et RESOURCE, des tables de mappage de transfert dont les noms sont préfixés par M_ sont créées comme des tables utilisées dans ETL pour stocker la relation de mappage.

Le flot de données ETL permettant de générer une maîtrise de données consiste au :

Une maîtrise de données implique plusieurs sources de données. En conséquence, le travail ETL doit refléter le flot de données global. L'implémentation ci-dessus relative à la maîtrise de données est spécifique du processus ETL et n'a pas d'impact sur d'autres composants. Dans l'échantillon de catalogue, un projet TestManager est mappé à un projet ALM ClearQuest, et des utilisateurs TestManager sont mappés à des utilisateurs ALM ClearQuest avec le même nom. Si lors de l'ouverture du fichier XML data configuration pour l'ETL TestManager vous constatez des erreurs, mettez à jour les tables de mappage des dimensions pour pointer sur le fichier XML data configuration utilisé pour l'ETL ClearQuest dans votre système.