| Suivant >

Leçon 1.1 : Personnaliser les données source utilisées dans les tâches ETL

Dans cette leçon, vous allez apprendre à modifier les fichiers de configuration de données XML. Le fichier de configuration de données XML contient des informations sur la source et la structure des données utilisées pour ETL et est utilisé par le pilote ODBC XML au moment de l'exécution. Dans cette leçon, vous allez ajouter de nouveaux attributs et ressources au fichier de configuration de données XML.
Conditions préalables : Avant de commencer la leçon, sauvegardez le fichier clearquest.xdc, qui se trouve généralement dans le répertoire [INSTALLDIR]/dataconfig/configs/configurations.

Pour cette leçon, vous allez utiliser le fichier clearquest.xdc comme point de départ, puis le modifier pour atteindre les objectifs de la leçon. Vous allez également ajouter une entité de composant en tant que propriété de l'enregistrement de l'incident.

Dans cette leçon, vous allez :
  • Modifier les informations de connexion du groupe de ressources pour qu'elles correspondent au serveur de services de données déployé dans votre environnement
  • Modifier la table de données d'incidents pour ajouter de nouveaux attributs et mappages de valeur
  • Ajouter une nouvelle table de données et de ressources pour le composant
  • Ajouter plusieurs projets à une catégorie de ressources
  1. Lancez la configuration de données XML.
  2. Cliquez sur Fichier > Ouvrir une configuration > clearquest.xdc. En général, le fichier se trouve dans le répertoire [INSTALLDIR]/dataconfig/config/configuration.
  3. Développez le noeud XML Data Configuration pour afficher les groupes de ressources. Cliquez deux fois sur CQEnterprise.
  4. Dans l'éditeur de groupe de ressources, modifiez l'URL de Data Services pour qu'elle corresponde à l'URL du serveur de services de données déployé dans votre environnement, puis modifiez le type d'authentification, le nom d'utilisateur et le mot de passe pour qu'ils correspondent aux paramètres d'authentification de votre serveur de service de données.
    Remarque : Un groupe de ressources doit définir une URL de base pour un ensemble de documents XML. La portée recommandée des groupes de ressources est :
    • Rational ClearQuest : URL d'accès à une base de données utilisateur
    • Rational RequisitePro : URL d'accès à un projet RequisitePro
    • Rational ClearCase : URL d'accès à un VOB ClearCase
    • Microsoft Project : URL d'accès à un fichier de projet
    • Rational QualityManager : URL racine du service RQM REST
    • Rational TestManager : URL d'accès à un projet TestManager
  5. Sauvegardez la configuration.

    Vous venez de modifier les informations de connexion du fichier clearquest.xdc pour qu'elles correspondent au serveur de services de données déployé dans votre environnement.

    Vous allez ensuite modifier la table de données d'incidents en ajoutant de nouveaux attributs et mappages de valeurs.

  6. Développez le noeud CQEnterprise > ENTDefect pour afficher les tables de données.
    Remarque : Le noeud ENTDefect représente le document XML (ressource) de tous les enregistrements d'incidents renvoyés suite à l'association de l'URL définie dans le groupe de ressources parent au chemin relatif attribué à la ressource.
  7. Cliquez deux fois sur la table de données ENTDefect.
  8. Cliquez sur l'onglet Colonnes, sélectionnez la ligne pour la colonne Priorité, puis cliquez sur le lien Mappage des valeurs situé dans le coin supérieur droit de l'éditeur.
    Remarque : A l'aide d'une mappe de valeur, vous pouvez transformer les valeurs de l'instance source en une nouvelle valeur pendant le processus d'extraction. Cette méthode est appropriée pour le processus de standardisation sur une définition commune des données issues de plusieurs sources. Par exemple, si votre société utilise les valeurs "Elevé", "Moyen" et "Bas" pour définir la priorité et que certains groupes au sein de la société utilisent P1, P2 et P3, vous pouvez définir une mappe de valeur pour standardiser cette définition.
  9. Dans la boîte de dialogue Mappage des valeurs, indiquez les valeurs ci-après :
    Clé Valeur
    P1 Elevé
    P2 Moyen
    P3 Bas
    Sauvegardez la table de données.
  10. Pour ouvrir le modèle de table de données associé, dans l'onglet Colonnes, cliquez sur le lien Modifier figurant dans le coin supérieur droit. Sélectionnez la définition des colonnes Priorité mise en évidence en rouge, sélectionnez la colonne BusinessPriority dans la section Schéma XML, puis cliquez sur Mettre à jour XPath.
    Remarque : La configuration de données XML valide automatiquement le schéma renvoyé par le service de données avec les mappages de colonnes existantes. Les mappages non valides sont mis en évidence. Dans ce cas, le schéma personnalisé contient les mêmes informations que la colonne Priorité en cours, mais dans un attribut différent. Dans cette étape, vous avez modifié l'affectation du XPath de Priorité/non valide et prêt à l'emploi en XPath BusinessPriority/valide.
  11. Dans la section Mappage des colonnes, développez le noeud racine Incident de la section Schéma XML pour afficher les attributs sous Incident

    Dans les étapes 11 à 13, vous allez créer des mappages de colonne de table à partir de la source XML. La structure arborescente située à gauche représente les noeuds enfant contenus dans le noeud extractible associé à la table de données.

  12. Cliquez avec le bouton droit de la souris sur Statut, puis cliquez sur Créer. Assurez-vous que le nom de la colonne de table est Statut et que le type SQL est Varchar. Sauvegardez le modèle de table.
  13. Dans la section Mappage des colonnes, développez le noeud racine Incident de la section Schéma XML pour afficher les attributs sous Incident.Sélectionnez le noeud Incident > Composant.
  14. Cliquez avec le bouton droit de la souris sur dbid, puis cliquez sur Créer. Assurez-vous que le nom de la colonne de table est Component_dbid et que le type SQL est Entier. Sauvegardez le modèle de table.
    Remarque : Dans le schéma Enterprise personnalisé de ce tutoriel, vous devez fournir suffisamment d'informations pour que le processus ETL crée une relation entre l'enregistrement Incident et l'enregistrement Composant. Pour ce faire, vous devez exposer l'attribut Component dbid (clé unique des enregistrements ClearQuest).
  15. Revenez à l'éditeur de la table de données ENTDefect. Lorsque vous êtes invité à effectuer la mise à jour, cliquez sur OK.
  16. Sélectionnez les deux nouvelles colonnes Statut et Component_dbid, puis cliquez sur Charger.
    Remarque : Une définition de table de données peut contenir un sous-ensemble des mappages de colonnes dans le modèle de table de données associé. La fonction Charger/Décharger vous permet de contrôler la visibilité des colonnes pour les clients ODBC.
  17. Sauvegardez la table de données.

    Vous venez d'ajouter deux nouvelles colonnes à la table de données.

    Vous pouvez ensuite définir une nouvelle table de données pour exposer les données du composant à partir de la source XML. La première étape consiste à définir une nouvelle ressource pour représenter le document XML contenant les informations sur le composant.

  18. Cliquez avec le bouton droit de la souris sur le groupe de ressources CQEnterprise, sélectionnez Nouveau > Ressource, puis sélectionnez Localiser à l'aide du service de données.
    Remarque : Si vous ne connaissez pas l'URL de la ressource, vous pouvez utiliser Localiser à l'aide du service de données pour définir la ressource.
  19. Indiquez ENTComponent comme nom et cliquez sur Suivant.
  20. Développez le noeud Base de données > RecordQueries > Requêtes > Requête et dans la section Propriétés, cochez la case href.

    Vous utilisez l'assistant pour extraire le schéma du document XML renvoyé par le niveau de groupe de ressources. Les dossiers PersonalQueries et PublicQueries contiennent les requêtes appropriées définies dans la base de données utilisateur ClearQuest. Le dossier RecordQueries contient les requêtes générées de manière dynamique du service de données ClearQuest qui vont renvoyer tous les enregistrements d'un type particulier. A l'aide de la page de l'assistant, vous pouvez vous concentrer sur tous les enregistrements possibles sans avoir à visualiser les données réelles.

  21. Sélectionnez une URL qui se termine par /Enregistrement+Requêtes/Composant. Toutes les instances du noeud sélectionné via la page de l'assistant précédente sont affichées.
    • S'il s'agit de l'emplacement de votre ressource, cela signifie que vous avez localisé la ressource du composant. Cochez la case Define the extraction properties for this resource et cliquez sur Terminer.
    • Si votre ressource est située plus bas dans le chemin de l'URL, répétez les étapes 19 à 20 pour les autres noeuds.
  22. Cliquez à l'aide du bouton droit de la souris sur la nouvelle ressource et sélectionnez Nouveau > Table de données, puis indiquez ENTComponent comme nom. Cliquez sur Suivant.
  23. Indiquez /Query/results/Component comme étant le noeud extractible. Cliquez sur Suivant.
  24. Sélectionnez Créer un modèle. Entrez un nom et une description pour la table de données et cliquez sur Suivant.

    Dans l'étape suivante, vous allez sélectionner les noeuds dans l'arborescence XML que vous souhaitez afficher en tant que colonnes de table.

  25. Sélectionnez les noeuds suivants :
    • dbid comme type SQL dont la valeur est Entier
    • Composant comme type SQL dont la valeur est VARCHAR
    Cliquez sur Terminer.

    Vous avez défini les tables de données requises dans le groupe de ressources CQEnterprise. Pour l'instant, cela s'applique à un seul projet. Vous pouvez cependant extraire des données depuis plusieurs groupes de ressources figurant dans une seule catégorie de ressources. Pour ce faire, vous devez créer des groupes de ressources pour chaque projet de la catégorie de ressources.

    Dans les étapes suivantes, vous allez créer un groupe de ressources dans la catégorie de ressources ClearQuest Enterprise. Pour cela, utilisez le groupe de ressources CQEnterprise comme point de départ.

  26. Faites glisser le groupe de ressources CQEnterprise vers la catégorie de ressources ClearQuest Enterprise.
  27. Cliquez sur Copier.
  28. Sélectionnez le groupe de ressources dupliqué et modifiez-le en changeant l'URL pour qu'elle corresponde à l'URL de services de données de la base de données utilisateur ClearQuest d'un autre projet. Reportez-vous à l'étape 4 pour des détails.
    Remarque : Pendant le processus ETL, vous pouvez charger plusieurs groupes de ressources dotés de configurations identiques en mode de traitement par lots en les organisant dans des catégories.
Dans cette leçon, vous avez :