Echantillon de catalogue pour le processus ETL (extraction, transformation et chargement)

Pour extraire des données d'une source de données, vous devez connaître la structure des données, créer un catalogue ETL (extraction, transformation et chargement) qui reproduit cette structure dans IBM® Cognos Data Manager, puis configurer le processus requis pour transformer les données en schéma en étoile ou au format de métadonnées requis par le magasin de données ciblé ou IBM Cognos Framework Manager. Afin de simplifier le processus, IBM Rational Insight dispose d'échantillons de catalogues permettant d'extraire des données des services de données, de charger les données dans le magasin de données opérationnel de IBM Rational Insight data warehouse, et de générer les magasins de données ciblés conformés. Cette section présente l'échantillon de catalogue.

Un catalogue IBM Cognos Data Manager est un référentiel central qui décrit la façon dont des informations seront extraites, transformées et chargées à partir de sources externes. D'une manière générale, un catalogue Data Manager décrit :

L'échantillon de catalogue de Rational Insight facilite l'extraction, la transformation et le chargement de données issues des produits suivants :

Ces échantillons de catalogues contiennent des flux de travaux et des générations prédéfinis qui mappent des données extraites de ces sources dans les tables correspondantes et transforment ces tables en faits et dimensions. Tous les échantillons de catalogue contiennent des bibliothèques, des générations et des métadonnées prédéfinis.

Exemple

Considérons la génération d'un échantillon ETL utilisé conjointement avec RequisitePro pour extraire des données de gestion des exigences. La génération charge des données à partir des sources en procédant comme suit :
  • Tous les types d'exigence dans la table REQUIREMENT du magasin de données opérationnel
  • Informations des types d'exigence dans la table REQUIREMENT_CLASSIFICATION
  • Données de révision des exigences dans la table REQUIREMENT_REVISION_HISTORY
  • Relation parent-enfant des exigences dans la table REQUIREMENT_REQUIREMENT_LOOKUP
  • Données de traçabilité des exigences dans la table REQUIREMENT_HIERARCHY
  • Données des projets dans la table PROJECT
  • Données utilisateurs dans RESOURCE
Le modèle d'échantillon ETL associé à IBM Rational RequisitePro contient également des flux de travaux prédéfinis ETL qui organisent des travaux dans une catégorie prédéfinie. Un flux de travail est défini pour chacune des sources de données externes. Tous les flux de travaux peuvent être planifiés indépendamment des autres.
Le travail OOTBE2E est le travail de niveau supérieur qui définit le flux global. Il exécute des travaux de chargement de données dans des tables correspondantes à partir des différentes sources de données opérationnelles externes, puis exécute le travail de génération du magasin de données ciblé dans l'entrepôt de données. Le travail Build_Star remplit le magasin de données ciblé. Il procède comme suit :
  • Démarre le travail Dimensions pour remplir les tables de dimension
  • Démarre Facts pour remplir les tables des faits
  • Démarre HistoricalLookups pour remplir les tables de consultation historiques.
Vous pouvez personnaliser ces générations et flux de travaux en fonction de votre situation métier spécifique et de l'implémentation de ces produits.