En esta lección, aprenderá a personalizar una compilación de Data Manager existente para extraer, transformar y cargar datos en el depósito de datos.
Requisitos previos:- Ha completado la lección 1.1.
- Ha creado una base de datos vacía para el catálogo de ETL.
En esta lección, modificará la compilación de Data Manager para que los atributos de una tabla de datos bajen la secuencia de datos y entren en el proceso de recopilación de datos. Aprenderá a personalizar una compilación existente para extraer atributos nuevos, transformarlos y entregarlos al depósito de datos.
- Inicie IBM Cognos Data Manager.
- Seleccione Crear un catálogo nuevo, especifique el nombre para que sea VegaETL, introduzca la información de la conexión de la base de datos que creó antes de empezar esta lección y pulse Finalizar.
- Cuando el catálogo nuevo se abra, pulse , y seleccione el archivo OOTBDMCatalog.ctg. La ubicación predeterminada de este archivo es el directorio INSTALLDIR/datamgr/vega_catalog/.
- Expanda la carpeta . Pulse CQ_ENT_Defect.
Nota: En el Data Manager, la extracción, transformación y carga está especificada en compilaciones de hechos o de dimensiones. Una compilación de hechos suministra datos de hechos y también puede suministrar datos de dimensión, de modo que puede construir una despensa de datos privados desde una sola compilación. Una compilación de dimensiones suministra datos para describir una única dimensión empresarial, como un producto o un cliente. Rational Insight utiliza compilaciones de hechos para cargar datos en el almacén de datos operativos agrupado. Las compilaciones de hechos y de dimensiones se utilizan para compilar las despensas de datos o los esquemas de estrella.
Las compilaciones se organizan en secuencias de trabajos como series de pasos que se pueden ejecutar secuencialmente o en paralelo en el Data Manager.
- Efectúe una doble pulsación sobre el icono de origen de datos Vega_Stg.
Pulse el separador Consulta.
Nota: Mediante el elemento de origen de datos de la compilación, puede seleccionar un subconjunto de la base de datos necesaria para la compilación.
En la lección 1.1, modificó la entidad predeterminada de ClearQuest para exponer el id de componente relacionado y los atributos de estado. En los próximos pasos, modificará la consulta de origen de datos para incluir los atributos.
- Expanda el nodo ClearQuest para listar los esquemas de base de datos (modelados como grupos de recursos en XDC). Expanda el esquema CQEnterprise para listar todas las tablas de datos definidas en el grupo de recursos de CQEnterprise del archivo de configuración XDC de la lección 1.1. Expanda la tabla ENTDefect para mostrar todas las columnas definidas.
Ahora modificará el SQL existente para recuperar las columnas component_dbid y de estado. Asegúrese de que añade una coma para separar los nombres de las columnas.
- Arrastre las columnas ENTDefect, Estado y Component_dbid desde el panel situado a la izquierda al panel Consulta SQL, a la derecha. Coloque las columnas nuevas después de la entrada "href" ya existente. Asegúrese de que de que las columnas están separadas por una coma.
- Para probar la nueva sentencia SQL, pulse el botón de play en la parte inferior izquierda de la ventana. En el diálogo para especificar las variables, escriba el nombre del esquema (CQEnterprise) para la entrada $RESOURCEGROUP. Deje el campo $MODIFIED_SINCE vacío para que el servicio de datos pueda utilizar el valor vacío para devolver todos los registros.
- Pulse el separador Columnas de resultado y pulse Renovar.
En el diálogo para especificar las variables, escriba el nombre del esquema (CQEnterprise) para la entrada $RESOURCEGROUP. Deje el campo $MODIFIED_SINCE vacío para que el servicio de datos pueda utilizar el valor vacío para devolver todos los registros. Las columnas definidas en este separador son las columnas resultantes del SQL definido en el paso 7. Estas columnas se utilizarán en objetos en sentido descendente. Pulse Aceptar.
- Pulse con el botón derecho del ratón sobre Secuencia de datos y seleccione Propiedades.
En el separador Elementos de la Secuencia de datos, efectúe una doble pulsación sobre las columnas nuevas en el panel de la izquierda para añadirlas a la secuencia de datos y pulse Aceptar.
Nota: Un objeto de la secuencia de datos reúne todos los orígenes de datos desde los cuales una compilación o una estructura de referencia adquiere los datos. Esto proporciona un método para combinar diferentes orígenes de datos en un objeto. Se puede ver un ejemplo en las compilaciones de RequisitePro.
- Pulse el botón derecho del ratón sobre el icono Modelo de transformación y abra el diálogo de correlación.
Nota: El modelo de transformación es central para una compilación de hechos. Se utiliza para manipular los orígenes de datos adquiridos de varias maneras, como fusionando datos de diferentes orígenes y agregándolos. En esta lección, cargará los atributos nuevos sin aplicar reglas empresariales.
- Efectúe una doble pulsación en la secuencia de datos Estado.
Ha añadido una columna nueva al catálogo y ha actualizado el modelo de transformación para reflejar este cambio.
A continuación, transformará el atributo component_dbid en la clave sucedánea del componente en el depósito de datos.
- Pulse Añadir, pulse Dimensión, especifique el nombre Lookup_Component, y seleccione el nodo hijo (sin referencia). Pulse el botón a la derecha de este nodo.
- Seleccione el nodo y pulse Aceptar.
- Vuelva al recuadro de diálogo de correlación. En el panel de la izquierda, seleccione el elemento de la secuencia de datos Component_dbid y en el panel de la derecha, seleccione el atributo Lookup_Component=>EXTERNAL_KEY1 y pulse Correlación.
Nota: En los pasos del 14 al 18, creará una relación entre la entidad predeterminada y la entidad componente en el depósito de datos. EXTERNAL_KEY1 especifica la clave natural (ID de BD para Rational ClearQuest) para el componente. La búsqueda revolverá la clave sucedánea si el componente existe en el depósito de datos. Si el registro no existe, la compilación insertará la entrada predeterminada -1 que representa "información no disponible".
- Pulse el botón Añadir y pulse Atributo.
Especifique el nombre COMPONENT_ID, y pulse Aceptar dos veces.
- Pulse el botón derecho del ratón sobre icono Modelo de transformación y seleccione Compilar elementos. Efectúe una doble pulsación sobre Lookup_Component, pulse el separador Elementos sin relacionar, seleccione Aceptar identificadores de miembro sin relacionar y pulse Aceptar.
- En el separador Modelo de transformación, pulse con el botón derecho del ratón sobre el atributo COMPONENT_ID y pulse Convertir en derivación.
- En el separador Modelo de transformación, efectúe una doble pulsación sobre el atributo COMPONENT_ID, pulse el separador Cálculo y escriba el código siguiente:
If NOT Unmatched( Lookup_Component )
then RETURN Lookup_Component.COMPONENT_ID ;
else RETURN -1;
Pulse Aceptar. Nota: Para especificar una coincidencia positiva para este tipo de condición, en el script, se utiliza una construcción de doble negación.
A continuación, entregará los atributos nuevos a la tabla de destino en el depósito de datos.
- Efectúe una doble pulsación en "{$CDA}"."REQUEST" entrega de tabla.
- En el separador Propiedades de tabla, especifique los nombres de las columnas STATUS y COMPONENT_ID para los elementos Estado y COMPONENT_ID.
Seleccione el recuadro de selección para Añadir columnas a la tabla automáticamente.
Pulse Aceptar.
Nota: Como no modificó la tabla predeterminada en el depósito de datos para incluir columnas para almacenar atributos nuevos, al seleccionar la opción Añadir columnas a la tabla automáticamente los resultados de la tabla se modifican si la columna no existe. También puede utilizar Rational Data Architect para modificar la tabla antes de ejecutar el trabajo ETL o para actualizar el modelo de datos del depósito de datos una vez el trabajo ETL haya modificado la tabla.
- Guarde el catálogo.
Ha modificado una compilación existente.
En esta lección:
- Ha añadido un atributo a la compilación de Data Manager
- Ha correlacionado el atributo nuevo con la columna de tabla del depósito de datos
- Ha desplegado los cambios
Cuando se carga una entidad nueva, es necesario crear una compilación nueva y modificar una ya existente para añadir más atributos a una entidad existente. En esta lección, modificó una compilación existente. En la siguiente lección (Lección 1.3), creará una compilación nueva. El proceso de ETL requiere una compilación para cada entidad.