Implementación de la maestría de datos mediante archivos de configuración de datos XML.
Cuando se definen las correlaciones en archivos de datos de configuración de datos XML, debe consultar la información en el controlador XML ODBC. La tabla del sistema System.DIMENSIONMAPPINGS se puede utilizar para consultar información sobre tablas de correlación de dimensiones disponibles. Todas las tablas de correlación de dimensiones se encuentran debajo del esquema DimensionMappings. Todas las tablas tienen la misma estructura; es decir, un valor_origen y un valor_destino. Se pueden utilizar para consultar las correlaciones de valores.
Implementación de la maestría de datos en el proceso ETL
En los artefactos del depósito de datos correspondientes a la dimensión común, sólo aquellos artefactos que se comportan como el maestro (destino de la correlación) o aquellos artefactos que no están correlacionados con ningún otro artefacto aparecerán en el almacén de datos operativos. Otros artefactos que están asociados a la dimensión común están enlazados directamente al artefacto de destino del artefacto original. Por ejemplo, si un Proyecto de UCM RI está correlacionado con un proyecto de ClearQuest Insight, sólo el proyecto de ClearQuest Insight aparece en la tabla PROJECT y las actividades de UCM que pertenecen al proyecto de UCM RI estarán enlazadas directamente con el proyecto de ClearQuest Insight en el depósito de datos. Para cada una de las dimensiones comunes, incluidas PROJECT, RELEASE, ITERATION, PRODUCT, COMPONENT y RESOURCE, las tablas de correlación intermedias con el prefijo M_ delante de los nombres se crean como tablas empleadas en ETL para almacenar la relación de correlación.
Como la lógica es genérica, se crean compilaciones y trabajos ETL reutilizables debajo de la carpeta Others/DimensionMapping. Es necesario cambiar el origen de datos en la compilación por el origen de datos donde se definieron las correlaciones, cambiar el nombre de conexión de la variable Connection definida en el trabajo por el nombre de conexión del origen de datos donde definió las correlaciones y añadir el trabajo a su trabajo.
Cuando se cargan los artefactos de origen, la compilación necesita buscar esta dimensión común en la tabla de correlación intermedia para ver si el artefacto específico aparece en la tabla de correlación intermedia como el origen de la correlación. Si la búsqueda devuelve los resultados coincidentes, se actualiza el registro en la tabla de correlación intermedia. Si la búsqueda no devuelve resultados coincidentes, el artefacto se entrega normalmente al almacén de datos operativo. Para cada dimensión común, se ha creado una búsqueda con _Source en el nombre para buscar los datos de origen en la tabla de correlación intermedia.
La dimensión de búsqueda empleada en el modelo de transformación para buscar la dimensión común busca tanto en la tabla de almacén de datos operativos como en la tabla de correlación intermedia. Para datos de la tabla del almacén de datos operativos, la búsqueda devuelve la clave sucedánea del registro. Para datos de la tabla de correlación intermedia, la búsqueda devuelve la clave sucedánea de los artefactos de destino. Para las dimensiones comunes, se emplean las búsquedas empleadas normalmente para buscar datos con EXTERNAL_KEY1 y EXTERNAL_KEY2.
La maestría de datos abarca varios orígenes de datos. Por lo tanto, el trabajo ETL debe reflejar el flujo de datos global. La anterior implementación para la maestría de datos es específica del proceso ETL y no tiene ningún impacto sobre otros componentes. En el catálogo de ejemplo, un proyecto TestManager está correlacionado con un proyecto ALM de ClearQuest y los usuarios de TestManager con los usuarios ALM de ClearQuest con el mismo nombre. Si detecta errores al abrir el archivo de configuración de datos XML para el proceso ETL de TestManager, actualice las tablas de correlación de dimensiones de tal modo que apunten al archivo de configuración de datos XML utilizado para el proceso ETL de ClearQuest en el sistema.