Controle de Dados

Geralmente, os negócios usam várias ferramentas para gerenciar informações sobre o projeto. O controle de dados é o mapeamento destes vários projetos distintos para uma única entidade comum. O catálogo de amostra define uma estrutura para simplificar a implementação de ETL para controle de dados.

Se você usar o RequisitePro para gerenciar requisitos, o ClearQuest para gerenciar pedidos de mudança e o ClearCase para gerenciar o código de origem para o qual o projeto RequisitePro pode ser mapeado, alguns exemplos de controle de dados são:

Implementação de controle de dados por meio dos arquivos de configuração de dados XML

As tabelas de mapeamento de dimensões são usadas para definir as regras para mapear dimensões de uma origem de dados para outra. As tabelas de mapeamento de dimensões são de dois tipos: As tabelas de mapeamento de dimensões podem ser agrupadas em categorias de mapeamento de dimensões. Se você usar categorias do grupo de recursos para agrupar origens de dados com a mesma estrutura de dados, também poderá usar a categoria de mapeamento de dimensões para agrupar tabelas de mapeamento de dimensões definidas para a mesma dimensão comum. As tarefas ETL podem consultar as tabelas de mapeamento de dimensões associadas à categoria e carregar todas as informações de mapeamento automaticamente.

Ao definir os mapeamentos em arquivos de configuração de dados XML, você consulta informações do driver ODBC XML. A tabela de sistema System.DIMENSIONMAPPINGS pode ser usada para consultar informações sobre tabelas de mapeamento de dimensões disponíveis. Todas as tabelas de mapeamento de dimensões estão sob o esquema DimensionMappings. Todas as tabelas possuem a mesma estrutura, ou seja, um source_value e um target_value. Elas podem ser usadas para consultar os mapeamentos de valores.

Implementação de controle de dados no processo ETL

Nos artefatos do armazém de dados para a dimensão comum, apenas os artefatos que se comportam como o principal (destino do mapeamento) ou os artefatos que não são mapeados para nenhum dos outros artefatos aparecem no armazém de dados operacional. Outros artefatos que estão associados à dimensão comum estão vinculados diretamente ao artefato de destino do artefato original. Por exemplo, se um RI do Projeto UCM for mapeado para um Insight do projeto ClearQuest, apenas o Insight do projeto ClearQuest aparecerá na tabela PROJECT, e as atividades de UCM pertencentes ao RI do projeto UCM serão diretamente vinculadas ao Insight do projeto ClearQuest no armazém de dados. Para cada uma das dimensões comuns, incluindo PROJECT, RELEASE, ITERATION, PRODUCT, COMPONENT e RESOURCE, as tabelas de mapeamento temporárias com M_ prefixado aos seus nomes serão criadas como tabelas usadas em ETL para armazenar o relacionamento de mapeamento.

O fluxo de dados de ETL para construir o controle de dados é:

O controle de dados envolve várias origens de dados. Portanto, a tarefa ETL deve refletir o fluxo de dados geral. A implementação acima para controle de dados é específica do processo ETL e não tem nenhum impacto em outros componentes. No catálogo de amostra, um projeto TestManager é mapeado para um projeto ClearQuest ALM, e os usuários do TestManager para usuários do ClearQuest ALM com o mesmo nome. Se aparecerem erros ao abrir o arquivo de configuração de dados XML para o TestManager ETL, atualize as tabelas de mapeamento de dimensões para apontar para o arquivo de configuração de dados XML usado para ClearQuest ETL em seu sistema.