< Anterior | Próximo >

Lição 2.2: Customizar o Catálogo ETL Padrão

Nesta lição você aprenderá como customizar o catálogo ETL padrão criando novas tabelas dimensões e fatos. Você incluirá um novo módulo de entrega para a construção do Data e planejará o módulo para execução.
Por Que e Quando Desempenhar Esta Tarefa
Nesta lição, você:
Criar uma dimensão de referência
  1. Ative o IBM Cognos Data Manager e carregue o catálogo RationalInsightETL.
  2. Expanda o nó Biblioteca.
  3. Clique com o botão direito do mouse em Dimensões e selecione Inserir Dimensão de Referência. Especifique o nome como Component_LabEx.
  4. Clique com o botão direito do mouse em Component_LabEx, selecione Inserir Hierarquia, especifique o nome como Component_LabEx_Dim e clique em OK.

    Agora você incluiu uma nova dimensão chamada Component_LabEx_Dim. Em seguida, você especificará onde recuperar os dados para a dimensão. Para isso, você usará um modelo e especificará as colunas que deseja carregar como parte da dimensão.

  5. Clique com o botão direito do mouse em Component_LabEx_Dim, selecione Inserir Nível, especifique o nome como Componente e clique na guia Atributos.
  6. Clique no botão Novo à direita do campo Modelo e especifique o nome como Component_LabEx_Dim.
  7. Clique na guia Atributos e inclua as duas definições de atributos a seguir:
    • COMPONENT_ID, chave comercial, chave primária, verdade
    • NAME, normal
    Clique em OK.
  8. Na seção Atributos Disponíveis, inclua COMPONENT_ID e Name como atributos escolhidos. Selecione a caixa de opção ID para o atributo COMPONENT_ID e a caixa de opção Legenda para o atributo Name.
  9. Clique na guia Acesso a Dados, selecione Usar modelo para acesso a dados e especifique os seguintes valores:
    • Para Conexão, selecione Rational Data Warehouse.
    • Para Nome da Tabela, clique em Navegar e selecione RIODS -> COMPONENT.
    Clique em OK.
Criar uma construção de dimensão
  1. Expanda o nó RationalInsightETL para listar as dimensões sob Construções e Fluxos de Tarefas.
  2. Clique com o botão direito do mouse em Dimensões, selecione Inserir Construção de Dimensão, digite D_COMPONENT_LABEX e clique na guia Dimensão.
  3. Na seção Dimensão a ser entregue, selecione Component_LabEx.
  4. Na seção Hierarquia/Consulta a ser entregue, selecione Component_LabEx_Dim(H).
  5. Na seção Entregar no banco de dados, selecione Rational Data Warehouse. Clique em OK.
  6. Clique com o botão direito do mouse em D_COMPONENT_LABEX, selecione Inserir Tabela, clique em ícone de tabela e selecione a tabela RIDW > D_COMPONENT_LABEX.
  7. Clique na guia Colunas. Na seção Usar Modelo, selecione Component_LabEx_Dim
  8. Na seção Origens Disponíveis, expanda o nó Component_LabEx_Dim > Componente. Arraste e solte COMPONENT_ID (id) para a coluna Originado de para COMPONENT_ID. Arraste e solte NAME (Legenda) para a coluna Originado de para NAME. Clique em OK.
Criar uma construção de fato
  1. Expanda o nó RationalInsightETL para listar as tabelas sob Construções e Fluxos de Tarefas > Fatos.
  2. Selecione Fato, clique com o botão direito do mouse e, em seguida, clique em Inserir Construção de Fato. Especifique o nome da nova construção como F_DEFECT_METRICS e clique em OK.
  3. Clique com o botão direito do mouse no nó da construção de fato F_DEFECT_METRICS recém-criada e, em seguida, clique em Propriedades. Clique na guia Entrada. Na lista Manipulação de Chaves Duplicadas, selecione Mesclar registros com chaves duplicadas. Clique em OK.
    Nota: A opção Mesclar registros com chaves duplicadas é equivalente à cláusula GROUP BY no SQL. Você está usando esta opção para que possa agregar as linhas ou, em vez disso, a agregação na entrega não funcionará e você talvez obtenha a mesma quantidade linhas que o número de linhas de entrada.
  4. Expanda a construção F_DEFECT_METRICS, clique com o botão direito do mouse no nó Fluxo de Dados e, em seguida, clique em Inserir Origem de Dados. Especifique o nome da nova origem de dados como RI_DW.
  5. Clique na guia Consulta. Na lista de bancos de dados, selecione a conexão Rational Data Warehouse.
  6. Expanda o nó Rational Data Warehouse para listar as tabelas sob o esquema RIODS e selecione REQUEST.
    Nota: O esquema RIODS é o armazém de dados operacional.
  7. No painel Consulta, inclua o seguinte código SQL:
    SELECT "REQUEST_ID",
    {$ETL_DATEID} AS DATE_ID, COMPONENT_ID
    FROM "RIODS"."REQUEST"
    WHERE "REQUEST_CLASS_ID"=1 
    Nota: {$ETL_DATEID} é uma variável definida no nível da tarefa principal e seu valor também é determinado no nível superior. A variável aponta para um registro na dimensão D_DATE. Neste caso, a data associada na tabela de fato reflete uma data de coleta ETL. Consulte as variáveis declaradas na tarefa Build_Star.
  8. Clique na guia Colunas de Resultados, selecione Preparar e clique Atualizar. Especifique qualquer valor inteiro para ETL_DATEID. Clique em OK duas vezes.

    Agora você criou uma nova construção chamada F_DEFECT_METRICS e incluiu o código SQL para especificar quais registros buscar na origem de dados.

  9. Clique com o botão direito do mouse no ícone Fluxo de Dados ícone para fluxo de dados e, em seguida, clique em Propriedades.
  10. Clique em Mapeamento Automático e, em seguida, clique em OK.
  11. Clique com o botão direito do mouse no ícone Modelo de Transformação ícone para modelo de transformação e selecione Mapeamento.
  12. Clique em Incluir, selecione Atributo e especifique o nome do novo atributo como DATE_ID.
  13. Clique em Incluir, selecione Medida e especifique o nome da nova medida como TOTAL_DEFECTS. Clique em OK duas vezes. Clique com o botão direito do mouse na medida e, em seguida, clique em Propriedades. Na guia Agregação, selecione SUM na lista. Na guia Mesclar, selecione COUNT na lista. Clique em OK.
  14. Expanda a construção de fato F_DEFECT_METRICS, clique com o botão direito do mouse em Modelo de Transformação e, em seguida, clique em Inserir Dimensão. Na guia Geral, especifique o nome como Component_Dim. Clique na guia Referência e na lista Dimensão selecione a dimensão Component_LabEx. Na lista Estrutura, selecione a hierarquia Component_LabEx(H). Selecione a caixa saída. Na guia Membro Não Correspondido, selecione a caixa Aceitar identificadores de membros não correspondidos. Clique em OK.
    Nota: Com a opção Aceitar identificadores de membros não correspondidos, você está aceitando linhas da entrada que não correspondem com um componente em D_COMPONENT_LABEX. Então, você pode tratar tais linhas na entrega (tal como a especificação de um valor padrão se a linha for nula) ou por meio de mais derivações na transformação que possui membros não correspondidos.
  15. Clique no ícone Modelo de Transformação ícone para modelo de transformação, expanda os nós na janela de mapeamento e arraste os seguintes itens para a coluna Mapas para:
    • DATE_ID to DATE_ID
    • TOTAL_DEFECTS to REQUEST_ID
    Clique em OK.

    Agora você criou um fluxo de dados para cada elemento da origem de dados. Você mapeou o elemento DATE_ID como um atributo e o elemento TOTAL_DEFECTS como uma medida para conter a contagem do elemento de atributo. Em seguida, você definirá uma entrega de fato para especificar o local no armazém de dados em que estas informações serão inseridas.

  16. Expanda a construção F_DEFECT_METRICS para listar os módulos de entrega sob Módulos de Entrega.
  17. Selecione Entrega de Fato, clique com o botão direito do mouse e, em seguida, clique em Inserir Entrega de Tabela Relacional. Especifique o nome da nova construção de fato como RIDW.F_DEFECT_METRICS.
  18. Na guia Propriedades da Tabela, selecione a conexão como Rational Data Warehouse e digite "RIDW"."F_REQUEST_METRICS".
  19. Na seção Colunas:
    • Para o elemento DATE_ID, selecione a caixa chave.
    • Para o elemento TOTAL_DEFECTS, selecione a caixa atualizar.
    Certifique-se de que a caixa Identidade do Registro esteja selecionada.
  20. Clique em Importar Tabela de Destino.
  21. Expanda o nó Rational Data Warehouse para listar as tabelas sob RIDW e selecione F_DEFECT_METRICS.
  22. Arraste o elemento DATE_ID para a coluna DATE_ID, o elemento DEFECT_METRICS_ID para a coluna (Identidade de Registro) e o elemento TOTAL_DEFECTS para a coluna TOTAL_DEFECTS. Clique em OK.
    Nota: O elemento Identidade de Registro está presente em cada entrega de tabela no IBM Cognos Data Manager. O elemento atua como um gerador de surrogate keys. Neste tutorial, você está usando o elemento para gerar os valores para a chave primária da tabela.
  23. Na guia Propriedades do Módulo, na janela Entrega de Tabela selecione APPEND como o tipo de atualização. Configure o intervalo de consolidação como 1000.
    Nota: O que isso significa é que esta tabela de fato sempre incluirá registros para a tabela e consolidará linhas para as 1000 linhas do banco de dados por vez.
Incluir as construções para a tarefa e publicar a tarefa
  1. Expanda o nó RationalInsightETL para listar os fluxos de tarefas sob Construções e Fluxos de Tarefas > Tarefas > StarJobs.
  2. Selecione Fatos, clique com o botão direito do mouse e, em seguida, clique em Inserir Nó > Nó de Construção de Fato. Especifique o nome do negócio do novo nó como F_DEFECT_METRICS.
  3. Na seção Construções Associadas, selecione Fatos > Fato > F_DEFECT_METRICS.
  4. Na guia Predecessor, selecione o nó Iniciar e clique em OK.
  5. Expanda o nó RationalInsightETL para listar as tarefas sob Construções e Fluxos de Tarefas > Tarefas > StarJobs, clique com o botão direito do mouse em Dimensões e selecione Inserir Nó > Nó da Construção de Dimensão.
  6. Especifique o nome como D_COMPONENT_LABEX e, na seção de construção associada, selecione Dimensões > D_COMPONENT_LABEX.
  7. Na guia Predecessor, selecione o nó Iniciar. Clique em OK.
  8. Publique novamente a tarefa Build_Star como uma tarefa de movimentação de dados:
    1. Selecione a tarefa Build_Star.
    2. Na barra de menus, clique em Ações > Publicar Tarefa de Movimentação de Dados.
    3. Expanda Tarefas > Star Jobs, selecione Build_Star e clique em OK.

Ponto de Verificação da Lição

Você aprendeu como criar dimensões de referências, criar construções de dimensões e construções de fatos, incluir construções em tarefas e publicar tarefas.