< Anterior | Próximo >

Lição 2.1: Customizar o Esquema Padrão do Armazém de Dados

Nesta lição você aprenderá como incluir uma nova tabela no esquema padrão e como relacionar duas tabelas.
Antes de Iniciar
Pré-requisito: Antes de realizar qualquer alteração no catálogo de dados e no armazém de dados, crie um backup. Para fazer backup do catálogo de dados, use o utilitário de backup de catálogo do Data Manager. Para fazer backup do armazém de dados, consulte a documentação do banco de dados que estiver usando para o armazém de dados.
Por Que e Quando Desempenhar Esta Tarefa
Nesta lição, você: Você usará o IBM InfoSphere Data Architect durante esta lição.
  1. Instale o modelo de banco de dados físico de amostra para o seu banco de dados. O modelo de amostra pode ser instalado automaticamente ao instalar o IBM Rational Insight. O local padrão do modelo de amostra é C:/Program Files/IBM/Rational Insight/datawarehouse/dw. Extraia o modelo de amostra.
  2. Inicie o IBM InfoSphere Data Architect. Quando solicitado, selecione a área de trabalho padrão.
  3. Crie um novo projeto de design de dados para seu tutorial:
    1. Clique em Novo > Projeto > Projeto de Design de Dados.
    2. Especifique o nome RISDW e aceite o local padrão.
    3. Clique em Concluir. Se solicitado, escolha exibir a visualização padrão.

      Um novo projeto de design de dados é criado com contêineres para os objetos de dados.

      Explorador de projetos de dados

    4. No Windows Explorer, navegue para o diretório em que fez o download do modelo de dados de amostra na Etapa 1. Copie o modelo de dados de amostra para o local padrão (etapa b).
    5. Retorne ao IBM InfoSphere Data Architect, clique com o botão direito do mouse no projeto RISDW e, em seguida, clique em Atualizar.

      Agora o projeto de design de dados exibe a amostra de modelo de dados físicos.

      Explorador de projetos de dados com modelo de dados

  4. Na visualização Explorador de Projetos de Dados (Janela > Mostrar Visualização > Explorador de Projetos de Dados), expanda Modelos de Dados para mostrar o modelo de dados físicos (nós com uma extensão dbm). Clique duas vezes no modelo de dados para expandi-lo.
    Nota: O primeiro nó na estrutura em árvore designa o alias do banco de dados. Para ver os componentes do banco de dados, tais como esquemas, espaços de tabelas e conjuntos de buffers, expanda o modelo físico.
    Explorador de projetos de dados com modelo de dados expandido

    Nesta lição, os nomes de esquemas padrão são usados. Se você alterou os nomes dos esquemas no banco de dados, os nomes usados nesta lição talvez não correspondam com o nome do esquema em seu banco de dados. Os nomes padrão são CONFIG, RIODS e RIDW. O esquema CONFIG é um esquema estático e não deve ser alterado. O esquema RIODS é o armazém de dados operacional designado. O esquema RIDW é designado para o data mart (fatos e dimensões) e pode ser renomeado para atender as convenções de nomenclatura de esquema de seu armazém de dados Rational Insight.

    Nesta lição, você modificará o esquema RIDW.

  5. Clique com o botão direito do mouse em RIDW e, em seguida, clique em Incluir Objeto de Dados > Tabela.
  6. Especifique as propriedades da tabela:
    1. Especifique o nome da tabela como F_DEFECT_METRICS.
    2. Na visualização Propriedades para a tabela, clique em Espaços de Tabelas, selecione VSTR_32K para Regular e VSTR_IDX para Índice.
      Explorador de projetos de dados com modelo de dados expandido
      Nota:
      • Para nomear as tabelas de fatos no data mart, a convenção é prefixar os nomes com F_.
      • VSTR_32K é o espaço de tabela designado para o data mart.
      • VSTR_IDX é o espaço de tabela designado para os índices para o data mart.
  7. Incluir colunas na tabela:
    Nota: Sua tabela conterá uma medida para o número total de defeitos pelas duas dimensões, Data e Componente. Você selecionará a dimensão de data a partir de uma tabela de dimensão existente chamada D_DATE. Para a dimensão Componente, você criará uma nova tabela de dimensão.

    Sua tabela de fato terá cinco colunas: TOTAL_DEFECTS, DEFECT_METRICS_ID,p REC_DATETIME, COMPONENT_ID e DATE_ID. Você designará a coluna DEFECT_METRICS_ID como a chave primária e a usará para identificar exclusivamente a linha de fato.

    1. Na visualização Explorador de Projetos de Dados, selecione a tabela F_DEFECT_METRICS, clique com o botão direito do mouse e, em seguida, clique em Incluir Objeto de Dados > Coluna.
    2. Especifique o nome como TOTAL_DEFECTS. Na visualização Propriedades, clique em Tipo e especifique os seguintes atributos: Tipo de Dados como INTEGER, Valor Padrão como 0, Não Nulo é selecionado.
    3. Repita a etapa (a). Especifique o nome como DEFECT_METRICS_ID. Na visualização Propriedades, clique em Tipo e especifique os seguintes atributos: Tipo de Dados como INTEGER e Chave Primária e Não Nulo são selecionados.

      Uma chave primária chamada F_DEFECT_METRICS1 é criada automaticamente.

    4. Repita a etapa (a). Especifique o nome como REC_DATETIME. Na visualização Propriedades, clique em Tipo e especifique os seguintes atributos: Tipo de Dados como TIMESTAMP, Valor Padrão como CURRENT_TIMESTAMP, Não Nulo é selecionado.
    5. Repita a etapa (a). Especifique o nome como COMPONENT_ID. Na visualização Propriedades, clique em Tipo e especifique os seguintes atributos: Tipo de Dados como INTEGER, Não Nulo é selecionado.
    6. Repita a etapa (a). Especifique o nome como DATE_ID. Na visualização Propriedades, clique em Tipo e especifique os seguintes atributos: Tipo de Dados como INTEGER, Não Nulo é selecionado.
    colunas da tabela

    Agora você criou uma nova tabela de fatos chamado F_DEFECT_METRICS e incluiu uma chave primária para a tabela. Nas próximas etapas, você incluirá uma chave estrangeira para esta tabela.

    Por padrão, a integridade referencial é impingida no armazém de dados. Portanto, na próxima etapa você implementará a integridade referencial entre a tabela de fatos e as dimensões que são referidas na tabela de fatos.

  8. Inclua uma chave estrangeira na tabela F_DEFECT_METRICS:
    1. Clique com o botão direito do mouse na tabela F_DEFECT_METRICS e, em seguida, clique em Incluir Objeto de Dados > Chave Estrangeira
    2. Especifique a tabela-pai para ser a tabela D_DATE. Clique em OK.
      Nota: D_DATE é a tabela de dimensão de data usada no armazém de dados.
    3. Especifique o nome da chave estrangeira como DATE_ID.
    4. Selecione DATE_ID e, na visualização Propriedades, clique em Detalhes. Na seção Pai, em Restrição exclusiva ou lista de índices, selecione a chave primária D_DATE_PK. Se solicitado, selecione Usar a coluna-filho/coluna de atributos existente.
      Nota: D_DATE_PK é a chave primária na outra tabela (tabela D_DATE) para a qual a chave estrangeira desta tabela (F_DEFECT_METRICS) está fazendo uma referência.

      Uma chave estrangeira chamada DATE_ID é criada para a tabela de fatos F_DEFECT_METRICS. Por meio desta chave estrangeira, você criou um relacionamento com uma tabela D_DATE existente.

      Na próxima etapa, você incluirá uma nova tabela de dimensão no data mart. A tabela de dimensão será referida pela tabela de fatos F_DEFECT_METRICS que você criou.

  9. Clique com o botão direito do mouse em RIDW e, em seguida, clique em Incluir Objeto de Dados > Tabela.
  10. Especifique as propriedades da tabela:
    1. Especifique o nome da tabela como D_COMPONENT_LABEX.
      Nota: Para nomear as tabelas de dimensões no data mart, a convenção é prefixar os nomes com D_.
    2. Na visualização Propriedades para a tabela, clique em Espaços de Tabela, selecione VSTR_32K para Regular e VSTR_IDX para Índice.
  11. Incluir colunas na tabela:
    Nota: Sua tabela terá duas colunas: NAME e COMPONENT_ID. Você designará COMPONENT_ID como a chave primária e a usará para identificar exclusivamente a linha de dimensão.
    1. Clique com o botão direito do mouse na tabela D_COMPONENT_LABEX e, em seguida, clique em Incluir Objeto de Dados > Coluna.
    2. Especifique o nome da coluna como NAME. Na visualização Propriedades da coluna, especifique os seguintes atributos: Tipo de Dados como VARCHAR, Comprimento como 255, Não Nulo é selecionado.
    3. Repita a etapa (a). Especifique o nome da coluna como COMPONENT_ID. Na visualização Propriedades da coluna, especifique os seguintes atributos: Tipo de Dados como INTEGER e Chave Primária e Não Nulo são selecionados.

      Uma chave primária chamada D_COMPONENT_LABEX1 é criada automaticamente.

    Agora você criou uma nova tabela de dimensões chamada D_COMPONENT_LABEX e incluiu uma chave primária na tabela. Nas próximas etapas, você usará esta chave primária para vinculá-la à tabela de fatos F_DEFECT_METRICS criada anteriormente.

  12. Faça o link da tabela de fatos F_DEFECT_METRICS com a tabela de dimensões D_COMPONENT_LABEX:
    1. Clique com o botão direito do mouse em F_DEFECT_METRICS e, em seguida, clique em Incluir Objeto de Dados > Chave Estrangeira.
    2. Especifique a tabela-pai como D_COMPONENT_LABEX. Clique em OK.
    3. Especifique o nome da chave estrangeira como COMPONENT_ID.
    4. Selecione COMPONENT_ID e, na visualização Propriedades, clique em Detalhes. Na seção Pai, em Restrição exclusiva ou lista de índices, selecione a chave primária D_COMPONENT_LABEX1. Se solicitado, selecione Usar a coluna-filho/coluna de atributos existente.

    Você vinculou a tabela de fatos F_DEFECT_METRICS a duas tabelas de dimensões: a tabela D_DATE para o atributo de data e a tabela D_COMPONENT_LABEX para o atributo de componente.

    Agora você produzirá o modelo para as novas tabelas incluídas. Para isso, você exportará as tabelas para um script DDL e executará o script.

  13. Gere um script DDL para a tabela D_COMPONENT_LABEX:
    1. Clique com o botão direito do mouse na tabela D_COMPONENT_LABEX e, em seguida, clique em Gerar DDL.
    2. Na página Opções, selecione:
      • Nomes Completos
      • Instruções CREATE
      • Instruções COMMENT ON
      • Cláusula IN TABLESPACE
      Clique em Avançar.
    3. Na página Objetos, selecione:
      • Restrição de verificação
      • Restrição de chave estrangeira
      • Restrição de chave primária
      • Tabelas
      Clique em Avançar.
    4. Selecione Executar DDL no servidor e clique em Avançar.
      Nota: Para o tutorial, você usará um banco de dados de amostra (RIDW). Seja cuidadoso ao usar a opção Executar DDL no servidor para executar um script DDL em um banco de dados em produção. Com o IBM InfoSphere Data Architect, você não pode usar uma função de migração; assim, os dados não podem ser preservados para uma tabela existente. A tabela é criada, eliminada e, então, criada.

      Você pode optar por salvar apenas o script DDL gerado e executar o script mais tarde.

    5. Na página Conexão, selecione Usar uma conexão existente, selecione RIDW e clique em Avançar.
    6. Digite o nome de usuário e a senha do administrador do banco de dados, clique em Avançar e, em seguida, clique em Concluir.
    7. Salve o modelo.
  14. Gere um script DDL para a tabela F_DEFECT_METRICS:
    1. Clique com o botão direito do mouse na tabela F_DEFECT_METRICS e, em seguida, clique em Gerar DDL.
    2. Na página Opções, selecione:
      • Nomes Completos
      • Instruções CREATE
      • Instruções COMMENT ON
      • Cláusula IN TABLESPACE
      Clique em Avançar.
    3. Na página Objetos, selecione:
      • Restrição de verificação
      • Restrição de chave estrangeira
      • Restrição de chave primária
      • Tabelas
      Clique em Avançar.
    4. Selecione Executar DDL no servidor e clique em Avançar.
    5. Na página Conexão, selecione Usar uma conexão existente, selecione RIDW e clique em Avançar.
    6. Digite o nome de usuário e a senha do administrador do banco de dados, clique em Avançar e, em seguida, clique em Concluir.
    7. Salve o modelo.

    Agora você aplicou as alterações para que as estruturas de suas tabelas sejam modificadas.

Resultados
Nesta lição, você:

Ponto de Verificação da Lição

Você criou uma nova origem de dados, definiu as medidas para os elementos da origem de dados e salvou as alterações.
< Anterior | Próximo >