< Wstecz | Dalej >

Lekcja 1.2: Modyfikowanie istniejącej kompilacji menedżera danych

Podczas tej lekcji dowiesz się, jak dostosować istniejącą kompilację menedżera danych na potrzeby wyodrębniania danych, transformowania danych i ładowania tych danych do hurtowni danych.
Zanim rozpoczniesz
Wymagania wstępne:
O tym zadaniu

W lekcji 1.1 zmodyfikowano plik konfiguracyjny danych Rational ClearQuest, dodając do tabeli danych nowe atrybuty. Atrybuty te należy teraz umieścić w strumieniu kompilacji, aby można je było umieszczać w raportach.

Podczas tej lekcji zmodyfikujesz kompilację menedżera danych, aby nowe atrybuty były widoczne w procesie gromadzenia danych. Dowiesz się, jak dostosować istniejącą kompilację, aby wyodrębnić nowe atrybuty, poddać je transformacji i dostarczyć do hurtowni danych.

Przygotuj katalog ETL
  1. Uruchom program IBM Cognos Data Manager.
  2. Wybierz opcję Create a new catalog (Utwórz nowy katalog), podaj nazwę RationalInsightETL, podaj informacje o połączeniu dla pustej bazy danych utworzonej przed rozpoczęciem tej lekcji, a następnie kliknij przycisk Finish (Zakończ).
  3. Po utworzeniu i otwarciu nowego katalogu kliknij opcje File (Plik) > Restore Catalog (Odtwórz katalog) i wybierz plik OOTBDMCatalog.ctg. Domyślnie plik ten znajduje się w katalogu [katalog_instalacyjny_rational_insight]/datamgr/insight_catalog/.
Wyodrębnij nowe atrybuty ze źródła danych
  1. Rozwiń folder Builds and JobStreams > ODS > ClearQuest > CQEnterprise. Kliknij CQ_ENT_Defect.
    Koncepcja: W menedżerze danych proces ETL jest określony w kompilacjach faktów lub wymiarów. Kompilacja faktu dostarcza dane faktu i może także dostarczać dane wymiaru, dzięki czemu można skonstruować prywatną tematyczną hurtownię danych w obrębie jednej kompilacji. Kompilacja wymiaru dostarcza dane do opisania pojedynczego wymiaru biznesowego, takiego jak produkt lub klient. Program Rational Insight używa kompilacji faktów w celu załadowania danych do skonsolidowanej operacyjnej składnicy danych. Kompilacji faktu i wymiaru używa się do zbudowania tematycznych hurtowni danych lub schematu gwiaździstego. Kompilacje są zorganizowane w strumieniach zadań jako serie kroków, które można wykonać sekwencyjnie lub równolegle w menedżerze danych.
  2. Kliknij dwukrotnie ikonę źródła danych RI_Stg. Kliknij zakładkę Zapytanie.
    ikona źródła danych
    Koncepcja: Używając elementu źródła danych kompilacji, można wybrać podzbiór bazy danych wymagany dla kompilacji.

    Podczas lekcji 1.1 jednostka defektu ClearQuest została zmodyfikowana w celu udostępnienia powiązanych atrybutów statusu i identyfikatora komponentu. W kilku kolejnych krokach zmodyfikujesz zapytanie źródła danych w taki sposób, aby zawierało nowe atrybuty.

  3. Rozwiń węzeł ClearQuest, aby wyświetlić schematy bazy danych (modelowane jako grupy zasobów w konfiguracji danych XML). Rozwiń schemat CQEnterprise, aby wyświetlić wszystkie tabele danych zdefiniowane w grupie zasobów CQEnterprise z pliku konfiguracji danych z lekcji 1.1. Rozwiń tabelę ENTDefect, aby wyświetlić wszystkie zdefiniowane kolumny.

    Teraz zmodyfikujesz istniejący kod SQL, aby wczytać kolumny component_dbid i status. Pamiętaj o dodaniu przecinka oddzielającego nazwy kolumn.

  4. Przeciągnij kolumny ENTDefect Status i Component_dbid z panelu po lewej stronie na panel Zapytanie SQL po prawej stronie. Umieść nowe kolumny za istniejącą pozycją "href". Sprawdź, czy kolumny są oddzielone przecinkiem.
  5. Aby przetestować nową instrukcję SQL, kliknij ikonę
    ikona odtwarzania
    znajdującą się w lewej dolnej części okna. W oknie, aby podać zmienne, wpisz nazwę schematu (CQEnterprise) dla pozycji $RESOURCEGROUP. Pozostaw pole $MODIFIED_SINCE niewypełnione, aby usługa danych użyła wartości NULL do zwrócenia wszystkich rekordów.
  6. Kliknij kartę Result columns (Kolumny wynikowe), a następnie opcję Refresh (Odśwież). W oknie, aby podać zmienne, wpisz nazwę schematu (CQEnterprise) dla pozycji $RESOURCEGROUP. Pozostaw pole $MODIFIED_SINCE niewypełnione, aby usługa danych użyła wartości NULL do zwrócenia wszystkich rekordów. Kolumny zdefiniowane na tej karcie są kolumnami wynikowymi z zapytania SQL zdefiniowanego w kroku 7. Kolumny te będą używane w obiektach downstream. Kliknij przycisk OK.
    Właściwości źródła danych
  7. Prawym przyciskiem myszy kliknij pozycję DataStream (Strumień danych) i wybierz opcję Properties (Właściwości). Na karcie DataStream items (Elementy strumienia danych) dwukrotnie kliknij nowe kolumny na panelu po lewej stronie i dodaj je do strumienia danych, a następnie kliknij przycisk OK.
    Koncepcja: Obiekt DataStream gromadzi wszystkie źródła, z których kompilacja lub struktura odniesienia uzyskuje dane. Jest to metoda połączenia różnych źródeł danych w jeden obiekt. Przykład takiego zastosowania można zaobserwować w kompilacjach RequisitePro.
Do katalogu została dodana jedna kolumna, a model transformacji został zmieniony w taki sposób, aby odzwierciedlał tę zmianę.

W kolejnym kroku dokonasz transformacji atrybutu component_dbid na odpowiadający mu klucz komponentu w hurtowni danych.

Transformuj atrybuty
  1. Kliknij ikonę Transformation Model (Model transformacji) i otwórz stronę odwzorowania.
    Koncepcja: Model transformacji jest zasadniczym elementem dla kompilacji faktu. Używa się go do manipulowania uzyskiwanymi danymi źródłowymi, na przykład do scalania danych z różnych źródeł i agregowania danych. Podczas tej lekcji załadujesz nowe atrybuty bez stosowania jakichkolwiek reguł biznesowych.
    Odwzorowanie strumienia danych
  2. Dwukrotnie kliknij strumień danych Status.
    Koncepcja: W modelu transformacji zostanie utworzony nowy atrybut, a na niego zostanie odwzorowany element strumienia danych.
  3. Kliknij opcje Add (Dodaj), Dimension (Wymiar), podaj nazwę Lookup_Component i wybierz węzeł podrzędny (no reference) (bez odniesień). Kliknij przycisk po prawej stronie węzła.
    Odwzorowanie modelu transformacji
  4. Wybierz węzeł Component (Komponent) > Lookup_Component i kliknij przycisk OK.
  5. Wróć do okna odwzorowania. Na panelu po lewej stronie wybierz element strumienia danych Component_dbid, a w panelu po prawej stronie wybierz atrybut Lookup_Component=>EXTERNAL_KEY1 i kliknij przycisk Map (Odwzoruj).
    Koncepcja: W następnych kilku krokach utworzysz relację między jednostką defektu a jednostką komponentu w hurtowni danych. EXTERNAL_KEY1 określa naturalny klucz (dbid dla Rational ClearQuest) dla komponentu. Wyszukiwanie zwróci klucz-odpowiednik, jeśli dany komponent istnieje w hurtowni danych. Jeśli taki rekord nie istnieje, kompilacja wstawi wartość domyślną -1 wskazującą, że "informacje nie są dostępne".
  6. Kliknij przycisk Add (Dodaj) i wybierz opcję Attribute (Atrybut). Podaj następującą nazwę: COMPONENT_ID, a następnie dwukrotnie kliknij przycisk OK.
  7. Kliknij prawym przyciskiem myszy obiekt Transformation Model (Model transformacji), a następnie wybierz opcję Show Build Elements (Wyświetl elementy kompilacji). Dwukrotnie kliknij Lookup_Component, kliknij kartę Unmatched Members (Składniki bez odpowiedników), wybierz opcję Accept unmatched member identifiers (Akceptuj identyfikatory składników bez odpowiedników) i kliknij przycisk OK.
  8. Na karcie Transformation Model (Model transformacji) prawym przyciskiem myszy kliknij atrybut COMPONENT_ID, a następnie wybierz opcję Convert to derivation (Przekształć w pochodny).
  9. Na karcie Transformation Model (Model transformacji) dwukrotnie kliknij atrybut COMPONENT_ID, kliknij kartę Calculation (Kalkulacja) i wprowadź następujący kod:
    If NOT Unmatched( Lookup_Component )
    then RETURN Lookup_Component.COMPONENT_ID ;
    else RETURN -1; 
    Kliknij przycisk OK.
    Koncepcja: Do określenia pozytywnego dopasowania dla warunku o tym typie, w skrypcie użyto konstrukcji z podwójnym zaprzeczeniem.
Dostarcz atrybuty do tabeli docelowej
  1. Kliknij dwukrotnie opcję dostarczania tabeli "{$ODS}"."REQUEST".
  2. Na karcie Table Properties (Właściwości tabeli) podaj następujące nazwy kolumn: STATUS i COMPONENT_ID dla elementów Status i COMPONENT_ID. Zaznacz pole wyboru Automatically add columns to table (Automatycznie dodaj kolumny do tabeli). Kliknij przycisk OK.
    Koncepcja: Ponieważ nie zmodyfikowano tabeli defektów w hurtowni danych, aby zawierała kolumny potrzebne do przechowywania nowych atrybutów, zaznaczenie opcji Automatically add columns to table (Automatycznie dodaj kolumny do tabeli) spowoduje zmodyfikowanie tabeli, jeśli kolumny te nie istnieją. Można także użyć aplikacji Rational Data Architect do zmodyfikowania tabeli przed wykonaniem zadania ETL lub do zaktualizowania modelu danych z hurtowni danych po zmodyfikowaniu tej tabeli przez zadanie ETL.
  3. Zapisz katalog.
Istniejąca kompilacja została zmodyfikowana.
Wyniki
Podczas tej lekcji:

Ładując nową jednostkę, należy utworzyć nową kompilację i zmodyfikować istniejącą kompilację, aby dodać więcej atrybutów do istniejącej jednostki. Podczas tej lekcji została zmodyfikowana istniejąca kompilacja. Podczas następnej lekcji (lekcja 1.3) utworzysz nową kompilację. Proces ETL wymaga jednej kompilacji dla każdej jednostki.

Punkt kontrolny lekcji

Dodano nowy atrybut do kompilacji menedżera danych, określono miejsce ładowania atrybutu w hurtowni danych i zaktualizowano kompilację menedżera danych w celu wdrożenia zmian.
< Wstecz | Dalej >

Opinia