< Vorherige Lektion | Nächste Lektion >

Lerneinheit 2.2: Standard-ETL-Katalog anpassen

In dieser Lerneinheit erfahren Sie, wie der Standard-ETL-Katalog durch Erstellen neuer Dimensions- und Fakttabellen anzupassen ist. Dabei werden Sie ein neues Bereitstellungsmodul zum Data Manager-Build hinzufügen und das Modul für die Ausführung terminieren.

Warum und wann dieser Vorgang ausgeführt wird
In dieser Lerneinheit führen Sie die folgenden Schritte aus:
Referenzdimension erstellen
  1. Starten Sie IBM Cognos Data Manager und laden Sie den Katalog RationalInsightETL.
  2. Blenden Sie den Knoten Library ein.
  3. Klicken Sie mit der rechten Maustaste Dimensions an und wählen Sie Insert Reference Dimension aus. Geben Sie als Namen Component_LabEx an.
  4. Klicken Sie mit der rechten Maustaste auf Component_LabEx und wählen Sie Insert Hierarchy aus. Geben Sie dann als Namen "Component_LabEx_Dim" an und klicken Sie auf OK.

    Sie haben nun eine neue Dimension mit Namen Component_LabEx_Dim hinzugefügt. Im nächsten Schritt geben Sie an, wo die Daten für die Dimension abzurufen sind. Dazu verwenden Sie eine Schablone und geben die Spalten an, die Sie als Bestandteil der Dimension laden möchten.

  5. Klicken Sie mit der rechten Maustaste auf Component_LabEx_Dim. Wählen Sie Insert Level aus und geben Sie als Namen Component ein. Klicken Sie dann auf die Registerkarte Attributes.
  6. Klicken Sie auf die Schaltfläche New rechts neben dem Feld Template und geben Sie als Namen "Component_LabEx_Dim" an.
  7. Klicken Sie auf die Registerkarte Attributes und fügen Sie die folgenden beiden Attributdefinitionen ein:
    • COMPONENT_ID, business key, primary key, true
    • NAME, normal
    Klicken Sie auf OK.
  8. Fügen Sie im Abschnitt Available Attributes die Einträge COMPONENT_ID und Name als ausgewählte Attribute hinzu. Wählen Sie für das Attribut COMPONENT_ID das Kontrollkästchen ID und für das Attribut "Name" das Kontrollkästchen Caption aus.
  9. Klicken Sie auf die Registerkarte Data Access, wählen Sie den Eintrag Use Template for data access aus und geben Sie die folgenden Werte an:
    • Wählen Sie für Connection den Eintrag Rational Data Warehouse aus.
    • Klicken Sie für den Tabellennamen auf Browse und wählen Sie RIODS -> COMPONENT aus.
    Klicken Sie auf OK.
Dimensionsbuild erstellen
  1. Blenden Sie den Knoten RationalInsightETL ein, um die Dimensionen unter Builds and JobStreams aufzulisten.
  2. Klicken Sie mit der rechten Maustaste auf Dimensions und wählen Sie Insert Dimension Build aus. Geben Sie dann D_COMPONENT_LABEX ein und klicken Sie auf die Registerkarte Dimension.
  3. Wählen Sie im Abschnitt Dimension to be delivered den Eintrag "Component_LabEx" aus.
  4. Wählen Sie im Abschnitt Hierarchy/Lookup to be delivered den Eintrag "Component_LabEx_Dim(H)" aus.
  5. Wählen Sie im Abschnitt Deliver into database den Eintrag Rational Data Warehouse aus. Klicken Sie auf OK.
  6. Klicken Sie mit der rechten Maustaste auf D_COMPONENT_LABEX und wählen Sie den Eintrag Insert Table aus. Klicken Sie dann auf das Symbol Tabellensymbol und wählen Sie die Tabelle RIDW > D_COMPONENT_LABEX aus.
  7. Klicken Sie auf die Registerkarte Columns. Wählen Sie im Abschnitt Use template den Eintrag Component_LabEx_Dim aus.
  8. Wählen Sie im Abschnitt Available Sources den Knoten Component_LabEx_Dim > Component aus. Ziehen und übergeben Sie COMPONENT_ID (ID) in die Spalte Sourced From für COMPONENT_ID. Ziehen und übergeben Sie NAME (Bildunterschrift) in die Spalte Sourced From für NAME. Klicken Sie auf OK.
Faktbuild erstellen
  1. Blenden Sie den Knoten RationalInsightETL ein, um die Tabellen unter Builds and JobStreams > Facts aufzulisten.
  2. Wählen Sie Fact aus. Klicken Sie zunächst mit der rechten Maustaste und klicken Sie dann auf Insert Fact Build. Geben Sie als Namen des neuen Builds F_DEFECT_METRICS an und klicken Sie auf OK.
  3. Klicken Sie mit der rechten Maustaste auf den neu erstellten Faktbuildknoten F_DEFECT_METRICS und klicken Sie dann auf Properties. Klicken Sie auf die Registerkarte Input. Wählen Sie aus der Liste "Duplicate Key Handling" den Eintrag Merge Records with duplicate keys aus. Klicken Sie auf OK.
    Anmerkung: Die Option Merge Records with duplicate keys entspricht der SQL-Klausel GROUP BY. Sie verwenden diese Option, um die Zeilen zu kumulieren. Ansonsten kann die Aggregation bei der Bereitstellung nicht funktionieren und Sie erhalten möglicherweise gleich viel Zeilen wie die Anzahl an Eingabezeilen.
  4. Blenden Sie den Build F_DEFECT_METRICS ein. Klicken Sie mit der rechten Maustaste auf Data Stream und klicken Sie dann auf Insert Data Source. Geben Sie als Namen für die neue Datenquelle RI_DW an.
  5. Klicken Sie auf die Registerkarte Query. Wählen Sie aus der Datenbankliste die Verbindung Rational Data Warehouse aus.
  6. Blenden Sie den Knoten Rational Data Warehouse ein, um die Tabellen unter dem Schema RIODS aufzulisten. Klicken Sie dann auf REQUEST.
    Anmerkung: Beim Schema RIODS handelt es sich um den Speicher für operative Daten.
  7. Fügen Sie in der Abfrageanzeige den folgenden SQL-Code hinzu:
    SELECT "REQUEST_ID",
    {$ETL_DATEID} AS DATE_ID, COMPONENT_ID
    FROM "RIODS"."REQUEST"
    WHERE "REQUEST_CLASS_ID"=1 
    Anmerkung: Bei {$ETL_DATEID} handelt es sich um eine Variable, die auf Masterjobebene definiert wird. Der dazugehörige Wert wird ebenfalls auf oberster Ebene definiert. Die Variable zeigt auf einen Datensatz in der Dimension D_DATE. In diesem Fall spiegelt das dazugehörige Datum in der Fakttabelle ein ETL-Sammeldatum wider. Vergleichen Sie dazu die im Job Build_Star deklarierten Variablen.
  8. Klicken Sie zunächst auf die Registerkarte Result columns. Wählen Sie dann Prepare aus und klicken Sie auf Refresh. Geben Sie für ETL_DATEID einen beliebigen ganzzahligen Wert an. Klicken Sie zweimal auf OK.

    Sie haben nun einen neuen Build mit Namen F_DEFECT_METRICS erstellt und SQL-Code hinzugefügt, über den angegeben wird, welche Datensatze aus der Datenquelle abgerufen werden sollen.

  9. Klicken Sie zunächst mit der rechten Maustaste auf das Symbol DataStream Symbol für Datenstrom und klicken Sie dann auf Properties.
  10. Klicken Sie zunächst auf Automap und dann auf OK.
  11. Klicken Sie mit der rechten Maustaste auf das Symbol Transformational Model Symbol für Transformationsmodell und wählen Sie Mapping aus.
  12. Klicken Sie auf Add, wählen Sie Attribute aus und geben Sie als Namen für das neue Attribut DATE_ID an.
  13. Klicken Sie auf Add, wählen Sie Measure aus und geben Sie als Namen für die neue Kennzahl TOTAL_DEFECTS an. Klicken Sie zweimal auf OK. Klicken Sie mit der rechten Maustaste auf die Kennzahl und klicken Sie dann auf Properties. Wählen Sie auf der Registerkarte Aggregation den Eintrag SUM aus der Liste aus. Wählen Sie auf der Registerkarte Merge den Eintrag COUNT aus der Liste aus. Klicken Sie auf OK.
  14. Blenden Sie den Faktbuild F_DEFECT_METRICS ein. Klicken Sie dann zunächst mit der rechten Maustaste auf Transformational Model und klicken Sie dann auf Insert dimension. Geben Sie auf der Registerkarte General als Namen Component_Dim an. Klicken Sie auf die Registerkarte Reference und wählen Sie in der Liste Dimension die Dimension Component_LabEx aus. Wählen Sie aus der Liste Structure die Hierarchie "Component_LabEx(H)" aus. Wählen Sie das Feld output aus. Wählen Sie auf die Registerkarte Unmatched Member das Feld Accept unmatched member identifiers aus. Klicken Sie auf OK.
    Anmerkung: Mit der Option Accept unmatched member identifiers werden Zeilen aus der Eingabe akzeptiert, die nicht einer Komponente in D_COMPONENT_LABEX entsprechen. Sie können solche Zeilen bei der Bereitstellung (durch Angabe eines Standardwerts für Zeilen mit dem Wert Null) oder über weitere Ableitungen in der Konvertierung mit Mitgliedern ohne Entsprechung bearbeiten.
  15. Klicken Sie auf das Symbol Transformation Model Symbol für Transformationsmodell, blenden Sie die Knoten im Zuordnungsfenster ein und ziehen Sie die folgenden Elemente in die Spalte Maps To:
    • DATE_ID to DATE_ID
    • TOTAL_DEFECTS to REQUEST_ID
    Klicken Sie auf OK.

    Nun haben Sie für jedes Element der Datenquelle einen Datenstrom erstellt. Sie haben das Element DATE_ID als Attribut und das Element TOTAL_DEFECTS als eine Kennzahl zur Angabe der Anzahl für das Attributelement zugeordnet. Im nächsten Schritt werden Sie eine Faktbereitstellung definieren, um die Position im Data-Warehouse anzugeben, an der diese Informationen eingefügt werden sollen.

  16. Blenden Sie den Build F_DEFECT_METRICS ein, um unter Delivery Modules die Bereitstellungsmodule aufzulisten.
  17. Wählen Sie Fact Delivery aus, klicken Sie zunächst mit der rechten Maustaste und klicken Sie dann auf Insert Relational Table Delivery. Geben Sie als Namen des neuen Faktbuilds RIDW.F_DEFECT_METRICS an.
  18. Wählen Sie auf der Registerkarte Table Properties als Verbindung Rational Data Warehouse aus und geben Sie "RIDW"."F_REQUEST_METRICS" ein.
  19. Führen Sie im Abschnitt Columns folgende Schritte aus:
    • Wählen Sie für das Element DATE_ID das Feld key aus.
    • Wählen Sie für das Element TOTAL_DEFECTS das Feld update aus.
    Stellen Sie sicher, dass das Feld "Record Identity" aktiviert ist.
  20. Klicken Sie auf Import Target Table.
  21. Blenden Sie den Knoten Rational Data Warehouse ein, um die Tabellen unter RIDW aufzulisten. Wählen Sie dann F_DEFECT_METRICS aus.
  22. Ziehen Sie das Element DATE_ID in die Spalte DATE_ID, das Element DEFECT_METRICS_ID in die Spalte "Record Identity" und das Element TOTAL_DEFECTS in die Spalte TOTAL_DEFECTS. Klicken Sie auf OK.
    Anmerkung: Das Element "Record Identity" findet sich in jeder Tabellenbereitstellung in IBM Cognos Data Manager. Das Element fungiert als Ersatzschlüsselgenerator. In diesem Lernprogramm verwenden Sie das Element dazu, die Werte für den Primärschlüssel der Tabelle zu generieren.
  23. Wählen Sie im Fenster "Table Delivery" auf der Registerkarte Module Properties den Eintrag APPEND als Aktualisierungsart aus. Geben Sie für das Commitintervall den Wert 1.000 an.
    Anmerkung: Das bedeutet, dass in dieser Fakttabelle grundsätzlich Datensätze zur Tabelle hinzugefügt und dabei jeweils 1.000 Zeilen für die Datenbank festgeschrieben werden.
Builds zum Job hinzufügen und Job veröffentlichen
  1. Blenden Sie den Knoten RationalInsightETL ein, um die Jobströme unter Builds and JobStreams > Jobs > StarJobs aufzulisten.
  2. Wählen Sie Facts aus. Klicken Sie zunächst mit der rechten Maustaste und klicken Sie dann auf Insert Node > Fact Build Node. Geben Sie als Namen des neuen Knotens F_DEFECT_METRICS an.
  3. Wählen Sie im Abschnitt Associated Builds nacheinander Facts > Fact > F_DEFECT_METRICS aus.
  4. Wählen Sie auf der Registerkarte Predecessor den Knoten Start aus und klicken Sie auf OK.
  5. Blenden Sie den Knoten RationalInsightETL ein, um die Jobs unter Builds and JobStreams > Jobs > StarJobs aufzulisten. Klicken Sie mit der rechten Maustaste auf Dimensions und wählen Sie Insert Node > Dimension Build Node aus.
  6. Geben Sie als Namen D_COMPONENT_LABEX an. Wählen Sie im dazugehörigen Buildabschnitt Dimensions > D_COMPONENT_LABEX aus.
  7. Wählen Sie auf der Registerkarte Predecessor den Knoten Start aus. Klicken Sie auf OK.
  8. Stellen Sie den Job Build_Star erneut als Datenübertragungsaufgabe bereit:
    1. Wählen Sie den Job Build_Star aus.
    2. Klicken Sie in der Menüleiste auf Actions > Publish Data Movement Task.
    3. Blenden Sie Jobs > Star Jobs ein, wählen Sie Build_Star aus und klicken Sie auf OK.

Prüfpunkt zur Lerneinheit

Sie haben erfahren, wie Referenzdimensionen zu erstellen sind, wie Dimensionsbuilds und Faktbuilds erstellt werden, wie Builds zu einem Job hinzugefügt werden und wie Jobs veröffentlicht werden.

Feedback
< Vorherige Lektion | Nächste Lektion >