< Vorherige Lektion | Nächste Lektion >

Lerneinheit 2.1: Standardschema für Data-Warehouse anpassen

In diesem Modul erfahren Sie, wie Sie eine Tabelle zum Standardschema hinzufügen und zwei Tabellen einander zuordnen.

Vorbereitungen
Voraussetzung: Erstellen Sie, bevor Sie Änderungen am Datenkatalog und am Data-Warehouse vornehmen, eine Sicherung. Verwenden Sie für die Sicherung des Datenkatalogs das Backup-Dienstprogramm für Kataloge in Data Manager. Informationen zum Sichern des Data-Warehouse finden Sie in der Dokumentation der Datenbank, die im Data-Warehouse verwendet wird.
Warum und wann dieser Vorgang ausgeführt wird
In dieser Lerneinheit führen Sie die folgenden Schritte aus: In dieser Lerneinheit werden Sie mit IBM InfoSphere Data Architect arbeiten.
  1. Installieren Sie das Muster des physischen Datenbankmodells für Ihre Datenbank. Sie können das betreffende Mustermodell bei der Installation von IBM Rational Insight automatisch installieren. Die Standardposition des Mustermodells lautet: C:/Programme/IBM/Rational Insight/datawarehouse/dw. Extrahieren Sie das Mustermodell.
  2. Starten Sie IBM InfoSphere Data Architect. Wählen Sie nach Aufforderung den standardmäßigen Arbeitsbereich aus.
  3. Erstellen Sie für Ihr Lernprogramm ein neues Datenentwurfsprojekt:
    1. Klicken Sie auf New > Project > Data Design Project.
    2. Geben Sie den Namen RISDW an und übernehmen Sie die Standardposition.
    3. Klicken Sie auf Fertig stellen. Wählen Sie bei Aufforderung die Standardsicht aus.

      Es wird ein neues Datenentwurfsprojekt mit Containern für die Datenobjekte erstellt.

      Datenprojektexplorer

    4. Navigieren Sie im Windows-Explorer zu dem Verzeichnis, in das Sie in Schritt 1 das Musterdatenmodell heruntergeladen haben. Kopieren Sie das Musterdatenmodell an die Standardposition (Schritt b).
    5. Kehren Sie zu IBM InfoSphere Data Architect zurück. Klicken Sie zunächst auf das Projekt RISDW und dann auf Refresh.

      Im Datenentwurfsprojekt wird nun das Muster des physischen Datenmodells angezeigt.

      Datenprojektexplorer mit Datenmodell

  4. Blenden Sie in der Sicht Data Project Explorer (Window > Show View > Data Project Explorer) den Eintrag Data Models ein, um die physischen Datenmodelle (Knoten mit der Erweiterung .dbm) anzuzeigen. Klicken Sie doppelt auf das Datenmodell, um es einzublenden.
    Anmerkung: Durch den ersten Knoten in der Baumstruktur wird der Aliasname der Datenbank genannt. Möchten Sie die Komponenten der Datenbank (wie Schemata, Tabellenbereiche und Pufferpools) anzeigen, blenden Sie das physische Modell ein.
    Datenprojektexplorer mit eingeblendetem Datenmodell

    In dieser Lerneinheit werden standardmäßige Schemanamen verwendet. Wenn Sie Schemanamen in der Datenbank geändert haben, stimmen die in dieser Lerneinheit verwendeten Namen möglicherweise nicht mit den Schemanamen in Ihrer Datenbank überein. Die Standardnamen lauten: CONFIG, RIODS und RIDW. Beim Schema CONFIG handelt es sich um ein statisches Schema, das nicht geändert werden darf. Beim Schema RIODS handelt es sich um den Speicher für operative Daten. Das Schema RIDW ist für das Datamart (Fakten und Dimensionen) vorgesehen und kann bei Bedarf entsprechend den Benennungskonventionen Ihres Rational Insight Data-Warehouse umbenannt werden.

    In dieser Lerneinheit werden Sie Änderungen am Schema RIDW vornehmen.

  5. Klicken Sie mit der rechten Maustaste auf RIDW und klicken Sie dann auf Add Data Object > Table.
  6. Geben Sie die Tabelleneigenschaften an:
    1. Geben Sie als Tabellennamen F_DEFECT_METRICS ein.
    2. Klicken Sie in der Sicht "Properties" für die Tabelle auf Table Spaces und wählen Sie VSTR_32K für Regular und VSTR_IDX für Index aus.
      Datenprojektexplorer mit eingeblendetem Datenmodell
      Anmerkung:
      • Konvention beim Benennen von Fakttabellen im Datamart ist es, die Namen mit dem Präfix F_ zu versehen.
      • VSTR_32K ist der Tabellenbereich für das Datamart.
      • VSTR_IDX ist der Tabellenbereich für die Indizes für das Datamart.
  7. Fügen Sie Spalten in die Tabelle ein:
    Anmerkung: Bestandteil Ihrer Tabelle wird eine Kennzahl für die Gesamtzahl der Fehler entsprechend den beiden Dimensionen "Date" und "Component" sein. Dabei werden Sie die Dimension "Date" einer vorhandenen Dimensionstabelle (D_DATE) entnehmen. Für die Dimension "Component" dagegen wird eine neue Dimensionstabelle erstellt.

    Die Fakttabelle wird die folgenden fünf Spalten enthalten: TOTAL_DEFECTS, DEFECT_METRICS_ID, REC_DATETIME, COMPONENT_ID und DATE_ID. Sie werden die Spalte DEFECT_METRICS_ID als Primärschlüssel definieren und zum eindeutigen Identifizieren der Faktzeile verwenden.

    1. Wählen Sie in der Sicht "Data Project Explorer" die Tabelle F_DEFECT_METRICS aus. Klicken Sie mit der rechten Maustaste und klicken Sie dann auf Add Data Object > Column.
    2. Geben Sie als Namen TOTAL_DEFECTS an. Klicken Sie in der Sicht "Properties" auf Type und geben Sie die folgenden Attribute an: INTEGER (als Datentyp), 0 (als Standardwert), Not Null (als Auswahl).
    3. Wiederholen Sie Schritt (a). Geben Sie als Namen DEFECT_METRICS_ID an. Klicken Sie in der Sicht "Properties" auf Type und geben Sie die folgenden Attribute an: INTEGER (als Datentyp) und Primärschlüssel und Not Null (als Auswahl).

      Es wird automatisch ein Primärschlüssel mit Namen F_DEFECT_METRICS1 erstellt.

    4. Wiederholen Sie Schritt (a). Geben Sie als Namen REC_DATETIME an. Klicken Sie in der Sicht "Properties" auf Type und geben Sie die folgenden Attribute an: TIMESTAMP (als Datentyp), CURRENT_TIMESTAMP (als Standardwert), Not Null (als Auswahl).
    5. Wiederholen Sie Schritt (a). Geben Sie als Namen COMPONENT_ID an. Klicken Sie in der Sicht "Properties" auf Type und geben Sie die folgenden Attribute an: INTEGER (als Datentyp), Not Null (als Auswahl).
    6. Wiederholen Sie Schritt (a). Geben Sie als Namen DATE_ID an. Klicken Sie in der Sicht "Properties" auf Type und geben Sie die folgenden Attribute an: INTEGER (als Datentyp), Not Null (als Auswahl).
    Tabellenspalten

    Sie haben nun eine neue Fakttabelle mit dem Namen F_DEFECT_METRICS erstellt und einen Primärschlüssel zu der Tabelle hinzugefügt. In den nächsten Schritten werden Sie einen Fremdschlüssel zu dieser Tabelle hinzufügen.

    Standardmäßig wird im Data-Warehouse für referenzielle Integrität gesorgt. Daher werden Sie im nächsten Schritt referenzielle Integrität zwischen der Fakttabelle und den in der Fakttabelle referenzierten Dimensionen implementieren.

  8. Fügen Sie einen Fremdschlüssel zur Tabelle F_DEFECT_METRICS hinzu:
    1. Klicken Sie mit der rechten Maustaste auf die Tabelle F_DEFECT_METRICS. Klicken Sie dann auf Add Data Object > Foreign Key.
    2. Geben Sie als Tabellennamen D_DATE an. Klicken Sie auf OK.
      Anmerkung: Bei D_DATE handelt es sich um die im Data-Warehouse verwendete Datumsdimensiontabelle.
    3. Geben Sie als Namen für den Fremdschlüssel DATE_ID an.
    4. Wählen Sie DATE_ID aus und klicken Sie in der Sicht "Properties" auf Details. Wählen Sie im Abschnitt Parent bei Unique constraint or index list den Primärschlüssel D_DATE_PK aus. Wählen Sie bei Aufforderung Use the existing child /attribute column aus.
      Anmerkung: Bei D_DATE_PK handelt es sich um den Primärschlüssel der anderen Tabelle (Tabelle D_DATE), auf die der Fremdschlüssel dieser Tabelle (F_DEFECT_METRICS) Bezug nimmt.

      Ein Fremdschlüssel mit Namen DATE_ID wird für die Fakttabelle F_DEFECT_METRICS erstellt. Über diesen Fremdschlüssel haben Sie eine Beziehung zur Tabelle D_DATE eingerichtet.

      Im nächsten Schritt werden Sie eine neue Dimensionstabelle in das Datamart einfügen. Auf die Dimensionstabelle wird von der von Ihnen erstellten Fakttabelle F_DEFECT_METRICS Bezug genommen.

  9. Klicken Sie mit der rechten Maustaste auf RIDW und klicken Sie dann auf Add Data Object > Table.
  10. Geben Sie die Tabelleneigenschaften an:
    1. Geben Sie als Tabellennamen D_COMPONENT_LABEX an.
      Anmerkung: Konvention beim Benennen von Dimensionstabellen im Datamart ist es, die Namen mit dem Präfix D_ zu versehen.
    2. Klicken Sie in der Sicht "Properties" für die Tabelle auf Table Spaces und wählen Sie VSTR_32K für Regular und VSTR_IDX für Index aus.
  11. Fügen Sie Spalten in die Tabelle ein:
    Anmerkung: Ihre Tabelle wird zwei Spalten enthalten: NAME und COMPONENT_ID. Sie werden die Spalte COMPONENT_ID als Primärschlüssel definieren und zum eindeutigen Identifizieren der Dimensionszeile verwenden.
    1. Klicken Sie mit der rechten Maustaste auf die Tabelle D_COMPONENT_LABEX. Klicken Sie dann auf Add Data Object > Column.
    2. Geben Sie als Spaltennamen NAME an. Geben Sie in der Sicht "Properties" der Spalte die folgenden Attribute an: VARCHAR (als Datentyp), 255 (als Länge), Not Null (als Auswahl).
    3. Wiederholen Sie Schritt (a). Geben Sie als Spaltennamen COMPONENT_ID an. Geben Sie in der Sicht "Properties" der Spalte die folgenden Attribute an: INTEGER (als Datentyp) und Primärschlüssel und Not Null (als Auswahl).

      Es wird automatisch ein Primärschlüssel mit Namen D_COMPONENT_LABEX1 erstellt.

    Sie haben nun eine neue Dimensionstabelle mit dem Namen D_COMPONENT_LABEX erstellt und einen Primärschlüssel zu der Tabelle hinzugefügt. In den nächsten Schritten werden Sie diesen Primärschlüssel dazu verwenden, eine Verbindung zu der zuvor erstellten Fakttabelle F_DEFECT_METRICS einzurichten.

  12. Stellen Sie eine Verbindung zwischen der Fakttabelle F_DEFECT_METRICS und der Dimensionstabelle D_COMPONENT_LABEX her:
    1. Klicken Sie mit der rechten Maustaste auf F_DEFECT_METRICS. Klicken Sie dann auf Add Data Object > Foreign Key.
    2. Geben Sie als Namen für die übergeordnete Tabelle D_COMPONENT_LABEX an. Klicken Sie auf OK.
    3. Geben Sie als Namen für den Fremdschlüssel COMPONENT_ID an.
    4. Wählen Sie COMPONENT_ID aus und klicken Sie in der Sicht "Properties" auf Details. Wählen Sie im Abschnitt Parent bei Unique constraint or index list den Primärschlüssel D_COMPONENT_LABEX1 aus. Wählen Sie bei Aufforderung Use the existing child /attribute column aus.

    Sie haben die Fakttabelle F_DEFECT_METRICS mit zwei Dimensionstabellen (Tabelle D_DATE für das Datumsattribut und Tabelle D_COMPONENT_LABEX für das Komponentenattribut) verbunden.

    Nun werden Sie die Schablone für die von Ihnen hinzugefügten neuen Tabellen erstellen. Dazu exportieren Sie die Tabellen in ein DDL-Script und führen dieses aus.

  13. Generieren Sie ein DDL-Script für die Tabelle D_COMPONENT_LABEX:
    1. Klicken Sie mit der rechten Maustaste auf die Tabelle D_COMPONENT_LABEX. Klicken Sie dann auf Generate DDL.
    2. Wählen Sie auf der Seite Options Folgendes aus:
      • Vollständig qualifizierte Namen
      • CREATE-Anweisungen
      • COMMENT ON-Anweisungen
      • IN TABLESPACE-Klausel
      Klicken Sie auf Weiter.
    3. Wählen Sie auf der Seite Objects Folgendes aus:
      • Check constraint
      • Foreign key constraint
      • Primary key constraint
      • Tables
      Klicken Sie auf Weiter.
    4. Wählen Sie Run DDL on server aus und klicken Sie auf Weiter.
      Anmerkung: Im Lernprogramm werden Sie eine Musterdatenbank (RIDW) verwenden. Gehen Sie bei der Verwendung der Option Run DDL on server zur Ausführung eines DDL-Scripts für eine zeitnahe Datenbank sorgfältig vor. Mit IBM InfoSphere Data Architect können Sie keine Migrationsfunktion verwenden, d. h. die Daten können nicht beibehalten werden. Die Tabelle wird entweder erstellt oder zuerst gelöscht und dann erstellt.

      Falls gewünscht können Sie das generierte DDL-Script einfach sichern und erst später ausführen.

    5. Wählen Sie auf der Seite Connection zunächst Use an existing connection und dann RIDW aus und klicken Sie auf Weiter.
    6. Geben Sie den Benutzernamen und das Kennwort für den Datenbankadministrator ein und klicken Sie zunächst auf Weiter und dann auf Fertig stellen.
    7. Sichern Sie das Modell.
  14. Generieren Sie ein DDL-Script für die Tabelle F_DEFECT_METRICS:
    1. Klicken Sie mit der rechten Maustaste auf die Tabelle F_DEFECT_METRICS. Klicken Sie dann auf Generate DDL.
    2. Wählen Sie auf der Seite Options Folgendes aus:
      • Vollständig qualifizierte Namen
      • CREATE-Anweisungen
      • COMMENT ON-Anweisungen
      • IN TABLESPACE-Klausel
      Klicken Sie auf Weiter.
    3. Wählen Sie auf der Seite Objects Folgendes aus:
      • Check constraint
      • Foreign key constraint
      • Primary key constraint
      • Tables
      Klicken Sie auf Weiter.
    4. Wählen Sie Run DDL on server aud und klicken Sie auf Weiter.
    5. Wählen Sie auf der Seite Connection zunächst Use an existing connection und dann RIDW aus und klicken Sie auf Weiter.
    6. Geben Sie den Benutzernamen und das Kennwort für den Datenbankadministrator ein und klicken Sie zunächst auf Weiter und dann auf Fertig stellen.
    7. Sichern Sie das Modell.

    Sie haben nun die Änderungen angewendet und so die Struktur Ihrer Tabellen geändert.

Ergebnisse
In dieser Lerneinheit haben Sie folgende Schritte ausgeführt:

Prüfpunkt zur Lerneinheit

Sie haben eine neue Datenquelle erstellt, die Kennzahlen für die Elemente der Datenquelle definiert und die Änderungen gesichert.


Feedback
< Vorherige Lektion | Nächste Lektion >