Rational Insight Data Warehouse 模型

IBM® Rational® Insight Data Warehouse (RIDW) 是用來儲存各種作業系統資料的元件,其儲存格式可簡化分析報告,此元件還提供查詢最佳化、多維度分析及歷程趨勢所需的引擎。其資料結構不同於即時交易系統,這些交易系統通常會將資訊儲存在正規化表單中。而送入的資料會經過數種不同的階段,在這段期間,資料會暫時儲存在正規化表格中,最終的使用格式為星狀綱目。 本節說明 RIDW 的基本資料結構。

資料儲存區

RIDW 包含三個資料儲存區:

配置區域

此區域儲存有關實體(如產品資料來源及日曆)的重要配置資訊。 配置區域包含倉儲的參照設定。 其中有四個主要表格:
表 1.
表格名稱 表格用途
SYS_CONFIG 包含系統配置資訊,如日期維度日曆類型。
ETL_INFO 包含擷取、轉換並載入 (ETL) 配置資訊,如 ETL 排程(每日、每週或每月)
在多個資料來源的相容性方面,RIDW 支援 ISO 及「格里高里曆」日期類型。您可以在安裝倉儲時,以及執行 ETL 交易之前,選取配置設定。

作業資料儲存處

此區域在 ETL 處理程序期間,用來接收、合併及儲存從資料來源收集的資訊。 RIDW 支援下列產品:IBM Rational ClearQuest®(企業及 ALM 綱目)、IBM Rational ClearCase®、IBM Rational Requisite® Pro、IBM Rational Team Concert、IBM Rational Test Manager、IBM Rational Quality Manager、IBM Rational Team Manager 及 Microsoft® 專案。然後會清除及處理資料,以確保多個來源之間的一致性。 RIDW 資料庫設計原則力求確保下列事項:
  • 資料可追蹤至其來源作業系統
  • 根據主旨將元素分組
  • 呈現與資料來源無關的統一正規化區域
控制直欄
ETL 處理程序會新增一些其他直欄,這些直欄中包含 RIDW 稍後使用的控制資訊。 例如,下列三個必要的直欄提供識別資訊:
  • EXTERNAL_KEY1 儲存自然鍵(若為整數)
  • EXTERNAL_KEY2 儲存自然鍵(若為 varchar 類型)
  • SOURCE_ID 儲存資料來源的 GUID 值
一般使用者不需要配置 GUID,因為在設計階段,會將 GUID 指派給資料來源。

還會新增另外兩個控制直欄:ISSOFDELETED 及 REC_DATETIME。

ISSOFDELETED 用來標示實際上已從原始來源中刪除的記錄。 若記錄已刪除,其值應設為 1,若未刪除,則應設為 0。
註: 絕不應實際刪除正規化區域中的記錄,因為它們可能鏈結至事實及維度區域中的測量。
REC_DATETIME 是時間戳記直欄,插入記錄時資料庫會設定其值,更新記錄時 ETL 後續會更新其值。

代理鍵

代理鍵是 ETL 處理程序建立的主要索引鍵。需要使用這些代理鍵來置換不同來源的主要索引鍵格式差異。 在每一個擷取的表格中,RIDW 會建立自己的主要索引鍵,並在 EXTERNAL_KEY1 或 EXTERNAL_KEY2 直欄中保留原始索引鍵。代理鍵是 0 型整數。

分類表格

這些是用來代表常用構件(如專案、要求、需求、作業、活動及元件)的表格。 這些表格可透過其名稱加以辨識,名稱中會包含 CLASSIFICATION 單字。每一個分類表格都有一個預先定義的記錄類型,代表一般理解的構件。 將擷取的表格轉換成由 ETL 處理程序管理的分類表格。

虛擬記錄

所有分類及構件表格都包含虛擬列,可以透過主要索引鍵值 -1 來識別該列。 若在參照限制中定義了空值,虛擬列可支援資料的正規化。

事實及維度區域

事實及維度區域實作星狀綱目設計,也就是一組事實、維度及歷程可追蹤性表格。 事實表格包含特定商業程序的測量或「事實」。 例如,若專案管理是您要測量的程序,則對應的事實表格可能包含需求數。 維度表格包含執行資料倉儲查詢時,用來限制及分組資料的屬性。 若需求數目是事實表格,則您可能想要使用需求類型作為維度。

設計慣例

維度表格名稱以 D_ 開頭,且含有可識別記錄的代理鍵。 事實表格名稱以 F_ 開頭,但若表格可以對事實表格中找到的測量提供歷程見解,則以 H_ 開頭。 主要索引鍵通常是由測量的代理鍵及構成測量的構件之代理鍵所組合而成。 含有「F_C_」的事實表格名稱相當於其原始趨勢事實表格,不同之處在於它們僅儲存資料的最新 Snapshot,而其對應表格則會累計資料以允許儲存隨著時間而變化的趨勢。資料集區還包含一組視圖,提供通往作業資料儲存處的視窗,可用來往下探查以取得更多詳細資料或儘可能提供清單報告。

控制直欄

所有實際表格皆具有參照日期維度 D_DATE 的直欄。對於趨勢表格,此環境定義中的日期表示取得資料 Snapshot 的日期。對於其他事實表格,此日期反映所發生的事件(如建立記錄)。視儲存在配置區域中 SYS_CONFIG 表格的值而定,資料 Snapshot 可以加上標籤以表示「每日」、「每週」或「每月」基準。 其他控制直欄包含 REC_DATEIME 直欄,當成插入或更新記錄時的記錄戳記使用。

空值指示符記錄

如同在作業資料儲存處中一樣,維度表格包含空值指示符列,該列可透過主要索引鍵值 -1 加以識別。在含有限制項的表格中,這就代表空值。


意見