Rational Insight Data Warehouse 模型

IBM® Rational® Insight Data Warehouse(RIDW)是一种组件,它以有助于分析报告的格式存储来自各种操作系统的数据,并提供查询优化、多维分析和历史趋势分析所需的引擎。其数据结构与通常以规范化格式存储信息的实时事务系统的数据结构不同。尽管传入数据会通过若干阶段,在这些阶段期间,传入数据会临时存储在规范化的表中,但最终使用的格式是星型模式。本部分描述了 RIDW 的基本数据结构。

数据存储区域

RIDW 包含了三个数据存储区域:

配置区域

该区域存储关于实体的重要配置信息,例如产品数据源和日历。配置区域包含仓库的引用设置。它有四个主要的表:
表 1.
表名 表的用途
SYS_CONFIG 包含系统配置信息,例如日期维日历类型。
ETL_INFO 包含抽取、变换和装入(ETL)配置信息,例如 ETL 调度(每日、每周或每月)
为与多个数据源兼容,RIDW 支持 ISO 和公历日期类型。安装了仓库后,在执行 ETL 事务之前,您可以选择配置设置。

运作数据存储

这是在 ETL 过程期间接收、组合和存储从数据源收集的信息的区域。RIDW 支持以下产品:IBM Rational ClearQuest®(Enterprise 和 ALM 模式)、IBM Rational ClearCase®、IBM Rational Requisite® Pro、IBM Rational Team Concert、IBM Rational Test Manager、IBM Rational Quality Manager、IBM Rational Team Manager 以及 Microsoft® Project。然后清除并处理数据以确保多个源之间的一致性。RIDW 数据库设计原则意在确保以下内容:
  • 数据到其源操作系统的可跟踪性
  • 基于主题的元素分组
  • 不依赖数据源呈现统一的规范化区域
控制列
ETL 过程将添加一些包含控制信息的其他列,这些控制信息稍后由 RIDW 使用。例如,以下三个必需的列提供标识信息:
  • EXTERNAL_KEY1 存储自然键(如果为整数)
  • EXTERNAL_KEY2 存储自然键(如果为 varchar 类型)
  • SOURCE_ID 存储数据源的 GUID 值
终端用户不需要配置 GUID,因为在设计阶段期间已将其指定给数据源。

还添加了其他两个控制列:ISSOFDELETED 和 REC_DATETIME。

ISSOFDELETED 用来标记已从起始源物理删除的记录。 如果记录已删除,那么它的值应该设置为 1;如果未删除,那么应该设置为 0。
注: 规范化区域中的记录不应物理删除,因为它们可能已链接到事实和维区域中的度量。
REC_DATETIME 是时间戳记列,其值由数据库在插入记录时设置,之后由 ETL 在更新记录时更新。

代理键

代理键是 ETL 过程创建的主键。要解决不同来源的主键格式之间差异的问题,需要使用这些代理键。在每个已抽取的表中,RIDW 创建自己的主键并在 EXTERNAL_KEY1 或 EXTERNAL_KEY2 列中保留原始键。代理键是从 0 开始的整数。

分类表

这些是表示常用工件(例如项目、请求、需求、任务、活动和组件)的表。它们是通过包含单词“CLASSIFICATION”的名称识别的。每个分类表有预定义的记录类型,表示对工件的常见理解。将抽取的表转换为分类表是由 ETL 过程管理的。

伪记录

所有的分类和工件表都包含了可通过主键值 -1 识别的伪行。伪行支持当定义的引用约束的值为空时,对数据进行规范化。

事实和维区域

事实和维区域实施星型模式设计,该设计是一组事实、维和历史可跟踪性表。事实表包含特定业务流程的度量或“事实”。例如,如果项目管理是要度量的过程,那么相应的事实表可能包含需求数。维表包含在执行数据仓储查询时用于对数据进行约束和分组的属性。如果需求数是事实表,那么您可能想要使用需求类型作为维。

设计约定

维表的名称以“D_”开头,并具有用于标识记录的代理键。事实表的名称带有“F_”,而从历史角度观察事实表中所发现度量的表以“H_”开头。主键通常是度量的代理键和提供度量的工件的代理键的组合。名称中带有“F_C_”的事实表等同于其原始趋势分析事实表,除了一点,这些事实表仅存储最新的数据快照,而其对等的原始趋势分析事实表会累计数据以允许对随时间推移呈现的趋势进行分析。数据集市也包含一组视图,这些视图为运作数据存储提供了窗口,目的是向下钻取更多详细信息,或者为了有可能提供列表报告。

控制列

所有的事实表都有一个引用日期维 D_DATE 的列。对于趋势分析表,此上下文中的日期表示执行数据快照的日期。 对于其他事实表,此日期反映出现了诸如记录创建之类的事件。 可以对数据快照进行标记,以指示是基于“每天”、“每周”还是“每月”,具体取决于配置区域中 SYS_CONFIG 表中存储的值。其他控制列包含 REC_DATEIME 列,该列充当插入或更新记录的记录戳记。

空指示符记录

与在运作数据存储中一样,维表包含可通过主键值 -1 标识的 NULL 指示符行。这表示带有约束的表中的空值。


反馈