数据存储区域
RIDW 包含了三个数据存储区域:
表名 | 表的用途 |
---|---|
SYS_CONFIG | 包含系统配置信息,例如日期维日历类型。 |
ETL_INFO | 包含抽取、变换和装入(ETL)配置信息,例如 ETL 调度(每日、每周或每月) |
还添加了其他两个控制列:ISSOFDELETED 和 REC_DATETIME。
代理键
代理键是 ETL 过程创建的主键。要解决不同来源的主键格式之间差异的问题,需要使用这些代理键。在每个已抽取的表中,RIDW 创建自己的主键并在 EXTERNAL_KEY1 或 EXTERNAL_KEY2 列中保留原始键。代理键是从 0 开始的整数。
分类表
这些是表示常用工件(例如项目、请求、需求、任务、活动和组件)的表。它们是通过包含单词“CLASSIFICATION”的名称识别的。每个分类表有预定义的记录类型,表示对工件的常见理解。将抽取的表转换为分类表是由 ETL 过程管理的。
伪记录
所有的分类和工件表都包含了可通过主键值 -1 识别的伪行。伪行支持当定义的引用约束的值为空时,对数据进行规范化。
事实和维区域实施星型模式设计,该设计是一组事实、维和历史可跟踪性表。事实表包含特定业务流程的度量或“事实”。例如,如果项目管理是要度量的过程,那么相应的事实表可能包含需求数。维表包含在执行数据仓储查询时用于对数据进行约束和分组的属性。如果需求数是事实表,那么您可能想要使用需求类型作为维。
设计约定
维表的名称以“D_”开头,并具有用于标识记录的代理键。事实表的名称带有“F_”,而从历史角度观察事实表中所发现度量的表以“H_”开头。主键通常是度量的代理键和提供度量的工件的代理键的组合。名称中带有“F_C_”的事实表等同于其原始趋势分析事实表,除了一点,这些事实表仅存储最新的数据快照,而其对等的原始趋势分析事实表会累计数据以允许对随时间推移呈现的趋势进行分析。数据集市也包含一组视图,这些视图为运作数据存储提供了窗口,目的是向下钻取更多详细信息,或者为了有可能提供列表报告。
控制列
所有的事实表都有一个引用日期维 D_DATE 的列。对于趋势分析表,此上下文中的日期表示执行数据快照的日期。 对于其他事实表,此日期反映出现了诸如记录创建之类的事件。 可以对数据快照进行标记,以指示是基于“每天”、“每周”还是“每月”,具体取决于配置区域中 SYS_CONFIG 表中存储的值。其他控制列包含 REC_DATEIME 列,该列充当插入或更新记录的记录戳记。
空指示符记录
与在运作数据存储中一样,维表包含可通过主键值 -1 标识的 NULL 指示符行。这表示带有约束的表中的空值。