📜  数据仓库什么是事实星座模式(1)

📅  最后修改于: 2023-12-03 15:10:18.060000             🧑  作者: Mango

数据仓库:事实星座模式

什么是数据仓库?

数据仓库是数据管理的一种特殊形式,它是一种面向主题、集成的、相对稳定的、面向主管用户的数据存储,用于支持管理决策。

什么是事实星座模式?

在数据仓库中,事实星座模式(Fact Constellation Schema)是一种多维数据建模方法,也称为星型/雪花型模型的变体。

星型模型

星型模型由中央的“事实表”(Fact Table)和与其关联的“维度表”(Dimension Table)组成。事实表包含业务过程中发生的事件的数据,维度表描述了这些事件发生的背景和上下文信息。例如,一张销售订单中可能包含销售日期、销售地点、销售员、订单总额等信息,这些数据可以被分为事实和维度,事实表被设计为以时间为中心,维度表则用来描述时间所属的各种属性。

雪花型模型

雪花型模型是星型模型的扩展形式,它引入了更多的维度表。维度表可以进一步分解为更小的维度表,这种分解过程造成了模型的层次结构,也给模型的维度表嵌套带来了雪花形状的外形,因而得名“雪花型模型”。

事实星座模式

事实星座模式则是将不同的星型模型或雪花型模型融合到一起,在一个大的数据仓库里面以星座的形状展现出来。它由多个事实表、多个维度表以及这些表之间的关系构成。在这种模型中,不同的事实表可以共享同一个维度表,并且一个事实表也可以同时包含多个度量(Measure)。

如何设计事实星座模式?
  • 理解业务需求:在着手设计数据仓库之前,必须清楚了解业务方的需求。只有深入理解业务流程,把握信息体系才能有针对性地制定建模方案。
  • 定义事实表:在事实星座模型中,事实表通常是以时间为主线来设计的。它包含了业务过程中产生的事实数据,如订单总额、销售数量、客户订购次数等度量。
  • 确定维度表:维度表用于描述产生事实数据的背景和上下文信息。维度表可以来源于业务流程中各个环节的主体,如订单、客户、产品、时间等等。
  • 建立度量:度量是用于计算、汇总、统计事实表中的数据的指标,它通常是与度量相关的计算维度的组合。在设计度量时,需要注重它们的可理解性、可变性和可计算性。
  • 建立关联:在确定了事实表、维度表和度量之后,需要对它们进行关联。在关联时,应该确保每个事实表都与至少一个维度表存在关联,同时避免建立过于复杂的关联关系。

参考资料:

1.《数据仓库与数据挖掘(第三版)》 黄勇、李军、罗建中 2.《The Data Warehouse Toolkit》Ralph Kimball 3.https://en.wikipedia.org/wiki/Fact_table 4.https://en.wikipedia.org/wiki/Dimension_(data_warehouse)