📜  数据仓库交付过程

📅  最后修改于: 2020-12-30 00:42:20             🧑  作者: Mango

数据仓库交付流程

现在我们讨论数据仓库的交付过程。数据仓库交付过程中使用的主要步骤如下:

IT策略: DWH项目必须包含IT策略以获取和保留资金。

业务案例分析:在设计了IT策略之后,下一步就是业务案例。必须了解可以证明其合理的投资水平,并认识到应该从使用数据仓库中获得的预期业务收益。

教育和原型制作:公司将尝试数据分析的思想,并对数据仓库的价值进行自我教育。这很有价值,如果这是公司首次接触DS记录的好处,则必须这样做。原型制作方法可以促进教育的发展。它比工作模型更好。原型制作需要业务需求,技术蓝图和结构。

业务需求:包含以下内容

数据仓库中数据的逻辑模型。

提供此数据的源系统(映射规则)

要应用于信息的业务规则。

即时需求的查询配置文件

技术蓝图:它安排了仓库的体系结构。交付过程的技术蓝图制定了可以满足长期需求的架构计划。它奠定了服务器和数据集市体系结构以及数据库设计的基本组成部分。

建立愿景:这是生产第一个交付成果的阶段。此阶段可能会创建用于提取和加载信息的重要基础结构元素,但将它们限制为信息源的提取和加载。

历史记录加载:下一步是将所需历史记录的其余部分加载到数据仓库中的步骤。这意味着不会将新实体添加到数据仓库中,但可能会创建其他物理表来保存增加的记录量。

AD-Hoc查询:在此步骤中,我们配置一个即席查询工具以对数据仓库进行操作。

这些最终客户访问工具能够自动生成数据库查询,以回答用户提出的任何问题。

自动化:自动化阶段是DWH中许多操作管理过程完全自动化的阶段。其中包括:

从各种来源系统中提取和加载数据

将信息转换为适合分析的形式

备份,还原和归档数据

根据数据仓库中的预定义定义生成聚合。

监视查询配置文件并确定适当的聚合以维护系统性能。

扩展范围:在此阶段,DWH的范围已扩展为满足一组新的业务需求。这涉及将其他数据源加载到DWH中,即引入新的数据集市。

需求演变:这是数据仓库交付过程的最后一步。众所周知,需求不是一成不变的,并且会不断发展。随着业务需求的变化,它将支持它反映在系统中。

概念层次

概念层次结构是有向图的有向图,其中唯一的名称标识每个理论。

从概念a到b的弧表示比b更通用的概念。我们可以用想法标记文本。

每个文本报告都由一组与其内容相对应的概念标记。

用概念标记报表隐含地将其标记在概念层次结构的所有祖先中。因此,希望报告应该以尽可能低的概念标记。

自动将报表标记到层次结构的方法是自上而下的方法。评估函数确定当前标记为节点的记录是否也可以标记为其子节点中的任何一个。

如果是这样,则标签将在层次结构中向下移动,直到无法将其进一步推送为止。

此步骤的结果是报告的层次结构,并且在每个节点处都有一组具有与该节点相关的通用概念的报告。

标记步骤产生的报告层次结构对于许多文本挖掘过程很有用。

假定概念的层次结构称为先验。通过使用任何层次聚类算法,我们甚至可以拥有没有概念层次的文档这样的层次,从而形成这样的层次。


概念层次结构定义了从一组特定的低层概念到更通用的高层概念的映射序列。

在数据仓库中,它通常用于表示维度表之一中属性的不同级别的粒度。

概念层次结构对于制定有用的OLAP查询至关重要。层次结构允许用户汇总各个级别的数据。

例如,使用位置层次结构,用户可以检索汇总每个位置,给定州,甚至给定国家/地区中所有区域的销售额的数据,而无需重新组织数据。