📜  数据挖掘与数据仓库

📅  最后修改于: 2020-12-21 09:55:17             🧑  作者: Mango

数据挖掘与数据仓库

数据仓库是指将数据编译和组织到一个通用数据库中的过程,而数据挖掘是指从数据库中提取有用数据的过程。数据挖掘过程依赖于在数据仓库阶段中编译的数据来识别有意义的模式。创建了数据仓库以支持管理系统。

数据仓库:

数据仓库是指可以存储数据以进行有用挖掘的地方。它就像一个快速的计算机系统,具有异常庞大的数据存储容量。来自各个组织系统的数据被复制到仓库中,可以在其中进行提取并符合删除错误的要求。在这里,可以针对数据的仓库存储提出高级请求。

数据仓库结合了来自众多来源的数据,从而确保了数据质量,准确性和一致性。数据仓库通过将分析处理与跨国数据库分开来提高系统执行力。数据从不同的数据库流入数据仓库。数据仓库通过将数据分类为描述数据格式和类型的模式来工作。查询工具使用模式检查数据表。

数据仓库数据库都是相对的数据系统,但是它们都可以用于不同的目的。通常使用在线分析处理(OLAP)来构建数据仓库来存储大量历史数据并授权对所有数据的快速请求。建立一个数据库来存储当前交易,并允许快速访问正在进行的业务流程的特定交易,通常称为在线交易处理(OLTP)。

数据仓库的重要功能

数据仓库的重要功能如下:

1.面向主题

数据仓库是面向主题的。它提供有关主题的有用数据,而不是公司的持续运营,这些主题可以是客户,供应商,市场营销,产品,促销等。数据仓库通常着重于数据的建模和分析,以帮助业务组织制作数据。驱动的决策。

2.时间变化:

数据仓库中存在的不同数据可提供特定时期的信息。

3.整合

数据仓库是通过联接来自异构源(例如社交数据库,关卡文档等)的数据而构建的。

4.非易失性

这意味着一旦输入仓库的数据就无法更改。

数据仓库的优势:

  • 更准确的数据访问
  • 提高生产力和性能
  • 成本效益
  • 一致的质量数据

数据挖掘:

数据挖掘是指数据分析。它是计算机支持的过程,用于分析由计算机系统编译或已下载到计算机中的大量数据。在数据挖掘过程中,计算机将分析数据并从中提取有用的信息。它在数据集中寻找隐藏的模式,并尝试预测未来的行为。数据挖掘主要用于发现和指示数据集之间的关系。

数据挖掘旨在使业务组织能够查看业务行为,趋势关系,从而使业务能够制定数据驱动的决策。它也被称为知识在数据库中发现(KDD)。数据挖掘工具利用AI,统计数据,数据库和机器学习系统来发现数据之间的关系。数据挖掘工具可以支持与业务相关的问题,这些问题通常在解决任何问题上都非常耗时。

数据挖掘的重要功能:

数据挖掘的重要功能如下:

  • 它利用模式的自动发现。
  • 它可以预测预期的结果。
  • 它侧重于大型数据集和数据库
  • 它创建可操作的信息。

数据挖掘的优势:

一世。市场分析:

数据挖掘可以预测有助于企业做出决策的市场。例如,它可以预测谁愿意购买哪种类型的产品。

ii。欺诈识别:

数据挖掘方法可以帮助发现哪些手机通话,保险索赔,信用卡或借记卡购买将是欺诈性的。

iii。金融市场分析:

数据挖掘技术被广泛用于帮助建立金融市场模型

iv。趋势分析:

分析市场上当前的现有趋势是一项战略利益,因为它有助于根据市场需求降低成本并降低制造过程。

数据挖掘和数据仓库之间的区别:

Data Mining Data Warehousing
Data mining is the process of determining data patterns. A data warehouse is a database system designed for analytics.
Data mining is generally considered as the process of extracting useful data from a large set of data. Data warehousing is the process of combining all the relevant data.
Business entrepreneurs carry data mining with the help of engineers. Data warehousing is entirely carried out by the engineers.
In data mining, data is analyzed repeatedly. In data warehousing, data is stored periodically.
Data mining uses pattern recognition techniques to identify patterns. Data warehousing is the process of extracting and storing data that allow easier reporting.
One of the most amazing data mining technique is the detection and identification of the unwanted errors that occur in the system. One of the advantages of the data warehouse is its ability to update frequently. That is the reason why it is ideal for business entrepreneurs who want up to date with the latest stuff.
The data mining techniques are cost-efficient as compared to other statistical data applications. The responsibility of the data warehouse is to simplify every type of business data.
The data mining techniques are not 100 percent accurate. It may lead to serious consequences in a certain condition. In the data warehouse, there is a high possibility that the data required for analysis by the company may not be integrated into the warehouse. It can simply lead to loss of data.
Companies can benefit from this analytical tool by equipping suitable and accessible knowledge-based data. Data warehouse stores a huge amount of historical data that helps users to analyze different periods and trends to make future predictions.