📜  数据分析过程的六个步骤

📅  最后修改于: 2022-05-13 01:57:01.400000             🧑  作者: Mango

数据分析过程的六个步骤

数据的收集、转换和组织以得出结论对未来进行预测,并做出明智的数据驱动决策,称为数据分析。处理数据分析的职业称为数据分析师。随着当今数据的快速增长,对数据分析师的需求巨大。数据分析用于为业务问题找到可能的解决方案。成为数据分析师的优势在于他们可以在他们喜欢的任何领域工作:医疗保健、农业、IT、金融、商业。数据驱动的决策是数据分析的重要组成部分。它使分析过程更加容易。数据分析有六个步骤。他们是:

  1. 询问或指定数据要求
  2. 准备或收集数据
  3. 清洁和处理
  4. 分析
  5. 分享
  6. 行动或报告

每个步骤都有自己的流程和工具,可以根据数据得出总体结论。

1. 问

该过程的第一步是询问。给数据分析师一个问题/业务任务。分析师必须了解任务和利益相关者对解决方案的期望。利益相关者是将资金和资源投入到项目中的人。分析师必须能够提出不同的问题,以便为他们的问题找到正确的解决方案。分析师必须找到问题的根本原因才能完全理解问题。分析师必须确保他/她在分析问题时没有任何分心。与利益相关者和其他同事进行有效沟通,以完全了解潜在问题是什么。在询问阶段要问自己的问题是:

  • 我的利益相关者提到的问题是什么?
  • 他们对解决方案有何期望?

2. 准备

第二步是准备或收集数据。此步骤包括收集数据并将其存储以供进一步分析。分析师必须根据来自多个来源的任务收集数据。必须从各种来源、内部或外部来源收集数据。内部数据是您工作的组织中可用的数据,而外部数据是您的组织以外的来源中可用的数据。个人从自己的资源中收集的数据称为第一方数据。收集和出售的数据称为第二方数据。从外部来源收集的数据称为第三方数据。收集数据的常见来源是访谈、调查、反馈、问卷。收集的数据可以存储在电子表格或 SQL 数据库中。

电子表格是包含行和列的数字工作表,而数据库包含具有操作数据功能的表。电子表格用于存储数千或一万条数据,而数据库用于存储太多行时。在电子表格的情况下,存储数据的最佳工具是 MS Excel 或 Google Sheets,并且有很多数据库,如 Oracle、Microsoft 来存储数据。

3. 清理和处理数据

第三步是过程。从多个来源收集数据后,就该清理数据了。干净的数据是指没有拼写错误、冗余和不相关的数据。干净的数据很大程度上取决于数据的完整性。可能存在重复数据或数据可能不是格式,因此删除并清理了不必要的数据。 SQL 和 Excel 提供了不同的函数来清理数据。这是数据分析中最重要的步骤之一,因为干净且格式化的数据有助于发现趋势和解决方案。处理阶段最重要的部分是检查您的数据是否有偏差。偏见是一种偏袒特定群体/社区而忽略其他人的行为。偏差是一个很大的禁忌,因为它可能会影响整体数据分析。数据分析师必须确保在收集数据时包括每个组。

4.分析

第四步是分析。清理后的数据用于分析和识别趋势。它还执行计算并组合数据以获得更好的结果。用于执行计算的工具是 Excel 或 SQL。这些工具提供内置函数来执行计算或用 SQL 编写示例代码来执行计算。使用 Excel,我们可以创建数据透视表并执行计算,而 SQL 创建临时表来执行计算。编程语言是解决问题的另一种方式。它们通过提供软件包使解决问题变得更加容易。用于数据分析的最广泛使用的编程语言是 R 和Python。

5. 分享

第五步是分享。没有什么比可视化更引人注目的了。现在转换的数据必须制作成可视化(图表,图形)。进行数据可视化的原因是可能有一些人,主要是非技术性的利益相关者。可视化是为了简单理解复杂数据。 Tableau 和 Looker 是用于引人注目的数据可视化的两个流行工具。 Tableau 是一个简单的拖放工具,有助于创建引人注目的可视化。 Looker 是一种数据可视化工具,可直接连接到数据库并创建可视化。数据分析师同样使用 Tableau 和 Looker 来创建可视化。 R 和Python有一些包可以提供漂亮的数据可视化。 R 有一个名为 ggplot 的包,它具有各种数据可视化。根据数据发现进行了演示。与团队成员和利益相关者分享见解将有助于做出更好的决策。它有助于做出更明智的决定,并带来更好的结果。

6. 行动或报告

最后/第六步是行动。在根据您的发现进行演示后,利益相关者讨论是否继续前进。如果他们同意您的建议,他们会进一步采用您的解决方案。如果他们不同意您的发现,您将不得不深入挖掘以找到更多可能的解决方案。每一步都必须重新组织。我们必须重复每一步,看看那里是否有任何差距。必须审查收集的数据以查看是否存在任何偏差并确定选项。确定差距并分析数据后,再次进行演示。