📝 敏捷数据科学教程

23篇技术文档
  部署预测系统

📅  最后修改于: 2021-01-23 05:52:36        🧑  作者: Mango

在此示例中,我们将学习如何创建和部署预测模型,该模型有助于使用Python脚本预测房价。用于部署预测系统的重要框架包括Anaconda和“ Jupyter Notebook”。请按照以下步骤来部署预测系统-步骤1-实现以下代码,将csv文件中的值转换为关联的值。上面的代码生成以下输出-步骤2-执行describe函数以获取csv文件属性中包含的数据类型。步骤3-我们可以基于我们创建的预测模型的部署...

  敏捷数据科学-SparkML

📅  最后修改于: 2021-01-23 05:52:54        🧑  作者: Mango

机器学习库也称为“ SparkML”或“ MLLib”,由常见的学习算法组成,包括分类,回归,聚类和协作过滤。为什么要学习SparkML for Agile?Spark正在成为构建机器学习算法和应用程序的实际平台。开发人员在Spark上工作,以在Spark框架中以可扩展和简洁的方式实现机器算法。我们将通过该框架学习机器学习的概念,其实用程序和算法。敏捷总是选择一个框架,该框架可以带来短期和快速的结...

  解决预测问题

📅  最后修改于: 2021-01-23 05:53:12        🧑  作者: Mango

在本章中,我们将重点放在借助特定方案来解决预测问题上。考虑到一家公司希望根据通过在线申请表提供的客户详细信息来自动化贷款资格详细信息。详细信息包括客户名称,性别,婚姻状况,贷款金额和其他强制性详细信息。详细信息记录在CSV文件中,如下所示-执行以下代码以评估预测问题-输出上面的代码生成以下输出。...

  改善预测性能

📅  最后修改于: 2021-01-23 05:53:32        🧑  作者: Mango

在本章中,我们将着重于构建一个模型,该模型利用其中包含的许多属性来帮助预测学生的表现。重点是显示学生在考试中的失败结果。处理评估的目标值为G3。此值可以归类,并进一步分为失败和成功。如果G3值大于或等于10,则学生通过考试。例考虑下面的示例,如果学生遇到以下情况,则执行代码以预测性能-输出上面的代码生成如下所示的输出仅参考一个变量来处理预测。参考一个变量,学生成绩预测如下所示-...

  使用敏捷和数据科学创建更好的场景

📅  最后修改于: 2021-01-23 05:53:51        🧑  作者: Mango

敏捷方法论可帮助组织适应变化,在市场中竞争并构建高质量的产品。可以看出,随着敏捷方法的发展,组织的成熟度不断提高,客户需求的变化也越来越多。与敏捷的团队一起编译和同步数据对于根据所需的产品组合汇总数据非常重要。制定更好的计划标准化的敏捷性能仅取决于计划。有序的数据架构可提高组织进度的生产力,质量和响应能力。数据一致性级别通过历史和实时方案得以维护。考虑下图以了解数据科学实验周期-数据科学涉及到需求...

  敏捷数据科学-敏捷的实现

📅  最后修改于: 2021-01-23 05:54:10        🧑  作者: Mango

敏捷开发过程中使用了各种方法。这些方法也可以用于数据科学研究过程。下面给出的流程图显示了不同的方法-Scrum用软件开发的术语来说,scrum意味着与一个小团队一起管理工作并管理一个特定项目,以揭示该项目的优势和劣势。晶体方法水晶方法论包括用于产品管理和执行的创新技术。使用这种方法,团队可以以不同的方式完成相似的任务。 Crystal系列是最简单的应用方法之一。动态软件开发方法该交付框架主要用于以...

  敏捷数据科学-有用的资源

📅  最后修改于: 2021-01-23 05:54:25        🧑  作者: Mango

以下资源包含有关敏捷数据科学的其他信息。请使用它们来获得有关此方面的更深入的知识。敏捷数据科学的有用链接敏捷数据科学–敏捷数据科学官方网站关于敏捷数据科学的有用书籍要在此页面上注册您的网站,请发送电子邮件至...

  讨论敏捷数据科学

📅  最后修改于: 2021-01-23 05:54:39        🧑  作者: Mango

敏捷是一种软件开发方法,可通过使用1到4周的短暂迭代通过增量会话帮助构建软件,从而使开发与不断变化的业务需求保持一致。敏捷数据科学由敏捷方法论和数据科学组成。在本教程中,我们使用了适当的示例来帮助您以一般而快速的方式理解敏捷开发和数据科学。...