📝 Scikit学习教程

22篇技术文档
  Scikit学习-随机决策树

📅  最后修改于: 2020-12-10 05:56:04        🧑  作者: Mango

本章将帮助您了解Sklearn中的随机决策树。随机决策树算法众所周知,DT通常是通过递归拆分数据来训练的,但是容易过度拟合,通过在数据的各个子样本上训练许多树,可以将它们转换为随机森林。sklearn.ensemble模块具有以下两种基于随机决策树的算法-随机森林算法对于考虑中的每个特征,它都会计算局部最优特征/分割组合。在随机森林中,集合中的每个决策树都是根据从训练集中替换而来的样本构建的,然后...

  Scikit学习-增强方法

📅  最后修改于: 2020-12-10 05:56:41        🧑  作者: Mango

在本章中,我们将学习Sklearn中的增强方法,该方法可以构建集成模型。Boosting方法以增量方式构建集成模型。主要原理是通过顺序地训练每个基本模型估计量来逐步构建模型。为了建立强大的整体,这些方法基本上结合了几个星期的学习者,这些学习者在训练数据的多次迭代中被顺序训练。 sklearn.ensemble模块具有以下两种增强方法。AdaBoost它是最成功的增强合奏方法之一,其主要关键在于它们...

  Scikit学习-聚类方法

📅  最后修改于: 2020-12-10 05:57:27        🧑  作者: Mango

在这里,我们将研究Sklearn中的聚类方法,这将有助于识别数据样本中的任何相似性。聚类方法是最有用的无监督ML方法之一,用于查找数据样本之间的相似性和关系模式。之后,他们将这些样本基于特征聚类为具有相似性的组。聚类决定了当前未标记数据之间的固有分组,这就是为什么它很重要。Scikit-learn库具有sklearn.cluster以执行未标记数据的聚类。在这个模块下scikit-leran具有以...

  Scikit学习-集群性能评估

📅  最后修改于: 2020-12-10 05:57:55        🧑  作者: Mango

在各种功能的帮助下,我们可以评估聚类算法的性能。以下是Scikit学习提供的一些重要且最常用的函数,用于评估集群性能-调整后的兰德指数兰德指数是一项函数,用于计算两个聚类之间的相似性度量。对于此计算,兰德指数考虑了在预测和真实聚类中分配给相似或不同聚类中的所有样本对和计数对。然后,使用以下公式将原始的兰德指数得分“调整为偶然”成调整后的兰德指数得分-$$ Adjusted \:RI = \ lef...

  Scikit学习-使用PCA减少维度

📅  最后修改于: 2020-12-10 05:58:23        🧑  作者: Mango

降维是一种无监督的机器学习方法,用于减少选择主要特征的每个数据样本的特征变量的数量。主成分分析(PCA)是降维的流行算法之一。精确的PCA主成分分析(PCA)用于线性降维,使用数据的奇异值分解(SVD)将其投影到较低维度的空间中。使用PCA进行分解时,在应用SVD之前,输入数据将居中但未按比例缩放。Scikit-learn ML库提供了sklearn.decomposition.PCA模块,该模块...

  Scikit学习-有用的资源

📅  最后修改于: 2020-12-10 05:58:38        🧑  作者: Mango

以下资源包含有关Scikit Learn的其他信息。请使用它们来获得有关此方面的更深入的知识。Scikit Learn上的有用链接Scikit Learn @ Wikipedia-Scikit Learn,其历史和其他各种术语已用简单的语言进行了解释。关于Scikit学习的有用书籍要在此页面上注册您的网站,请发送电子邮件至...

  讨论Scikit学习

📅  最后修改于: 2020-12-10 05:58:50        🧑  作者: Mango

Scikit-learn(Sklearn)是Python用于机器学习的最有用和最强大的库。它通过Python的一致性接口为机器学习和统计建模提供了一系列有效的工具,包括分类,回归,聚类和降维。该库主要用Python编写,基于NumPy,SciPy和Matplotlib构建。...