📜  sklearn 导入树 - Python (1)

📅  最后修改于: 2023-12-03 15:20:09.337000             🧑  作者: Mango

sklearn 导入树 - Python

在机器学习中,决策树是一种常用的模型,被用于分类和回归问题。在Python中,使用scikit-learn(sklearn)库可以很容易地实现决策树。

导入sklearn库
from sklearn import tree

在代码中,我们导入了sklearn库中的tree模块。该模块允许我们创建、训练和可视化决策树模型。

加载训练数据

在训练决策树之前,需要加载数据集。数据集应包含有关要预测的目标的特征和标签。

features = [[0, 0], [0, 1], [1, 0], [1, 1]]
labels = [0, 1, 1, 0]

在上述代码中,包含了一个X列表与一个y列表,它们分别表示训练数据以及对应的标签。

创建决策树模型
clf = tree.DecisionTreeClassifier()
clf = clf.fit(features, labels)

在这里,我们使用DecisionTreeClassifier创建分类器。然后我们将训练数据用于fit函数来训练我们的模型。

可视化决策树

接下来,我们可以使用Graphviz库和export_graphviz函数将训练好的决策树可视化。

from sklearn.tree import export_graphviz
import graphviz

dot_data = tree.export_graphviz(clf, out_file=None,
                                filled=True, rounded=True,
                                special_characters=True)
graph = graphviz.Source(dot_data)
graph

上述代码将输出可视化决策树。您可以使用该方法导出类似的图片:

graph.render("decision_tree")

树的可视化将显示每个节点的分类规则和分裂条件。从根节点到叶节点,每个节点都将显示预测类别。

总结

在这个介绍中,我们看到了如何从sklearn中导入决策树,并使用它创建,训练和可视化。决策树在机器学习中是一个强大的模型,能用于许多分类和回归问题。