使用 sklearn 构建决策树并使用 Graphviz 绘制树结构
1. 概述 之前两篇日志,我们系统性的介绍了决策树的构建算法、构建流程、展示与决策: 决策树的构建算法 – ID3 与 C4.5 算法 决策树的构建、展示与决策 本文,我们来介绍如何使用 sklearn 构建决策树。 2. sklearn 之前我们已经介绍和使用过 python 的 sklearn 包: k 近邻算法 sklearn 也提供了决策树明星,用于解决分类和回归问题。 http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html。 3. sklearn.tree.DecisionTreeClassifier 构造参数 sklearn.tree.DecisionTreeClassifier 类就是我们需要的决策树类,它具有如下构造参数: ####sklearn.tree.DecisionTreeClassifier 类构造参数 参数名 类型 可选参数 默认值 说明 criterion string ‘gini’、‘entropy’ ‘gini’ 构建决策树算法,基尼不纯度准则(CART 算法)或信息熵准则(C4.5算法) splitter string ‘best’、‘random’ ‘random’ 决策树分支选取原则,全局最优或选取随机局部最优点 max