阅读原文:http://980.so/3z806D
如果大家处于Python入门阶段或者机器学习的初级阶段,可以尝试用著名统计学家Fisher统计的Iris(鸢尾草分类)数据进行试验,这段code来源于sk-learn官网,为了更好地说明结果,我做了一些改进:
运行成功的结果如下:
其中如(2,4)分别代表了第一个最佳的分割属性(如:叶长)和该次属性结点选择中总共有几个剩余属性,最后的"{ }"中“<”代表进入了下一个右侧树枝,">"代表进入了上行左侧分支,数字集合代表各属性下面划分类别的阈值。如下所示:
现在大家已经知道了如何构建一棵树,那么接下来如何判断一个样本属于哪类呢?我们需要定义一个分类函数,实际上就是依照之前得到的分类标准来分:
最后输出的结果就是virginica这个分类。
原文有完整代码,想要学习的可以去看一下。
阅读原文:http://980.so/3z806D


雷达卡





京公网安备 11010802022788号







