我来试一下
1 在叶子层,标上颜色的结点表示应该判断为1的结点
2 连接线的粗细表示该结点所表示的数据子集的大小,数据子集大则线条粗
3 Node的预测结果是看1的占比大还是0的占比大,如果1的占比大,则判定为1。你可以这么理解,在叶子结点上有一个数据子集,在数据子集上进行投票,如果1超过半数,该叶子结点就判定为1,反之就为0。例如4个叶子结点中,蓝色的结点都标为1。按理来说,第一个白色的叶子结点本应该为1,但是由于1的比例仅为50.6%,也就是优势非常弱,可能不满足某些原则,所以不能标为1.
就像在投票中,如果优势很小则投票无效一样。
总体上,这个决策树的预测准确率应该很低。你需要找到更好的变量。


雷达卡




京公网安备 11010802022788号







