楼主: beci426
3773 7

[SAS EM] 有关Em决策树的一些问题 [推广有奖]

  • 8关注
  • 6粉丝

已卖:1380份资源

讲师

0%

还不是VIP/贵宾

-

威望
0
论坛币
91556 个
通用积分
529.2753
学术水平
47 点
热心指数
50 点
信用等级
43 点
经验
12274 点
帖子
348
精华
0
在线时间
396 小时
注册时间
2008-6-20
最后登录
2024-3-20

楼主
beci426 发表于 2013-6-7 17:16:07 |AI写论文
200论坛币


QQ截图20130607165610.png
以上使用EM 的Decision Tree 做出的分析
小弟新手有些许问题,希望不吝赐教
1  为什么每个Node的颜色不太一样,颜色是否有特定含义,在图表设置没有看见说明
2 连接线的颜色粗细不同,是什么特定含义?
3 有关Node 的Prediction,如何判定是1还是0? 大致原理是什么,我在大多数是将怎么Split Node的原理,没有讲到分完之后预测是什么。
4 还有一些其他的小问题,希望有人给提供思路厚我再自行解决或者补充问下

一点点小论坛币不成敬意希望大家帮帮忙


关键词:决策树 Prediction Decision 希望大家帮帮忙 predict

沙发
dokers 发表于 2013-6-8 15:10:47
我来试一下
1 在叶子层,标上颜色的结点表示应该判断为1的结点
2 连接线的粗细表示该结点所表示的数据子集的大小,数据子集大则线条粗
3 Node的预测结果是看1的占比大还是0的占比大,如果1的占比大,则判定为1。你可以这么理解,在叶子结点上有一个数据子集,在数据子集上进行投票,如果1超过半数,该叶子结点就判定为1,反之就为0。例如4个叶子结点中,蓝色的结点都标为1。按理来说,第一个白色的叶子结点本应该为1,但是由于1的比例仅为50.6%,也就是优势非常弱,可能不满足某些原则,所以不能标为1.
就像在投票中,如果优势很小则投票无效一样。
总体上,这个决策树的预测准确率应该很低。你需要找到更好的变量。

藤椅
beci426 发表于 2013-6-9 19:24:38
Hello world
No成绩评分
小王95优秀


板凳
dokers 发表于 2013-6-9 20:56:49
beci426 发表于 2013-6-9 19:24
Hello world
这是啥意思?回答满意吗,可以给论坛币吗?等米下锅唉,呵呵

报纸
beci426 发表于 2013-6-9 22:06:48
dokers 发表于 2013-6-8 15:10
我来试一下
1 在叶子层,标上颜色的结点表示应该判断为1的结点
2 连接线的粗细表示该结点所表示的数据子集 ...
### 您好
非常感谢你的回答,好多地方已经理解。但是还有部分地方不是很理解 比如
1. 您说标上颜色的叶子表示是判断为1 的例子,但是您看最底行第三个,就是Prediction是0,但是依然标上了颜色
2. 您提到了蓝色的叶子都标为1,但是最低行第三个就不是1

* 以及非常感谢您的回答! 希望可以以此交个朋友,共同进步!

地板
dokers 发表于 2013-6-10 22:26:21
beci426 发表于 2013-6-9 22:06
### 您好
非常感谢你的回答,好多地方已经理解。但是还有部分地方不是很理解 比如
1. 您说标上颜色的叶 ...
抱歉没有看仔细,叶子层蓝色的结点表示满足判断条件的结点,即以一定优势的方式将该叶子结点判定为0或1

7
aufe2008 发表于 2013-6-12 01:25:38
这个我也玩过,没完全搞懂!

8
easyfly 发表于 2013-7-21 11:31:12
我也试一下:
1、颜色是和你的设置有关,我看图中的设置应该是预测的错误误判最小,即在训练数据集和检验数据集中1的占比之差最小;
2、线的大小好像是和数据集的大小是相关的;
3、prediction变量是你在跑模型之前设置的吧,建议你找一些数据挖掘的书看看,经典的决策树算法就只有几种,原理都比较简单,模型的结果和你跑模型之前选择的算法是相关的。

新版的em没有用过,我想原理应该是一样的吧?欢迎其它同学一起讨论

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 03:53