楼主: chasedreamtrue
1696 2

请教熟悉enterprise miner的一个问题 [推广有奖]

  • 0关注
  • 0粉丝

本科生

78%

还不是VIP/贵宾

-

威望
0
论坛币
123 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
781 点
帖子
82
精华
0
在线时间
12 小时
注册时间
2007-7-30
最后登录
2010-10-24

楼主
chasedreamtrue 发表于 2009-3-15 00:10:00 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
现在在用EM的decison tree 作一个东西,因为没有学过,发现把把数据作decision
tree后,有些variable 并没有在tree leaf里面,比如这个数据有8个variable, 只有6
个出现在tree里面,看到那个sas output 中importance数据中,也没有那两个
variable,这样正常吗?要改那些参数才能让所有的variable 被用上呢?

还有就是sum of squared error ,average squared error 几个error都是很大的数,
是不是哪里出了问题?怎莫来处理呢?谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Enterprise enter Miner MINE rise 请教 Miner Enterprise

回帖推荐

wolfcrying 发表于2楼  查看完整内容

没有出现在tree里可能是因为变量的不够显著性,因此没有入选。Tree在分裂节点时,根据不同的算法,一般有entropy, LogP,Gini,IV值等差异性指标,EM会为这些指标设置一些默认的阈值,只有变量的显著性水平超过阈值,才会出现。一般说来,没有入选说明不显著,也就是说,这个变量对于预测和判别目标变量来说,没有特别的信息,最简单的例子是判别为0或判别为1的概率都接近0.5, 在这种情况下,这个特征就没有判别能力,通常情况下 ...

本帖被以下文库推荐

沙发
wolfcrying 发表于 2009-3-15 21:41:00

没有出现在tree里可能是因为变量的不够显著性,因此没有入选。Tree在分裂节点时,根据不同的算法,一般有entropy, LogP,Gini,IV值等差异性指标,EM会为这些指标设置一些默认的阈值,只有变量的显著性水平超过阈值,才会出现。

一般说来,没有入选说明不显著,也就是说,这个变量对于预测和判别目标变量来说,没有特别的信息,最简单的例子是判别为0或判别为1的概率都接近0.5, 在这种情况下,这个特征就没有判别能力,通常情况下没必要通过修改阈值使其入选

已有 1 人评分经验 论坛币 收起 理由
bakoll + 3 + 3 精彩帖子

总评分: 经验 + 3  论坛币 + 3   查看全部评分

藤椅
chasedreamtrue 发表于 2009-3-15 23:27:00
谢谢你的回复.
还有个问题就是有好几个error的值很大,将近6-7位数,这个说明哪里有问题呢?能不能通过一些方法把它变小呢?
然后就是,如果target variable 是数值型的,在rule里面出现的target variable 是指的他的平均值?谢谢

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 09:48