tree后,有些variable 并没有在tree leaf里面,比如这个数据有8个variable, 只有6
个出现在tree里面,看到那个sas output 中importance数据中,也没有那两个
variable,这样正常吗?要改那些参数才能让所有的variable 被用上呢?
还有就是sum of squared error ,average squared error 几个error都是很大的数,
是不是哪里出了问题?怎莫来处理呢?谢谢

|
楼主: chasedreamtrue
|
1696
2
请教熟悉enterprise miner的一个问题 |
|
本科生 78%
-
|
回帖推荐wolfcrying 发表于2楼 查看完整内容 没有出现在tree里可能是因为变量的不够显著性,因此没有入选。Tree在分裂节点时,根据不同的算法,一般有entropy, LogP,Gini,IV值等差异性指标,EM会为这些指标设置一些默认的阈值,只有变量的显著性水平超过阈值,才会出现。一般说来,没有入选说明不显著,也就是说,这个变量对于预测和判别目标变量来说,没有特别的信息,最简单的例子是判别为0或判别为1的概率都接近0.5, 在这种情况下,这个特征就没有判别能力,通常情况下 ...
本帖被以下文库推荐
| ||
|
|
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


