楼主: 285743489
11227 15

[数据挖掘理论与案例] C5.0的变量重要性和决策树问题 [推广有奖]

11
raoduan 发表于 2015-3-30 16:16:09
夏夜风暖 发表于 2015-2-15 01:16
左边的重要性,不用多说了。右图重要性得分的计算式:
某变量的得分=(1-Pi)/sum(1-Pi)
其中pi是该变量与目 ...
你好,我应用的模型是CHAID,在对变量进行预处理(分箱)之后,根据计算与输出变量相关性检验的P值大小,来选取最佳分组变量。P值最小,按理说是最早用来决策树分枝的。可是我的右侧“预测变量重要性图”的第一个变量也跟左边的第一个分枝变量不一样,这是为什么呢?你说的显著性检验是相关性检验吗?

12
夏夜风暖 发表于 2015-4-1 13:50:11
raoduan 发表于 2015-3-30 16:16
你好,我应用的模型是CHAID,在对变量进行预处理(分箱)之后,根据计算与输出变量相关性检验的P值大小, ...
我说的显著性检验:2个分类变量是卡方检验;1分类变量1数值变量是方差分析;2个数值变量是相关系数的可靠性

13
raoduan 发表于 2015-4-1 18:34:12
夏夜风暖 发表于 2015-4-1 13:50
我说的显著性检验:2个分类变量是卡方检验;1分类变量1数值变量是方差分析;2个数值变量是相关系数的可靠 ...
明白了!感谢!

14
raoduan 发表于 2015-4-1 18:38:02
夏夜风暖 发表于 2015-4-1 13:50
我说的显著性检验:2个分类变量是卡方检验;1分类变量1数值变量是方差分析;2个数值变量是相关系数的可靠 ...
你知道CHAID在确定最佳分组变量时,用的是哪一种相关性检验吗?

15
夏夜风暖 发表于 2015-4-3 10:16:15
raoduan 发表于 2015-4-1 18:38
你知道CHAID在确定最佳分组变量时,用的是哪一种相关性检验吗?
是卡方检验。
http://wenku.baidu.com/link?url=4LfKyLTo7r07uI1tk3vyiORSUF6iwgKMdC4htfFvY-2OxbIGUgI-CbyIpzEECza69cKxoBvWfESMGvyS_LdaxeeBs4_uAhEGjwEcQkmjpV_

16
raoduan 发表于 2015-4-3 22:08:56
夏夜风暖 发表于 2015-4-3 10:16
是卡方检验。
http://wenku.baidu.com/link?url=4LfKyLTo7r07uI1tk3vyiORSUF6iwgKMdC4htfFvY-2OxbIGUgI- ...
哦,我的目标变量是分类型变量,你说的显著性检验是卡方检验,CHAID确定分组变量相关性的也是卡方检验,按理说结果是一致的,为什么第一层分枝变量和右侧“预测变量重要性图”的第一个变量不一样呢?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-9 10:59