决策树模型解决商业问题―是否对变量值有要求？ - SAS专版

0关注
0粉丝

硕士生

1%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 70 个
通用积分: 0
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 197 点
帖子: 147
精华: 0
在线时间: 85 小时
注册时间: 2010-8-5
最后登录: 2019-9-3

楼主

well306 发表于 2011-11-22 20:49:19 |只看作者 |坛友微信交流群|倒序 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

如题，请教各位高手：
跑决策树时，是否对输入变量的值范围、分布啥的有所要求？

例如，现在评价一个网上牛奶促销活动的好坏，观测购买牛奶的用户特征，
输出变量为：IsMilk 变量值：T（购买）,F（未购买）
输入变量为：年龄、性别、用户级别、所在城市、用户注册年限等等

假设现在用户全部来自一线城市（比较极端的情况），或者注册年限80﹪都在一年以内...
像这种情况是否这两个不可以作为输入变量？

简单说就是：决策树模型对输入变量值的分布均匀性是否有要求？

是否有个约定俗成的比例在这，当存在取某一值比例大于？﹪时，此变量不适合作为输入变量？