楼主: rockfido
4451 16

[原创博文] 实际建模的时候,变量过千,到底该怎么选择? [推广有奖]

11
爱萌 发表于 2010-6-24 14:15:58
rockfido 发表于 2010-6-24 00:07
6# 爱萌

对的,我没表达清楚,我就是指的是建立回归模型。

可是银行做CREDIT,做RISK的经常是几百上千的变量啊?
我不知道是你自己想的,还是什么,我处理过银行数据,最多也就100多个变量,真正多的是它的样本
最恨对我说谎或欺骗我的人

12
sailingyf 发表于 2010-6-24 19:48:40
能不能按照贡献度排序。
或者按照某种方法分类,
然后再stepwise 回归

13
rockfido 在职认证  发表于 2010-6-24 20:52:38
11# 爱萌

有没有上千,我不能肯定。但是4,500个变量的,在BOA,CHASE肯定有。我面试的时候就被问过。

但是就拿100多个变量来说,我们到底该如何解决这个问题呢?如何降维呢?

14
rockfido 在职认证  发表于 2010-6-24 20:53:59
12# sailingyf

我先用了PCA,然后再STEPWISE,问题就是出来的结果,还不如直接STEPWISE的。。。

15
rockfido 在职认证  发表于 2010-6-24 20:55:33
10# wyq1987

好吧,我去找找看,谢谢你。

其实感觉学到的理论,在用的时候,经常不是那么容易用起来。。。

16
yunqingwang 在职认证  发表于 2010-6-24 22:27:58
10# wyq1987
利用贝叶斯的方法,贝叶斯压缩估计效果很好

17
rockfido 在职认证  发表于 2010-6-25 00:54:40
16# yunqingwang

这个听起来对我还挺难的。。没接触过。。。。
不过我去GOOGLE,非常感谢。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 17:10