能想到的就是做STEPWISE,去除HIGHLY CORRELATED VARIABLES,通过PCA来集合VARIABLE,去掉贡献不多,但是花费很高的变量。
请问还有啥方法么?
另外,这个变量本来就是加越多,R2越大,到底该如何取舍呢?

|
楼主: rockfido
|
4450
16
[原创博文] 实际建模的时候,变量过千,到底该怎么选择? |
|
已卖:1754份资源 博士生 32%
-
|
回帖推荐BraveMadMan 发表于8楼 查看完整内容 楼主大概需要换个工作了 :) 当然只看ADJ-R2。要不然我只需要增加足够的自变量(包括chicken shit。见下边的笑话),我的模型的R2就会接近于1。
一般来讲,计量模型是由理论决定的,这包括用什么样的模型和用什么样的变量。比如你要研究什么决定一个人的收入水平,要从经济理论中寻找相关的变量,比如教育水平,肤色等,而不是想当然的找一些变量来凑数。如果理论建议的变量不显著,你要进一步寻找这个不显著是由什么造成的 ...
本帖被以下文库推荐
| ||
|
|
| ||
| ||
|
Don't get lost in technical details. What is the big picture?
|
||
| ||
| ||
|
最恨对我说谎或欺骗我的人
|
||
| ||
|
Don't get lost in technical details. What is the big picture?
|
||
| ||
加好友,备注cda京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


