资料狂人 发表于 2013-7-16 16:37 
坛友zhoubuer2008:
那俺弱弱的问一个问题吧:对于变量数较多,样本数目极少的情况,如何对变量进行降维处 ...
这个问题问的很好,也是过去20多年统计界很热门的研究方向: high dimensional data analysis, penalized regression and regularization methods. 具体的话,如果变量个数大于样本量的时候,一般最小二乘就不能用了饿,如果做回归分析,可以用加惩罚项的回归分析,例如 LASSO (Tibshirani 1996), SCAD (Fan and Li, 2001)。最近几年,有很多关于超高维数据的分析研究,就是变量个数远远大于样本量,这样的方法可以采用 independence screening的方法先做一次,可以看看Fan and Lv (2008), Li, Zhong and Zhu(2012)等。最后建议你看看这个综述的文章,Fan, J., Lv, J., and Qi, L. (2011)
Sparse high-dimensional models in economics.
Annual Review of Economics, 3, 291-317
连接:
http://orfe.princeton.edu/~jqfan/publications-general.html