老师您好,
问题背景:
现在我有500个左右的宏观经济变量, 喜欢用他们来预测某个指标的未来走向。 由于不知道(至少不敢确定)哪些宏观经济变量与该指标有必然关系(因果关系), 所以采用了如下方法:
1. 将500个变量输入SPSS
1.1 如果能产生模型, 则随机除去产生模型中的一个变量, 将剩下的499个变量作为独立变脸输入到SPSS
1.2 如何还能产生模型, 则继续上一步骤
1.3 如何不能产生模型, 随机从留下的变量中剔除一个, 继续
1.4 运行到满足一定次数,或产生足够的备选模型后停止。
该过程由程序调用SPSS, 所以不怕麻烦, 但是我不知道这样有否科学依据。
如此往复,我得到了几十个模型, 就这些模型, 我现在利用如下标准进行帅选:
1. Rsuquare - 高的加分, 是1的减分 - 没有完美的世界是吧 呵呵
2. pvalue (sig) -- >0.05 舍弃, <0.01 加分, 否则 也不减分
3. 模型中的变量是否与dependent var 有自觉的因果关系, 如有, 加分; 没有也不减分
4. 查看模型预测与实际值的走向 (即是否一起上升, 一起下降), 走向一致性高的,加分; 低的减分
5. 预测出来的指标值变动剧烈 ( 我预测某个公司的表现, 很多rsquare很高的,居然很快该公司就负产出了!),减分
我知道这样做显得很不够科学, 但是尚没有系统学习统计分析预测, 希望老师就整个过程指点,
哪些步骤是完全错误的, 没有必要的, 以及烦请指点如何改进。
任务紧急, 非常感谢!


雷达卡




京公网安备 11010802022788号







