请选择 进入手机版 | 继续访问电脑版
楼主: 番茄奏鸣曲
1632 5

[有偿编程] SAS多重共线问题 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

60%

还不是VIP/贵宾

-

威望
0
论坛币
1808 个
通用积分
30.4222
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
6004 点
帖子
92
精华
0
在线时间
150 小时
注册时间
2012-2-20
最后登录
2022-4-28

10论坛币
完成模型在做测试的时候,发现有多重共线问题,但是去掉一个variable以后,本来没有自相关问题却出现了自相关问题,应该怎么去解决阿,求各位大神.....

最佳答案

每一天都是晴。 查看完整内容

我建议你用不带log的模型,不过考虑换一种模型,比如mix model,这样或许可以解决多重共线性问题。另外,不知道你的trend是什么,这个可能会对自相关产生影响。对于解决自相关,是不是应该先做平稳检验呀,然后再用差分的方法去解决试试....统计学的知识好多还给老师了,暂时只能给出这些建议,不好意思....
关键词:多重共线 Variable 自相关问题 ABLE 自相关
我建议你用不带log的模型,不过考虑换一种模型,比如mix model,这样或许可以解决多重共线性问题。另外,不知道你的trend是什么,这个可能会对自相关产生影响。对于解决自相关,是不是应该先做平稳检验呀,然后再用差分的方法去解决试试....统计学的知识好多还给老师了,暂时只能给出这些建议,不好意思....

使用道具

8112mmw 发表于 2017-6-27 07:45:11 |显示全部楼层 |坛友微信交流群
分层分析,看相互影响啊!

使用道具

发数据和代码出来,这个要具体情况具体分析

使用道具

啊好的,其实回归方程就是下面这个:
model log_Recreation_Visits= trend d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 lag UR Gasrate cci/vif tol dwprob;
回归方程的左边,是各个公园的访问量也就是客流,一共58个公园,数据是月度数据,时间跨度是25年,所以整套数据有上万个。
我所有等号右边的量都算出来了,d1~d11是月份的dummy, 就是当月份是1月份的时候的d1=1其余等于0,当月份是2月份的时候d2=1其余等于0,lag是每个公园月度访问量的滞后项,UR是每个月的失业率,gasrate是每个月的汽油费,CCI是消费者信心指数。

现在问题是这样,这个回归方程我有带log就是同上式和不带log的如下:
model Recreation_Visits= trend d1 d2 d3 d4 d5 d6 d7 d8 d9 d10 d11 lag UR Gasrate cci/vif tol dwprob;

带log的自相关做出来好高,不带log好非常多,但是存在共线问题,vif的值是d8和lag,比较高,最高的48,然后不是所有的,大概24个公园这两个量出现了高的共线,如果移除lag或者d8这个问题可以被解决,但是呢自相关问题会变得严重....

我应该怎么办,我试了好多好多...都不行

使用道具

每一天都是晴。 发表于 2017-6-27 11:22
发数据和代码出来,这个要具体情况具体分析
我发出来了哦,不知道是不是够详细...

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-28 21:40