楼主: champion168
20991 24

[面板数据求助] 急求stata中出现年度虚拟变量居然出现共线性问题 [推广有奖]

11
jack_yuexp 发表于 2012-1-21 16:26:33
正常来说,不能给每一期都设定虚拟变量的,楼主的T是9期吗?
我认为7楼说的不妥,很少会遇到虚拟变量之间或与其他x变量共线的情况,一般是常数项的问题,因为:
常数项是[111111111.........]一共NxT个1
如果每一年都设虚拟变量,那么分别是
year1=[1111....000000],包含N个1和Nx(T-1)个0
year2=[0000....11111....0000],包含N个0,N个1和Nx(T-1)个0
以此类推,刚好所有虚拟变量加起来等于常数项,出现线性组合。
cons=year1+year2+year3+...+year9
所以不能给每一期都设定虚拟变量,否则必然有共线性。

同理,时间趋势项year也要去掉,否则也会出现共线性。假定楼主的year是1991-1999,则
year=1991*year1+1992*year2+...+1999*year9
也是线性组合,共线性。

楼主可以做这样几种尝试:
1,禁止常数项,然后剔除至少一个年度虚拟变量,你可以剔除第一个或最后一个;
or
2,禁止趋势项,然后剔除至少一个年度虚拟变量
or
3,禁止常数项和趋势项
or
4,剔除两个年度虚拟变量



求赏金!

已有 1 人评分学术水平 热心指数 信用等级 收起 理由
champion168 + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

12
jack_yuexp 发表于 2012-1-22 12:40:22
正常来说,不能给每一期都设定虚拟变量的,楼主的T是9期吧?
我认为7楼说的不对,按楼主这样设定的话,虚拟变量之间是不会共线的,也不大可能会和其他x变量共线的情况,通常是常数项的问题,因为:
常数项是[111111111.........]一共NxT个1
如果每一年都设虚拟变量,那么分别是
year1=[1111....000000],N个1之后Nx(T-1)个0
year2=[0000....11111....0000],N个0之后是N个1,之后是Nx(T-2)个0
以此类推,刚好所有虚拟变量加起来等于常数项,出现线性组合。
cons=year1+year2+....+year9
所以不能给每一期都设定虚拟变量,否则必然同常数项有共线性。

另外动态面板里面很少见到有加趋势项的。我不理解这是什么含义。
而且如果楼主这里列出了所有的虚拟年份变量,那么她们除了会同常数项共线之外,自然也会和趋势项共线。例如,如果楼主的year变量是1991-1999,那么year=1991*year1+1992*year2+...+1999*year9,出现了线性组合,自然要drop掉。

所以,楼主可以尝试如下办法
1,剔除时间趋势year变量和一个年度虚拟变量,年度虚拟变量你可以剔除第一个或最后一个再试一下。
or
2,禁止常数项,剔除一个年度虚拟变量;
or
3,剔除常数项和时间趋势year变量
or
4,剔除2个年度虚拟变量。


求赏金!

13
champion168 发表于 2012-1-24 10:19:52
非常感谢您的指导。祝您新春佳节快乐、幸福健康。有二个问题商讨:
第一,我的样本是T=9。stata中时间虚拟变量的确定是自动生成的。
第二,year_1-year9不是时间趋势项,是时间虚拟变量的表示方法。
盼您能看到回复

14
jack_yuexp 发表于 2012-1-25 12:37:11
我说的时间趋势变量不是year1到year9,而是year9后面那个year

15
zhuyunhui1989 发表于 2012-4-28 16:02:07
在有结局的情况下,m个定性变量只能设置m-1个虚拟变量 否则会出现多重共线性

16
champion168 发表于 2012-4-29 17:02:05
zhuyunhui1989 发表于 2012-4-28 16:02
在有结局的情况下,m个定性变量只能设置m-1个虚拟变量 否则会出现多重共线性
请高人能否详细说明?
时间虚拟变量并没有多设

17
bboyfree 发表于 2013-5-1 11:17:39
请问lz最后您解决了吗,,我也遇到同样的问题,几个时间虚拟变量被drop,到底如何处理呢

18
peyzf 发表于 2013-7-13 06:47:28
it will not influence the estimation of key variables.
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
champion168 + 1 + 1 + 1 热心帮助其他会员

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

19
小南瓜2013 发表于 2013-11-13 14:21:32
好高端的样子。。。

20
汪亚楠 发表于 2014-1-26 18:28:04
jack_yuexp 发表于 2012-1-21 16:26
正常来说,不能给每一期都设定虚拟变量的,楼主的T是9期吗?
我认为7楼说的不妥,很少会遇到虚拟变量之间或 ...
楼主,请问一下,设置了area虚拟变量,东部地区为1,中部地区为2,西部地区为3,实证结果怎么看懂啊?我是新手,基础的计量都不懂!劳烦帮我解答一下!谢谢!

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 13:12