我目前正在利用一个面板数据考察某一项改革(x)对企业绩效(y)的影响。对于某个企业而言,这个变量为000000111111的形式。0代表没有进行改革,1代表进行了改革。
通常的研究需要控制时间固定效应,即需要加入时间虚拟变量。但在简约式(reduced form)回归中,用y单独对x或时间虚拟变量进行回归时,除了在某几年的时间虚拟变量为正或不显著外,两类变量的系数都显著为负;但同时加入x及时间虚拟变量,两者变得基本上都不显著,且大部分情况下,x的系数由负变为正。这是不是表明存在严重的多重共线性问题?
我利用回归中实际使用的样本(e(sample))计算了两者的相关系数,发现只有当年份为2,3,4这三年时,年份虚拟变量与转制变量的相关系数大约为0.4,而其它年份的虚拟变量与转制变量的相关系数很小,基本上小于0.2。将1,2,3这三年的年份虚拟变量删除后,以上问题依然存在。
我的问题是,为了分析诸如00000011111类似变量的作用效果,且该变量与时间虚拟变量具有严重的多重共线性,一般如何处理?
谢谢。