楼主: 耕耘使者
18961 14

[学科前沿] 关于虚拟变量导致的多重共线问题 [推广有奖]

11
@浪花朵朵开 发表于 2017-1-23 23:11:41
耕耘使者 发表于 2011-12-2 19:33
回复上面两楼:在一些计量经济学教科书(如贺铿的《经济计量学》中写到,如果模型包含常数项,则一个因 ...
根据计量理论的推导,当不包含常数项时,是需要引入m个虚拟变量来定义定性变量,而当包含常数项时,仅需要引入m-1个虚拟变量,因为此时的截距项就是基组,虚拟变量系数表示了该组与基组之间在截距上的估计差异,简单的教材可看《计量经济学导论:现代观点》,复杂的可参考林文夫的那本经典教材。
已有 1 人评分学术水平 收起 理由
耕耘使者 + 2 鼓励积极发帖讨论

总评分: 学术水平 + 2   查看全部评分

12
frankyzj 发表于 2017-1-25 00:24:22
引入与类别数相同的虚拟变量本质上不是多重共线性的问题,而是如果模型中包括了常数项,那么自变量矩阵当中的常数项的那一列都等已于1,引入了与类别数相同个数的虚拟变量的话,这些虚拟变量的列加起来正好等于常数项的那一列,而导致自变量的矩阵非满秩,使得自变量矩阵的转置左乘自变量矩阵得到的方阵也不是满秩矩阵,行列式为零,逆矩阵不存在,进而难以得到参数估计量。如果模型中只考虑一种定性因素采取引入类别数减一个虚拟变量是可以避免这个问题,但是如果两个以上的定性因素(比如同时考虑性别和季节两个因素)则不一定了,要取决于所获得的具体数据了。
已有 1 人评分学术水平 热心指数 收起 理由
耕耘使者 + 2 + 2 观点有启发

总评分: 学术水平 + 2  热心指数 + 2   查看全部评分

13
耕耘使者 发表于 2017-1-25 10:30:31
frankyzj 发表于 2017-1-25 00:24
引入与类别数相同的虚拟变量本质上不是多重共线性的问题,而是如果模型中包括了常数项,那么自变量矩阵当中 ...
“引入与类别数相同的虚拟变量本质上不是多重共线性的问题”
我的问题是,多重共线性的实质是,自变量之间存在高度线性相关。
而如果两个特征引入两个虚拟变量,如D1,D2,无论是否有无常数项,都确实是完全相关的。
如图: TT截图未命名.jpg
d1和d2相关系数为-1,应该是完全的多重共线,这又该如何解释呢?

14
ljk19911111 发表于 2018-11-13 14:52:33
耕耘使者 发表于 2017-1-25 10:30
“引入与类别数相同的虚拟变量本质上不是多重共线性的问题”
我的问题是,多重共线性的实质是,自变量之 ...
遇到了同样的问题,请问解决了吗?

15
耕耘使者 发表于 2018-11-13 18:22:26
ljk19911111 发表于 2018-11-13 14:52
遇到了同样的问题,请问解决了吗?
还没有

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-27 09:02