楼主: 葫芦娃大王
6000 6

[回归分析求助] 系数被高估还是低估? [推广有奖]

  • 9关注
  • 27粉丝

已卖:32份资源

学科带头人

8%

还不是VIP/贵宾

-

威望
0
论坛币
-18578 个
通用积分
3095.9725
学术水平
54 点
热心指数
63 点
信用等级
36 点
经验
7464 点
帖子
1200
精华
0
在线时间
2149 小时
注册时间
2012-11-22
最后登录
2024-8-25

楼主
葫芦娃大王 学生认证  发表于 2018-9-30 17:59:06 |AI写论文
20论坛币
在实证分析过程中,由于内生性问题的存在,系数估计往往可能存在偏误。遗漏变量的情形下,系数是被高估还是低估了相对还比较好判断,但是反向因果情形下,系数到底是被低估还是高估了,这该如何判断?另外,当核心解释变量存在测量误差的时候,又如何判断系数是高估还是低估呢?欢迎大家讨论!

关键词:被高估 内生性问题 大家讨论 测量误差 解释变量
磨刀不误砍柴工!

沙发
李志云 发表于 2022-10-5 10:40:23
这是个好问题,我认为可以通过回归内生性问题本质,即解释变量与残差相关这一点上,如果是负相关或者协方差小于0就是高估,正相关或者大于0就是低估,如果等于0就是无偏估计。OLS估计系数是beta,而内生性下估计系数是beta+cov(x,e)/var(x),这样理解就可以了,而不管是什么内生性问题,遗漏变量、反向因果、测量误差、selection bias。

藤椅
李志云 发表于 2022-10-5 10:40:34
这是个好问题,我认为可以通过回归内生性问题本质,即解释变量与残差相关这一点上,如果是负相关或者协方差小于0就是高估,正相关或者大于0就是低估,如果等于0就是无偏估计。OLS估计系数是beta,而内生性下估计系数是beta+cov(x,e)/var(x),这样理解就可以了,而不管是什么内生性问题,遗漏变量、反向因果、测量误差、selection bias。

板凳
李志云 发表于 2022-10-5 10:40:38
这是个好问题,我认为可以通过回归内生性问题本质,即解释变量与残差相关这一点上,如果是负相关或者协方差小于0就是高估,正相关或者大于0就是低估,如果等于0就是无偏估计。OLS估计系数是beta,而内生性下估计系数是beta+cov(x,e)/var(x),这样理解就可以了,而不管是什么内生性问题,遗漏变量、反向因果、测量误差、selection bias。

报纸
李志云 发表于 2022-10-5 10:43:10
这是个好问题,我认为可以通过回归内生性问题本质,即解释变量与残差相关这一点上,如果是负相关或者协方差小于0就是高估,正相关或者大于0就是低估,如果等于0就是无偏估计。OLS估计系数是beta,而内生性下估计系数是beta+cov(x,e)/var(x),这样理解就可以了,而不管是什么内生性问题,遗漏变量、反向因果、测量误差、selection bias。

地板
李志云 发表于 2022-10-5 15:20:19
上面好像说的不对,说反了,没有内生性问题下OLS估计值为beta,真实效应(且软件输出结果),有内生性问题下OLS估计值为beta(真实效应)+cov(D,e)/var(D)(软件输出结果),此时cov(D,e)大于0高估,小于0低估。所以看各种情况内生性下估计系数表达式可能有助于理解高估还是低估。

想了想,回归到反事实框架上好像更容易理解,delta=E(Y|D=1)-E(Y|D=0),分析内生性问题导致这两个潜在结果如何变化就可以知道高估还是低估了,比如反向因果问题,战争是否降低一个社会的人类发展指数,这里存在反向因果问题,越穷越爱打仗的可能性,假定D=1表示战争,即实验组,D=0表示没有战争,即参照组,此时因为HDI越高越不可能归入战争组即D=1的可能性更低,反之亦然,此时导致两个组别不可比,即穷国更多地在D=1,而富国更多的在D=0,直接比较(OLS)的效应就会高估D的平均影响。

7
赵安豆 发表于 2024-12-16 10:57:00
在实证分析中,内生性问题确实可能使得估计的回归系数出现偏误。对于不同的内生性来源(如遗漏变量、反向因果和测量误差),系数的方向性偏差可以按照以下方式理解:

1. **遗漏变量**:
   - 如果被遗漏的变量与已包含在模型中的解释变量相关,且对因变量有正影响,则该解释变量的估计系数可能被高估。反之,如果遗漏变量的影响是负的,则系数可能被低估。
   
2. **反向因果(双向因果)**:
   - 反向因果问题使得确定偏误方向较为复杂。如果反向因果关系加强了观察到的相关性,那么系数可能会被高估;若削弱相关性,则可能导致系数低估。

3. **测量误差**:
   - 如果解释变量存在随机的测量误差(即“噪声”),通常会导致该变量与因变量之间的关联减弱,结果是回归系数的绝对值会比真实值小——这就是所谓的衰减偏差(attenuation bias)或古典测量误差导致的偏差。因此,在大多数情况下,这种类型的测量误差会导致系数被低估。

为了减少内生性问题对估计的影响,研究者可以采取多种方法,如使用工具变量、控制更多的潜在相关变量、采用面板数据模型等策略。这些方法有助于识别并解决偏误,提供更准确的因果效应估计。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-2-10 05:20