请选择 进入手机版 | 继续访问电脑版
楼主: fd2008
52440 47

请教代理变量与工具变量的区别 [推广有奖]

冬日的碧雪 发表于 2010-3-30 10:58
遗漏变量如果和其他解释变量不相关的话,不会产生内生性问题,OLS是consistent的;如果遗漏变量和其他解释变 ...
好厉害

使用道具

代理变量是直接替代变量进行回归,求出的结果为b=(x'x)^(-1)*(x'y),然而工具变量为b=(z'x)^(-1)*(z'y),

使用道具

clayboy 在职认证  发表于 2019-6-10 20:08:41 |显示全部楼层 |坛友微信交流群
偶也在看伍德理奇,遇到同样的问题,大体感觉是,代理变量是对无法量化变量的代替,而工具变量是在存在遗漏变量时为了得到有效估计的一个方法。也就四楼的意思吧。迷惑ing,期待高手解答。

谢谢

使用道具

Mpaul 发表于 2019-12-12 09:30:03 |显示全部楼层 |坛友微信交流群
当产生遗漏变量的问题时,由于遗漏变量与x相关,从而导致内生性问题。解决方法有二:代理变量是找到一个变量,作为遗漏变量的替代,这样方程中就增加了一个变量,该变量要求与残差不相关,与遗漏变量高度相关;而工具变量是从与遗漏变量相关的x入手,找到x的一个工具变量,该变量与x高度相关,与残差不相关,从而解决了遗漏变量与x的相关问题。
总结就是,代理变量是从所遗漏的变量入手,工具变量是从与遗漏变量相关的原有变量入手。

使用道具

mxn2019 发表于 2020-7-6 21:44:51 |显示全部楼层 |坛友微信交流群
李志云 发表于 2014-5-13 13:05
解决内生性问题的原理是不一样的。工具变量,好比你模型设置好了,各个解释变量都到位了,发现你想研究的 ...
个人理解:替代内生解释变量的应该是代理变量而非工具变量,工具变量不是“代替”  欢迎指正批评

使用道具

我认为代理变量是把不可观测的因素从误差项中提取出来了(遗漏变量现在变成不遗漏了)

而工具变量则是把和误差项相关的解释变量替换了(使得真正应该遗落的变量也就是误差项和替换后的解释变量无关了)

所以一个是解决数据不可测量问题导致的内生性,一个是解决解释变量错放或者误差含未知遗漏变量的内生性

使用道具

Jesyyyyy_ca 学生认证  发表于 2021-10-15 20:44:10 |显示全部楼层 |坛友微信交流群
dahanruoshui 发表于 2013-6-4 10:28
我是这么理解的  代理变量与遗漏变量存在高度相关性 而工具变量与遗漏变量不相关吧
有点道理

使用道具

Jesyyyyy_ca 学生认证  发表于 2021-10-15 21:02:08 |显示全部楼层 |坛友微信交流群
我觉得关键问题在于,内生性的原因不是单一的,遗漏变量,测量误差,联立因果...
那么能力这个解释变量首先是因为无法度量被omitted了,遗漏变量产生的内生性问题满足,解决这个层面内生性的方法之一是使之可以被度量,那么就用iq作为他的代理变量,iq显然和u高度相关,因为iq和能力高度相关。
然后iq引入后,却存在测量误差引起的内生性问题,具体这个测量误差是什么,书上没有解释清楚,我猜是除了能力,其他被忽略的变量也可以影响iq得分,比如健康状况啊,学区教学质量之类的,所以这个iq和能力以外的其他omitted variable也相关,也就有内生性问题了。
那么就用工具变量,包括母亲的受教育程度、其他能力测试得分、地理区域等等作为工具变量来获得一个iq的拟合值,这个拟合值不再是单纯的一个分数,而是一些其他体现能力的变量的结合,还记得能力才是我们真正担心的内生变量吗?这些和能力有关的变量满足了“相关性”,又与能力以外的其他omitted variable认为无关,满足了“外生性”,iq的拟合值也就不再有内生性问题了。、
总之,有的内生性,仅仅是omitted variable造成的,代理变量引入后,就解决了,而且代理变量本身不存在问题,而书里面的代理变量还有其他问题,这两者并不是无关,但并不总是关联的。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 14:35