这两个是两个不同的概念了吧。proxy variable是指你在研究一个问题,有一系列的解释变量,但是其中有一个是不能够度量的(比如说这个概念太抽象了),在伍德里奇的书里面好像是talent还是什么的,你不能够用一个数字来度量这个东西,于是就用IO来替代talent做回归。
而工具变量,是你研究问题的所有解释变量都是可以度量的,但是可能存在比较严重的内生性的问题,于是需要找一个与X相关又与U不像个的变量来做回归,解决内生性的问题。举一个例例子,Aghion, Philippe, John Van Reenen, and Luigi Zingales. 2013. Innovation and Institutional Ownership。想要研究机构持有股份多少对于创新的影响,就存在一个很严重的内生性问题,可能是机构投资者选择持有那些有创新潜力的股票,这样一来得到的回归结果就不一定是机构投资者监管带来的结果,selection带来的结果。Aghion用S&P500作为工具变量,因为是否纳入s&p500不是因为是否具有创新的潜质,但进入了sp500的企业会明显得到更多机构的持股。这样工具变量就与X相关但与Y不相关了。
我觉得考虑工具变量可以的时候可以尝试考虑一下完全外生的解释变量。比如managerial entrenchment,一个关于制度的改变就会影响到X,但完全与U无关。
|