楼主: 日新少年
8999 2

[学习心得] 【独家发布】使用地理边界进行断点回归设计 [推广有奖]

区版主

大师

44%

还不是VIP/贵宾

-

TA的文库  其他...

日新文库:Matlab入门及进阶

日新文库:Stata入门及进阶

日新文库:R入门及进阶

威望
3
论坛币
646732 个
通用积分
22664.0878
学术水平
1185 点
热心指数
1364 点
信用等级
1051 点
经验
160684 点
帖子
10958
精华
11
在线时间
6549 小时
注册时间
2010-4-15
最后登录
2024-5-19

初级热心勋章 初级学术勋章 初级信用勋章 中级热心勋章 中级学术勋章 中级信用勋章 高级学术勋章 高级热心勋章 高级信用勋章

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

640.webp.jpg



使用地理边界进行断点回归设计

       断点回归设计(Regression Discontinuity Design)是近年来十分流行的一种因果识别方法,被广泛地应用于社会科学研究的诸多领域。使用地理边界作为断点回归设计中断点的文章近年来也屡屡有佳作涌现,本期推送的是PennState University政治系副教授Luke J. Keele和密歇根大学政治系助理教授Rocio Titiunik发表在Political Analysis上的综述性文章Geographic boundaries as regression discontinuities。

      

       题外话,推文作者注意到,其实早在Hahn等(2001)发表在Econometrica上的经典文章之前,他们三位1999年就已经在一篇很古老的NBER工作论文中给出了断点回归设计的基本估计方法(NBER working paper No. 7131),可惜当时并未引起重视。

回到我们推送的文章,作者认为,地理断点回归(Geographic Regression Discontinuity,GRD)虽然其基本思想和估计方法与Hahn等(2001)给出的方法类似,但也有其自身独有的一些特点。作者将其归纳为以下三个主要的方面:第一,地理断点作为一种多维度处理效应,对结果变量的影响也是多维度的,很容易同时引起其他变量的跳跃,从而使研究者比其他类型的断点回归设计更容易遭遇联立性偏误的问题。第二,在GRD中,选用不同的距离度量方法将会影响断点回归中的处置变量(forcing variable或者assignment variable),进而对结果产生十分重大的影响。第三,任何使用GRD的研究都将无法回避空间相关性的问题,而现有的研究通常没有加以考虑。

        

       地理边界对样本的处理效应实际上是高维的,其是否受到处置由经度、维度(有时可能还包括海拔)共同决定。地球上两点之间的距离是两点经度、维度和该点与地心距离的一个函数,通常我们不考虑地球是个不规则球体这一事实,并且认为相对于地球平均半径(6371千米),任何两点间的海拔差异都小得可以忽略不计。上述函数可以近似地简化为只包含两点的经纬度,但仍然是由两个参数决定的。


        为了将GRD与经典RDD文献中的估计方法联系起来,文献中一个十分常见的方法是使用与政策边界最短距离作为处置变量。这一方法实际上是将高维处置效应化为低维处置效应,其背后隐含的一个加强后的假定是,沿着与政策边界最短距离相同的线移动时处理效应的大小不变,作者认为这一假定很大程度上是天真的。Chen et al. (2013)发表于PNAS使用“秦岭-淮河”断点的著名文章采用了同样的处理方式,但这样处理可能会遭遇到较为严重的偏差,当政策边界越长时这一问题越严重。


       当时MIT经济系(现在任教于哈佛经济系)助理教授萌妹Melissa Dell在她2010年发表于Econometrica的文章Mita中使用了另外一种方法来解决这一问题,她在小样本中直接控制不同点的经度和维度;在更大的样本中,进一步控制经度的平方、维度的平方以及经度×维度。为了解决长边界线时处置效应的异质性问题,Dell(2010)控制了许多沿政策线两侧分布区域的固定效应,从而使得其所估计的treatment effect被限定在一个较小的可比范围内。作者认为这一方法是不严谨的,同时批评了Dell使用某个地区地理位置(通常是某个区域的中心点经纬度)来匹配个体层面数据的做法,认为这样会导致潜在的问题。


       为此,作者开发了一套基于非参数方法的GRD估计策略和识别方法,其技术细节详见原文。由于地理断点通常是地理边界这一断点的特殊性,原则上可以在边界的每个点估计一个单独的处理效应(treatment effect),将每个点处的处理效应沿整条边界积分后,便可以得到我们想要估计的整条边界的处理效应。这一方法与Imbensand Zajonc (2011)提出的多元RDD方法相似,但又不完全相同,从而使得我们能够捕捉政策边界上任意一点的处理效应或者任何一段的加权平均。


       作者在文章最后给读者提供了关于进行此类研究的一些建议。首先,一定要确认研究设计尽量满足“个体无法准确操纵自身相对于政策边界位置”的条件。为了防止联立性偏误的发生,尽量保证可能与政策边界不与其他一些重要的地理边界(比如行政区域边界、学区等)重合。一旦重合,就要检验另外一些政策是否引发了与之直接相关的变量在边界两侧处置组和对照组间的跳跃。为了解决空间相关性问题,研究者应当对政策之前的因变量在政策边界两侧的空间相关程度进行估计,正常情况下应有较高的正的空间相关系数。处置效应本身显然会降低两侧的空间相关程度,如果数据支持这一预测,那么我们对空间相关性影响估计结果的担心将会大大减轻。


       参考文献:

Chen, Y., Ebenstein, A., Greenstone, M., & Li, H. 2013. Evidence onthe impact of sustained exposure to air pollution on life expectancy fromChina’s Huai River policy. Proceedings of the National Academy of Sciences, 110(32),12936-12941.

Hahn, J., Todd, P., & Van der Klaauw, W. 1999. Evaluating the effectof an antidiscrimination law using a regression-discontinuity design (No.w7131). National bureau of economic research.

Hahn, J., Todd, P., & Van der Klaauw, W. 2001. Identification andestimation of treatment effects with a regression‐discontinuity design. Econometrica,69(1), 201-209.

Keele, Luke J., and Rocio Titiunik. 2014. “Geographic boundaries asregression discontinuities.” Political Analysis. mpu014.

Imbens, Guido W., and Tristan Zajonc. 2011. Regression discontinuitydesign with multiple forcing variables. Working Paper.

Dell, M. 2010. The persistent effects of Peru's mining mita. Econometrica,78(6), 1863-1903.




转载地址:地址





--------------------------2016年7月4日11:17:28







二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:断点回归 econometrica Econometric Proceedings regression 断点

本帖被以下文库推荐

沙发
pkl 在职认证  发表于 2016-7-4 15:35:50 |只看作者 |坛友微信交流群
很好的资料,感谢楼主分享,准备下载该资料来学习,谢谢!

使用道具

藤椅
h2h2 发表于 2016-7-5 08:26:56 |只看作者 |坛友微信交流群
谢谢分享

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-21 09:04