搜索
人大经济论坛 标签 倾向得分匹配 相关日志

tag 标签: 倾向得分匹配经管大学堂:名校名师名课

相关日志

分享 关于PSM(倾向得分匹配)的一些思考
水一天sdu 2019-4-29 15:56
关于 PSM (倾向得分匹配)的一些思考 水兵兵 近些天,写论文过程中用到了 PSM 估计方法,论文完成后,对方法进行了一点思考和总结,以加深了解和备今后复习使用。 一、 理想控制实验 我觉得,所有的因果分析方法(包括 OLS )如果能从理想控制实验切入,很多问题都能轻易理解,比如系数一致性估计、遗漏变量问题、代理变量偏差问题、严格外生性、内生性等等。 如果想精确研究 x 对 y 的影响,最好的方法就是控制住其他所有影响因素,仅让 x 变化,来观测 y 的反应。 这个实验过程本身已经杜绝了内生性过程。因为在时间先后上,是让 x 先变化,再观察 y 的变化,更重要的是,其他所有变量均被控制使 y 无法通过扰动项对 x 产生影响,故不存在内生性。 二、 实验与数据的现实情况 现实情况下,不可能存在绝对理想的控制实验,最好的情况也就是无限接近。例如,物理学中的控制实验,也不能做到完全控制住所有其他变量。 经济学作为一门社会科学,就更能做到随机实验获取随机实验数据。且通常为观测数据而非实验数据。例如,实验个体会受到身高、体重、智商、所处环境及思想的影响,且不存在完全相同的两个个体(即使是同卵双胞胎也存在后天差异)。这会导致两个后果:一是遗漏变量——很多变量无法被观察到(就无法通过控制变量来控制);二是测量偏差——代理变量与真实变量差异。遗漏变量和变量偏差都会被归集到扰动项,如果扰动项与 x 相关,则会导致内生性问题(不满足严格外生性),导致结果估计的不一致。如果不一致的差异很大,则实证研究失败。 三、 创新性解决办法——随机实验法 大统计学家 Fisher 提出了随机实验思想。其思想是:将足够多样本随机分配到不同组,则依据大数定律,各个变量在组与组之间不再存在系统差异,即各个变量均值相等(每个个体的变量差异被平均化),使数据接近理想控制实验数据。很好起到了克服遗漏变量偏差、内生性等问题。 四、 反事实框架与 PSM 估计 反事实框架就是寻找这样一个随机实验:两个实验组的所有其他影响因素不存在系统差异,唯独自己关心的 x 存在差异,则一个组就是另一个组的“反事实”,他们之间的 y 的差异就可认为是由 x 引起的。 PSM 就是为得到这样的两组数据创造条件的方法,其具体操作是:在对照组为实验组个体 i 寻找一个非常接近的个体 j ,用其作为 i 的反事实数据。按照这样的方法对每个个体都进行配对(删除配对不成功个体——无法找到非常接近反事实个体的个体),两个实验组数据就变得非常接近理想随机实验了。
个人分类: 原创|12 次阅读|0 个评论

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-3 10:28