PSM是解决什么内生性问题的
做实证研究的朋友,最怕的大概就是“内生性”这三个字了。它像幽灵一样盘旋在模型的头顶,让我们估计出的系数不再纯净,让我们的因果推断充满疑问。在众多解决内生性的工具箱里,PSM(倾向得分匹配,Propensity Score Matching)是一颗耀眼的明星。但它并非万能钥匙,它精准地瞄准了某一类特定的内生性问题。那么,PSM是解决什么内生性问题的呢?
一、 PSM的靶心:选择偏差
简单来说,PSM核心要解决的内生性问题,是由“选择偏差”(Selection Bias)所导致的。 这种问题通常出现在一个非随机化的情境中。比如,我们想研究“参加职业培训”(处理)是否提升了人们的“收入”(结果)。最理想的状态是,我们随机指派一部分人去参加培训(处理组),另一部分人不参加(控制组),这样两组人在各方面特征上理论上就没有系统性差异了。 但现实是,参加培训的人往往是自我选择的(self-selected)。可能是那些更有上进心、更有能力的人更主动地去参加培训。最终我们看到处理组收入更高,这个结果究竟是培训本身带来的,还是这群人本身的能力和上进心带来的?我们无法区分。这种由于个体自身选择而非随机分配导致处理组和对照组初始条件就不相同的现象,就是选择偏差。它使得处理变量(是否培训)与误差项(包含了像能力这样的不可观测因素)相关,从而引发了内生性。
PSM正是为了模拟随机实验的“可比性”而设计的。它的核心思想是:既然我们无法做到随机分配,那我们就从庞大的控制组中,为每一个处理组的个体,找到一个或几个“双胞胎”。这个“双胞胎”在一切可观测的特征(如年龄、性别、教育背景、前期收入等)上都和处理组个体极其相似,唯一的区别就是他没有接受处理(培训)。通过构建这样一个人为的、可比的控制组,我们就能在很大程度上剥离出处理本身的净效应。
二、 PSM如何工作:倾向得分的魔力
PSM的实现,依赖于一个神奇的中间变量——“倾向得分”。它不是一个直接匹配无数个变量的繁琐过程,而是采用了非常巧妙的降维思想。 倾向得分,定义为一个个体在给定其一系列可观测特征(X)后,接收到处理(D=1)的条件概率,即 P(D=1|X)。我们可以通过Logit或Probit模型来估计这个概率。 它的魔力在于,PSM理论表明,如果基于可观测变量X的条件独立性假设成立,那么只要两个个体具有相同的倾向得分,无论他们的X具体是什么组合,他们就处理分配而言就是可比的。这就把多维度的匹配问题(匹配所有X),简化成了单一维度的匹配问题(匹配倾向得分)。 接下来,PSM会根据这个得分,为处理组每个成员在控制组中寻找得分最接近的“邻居”(最近邻匹配),或采用核匹配、卡尺匹配等方法,进行加权平均,从而构造出一个反事实的、高质量的控制组。最后,我们只需要比较处理组和这个新匹配上的控制组在结果变量(Y)上的均值差异,就能得到一个相对更干净的“平均处理效应”(ATT)。
三、 PSM的致命前提与局限性
理解了PSM是解决什么内生性问题的,就必须立刻认识到它的边界。PSM的强大建立在一個非常强的前提假设之上:“条件独立性假设”(CIA)或“可忽略性假设”。这个假设要求,我们选择用于计算倾向得分的可观测变量集(X)必须足够丰富,以至于能够包含所有同时影响处理分配和结果变量的混淆因素。 换言之,PSM只能解决由“可观测混淆变量”导致的内生性问题。如果存在重要的“不可观测混淆变量”(例如上文例子中的“个人能力”、“上进心”),而我们的数据中又没有这些变量的测量,PSM将对此无能为力。匹配得再完美,也无法消除这种由不可观测因素导致的内生性。 这就是PSM最主要的局限性。它常常被批评为“只能解决你看得见的问题,对看不见的敌人束手无策”。因此,在使用PSM时,我们必须竭尽所能地寻找并控制所有相关的可观测变量,并对不可观测变量的潜在影响进行充分的讨论。
结论:PSM的定位
所以,回到最初的问题:PSM是解决什么内生性问题的? 它的答案是:PSM是主要用来解决由“可观测变量”造成的“选择偏差”这一特定内生性问题的有力工具。它通过倾向得分匹配,模拟随机实验,构造出可比的控制组,从而更干净地识别因果效应。 但它绝非因果推断的终极答案。研究者必须清醒地意识到其假设的苛刻性,明确它无法处理“不可观测异质性”的问题。在实际应用中,PSM常与其他方法(如差分-in-Differences, DID)结合使用,以提供更为稳健的实证证据。理解PSM的能与不能,是我们迈向更严谨实证研究的关键一步。


雷达卡


京公网安备 11010802022788号







