倾向得分匹配法(Propensity Score Matching,简称PSM)是一种在观察性研究中评估因果效应的方法。它的主要目的是为了减少选择偏差,即解决由于实验组和对照组之间存在的系统差异而导致的估计偏差问题。
在应用PSM时,首先需要构建一个模型来预测每个个体被分配到实验组的概率(这被称为倾向得分)。这个概率是基于一系列可观测的协变量计算出来的。一旦得到了每个个体的倾向得分,就可以通过匹配技术将实验组和对照组中的个体进行配对,使得每一对在倾向得分上尽可能接近。
常见的匹配方法包括:
1. 最近邻匹配:为每个实验组个体找到一个与之倾向得分最近的对照组个体。
2. 卡尺匹配:仅选择那些倾向得分差异不超过某个阈值(卡尺)内的个体进行匹配。
3. 共同支持内的匹配:只在实验组和对照组之间共享的倾向得分范围内寻找匹配。
通过PSM,研究者可以在没有随机化分组的情况下创建出一组相似性较高的配对样本。然后可以比较这些匹配样本在结果变量上的差异,从而估计出处理效应。这种方法被广泛应用于经济学、流行病学和社会科学等领域,以评估政策干预的效果或评价治疗方案的优劣。
需要注意的是,PSM虽然能够有效减少选择偏差,但它不能解决不可观测因素的影响问题。此外,在实际应用中,正确选择和构建倾向得分模型非常重要,否则可能会导致匹配效果不佳,从而影响因果效应估计的准确性。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用