楼主: TeresaTLH
36335 15

[数据管理求助] PSM(倾向得分匹配法)中,关于处理组和对照组的样本 [推广有奖]

11
6513 在职认证  发表于 2020-9-23 07:56:56
whr1994 发表于 2020-9-20 19:42
你好,我在匹配的时候,加入一个新的变量之后,样本量减少了,这是因为什么呢
是不是又缺失值?

12
一个俗人罢了K 发表于 2020-11-23 16:59:30
whr1994 发表于 2020-9-20 19:42
你好,我在匹配的时候,加入一个新的变量之后,样本量减少了,这是因为什么呢
加入新的协变量进行匹配,得到的样本量有变化很正常啊!

13
whr1994 学生认证  发表于 2020-11-23 19:18:52
6513 发表于 2020-9-23 07:56
是不是又缺失值?
应该是

14
whr1994 学生认证  发表于 2020-11-23 19:19:21
一个俗人罢了K 发表于 2020-11-23 16:59
加入新的协变量进行匹配,得到的样本量有变化很正常啊!
好的,谢谢

15
zhuxiaoxia5566 学生认证  发表于 2021-4-15 13:27:04
橙大事者 发表于 2018-2-2 16:29
大神,想请教你关于倾向得分匹配法原理上的问题,感谢!1.比如用1998-2015年建立海外研发中心的企业共37家 ...
请问你的问题解决了吗?

16
赵安豆 发表于 2025-1-7 21:27:07
在PSM(倾向得分匹配法)中,如果处理组的样本数量远超对照组(例如,3:1的比例),直接进行一对一匹配确实可能导致大量处理组样本被排除,从而影响研究的有效性和效率。这种情况下,可以考虑以下几种解决方案:

### 1. 多对一匹配
尝试使用多对一的匹配策略。比如,在你的情况下,每3个处理组样本中选择与对照组最接近的一个或几个进行匹配。这要求你的倾向得分估计足够精确,以确保匹配的有效性。

### 2. 使用卡尺(Caliper)匹配
在PSM中添加卡尺限制,即定义一个允许的最大距离范围内的匹配标准,可以减少由于处理组和对照组样本数量差异导致的问题。这种策略有助于提高匹配质量,同时尽可能多地保留样本。

### 3. 共同支持原则下的重采样
根据共同支持(Common Support)原则,在匹配前先确定处理组与对照组倾向得分的交集范围,然后在该范围内进行匹配。如果处理组样本过多,可以通过随机抽样的方式减少其数量至更接近对照组的数量,或者使用有放回的抽样(bootstrap)来增加对照组的样本量。

### 4. 使用全匹配或半径匹配
考虑使用全匹配(Full Matching)或半径匹配(Radius Matching),前者试图为每个处理组样本找到最佳匹配对象,后者则在固定距离内寻找所有可能的匹配。这两种方法可以有效利用所有的处理组和对照组数据。

### 5. 加权法
采用加权策略来平衡样本。例如,使用倾向得分逆概率加权(Inverse Probability of Treatment Weighting, IPTW)对每个样本进行加权,以达到在分析中模拟平衡的样本结构的目的。

选择哪种方法应根据具体研究设计、数据特性以及你想要解决的关键问题来进行决定。重要的是要确保所选方法能够提高匹配质量,同时满足你的研究目标和假设检验需求。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-29 22:13