楼主: 玄玄果
5177 7

[回归分析求助] 我的psm匹配结果特别不好,请问这种情况该如何解决呢? [推广有奖]

  • 1关注
  • 0粉丝

本科生

45%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.5591
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
881 点
帖子
61
精华
0
在线时间
64 小时
注册时间
2024-6-4
最后登录
2025-5-12

楼主
玄玄果 发表于 2024-7-30 09:53:49 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如图,我做了psm匹配之后结果不太好,p值很少有大于0.1的,能调整的地方都调整过试过了,但p值还是不理想,该怎么办呢? psm匹配表格(缩尾).png psm匹配效果(缩尾且没用循环).png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:PSM 怎么办

psm匹配表格(缩尾).png (68.12 KB)

psm匹配表格(缩尾).png

沙发
赵安豆 发表于 2024-8-4 11:54:59
在进行倾向得分匹配(PSM)时遇到匹配效果不佳的情况是比较常见的问题。如果您的匹配结果中 p 值普遍较小,这可能表明匹配的质量不高,导致处理组和控制组之间的协变量分布仍然存在显著差异。为了解决这个问题,您可以尝试以下几个策略:

1. **调整匹配算法**:不同的匹配方法(如最近邻、卡尺内匹配、半径匹配等)可能会给出不同的结果。尝试使用不同的匹配方法,并观察它们对匹配质量的影响。

2. **优化卡尺宽度**:在进行卡尺内匹配时,您可以通过调整卡尺的宽度来影响匹配的质量和数量。一个更严格的卡尺(较小的值)可能有助于提高匹配质量,但可能会导致较少的数据被保留;而较宽的卡尺则可能导致更多的数据点被包含进来,但也可能增加不匹配的风险。

3. **使用共变量**:在匹配过程中加入更多或不同的共变量可能会改善匹配结果。考虑是否有其他重要的协变量未被包括在内,或者重新评估已有的共变量是否以最优的方式被处理(例如,将连续变量转换为分类变量)。

4. **增加样本量**:如果可能的话,增加您的数据集中的观察值数量可以提高找到良好匹配的可能性。

5. **使用高维度匹配方法**:尝试使用如遗传匹配、优化匹配或熵平衡等更先进的匹配技术,它们能够在处理多个协变量时提供更好的匹配性能。

6. **多点匹配**:考虑每个受试者与多个控制组进行匹配,而不是一对一的匹配。这可以提高匹配的概率和质量。

7. **检查模型假设**:确保您的倾向得分模型假设(如正确选择模型形式、线性或非线性关系的假设)是合理的,并且没有违反任何统计假设。

8. **专家意见**:最后,考虑寻求领域内专家的意见。他们可能会提供关于特定研究问题下的最佳实践或可能被忽视的解决方案。

每个建议的适用性和效果都会根据您的具体数据和研究设计而变化,因此您可能需要尝试多种方法来确定哪种策略最能改善您的匹配结果。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



藤椅
小嘉是个神经病 发表于 2024-8-7 17:47:09
变量太少了,至少搞10个,你多增加一下宏观经济变量进去平衡一下,不然就只能考虑熵平衡法之类的其他方法了

板凳
3363840588 发表于 2025-7-22 16:25:36
小嘉是个神经病 发表于 2024-8-7 17:47
变量太少了,至少搞10个,你多增加一下宏观经济变量进去平衡一下,不然就只能考虑熵平衡法之类的其他方法了 ...
如果政策全部推广之后,还可以使用熵平衡匹配吗?我之前用的是PSM,参考文献也都用了PSM这个方法,按理来说政策全部实施了,就没有对照组,treat全部为1,但是,目前的做法应该都是把treat换成did进行匹配,那熵平衡下也可以这样吗?

报纸
小嘉是个神经病 发表于 2025-7-22 20:07:06
3363840588 发表于 2025-7-22 16:25
如果政策全部推广之后,还可以使用熵平衡匹配吗?我之前用的是PSM,参考文献也都用了PSM这个方法,按理来 ...
PSM、 熵平衡,非参匹配,主成分,合成控制等都是为了解决处理组和对照组不对应的情况,并不适用于无对照组的情况。

如果是没有对照组的情况,那么就只有三条思路,第一条创造对照组,第二条不考虑推广之后的数据,第三条时间序列

第一种,创造对照组,利用强度法的思路来考虑,比如疫情,中招的比较少的就是对照组,多的就是处理组

第二条,不考虑推广之后的情况,直接把这部分干掉

第三条,利用时间断点来考虑,但是时间断点的模型并不稳健,如果数据量不够多,就别考虑这个路子。

地板
我要我的滋味sd 发表于 2025-7-29 14:42:46
赵安豆 发表于 2024-8-4 11:54
在进行倾向得分匹配(PSM)时遇到匹配效果不佳的情况是比较常见的问题。如果您的匹配结果中 p 值普遍较小, ...
感谢你的回答,非常有用

7
DCDC12 发表于 2025-9-10 16:00:30
小嘉是个神经病 发表于 2024-8-7 17:47
变量太少了,至少搞10个,你多增加一下宏观经济变量进去平衡一下,不然就只能考虑熵平衡法之类的其他方法了 ...
您好,请问添加变量的话,是否要考虑多重共线性问题呢?因为我最开始使用了很多变量发现共线性问题比较大,就删除了一些。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-31 07:51