ZZ1119 发表于 2019-10-28 12:18
也就是说,匹配前的结果是关于整个对照组和整个实验组的性质,而匹配后也是关于整个对照组和整个实验组的 ...
1、“也就是说,匹配前的结果是关于整个对照组和整个实验组的性质,而匹配后也是关于整个对照组和整个实验组的性质,只不过剔除了没有匹配上的样本对吗?”
前半句是对的,匹配前是关于全部总体original(unmatched)。但匹配后我们看的就是匹配成功matched的样本,不看没有匹配上的,我觉得没有“匹配后的整个对照组、整个实验组”这个说法。
2、“但事实上没匹配上的样本可能很少,大部分样本都能被匹配,这样一来匹配前后的结果可能差异不大。”
如果你在匹配时的参数设置合理,而大部分样本被匹配,那么恭喜你,你的original可能组间差异就不大。
如果original的组间差异大,但大部分样本被匹配,那么很可能是你的设置参数有问题,设置入选条件太宽松。
3、“如果匹配之后还是在比较整个对照组和整个实验组的性质(尽管是剔除了不能匹配的样本),那么即便是性质差异较大也不能说明匹配效果不好,因为匹配仅仅对局部有效。”
首先,匹配后不是比较整个对照组和实验组,你加了括号说明你理解,只是我们不用这样的说法,你可以叫匹配后样本或matched sample ,相对应的匹配前的叫original 或unmatched。
其次,还是我第一次留言时说的匹配只对matched sample 负责,它无法改变原总体的任何,而没有匹配成功的数据将不会进入到后面的分析,因为根据PSM,我们认为这些数据应该被剔除。
另外,参看第四条,我不太明白最后这个“即便是性质差异较大也不能说明匹配效果不好”
4、关于你说的“差异”问题
我在前面讨论中提到的“差异”指的是两个总体的组间差异是否显著,或者匹配后两样本组间差异是否显著,这里的差异是统计学意义上的显著差异。
在你的回复中,“匹配前后的结果可能差异不大”、 “那么即便是性质差异较大也不能说明匹配效果不好”,你这里的两个差异是什么意思呢