[回归分析求助] pstest 结果解释 [推广有奖]

11楼

女巫瑞子 发表于 2020-10-31 17:00:35

1.U代表未匹配组的情况，M代表匹配上的组的情况。
2.mean代表匹配前后，控制组和实验组中，对应变量的均值。PSM匹配就是从控制组中选取与实验组变量特征相似的那些样本点，用这些选取出来的样本点的结果变量取值，去作为实验组的反事实估计数据。
3.%bias ，是标准化平均值差异。公式为=（mean_T - mean_UT）/SD ，就是用表格中实验组与控制组的均值之差，除以该变量样本总体的标准差，标准差可通过sum得到。
4.%reduct bias的意义就更明显了，是匹配后标准化平均值差异下降的幅度。其数值是通过前面 %bias一列的得到的，公式为( | UnMatched %bias |-|Matched % bias | ) \ |UM%bias| .意义是匹配之后，衡量实验组和控制组间的bias减少了多少。
5.最后的t-test，用于判断前述的 %bias 是否显著，若显著则说明针对该变量而言，实验组和控制组的均值差异是显著的。
6. 最后一列为协变量方差比

综上所述，如何通过数值大小判断匹配是否满足平衡性呢？
1.匹配后的t值越小越好，p值越大越好，代表匹配后，实验组和控制组样本均值差异不显著。
2.匹配后标准化平均值差异越接近0越好。
3.从方差比看，若角标带星号，说明两组协变量的方差仍存在一定差异，个人认为这个数值会影响到后期的匹配偏差和估计方差。众所周知，协变量方差越大，匹配偏差越大，但能有效降低估计方差，使估计出来的结果更易倾向于显著。

如何去改进平衡性？
1.协变量选取环节可以用 pscore（字数不够了，请help查看命令说明），直到命令反馈的结果出现“santisfied”
2.扩大样本量，或者说，使回归元的取值范围的广度提升，有助于%bias的下降，更有助于psmatch2返回结果中t值更显著。