1.U代表 未匹配组的情况,M代表匹配上的组的情况。
2.mean代表匹配前后,控制组和实验组中,对应变量的均值。PSM匹配就是从控制组中选取与实验组变量特征相似的那些样本点,用这些选取出来的样本点的结果变量取值,去作为实验组的反事实估计数据。
3.%bias ,是标准化平均值差异。公式为=(mean_T - mean_UT)/SD ,就是用表格中实验组与控制组的均值之差,除以该变量样本总体的标准差,标准差可通过sum得到。
4.%reduct bias的意义就更明显了,是匹配后标准化平均值差异下降的幅度。其数值是通过前面 %bias一列的得到的,公式为( | UnMatched %bias |-|Matched % bias | ) \ |UM%bias| .意义是匹配之后,衡量 实验组和控制组间的bias减少了多少。
5.最后的t-test,用于判断前述的 %bias 是否显著,若显著则说明针对该变量而言, 实验组和控制组的均值差异是显著的。
6. 最后一列为协变量方差比
综上所述,如何通过数值大小判断匹配是否满足平衡性呢?
1.匹配后的t值越小越好,p值越大越好,代表匹配后,实验组和控制组样本均值差异不显著。
2.匹配后标准化平均值差异越接近0越好。
3.从方差比看,若角标带星号,说明两组协变量的方差仍存在一定差异,个人认为这个数值会影响到后期的匹配偏差和估计方差。 众所周知,协变量方差越大,匹配偏差越大,但能有效降低估计方差,使估计出来的结果更易倾向于显著。
如何去改进平衡性?
1.协变量选取环节可以用 pscore(字数不够了,请help查看命令说明),直到命令反馈的结果出现“santisfied”
2.扩大样本量,或者说,使回归元的取值范围的广度提升,有助于%bias的下降,更有助于psmatch2返回结果中t值更显著。