楼主: secretsky
25360 11

[问答] 倾向性评分匹配如何确定协变量 [推广有奖]

  • 0关注
  • 0粉丝

已卖:85份资源

高中生

55%

还不是VIP/贵宾

-

威望
0
论坛币
420 个
通用积分
2.0275
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
323 点
帖子
3
精华
0
在线时间
58 小时
注册时间
2015-10-30
最后登录
2022-6-11

楼主
secretsky 发表于 2016-3-15 18:01:45 |AI写论文
5论坛币

本人学位论文需要用到倾向性评分匹配的统计分析方法,目的是比较两组研究对象在4个结局变量的差异,需要均衡影响结局变量的混杂因素,主要是社会人口学变量,匹配的具体方法请教论坛里的统计学大神们,论坛币不多,5个予以酬谢!

1、很多关于倾向性评分匹配的例子都是考虑1个结局变量,我需要比较4个结局变量,所以协变量会纳入4个结局变量的混杂因素,但4个结局变量的混杂因素有差异,共9个社会人口学变量,这样会不会不妥?我的理解是,选入了全部的混杂因素,相当于均衡了社会人口学资料,可以更好比较两组研究对象在结局变量的差异。

2、根据二元logistics回归建立倾向性得分模型,关于协变量的选择,年龄和工作年限高度相关,是否最好只纳入其中一个,如工作年限,另外工作年限以连续型还是分类变量纳入为好?

3、选好协变量进行匹配后,还有1个混杂因素未均衡怎么处理?之前看到论坛有人建议根据这个混杂因素(3分类变量)分层匹配后再合并,不知是否合理?另外,我想匹配后比较分组对结局变量的影响时,将PS得分作为矫正因素,由于PS得分是基于3次匹配后汇总的,是否不合理?

问题比较多,希望懂这方面的大神不吝赐教,遇到类似问题的筒子也可以得到解答,大家一起交流学习。


最佳答案

雪莲123 查看完整内容

最近也在学习这个方法。首先,关于你的问题,个人感觉第一个应该是所有的有可能在组间不平衡的基本信息都纳入进去。第二logistic回归分析并无要求自变量之间相互独立吧,而且年龄跟工作年限不一定是绝对的解释关系吧,有些初中毕业就工作的,有些博士后才工作的,工作年限差的比较远哦。PS得分不是logistic回归分析之后的预测值吗?这样的话应该不受到你所谓解决变量多少的影响啊。在匹配之后你才进行后面的不同解决变量之间的配对 ...
关键词:倾向性 协变量 二元logistic LOGISTICS logistic logistics 统计学 人口学 如何 论文

沙发
雪莲123 发表于 2016-3-15 18:01:46
最近也在学习这个方法。首先,关于你的问题,个人感觉第一个应该是所有的有可能在组间不平衡的基本信息都纳入进去。第二logistic回归分析并无要求自变量之间相互独立吧,而且年龄跟工作年限不一定是绝对的解释关系吧,有些初中毕业就工作的,有些博士后才工作的,工作年限差的比较远哦。PS得分不是logistic回归分析之后的预测值吗?这样的话应该不受到你所谓解决变量多少的影响啊。在匹配之后你才进行后面的不同解决变量之间的配对t或配对卡方的比较不是吗?  希望能对你有帮助。
另外,请问下你用什么软件做的倾向性评分呢?SPSS吗?暂时我还没搞定软件的问题。可否共享一下啊?
已有 1 人评分论坛币 学术水平 收起 理由
admin_kefu + 20 + 1 热心帮助其他会员

总评分: 论坛币 + 20  学术水平 + 1   查看全部评分

藤椅
secretsky 发表于 2016-7-9 00:27:16
非常感谢你的热心解答,不好意思今天才看到,我有SPSS20.0相关PSM插件,你需要的话,发你邮箱。关于我之前的疑问,查了一些资料,首先关于协变量的纳入,多数研究者认为任何与结局变量相关的协变量,无论其与处理因素的关系,都应纳入模型中,其次如果自变量高度相关(r>0.7),logistic回归也需要考虑共线性问题,最后关于分层匹配再合并,合并后PS得分是否具有可比性我还没弄清,很高兴一起交流学习!

板凳
peyzf 发表于 2017-12-3 11:57:05
选择匹配变量有什么规定性?

报纸
yangye823 学生认证  发表于 2017-12-26 22:48:11
想问下楼主,协变量的选取标准是什么啊?我就选择4个,然后控制行业和年度。平衡性检验的结果显示,偏度都在10%以内,而且t值都不显著,通过检验。这样就完成PSM匹配了吗?谢谢!!

地板
机智的小球球IU 学生认证  发表于 2018-7-6 10:03:35
yangye823 发表于 2017-12-26 22:48
想问下楼主,协变量的选取标准是什么啊?我就选择4个,然后控制行业和年度。平衡性检验的结果显示,偏度都在 ...
这几天也在考虑协变量的选取问题。我一直的理解是 尽量控制影响Y的因素,这样匹配得到的就是在除了X不同 ,其余都相同的情况下,考察不同X对Y的影响,这时产生的影响就仅仅是X的作用。不知道你的理解是怎么样的?

7
yangye823 学生认证  发表于 2018-7-12 10:30:38
机智的小球球IU 发表于 2018-7-6 10:03
这几天也在考虑协变量的选取问题。我一直的理解是 尽量控制影响Y的因素,这样匹配得到的就是在除了X不同  ...
logit回归,哪些显著选哪些。

8
贝伯二氏病8 发表于 2018-9-15 11:10:55
yangye823 发表于 2018-7-12 10:30
logit回归,哪些显著选哪些。
倾向评分匹配估计的可靠性取决于“条件独立性”是否被满足,即要求匹配后处理组企业与对照组企业在匹配变量上不存在显著差异。所以,不应该是在logit回归中各变量不显著才算匹配成功吗?

9
宇宁静 发表于 2018-12-16 22:56:19
贝伯二氏病8 发表于 2018-9-15 11:10
倾向评分匹配估计的可靠性取决于“条件独立性”是否被满足,即要求匹配后处理组企业与对照组企业在匹配变 ...
不是的,你可以先做OLS回归挑出显著的变量,然后再做Logit

10
onlylovetheo 发表于 2019-3-31 10:57:30
雪莲123 发表于 2016-3-15 18:01
最近也在学习这个方法。首先,关于你的问题,个人感觉第一个应该是所有的有可能在组间不平衡的基本信息都纳 ...
用stata

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-3 13:52