楼主: lizhewenbei
5630 16

[回归分析求助] 请问PSMATCH2怎么挑选无重复(不和处理组重复)的对照组? [推广有奖]

  • 15关注
  • 5粉丝

副教授

36%

还不是VIP/贵宾

-

威望
0
论坛币
309 个
通用积分
11.4770
学术水平
4 点
热心指数
13 点
信用等级
5 点
经验
9699 点
帖子
609
精华
0
在线时间
496 小时
注册时间
2008-2-6
最后登录
2024-1-9

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问高手,PSMATCH2怎么挑选不和处理组重复的对照组?
我的处理组有6000个,配对后形成了6000个对照组,但是按照ID一比较,对照组中4000个都是处理组中的。最后放在一起的话,处理组6000个,对照组2000个,跑回归很不显著。请大家帮助!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:psmatch2 Match ATCH SMA PSM

沙发
hustchen2012 在职认证  发表于 2015-4-7 08:38:37 |只看作者 |坛友微信交流群
那你就先剔除4000  多个和控制组特征差异比较明显的样本,然后再进行PSM
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
lizhewenbei + 1 + 1 + 1 + 1 精彩帖子
SpencerMeng + 10 + 1 + 1 观点有启发

总评分: 论坛币 + 11  学术水平 + 2  热心指数 + 2  信用等级 + 1   查看全部评分

使用道具

藤椅
lizhewenbei 学生认证  发表于 2015-4-7 08:56:45 |只看作者 |坛友微信交流群
hustchen2012 发表于 2015-4-7 08:38
那你就先剔除4000  多个和控制组特征差异比较明显的样本,然后再进行PSM
这样样本缩减很多啊,很可能是:处理组2000,对照组2000。另外我发现,很多对照组都是处理组同一家公司的不同年度的观测。比如股票000001的2005年匹配上了000001的2006年,请问这种情况怎么用语句控制一下呢?

使用道具

板凳
lizhewenbei 学生认证  发表于 2015-4-7 08:56:49 |只看作者 |坛友微信交流群
hustchen2012 发表于 2015-4-7 08:38
那你就先剔除4000  多个和控制组特征差异比较明显的样本,然后再进行PSM
这样样本缩减很多啊,很可能是:处理组2000,对照组2000。另外我发现,很多对照组都是处理组同一家公司的不同年度的观测。比如股票000001的2005年匹配上了000001的2006年,请问这种情况怎么用语句控制一下呢?

使用道具

报纸
hustchen2012 在职认证  发表于 2015-4-7 09:24:27 |只看作者 |坛友微信交流群
lizhewenbei 发表于 2015-4-7 08:56
这样样本缩减很多啊,很可能是:处理组2000,对照组2000。另外我发现,很多对照组都是处理组同一家公司的 ...
第一,样本缩减远比控制组和处理组样本差异大问题来的严重(直接影响到因果识别)
第二,对照组和处理组是同一家公司不同时期的问题确实存在,我当初做PSM时就遇到过这样的问题,后来好像解决了。思路大概是先对对处理组和待匹配组的ID做一个识别,即先明确那些是处理组,保证处理组样本不能进入匹配组。然后再进行匹配。你好好琢磨肯定能找到思路的
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
lizhewenbei + 2 + 2 + 2 + 2 精彩帖子

总评分: 论坛币 + 2  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

使用道具

地板
lizhewenbei 学生认证  发表于 2015-4-9 09:56:55 |只看作者 |坛友微信交流群
hustchen2012 发表于 2015-4-7 09:24
第一,样本缩减远比控制组和处理组样本差异大问题来的严重(直接影响到因果识别)
第二,对照组和处理组 ...
感谢你!这个问题已经解决了,目前找到的匹配组具有不同的ID。另外,在PSM过程中,尚有一点疑问,寻找的对照组是否允许重复值(如:几个处理组的样本选中了同一个对照组)?因为我找到的对照组中,好多都是重复的。

使用道具

7
hustchen2012 在职认证  发表于 2015-4-9 12:18:28 |只看作者 |坛友微信交流群
lizhewenbei 发表于 2015-4-9 09:56
感谢你!这个问题已经解决了,目前找到的匹配组具有不同的ID。另外,在PSM过程中,尚有一点疑问,寻找的对 ...
严格来说,是不可以的,匹配一般是1:1、1:2、1:3、1:5,也就是控制组样本多一些。
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
lizhewenbei + 1 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 1  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

8
lizhewenbei 学生认证  发表于 2015-4-19 08:45:41 |只看作者 |坛友微信交流群
hustchen2012 发表于 2015-4-9 12:18
严格来说,是不可以的,匹配一般是1:1、1:2、1:3、1:5,也就是控制组样本多一些。
明白了!但是我的初始样本中,处理组就占比较大,约占60%,对照组约占40%。那么PSM之后,也不可能1:2、1:3之类的,该怎么办呢?

使用道具

9
hustchen2012 在职认证  发表于 2015-4-19 10:07:00 |只看作者 |坛友微信交流群
lizhewenbei 发表于 2015-4-19 08:45
明白了!但是我的初始样本中,处理组就占比较大,约占60%,对照组约占40%。那么PSM之后,也不可能1:2、1: ...
看看两组之间自变量的差异,如果处理组的自变量显著大于控制组,那么处理组中自变量比较大的那部分删除掉,至少似的两组的比例为1:1,这样样本更加符合随机分布的特征

使用道具

10
lizhewenbei 学生认证  发表于 2015-4-19 10:43:43 |只看作者 |坛友微信交流群
hustchen2012 发表于 2015-4-19 10:07
看看两组之间自变量的差异,如果处理组的自变量显著大于控制组,那么处理组中自变量比较大的那部分删除掉 ...
非常受教!感谢你

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 04:25