楼主: zzwalking
4271 8

[编程问题求助] 关于用psmatch2命令进行PSM匹配的问题 [推广有奖]

  • 0关注
  • 1粉丝

大专生

68%

还不是VIP/贵宾

-

威望
0
论坛币
378 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
248 点
帖子
30
精华
0
在线时间
75 小时
注册时间
2005-11-22
最后登录
2017-7-24

楼主
zzwalking 发表于 2017-6-26 21:27:36 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
小弟最近正在做关于公司并购的问题,需要对实验组也就是发生并购的企业,和对照组也就是未发生并购的企业进行匹配。选定的是2010年的数据,以全要素生产率,资本密度,公司规模也就是员工人数还有行业属性作为匹配变量。
psmatch2 shougou lao mden tfp indid, out(tfp) logit neighbor(2) common caliper(.05) ties
shougou作为分组变量 lao mden tfp分别是劳动力 资本密度 生产率,采用 logit模型 1:2进行匹配
但是这样匹配出来的话产生的n1 n2变量总是连续的,也就是说,那个自动生成的n1 n2的id是连续的
但实际上这个id是随机生成的
有哪位大神能给出解释吗?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:psmatch2 Match ATCH PSM SMA

d1.dta
下载链接: https://bbs.pinggu.org/a-2278517.html

299.41 KB

沙发
zzwalking 发表于 2017-6-27 08:26:56
截图,情况如图所示

QQ截图20170627082610.png (9.92 KB)

QQ截图20170627082610.png

藤椅
黃河泉 在职认证  发表于 2017-6-27 18:33:29
zzwalking 发表于 2017-6-27 08:26
截图,情况如图所示
这倒是蛮奇特,你应该去看看每一组紧邻的两个值是否一样?

板凳
zzwalking 发表于 2017-6-28 08:44:23
黃河泉 发表于 2017-6-27 18:33
这倒是蛮奇特,你应该去看看每一组紧邻的两个值是否一样?
这相邻的两个值区别倒是挺大的,但是1:1匹配的时候两家公司的各个指标倒是差不多,也就是n1匹配的比较准确

报纸
黃河泉 在职认证  发表于 2017-6-28 10:03:28
zzwalking 发表于 2017-6-28 08:44
这相邻的两个值区别倒是挺大的,但是1:1匹配的时候两家公司的各个指标倒是差不多,也就是n1匹配的比较准确 ...
我知道了,因为该程序按照 _pscore 重新将所有资料排序为 _id,所以当你要找 neighbor(2) 必然是相邻的两个 _id (_n1&_n2)。 neighbor(3) 也一定是紧邻的三个观察值!

地板
zzwalking 发表于 2017-6-28 10:32:13
黃河泉 发表于 2017-6-28 10:03
我知道了,因为该程序按照 _pscore 重新将所有资料排序为 _id,所以当你要找 neighbor(2) 必然是相邻的两 ...
啊, 谢谢大神,还有马氏距离匹配的时候的命令您熟悉吗?我只知道logit方式匹配,help文件里面 没太看懂
psmatch2 depvar [if exp] [in range] , mahalanobis(varlist) outcome(varlist) ai(integer) [population altvariance kernel(kernel_type) llr bwidth(real) caliper(real) w(matrix) ate]

7
黃河泉 在职认证  发表于 2017-6-28 10:45:24
zzwalking 发表于 2017-6-28 10:32
啊, 谢谢大神,还有马氏距离匹配的时候的命令您熟悉吗?我只知道logit方式匹配,help文件里面 没太看懂
...
我没用过 Mahalanobis matching (只有初步概念),但原理应该是一样的,都是一种衡量距离 (pscore) 的方法!

8
zzwalking 发表于 2017-6-28 14:38:14
黃河泉 发表于 2017-6-28 10:45
我没用过 Mahalanobis matching (只有初步概念),但原理应该是一样的,都是一种衡量距离 (pscore) 的方法 ...
好的,我再研究一下,谢谢!

9
赵安豆 发表于 2024-6-13 21:29:20
在使用`psmatch2`命令进行倾向得分匹配(PSM)时,你观察到匹配后生成的`n1`和`n2`变量总是连续的,这实际上是因为`psmatch2`命令在匹配过程中确实为每个匹配组自动分配了连续的ID。这些ID并不表示数据点在原始数据集中的位置或顺序,而是表示匹配后的组编号。

当你使用`neighbor(2)`选项时,这意味着你选择了1:2最近邻匹配法,即每一个处理组(实验组)单位将与对照组中两个最接近的单位进行匹配。因此,对于每个处理组单位,命令会找到两个最相似的控制组单位,并为这三者分配一个共同的连续ID。

然而,“随机生成”这个描述并不完全准确,在PSM过程中,`psmatch2`是基于倾向得分和你指定的匹配选项(如caliper, common等)来寻找匹配对象。这意味着即使在每次运行命令时,由于初始排序或随机种子的不同,匹配结果可能会有轻微变化,但一旦设定好相同的随机种子并保持其他条件不变,匹配结果应该是可重复的。

如果你希望看到不同的匹配结果,可以尝试调整`psmatch2`中的参数设置,比如改变caliper大小、使用不同的匹配算法(如核密度估计或局部线性回归)或是引入更多的匹配变量。当然,在进行这些更改前,请确保它们符合你研究设计的需求和假设检验的有效性。

在处理PSM结果时,重要的是要评估匹配质量,检查标准化均值差异、平衡测试以及最终模型的统计显著性和效应大小,以确保匹配有效地消除了选择偏见,并且你的分析结果是稳健可靠的。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-31 07:54