楼主: susangao1118
4506 4

[数据管理求助] stata 合并命令以后,为何会出现匹配结果多于原表数据? [推广有奖]

  • 0关注
  • 0粉丝

初中生

90%

还不是VIP/贵宾

-

威望
0
论坛币
9 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
409 点
帖子
15
精华
0
在线时间
22 小时
注册时间
2011-9-24
最后登录
2015-1-26

楼主
susangao1118 发表于 2013-2-17 15:58:37 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
各位好,我要用stata把不同的表合并起来,在合并过程当中,我发现本来一万多条数据,合并结果_merge(3)的情况比一万多条数据还多然后我就尝试duplicates drop,竟然会有重复数据被删除,请问在合并过程中,为什么会出现自动复制的情况呢?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata duplicates duplicate Merge

沙发
sunzhimeng 在职认证  发表于 2013-3-5 00:04:51
这个问题,我也遇到了。可能stata的merge应该是采用并集,默认缺失的变量值用上一年代替。我建议可以先对文件进行筛选,使其变成一致。但是筛选好像很麻烦,我也不会用。亲,你这个问题是怎么解决的?

藤椅
蓝色 发表于 2013-3-5 02:54:31
1、没有你的数据,如果不想让别人用你的数据,那么可以只提供两个数据库的merge的那个变量
2、不清楚你用的merge命令怎么写的,只是说一个结果怎么判断问题出在那里

板凳
susangao1118 发表于 2013-3-5 11:00:50
sunzhimeng 发表于 2013-3-5 00:04
这个问题,我也遇到了。可能stata的merge应该是采用并集,默认缺失的变量值用上一年代替。我建议可以先对文 ...
后来我检测过了,原来是我的using data里面有部分重复的数据,我当时直接从数据库下载,就认为不存在重复问题所以没有进行重复值删除的步骤,后来试了一下,然后结果就正常了。亲,你可以试下

报纸
susangao1118 发表于 2013-3-5 11:04:53
蓝色 发表于 2013-3-5 02:54
1、没有你的数据,如果不想让别人用你的数据,那么可以只提供两个数据库的merge的那个变量
2、不清楚你用的 ...
嗯嗯~我的using data里面存在了重复值,merger语句是正确的,问题也解决了,谢谢哦^_^

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-30 01:47