楼主: 529976527
3257 2

[数据管理求助] merge的时候,因为数据不唯一而失败,怎么找出重复值 [推广有奖]

  • 3关注
  • 0粉丝

本科生

18%

还不是VIP/贵宾

-

威望
0
论坛币
486 个
通用积分
65.1876
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
2865 点
帖子
59
精华
0
在线时间
65 小时
注册时间
2017-2-20
最后登录
2024-3-10

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我在尝试merge两个文件的时候失败并提示:variables cusip fyear do not uniquely identify observations in the master data
mer 1:1 cusip fyear using /Users/Desktop/ISS2017.dta

我理解可以直接deplicate drop,但是我想先看看到底重复的是什么情况,但是我看不懂duplicates report的含义,例如surplus是什么意思
--------------------------------------
   copies | observations       surplus
----------+---------------------------
        1 |        50446             0
        2 |        10934          5467
--------------------------------------


我尝试了duplicate list fyear cusip 但是出来太多东西了 导致表格的表头都无法显示了

请问如何找出重复值?
非常感谢

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Merge 重复值 observations observation duplicates

沙发
917968079 发表于 2020-6-21 17:52:09 |只看作者 |坛友微信交流群
应该是有观察值重复了两次.可以用下面的命令检查一下重复的情况,如果是完全重复直接把重复的删了就行了
  1. duplicates tag fyear cusip,g(copy)
  2. br if copy!=0
复制代码
已有 2 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
gobaw + 5 + 2 + 2 + 2 精彩帖子
529976527 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

使用道具

藤椅
529976527 学生认证  发表于 2020-6-22 11:26:38 |只看作者 |坛友微信交流群
917968079 发表于 2020-6-21 17:52
应该是有观察值重复了两次.可以用下面的命令检查一下重复的情况,如果是完全重复直接把重复的删了就行了
非常感谢

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-6 01:44