楼主: 蠢猫猫
305 7

[数据管理求助] 求助删除重复数据的语句!!! [推广有奖]

  • 2关注
  • 0粉丝

本科生

43%

还不是VIP/贵宾

-

威望
0
论坛币
23 个
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
980 点
帖子
58
精华
0
在线时间
83 小时
注册时间
2019-1-18
最后登录
2019-4-23

蠢猫猫 发表于 2019-2-11 01:11:51 |显示全部楼层
id year amount
1 2009 10000
1 2010 666
1 2011 .
1 2011 888
1 2012 9999
2 2010 500
2 2010 6000
2 2011 .
2 2012 4444
如表,我想删除的步骤是这样的:首先,检验id、year的重复,比如表中的 1-2011重复了两次,2-2010重复了两次。然后,看重复变量对应的amount的值,优先保留数值大的和存在的。
也就是我希望得到如下的结果
id year amount
1 2009 10000
1 2010 666
1 2011 888
1 2012 9999
2 2010 6000
2 2011 .
2 2012 4444
这个语句该怎么写呢。。。?求各位大佬帮助!!!
关键词:重复数 amount year AMO ear

回帖推荐

黃河泉 发表于6楼  查看完整内容

试试
stata SPSS
xiyuhuanghun 发表于 2019-2-11 02:35:24 来自手机 |显示全部楼层
duplicates drop
已有 1 人评分热心指数 信用等级 收起 理由
蠢猫猫 + 1 + 1 热心帮助其他会员

总评分: 热心指数 + 1  信用等级 + 1   查看全部评分

回复

使用道具 举报

黃河泉 在职认证  发表于 2019-2-11 07:53:25 |显示全部楼层
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。
2.        并请参考 http://www.jianshu.com/p/9870080fe769,  http://bbs.pinggu.org/thread-5048204-1-1.html, 与 http://bbs.pinggu.org/thread-5917273-1-1.html
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
蠢猫猫 + 1 + 1 + 1 好的意见建议

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

回复

使用道具 举报

蠢猫猫 发表于 2019-2-11 11:01:05 |显示全部楼层
xiyuhuanghun 发表于 2019-2-11 02:35
duplicates drop
嗯嗯我知道这个,可是这个删除的时候没办法保留我需要的那个条件。。
回复

使用道具 举报

蠢猫猫 发表于 2019-2-11 11:27:29 |显示全部楼层
黃河泉 发表于 2019-2-11 07:53
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见 ...
谢谢老师提醒,资料如下。我希望删除的是 4 2017 . 和 5 2017 80160 这两条数据,就是以Stkcd 和year先判断是否存在重复,如果重复的话就删除缺失值和较小值的数据。
* Example generated by -dataex-. To install: ssc install dataex
clear
input long Stkcd int year double Amount
4 2007     598120
4 2008      64400
4 2009          .
4 2015     134772
4 2016  130617.67
4 2017       4000
4 2017          .
5 2010    43438.4
5 2011          .
5 2015    5345059
5 2016  2911384.4
5 2017      80160
5 2017 1823975.84
6 2007    3473200
6 2008  587904.69
end
回复

使用道具 举报

黃河泉 在职认证  发表于 2019-2-11 11:40:40 |显示全部楼层
蠢猫猫 发表于 2019-2-11 11:27
谢谢老师提醒,资料如下。我希望删除的是 4 2017 . 和 5 2017 80160 这两条数据,就是以Stkcd 和year先判 ...
试试
  1. collapse (max) Amount, by(Stkcd year)
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
蠢猫猫 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

回复

使用道具 举报

蠢猫猫 发表于 2019-2-11 12:16:38 |显示全部楼层
黃河泉 发表于 2019-2-11 11:40
试试
谢谢老师!!!可以了[lol][lol]
回复

使用道具 举报

黃河泉 在职认证  发表于 2019-2-11 12:19:36 |显示全部楼层
蠢猫猫 发表于 2019-2-11 12:16
谢谢老师!!!可以了
Great to hear that.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 我要注册

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2019-4-23 22:42