楼主: 蠢猫猫
1725 7

[数据管理求助] 求助删除重复数据的语句!!! [推广有奖]

  • 2关注
  • 1粉丝

硕士生

51%

还不是VIP/贵宾

-

威望
0
论坛币
1 个
通用积分
20.3335
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1140 点
帖子
76
精华
0
在线时间
204 小时
注册时间
2019-1-18
最后登录
2023-12-18

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
id year amount
1 2009 10000
1 2010 666
1 2011 .
1 2011 888
1 2012 9999
2 2010 500
2 2010 6000
2 2011 .
2 2012 4444
如表,我想删除的步骤是这样的:首先,检验id、year的重复,比如表中的 1-2011重复了两次,2-2010重复了两次。然后,看重复变量对应的amount的值,优先保留数值大的和存在的。
也就是我希望得到如下的结果
id year amount
1 2009 10000
1 2010 666
1 2011 888
1 2012 9999
2 2010 6000
2 2011 .
2 2012 4444
这个语句该怎么写呢。。。?求各位大佬帮助!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:重复数 amount year AMO ear

回帖推荐

黃河泉 发表于6楼  查看完整内容

试试
沙发
xiyuhuanghun 发表于 2019-2-11 02:35:24 来自手机 |只看作者 |坛友微信交流群
duplicates drop
已有 1 人评分热心指数 信用等级 收起 理由
蠢猫猫 + 1 + 1 热心帮助其他会员

总评分: 热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

藤椅
黃河泉 在职认证  发表于 2019-2-11 07:53:25 |只看作者 |坛友微信交流群
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见说明),将原始 Stata 资料中具有”代表性”的一部分资料列出,以供有意回答者实验之用,并能提供具体操作指令。
2.        并请参考 http://www.jianshu.com/p/9870080fe769,  https://bbs.pinggu.org/thread-5048204-1-1.html, 与 https://bbs.pinggu.org/thread-5917273-1-1.html
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
蠢猫猫 + 1 + 1 + 1 好的意见建议

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

板凳
蠢猫猫 发表于 2019-2-11 11:01:05 |只看作者 |坛友微信交流群
xiyuhuanghun 发表于 2019-2-11 02:35
duplicates drop
嗯嗯我知道这个,可是这个删除的时候没办法保留我需要的那个条件。。

使用道具

报纸
蠢猫猫 发表于 2019-2-11 11:27:29 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-2-11 07:53
你若要问程序,永远附上相关资料;若附上资料,永远用 dataex 印出资料。
1.        先 ssc install dataex (并见 ...
谢谢老师提醒,资料如下。我希望删除的是 4 2017 . 和 5 2017 80160 这两条数据,就是以Stkcd 和year先判断是否存在重复,如果重复的话就删除缺失值和较小值的数据。
* Example generated by -dataex-. To install: ssc install dataex
clear
input long Stkcd int year double Amount
4 2007     598120
4 2008      64400
4 2009          .
4 2015     134772
4 2016  130617.67
4 2017       4000
4 2017          .
5 2010    43438.4
5 2011          .
5 2015    5345059
5 2016  2911384.4
5 2017      80160
5 2017 1823975.84
6 2007    3473200
6 2008  587904.69
end

使用道具

地板
黃河泉 在职认证  发表于 2019-2-11 11:40:40 |只看作者 |坛友微信交流群
蠢猫猫 发表于 2019-2-11 11:27
谢谢老师提醒,资料如下。我希望删除的是 4 2017 . 和 5 2017 80160 这两条数据,就是以Stkcd 和year先判 ...
试试
  1. collapse (max) Amount, by(Stkcd year)
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
蠢猫猫 + 1 + 1 + 1 精彩帖子

总评分: 学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

7
蠢猫猫 发表于 2019-2-11 12:16:38 |只看作者 |坛友微信交流群
黃河泉 发表于 2019-2-11 11:40
试试
谢谢老师!!!可以了[lol][lol]

使用道具

8
黃河泉 在职认证  发表于 2019-2-11 12:19:36 |只看作者 |坛友微信交流群
蠢猫猫 发表于 2019-2-11 12:16
谢谢老师!!!可以了
Great to hear that.

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 02:06