楼主: wonway
159777 38

[数据管理求助] 如何在stata中删除重复值   [推广有奖]

  • 0关注
  • 4粉丝

硕士生

89%

还不是VIP/贵宾

-

威望
0
论坛币
801 个
通用积分
54.0353
学术水平
1 点
热心指数
2 点
信用等级
1 点
经验
2181 点
帖子
129
精华
0
在线时间
121 小时
注册时间
2008-4-13
最后登录
2022-5-2

楼主
wonway 发表于 2010-8-5 15:52:25 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请问 (1) 在stata中 有某两个或多个样本所有变量或部分变量相同,想删除重复的样本 仅保留一个如何操作。

            (2)想有条件地删除样本,比如 if year==2007 ,命令是怎样的呢?

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Stata tata 重复值 如何操作 year Stata 删除

回帖推荐

sungmoo 发表于5楼  查看完整内容

*设数据中无缺失值 bys id year age (height): g n=_n bys id year age (height): g N=_N keep if n==N drop n N

danshenyazi 发表于3楼  查看完整内容

可以用 duplicates 命令,具体的参数可以参看stata的help

本帖被以下文库推荐

沙发
sungmoo 发表于 2010-8-5 16:21:12
wonway 发表于 2010-8-5 15:52 (1) 在stata中 有某两个或多个样本所有变量或部分变量相同,想删除重复的样本 仅保留一个如何操作
举个例子,摆出原始数据,说明你想要的结果。

藤椅
danshenyazi 发表于 2010-8-5 18:02:40
可以用 duplicates 命令,具体的参数可以参看stata的help
已有 1 人评分论坛币 热心指数 收起 理由
SpencerMeng + 10 + 1 观点有启发

总评分: 论坛币 + 10  热心指数 + 1   查看全部评分

板凳
wonway 发表于 2010-8-6 11:14:22
我的问题的两个例子就是:
(1) id      year      age        height
             1      2007       5             1.2
             1      2007        5            1.4
             2      2008        5            1.2
比如在这个数据中,前两个样本id  year  age相同,我想要删除掉其中一个,仅保留一个,然后还想附加一个条件,就是删掉height较小(1.2)的那个。

(2)还是上面的数据,然后我想要删掉 year==2007的全部样本。

请问这两个命令如何操作,谢谢了。

报纸
sungmoo 发表于 2010-8-6 11:53:56
wonway 发表于 2010-8-6 11:14
(1) id      year      age        height
             1      2007       5             1.2
             1      2007        5            1.4
             2      2008        5            1.2
比如在这个数据中,前两个样本id  year  age相同,我想要删除掉其中一个,仅保留一个,然后还想附加一个条件,就是删掉height较小(1.2)的那个。
*设数据中无缺失值
bys id year age (height): g n=_n
bys id year age (height): g N=_N
keep if n==N
drop n N
已有 8 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
cavs + 1 + 1 + 1 精彩帖子
635990503 + 5 很好用
南宫姑娘 + 5 + 1 + 1 精彩帖子
芒果宝宝蛋 + 1 + 1 + 1 精彩帖子
mumu爱老虎油 + 1 + 1 + 1 非常不错,很容易就去掉了重复值!
零点晓敏 + 1 + 1 + 1 精彩帖子
福建的小苗 + 1 + 1 + 1 精彩帖子
dxystata + 10 好的意见建议

总评分: 论坛币 + 20  学术水平 + 6  热心指数 + 6  信用等级 + 5   查看全部评分

地板
sungmoo 发表于 2010-8-6 11:54:45
wonway 发表于 2010-8-6 11:14 我想要删掉 year==2007的全部样本
drop if year==2007

7
小洋芋 发表于 2010-8-7 22:16:34
如果有缺失的可以先删除缺失的值
drop if height==.

sort year age height
by year age: keep if _n==_N
就可以了吧

8
ywh19860616 发表于 2010-8-8 16:06:59
对,直接用drop命令
具体用法,自己help了

9
2008201102 发表于 2010-8-26 10:52:54
嗯……学习一下经验……

10
liangsky 发表于 2010-8-26 11:37:57
duplicates drop ***

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 08:04