楼主: meilige12321
10651 7

[数据管理求助] STATA如何分组剔除组内重复值 [推广有奖]

  • 6关注
  • 1粉丝

硕士生

73%

还不是VIP/贵宾

-

威望
0
论坛币
84 个
通用积分
4.0662
学术水平
3 点
热心指数
4 点
信用等级
2 点
经验
1768 点
帖子
122
精华
0
在线时间
170 小时
注册时间
2012-12-6
最后登录
2019-4-9

10论坛币
假设数据如下

城市   变量
北京   10
北京   20
北京   10
北京  20
天津  30
天津  10
天津  20
……
我只要剔除北京这一组内变量的重复记录,即10 和 20,但是用dupilicates drop 会连天津的记录一起剔除,请问怎么破?
有很多城市,所以不能拆分数据。如何用stata 实现?

关键词:Stata tata 重复值 PILI drop 北京 如何 记录 天津
沙发
meilige12321 发表于 2014-12-3 16:08:33 |只看作者 |坛友微信交流群
看到论坛里的解决方法了
*设数据中无缺失值
bys id year age (height): g n=_n
bys id year age (height): g N=_N
keep if n==N
drop n N
已有 2 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
狮子坟沉淀 + 5 + 1 + 1 + 1 精彩帖子
SpencerMeng + 60 + 1 鼓励积极发帖讨论

总评分: 经验 + 60  论坛币 + 5  学术水平 + 1  热心指数 + 2  信用等级 + 1   查看全部评分

使用道具

藤椅
zhonghuijie 发表于 2014-12-3 19:22:21 |只看作者 |坛友微信交流群
按照你说的,城市和变量联合起来可以标明一个样本,否则是重复,那么直接用
duplicates drop 城市 变量,force
我觉得这样就可以

使用道具

板凳
你琛爷 发表于 2018-8-11 16:40:39 |只看作者 |坛友微信交流群
谢谢答复,很好用

使用道具

报纸
jiejure 发表于 2020-11-4 17:45:17 |只看作者 |坛友微信交流群
meilige12321 发表于 2014-12-3 16:08
看到论坛里的解决方法了
*设数据中无缺失值
bys id year age (height): g n=_n
赞!!!很好用,我也遇到了你这个问题,这样解决了。像上面说的直接duplicate的话是不行的,天津20会跟北京20冲突。

使用道具

地板
懂了DL 学生认证  发表于 2023-2-2 16:28:38 |只看作者 |坛友微信交流群
zhonghuijie 发表于 2014-12-3 19:22
按照你说的,城市和变量联合起来可以标明一个样本,否则是重复,那么直接用
duplicates drop 城市 变量,f ...
如果年份和省份两个分组呢 我尝试了在后面加入province 但是行不通

使用道具

7
懂了DL 学生认证  发表于 2023-2-2 16:39:47 |只看作者 |坛友微信交流群
懂了DL 发表于 2023-2-2 16:28
如果年份和省份两个分组呢 我尝试了在后面加入province 但是行不通
所以,如果采用多个分组下(年份、省份等),以楼主的方法进行,属实巧妙

使用道具

8
三伏tian 发表于 2023-4-5 16:47:30 |只看作者 |坛友微信交流群
meilige12321 发表于 2014-12-3 16:08
看到论坛里的解决方法了
*设数据中无缺失值
bys id year age (height): g n=_n
抱歉抱歉,点错了,本来要点赞的。是想问下楼主可以解释下这串代码吗

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-23 17:56