楼主: xts1xts
43104 17

[数据管理求助] 关于duplicates drop, force的一点疑问 [推广有奖]

  • 0关注
  • 1粉丝

博士生

91%

还不是VIP/贵宾

-

威望
0
论坛币
1386 个
通用积分
1.8875
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3084 点
帖子
175
精华
0
在线时间
453 小时
注册时间
2008-5-2
最后登录
2022-12-3

楼主
xts1xts 发表于 2012-9-16 18:44:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
当出现冗余观测值时,我们是不是可以用duplicates drop var1 var2, force这个命令?
那么留下的是默认排序之后遇到的第一个变量吗?还是随机地删除??
比较困惑,求解!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:duplicates duplicate Force drop ATE

沙发
夏目贵志 发表于 2012-9-17 03:14:58
留下的是第一个。看这个例子:
  1. . set obs 9
  2. obs was 0, now 9

  3. . gen x1=mod(_n, 3)

  4. . gen x2=rnormal()

  5. . list

  6.      +----------------+
  7.      | x1          x2 |
  8.      |----------------|
  9.   1. |  1   -.4408787 |
  10.   2. |  2    .9444048 |
  11.   3. |  0    1.112015 |
  12.   4. |  1   -1.636805 |
  13.   5. |  2   -2.022099 |
  14.      |----------------|
  15.   6. |  0   -1.056625 |
  16.   7. |  1   -.3617832 |
  17.   8. |  2   -1.638646 |
  18.   9. |  0    .1321672 |
  19.      +----------------+

  20. . duplicates drop x1, force

  21. Duplicates in terms of x1

  22. (6 observations deleted)

  23. . list

  24.      +----------------+
  25.      | x1          x2 |
  26.      |----------------|
  27.   1. |  1   -.4408787 |
  28.   2. |  2    .9444048 |
  29.   3. |  0    1.112015 |
  30.      +----------------+

  31. .
复制代码
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Sunknownay + 100 + 10 + 1 + 1 + 1 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 10  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

藤椅
xts1xts 发表于 2012-9-17 16:06:30
夏目贵志 发表于 2012-9-17 03:14
留下的是第一个。看这个例子:
非常感谢!!!

板凳
夏目贵志 发表于 2012-9-18 07:09:54
xts1xts 发表于 2012-9-17 17:06
非常感谢!!!
不客气~

报纸
种子sxd 发表于 2013-5-29 09:48:48
夏目贵志 发表于 2012-9-17 03:14
留下的是第一个。看这个例子:
如果我想把重复出现的全部删除一个也不保留该怎么弄?

地板
shevaze 发表于 2013-6-4 21:11:01
种子sxd 发表于 2013-5-29 09:48
如果我想把重复出现的全部删除一个也不保留该怎么弄?
直接删呗?

7
种子sxd 发表于 2013-6-6 09:40:33
shevaze 发表于 2013-6-4 21:11
直接删呗?
好几万个数据,要命啊

8
shevaze 发表于 2013-6-6 19:29:25
种子sxd 发表于 2013-6-6 09:40
好几万个数据,要命啊
bys id : gen count = _N
drop if count > 1
楼主试试这个
已有 1 人评分经验 论坛币 学术水平 热心指数 信用等级 收起 理由
Sunknownay + 100 + 10 + 1 + 1 + 1 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 10  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

9
种子sxd 发表于 2013-6-6 20:40:26
shevaze 发表于 2013-6-6 19:29
bys id : gen count = _N
drop if count > 1
楼主试试这个
谢谢,已经解决了,我用的duplicates,回头试试这个

10
SpencerMeng 在职认证  发表于 2014-4-19 10:18:14
学习了 duplicates drop 命令。 我的疑惑是为什么留下的是第一个,而不是按照一定的条件呢
有问题来发帖,来发帖没问题!
我尊重版规,一切为了学术!
Stata专版版规:https://bbs.pinggu.org/thread-1651470-1-1.html

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2026-1-2 01:27