楼主: 皖山一流
4750 6

[问答] R语言多变量怎么去重复值怎么做? [推广有奖]

  • 4关注
  • 13粉丝

已卖:215份资源

讲师

25%

还不是VIP/贵宾

-

威望
0
论坛币
2352 个
通用积分
156.1810
学术水平
73 点
热心指数
80 点
信用等级
54 点
经验
16517 点
帖子
352
精华
0
在线时间
308 小时
注册时间
2013-12-9
最后登录
2021-1-21

楼主
皖山一流 学生认证  发表于 2017-1-6 18:26:16 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
如果多变量重复值怎么判断呢?下列数据集df

id1 id2
1  2
1  2
1  3
2  2
2  2


  • 如果仅以id2去重复值会得到(下划线为删除了的行):      df[!duplicated(df$id2)]

id1 id2
1  2
1  2
1  3
2  2
2  2

  • 如果以id1和id2一起确定重复值,去重复值应该为(下划线为删除了的行):   这种怎么实现呢??

id1 id2
1  2
1  2
1  3
2  2
2  2

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:R语言 重复值 怎么做 多变量 duplicate duplicated 重复值 R语言

回帖推荐

zhou1_20 发表于2楼  查看完整内容

士不可不弘毅,任重而道远~

沙发
zhou1_20 发表于 2017-1-6 19:08:55
  1. library(StatMeasures)
  2. df <- data.frame(id1 = c(1, 1, 1, 2, 2), y = c(2, 2, 3, 2, 2))
  3. df
  4. dfUnq <- rmdupobs(data = df)
  5. dfUnq
复制代码
捕获.PNG

藤椅
皖山一流 学生认证  发表于 2017-1-6 19:43:43
zhou1_20 发表于 2017-1-6 19:08
StatMeasures 这个包貌似就是我一直想要的,有时间学习学习,非常感谢!

板凳
皖山一流 学生认证  发表于 2017-1-6 19:59:55
感觉R语言的分组统计、计算好麻烦哦,,,远远没有stata方便···
还是我没有掌握好用的工具包??

报纸
cheetahfly 在职认证  发表于 2017-1-6 23:39:05
皖山一流 发表于 2017-1-6 19:59
感觉R语言的分组统计、计算好麻烦哦,,,远远没有stata方便···
还是我没有掌握好用的工具包??
那是因为你对R还不够熟悉。
R基础包中自带的
unique(df)
就能解决你的问题。
当然,如果你的数据是上千万行的数据,最好用:
dplyr::distinct(df)
已有 1 人评分论坛币 收起 理由
jiangbeilu + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

地板
皖山一流 学生认证  发表于 2017-1-7 10:07:02 来自手机
cheetahfly 发表于 2017-1-6 23:39
那是因为你对R还不够熟悉。
R基础包中自带的
unique(df)
是这样,还有待学习

7
皖山一流 学生认证  发表于 2017-1-10 14:43:14 来自手机
cheetahfly 发表于 2017-1-6 23:39
那是因为你对R还不够熟悉。
R基础包中自带的
unique(df)
dplyr包原来就是我想要的

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 12:02