请选择 进入手机版 | 继续访问电脑版
楼主: 万人往LVR
5114 4

[问答] 求对数据框某一列去重的函数 [推广有奖]

  • 1关注
  • 13粉丝

副教授

82%

还不是VIP/贵宾

-

威望
0
论坛币
5127 个
通用积分
816.1888
学术水平
70 点
热心指数
112 点
信用等级
40 点
经验
9088 点
帖子
625
精华
0
在线时间
1182 小时
注册时间
2013-7-18
最后登录
2023-12-6

万人往LVR 在职认证  发表于 2017-5-22 08:54:39 |显示全部楼层 |坛友微信交流群

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
目前知道的对数据框排序去重的方法为
data[!duplicated(data$ID),]
但是代码量太多了,求问有没有哪个包有现成的去重函数,代码比较简便,类似function(data,ID)这种

也想知道一下,duplicated的效率和其他包的去重函数的效率相比是怎样的,是什么原理导致的效率不同
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数据框 duplicate function Data CAT

Eric1028 发表于 2017-5-22 09:37:08 |显示全部楼层 |坛友微信交流群
  1. dplyr::distinct()
复制代码
已有 1 人评分论坛币 收起 理由
万人往LVR + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

使用道具

cheetahfly 在职认证  发表于 2017-5-22 10:19:16 |显示全部楼层 |坛友微信交流群
dplyr::distinct(data, ID, .keep_all = TRUE)
已有 1 人评分论坛币 收起 理由
万人往LVR + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

使用道具

wh1207353991 发表于 2017-5-22 16:45:52 来自手机 |显示全部楼层 |坛友微信交流群
万人往LVR 发表于 2017-5-22 08:54
目前知道的对数据框排序去重的方法为
data[!duplicated(data$ID),]
但是代码量太多了,求问有没有哪个包有 ...
dplyr包中的select函数就可以
已有 1 人评分论坛币 收起 理由
万人往LVR + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

使用道具

万人往LVR 在职认证  发表于 2017-5-23 09:04:13 |显示全部楼层 |坛友微信交流群
多谢各位

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-3-29 22:20