楼主: 李会超
4606 3

[程序分享] R删除重复值 [推广有奖]

  • 1关注
  • 31粉丝

教授

33%

还不是VIP/贵宾

-

威望
0
论坛币
121197 个
通用积分
59.1084
学术水平
140 点
热心指数
152 点
信用等级
84 点
经验
56182 点
帖子
1183
精华
1
在线时间
1119 小时
注册时间
2008-11-6
最后登录
2022-7-22

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
今天在做一个项目的时候发现R剔除重复值比较困难,百度之后找到了解决办法:如果有下列的数据
> a
  公司 比例
1    a  0.4
2    a  0.3
3    a  0.2
4    b  0.5
5    b  0.4
如果想仅保留每个公司的第一条数据,可使用如下方法
> duplicated(a$公司)
[1] FALSE  TRUE  TRUE FALSE  TRUE
> b<-duplicated(a$公司)
> a[!b,]
  公司 比例
1    a  0.4
4    b  0.5

如果是要完全去重呢?也就是去除公司和比例完全一样的行数据,则用如下方法:
> duplicated(paste(a$公司,a$比例))
[1] FALSE FALSE FALSE FALSE FALSE
> a[!duplicated(paste(a$公司,a$比例)),]
  公司 比例
1    a  0.4
2    a  0.3
3    a  0.2
4    b  0.5
5    b  0.4
如果有更好的方法,欢迎回复



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:重复值 duplicate paste past 解决办法 百度 项目

已有 1 人评分经验 收起 理由
hubifeng? + 40 精彩帖子

总评分: 经验 + 40   查看全部评分

学无止境,坚持!
沙发
hdmars 在职认证  发表于 2014-10-10 11:19:15 |只看作者 |坛友微信交流群
好贴,谢谢分享
已有 1 人评分经验 收起 理由
李会超 + 12 鼓励积极发帖讨论

总评分: 经验 + 12   查看全部评分

使用道具

藤椅
贝儿10 发表于 2014-10-10 15:47:43 |只看作者 |坛友微信交流群
进来看看                                                                        
                                       
                                                     
                                                     
                                             
                                                                 
                                                                                 
已有 1 人评分经验 收起 理由
李会超 + 12 鼓励积极发帖讨论

总评分: 经验 + 12   查看全部评分

使用道具

板凳
daishen 发表于 2014-10-10 17:15:28 |只看作者 |坛友微信交流群
公司 比例
    a  0.4
    a  0.4
    a  0.2
    b  0.4
    b  0.4

unique(a)
  公司 比例
1    a  0.4
3    a  0.2
4    b  0.4
已有 1 人评分论坛币 收起 理由
李会超 + 12 精彩帖子

总评分: 论坛币 + 12   查看全部评分

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 19:41