楼主: 李会超
4986 3

[程序分享] R删除重复值 [推广有奖]

  • 1关注
  • 31粉丝

已卖:1166份资源

教授

33%

还不是VIP/贵宾

-

威望
0
论坛币
121239 个
通用积分
62.0400
学术水平
140 点
热心指数
152 点
信用等级
84 点
经验
56173 点
帖子
1180
精华
1
在线时间
1120 小时
注册时间
2008-11-6
最后登录
2024-4-29

楼主
李会超 发表于 2014-10-10 11:05:53 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
今天在做一个项目的时候发现R剔除重复值比较困难,百度之后找到了解决办法:如果有下列的数据
> a
  公司 比例
1    a  0.4
2    a  0.3
3    a  0.2
4    b  0.5
5    b  0.4
如果想仅保留每个公司的第一条数据,可使用如下方法
> duplicated(a$公司)
[1] FALSE  TRUE  TRUE FALSE  TRUE
> b<-duplicated(a$公司)
> a[!b,]
  公司 比例
1    a  0.4
4    b  0.5

如果是要完全去重呢?也就是去除公司和比例完全一样的行数据,则用如下方法:
> duplicated(paste(a$公司,a$比例))
[1] FALSE FALSE FALSE FALSE FALSE
> a[!duplicated(paste(a$公司,a$比例)),]
  公司 比例
1    a  0.4
2    a  0.3
3    a  0.2
4    b  0.5
5    b  0.4
如果有更好的方法,欢迎回复



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:重复值 duplicate paste past 解决办法 百度 项目

已有 1 人评分经验 收起 理由
hubifeng? + 40 精彩帖子

总评分: 经验 + 40   查看全部评分

学无止境,坚持!

沙发
hdmars 在职认证  发表于 2014-10-10 11:19:15
好贴,谢谢分享
已有 1 人评分经验 收起 理由
李会超 + 12 鼓励积极发帖讨论

总评分: 经验 + 12   查看全部评分

藤椅
贝儿10 发表于 2014-10-10 15:47:43
进来看看                                                                        
                                       
                                                     
                                                     
                                             
                                                                 
                                                                                 
已有 1 人评分经验 收起 理由
李会超 + 12 鼓励积极发帖讨论

总评分: 经验 + 12   查看全部评分

板凳
daishen 发表于 2014-10-10 17:15:28
公司 比例
    a  0.4
    a  0.4
    a  0.2
    b  0.4
    b  0.4

unique(a)
  公司 比例
1    a  0.4
3    a  0.2
4    b  0.4
已有 1 人评分论坛币 收起 理由
李会超 + 12 精彩帖子

总评分: 论坛币 + 12   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 22:01