楼主: snile
1483 4

[问答] R 数据框中多行数据ID列的值相同,如何根据Length列中的最大值去除重复ID数据 [推广有奖]

  • 0关注
  • 0粉丝

大专生

28%

还不是VIP/贵宾

-

威望
0
论坛币
19 个
通用积分
0.1198
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
426 点
帖子
23
精华
0
在线时间
46 小时
注册时间
2017-12-8
最后登录
2023-1-19

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
多行数据ID列的值相同,如何根据Length列中的最大值(该列中存在多个数据为最大值),去除重复的ID值,仅保留一个Length最大 且 ID唯一的整行数据。数据如图所示,对于EntrezGeneID1该列数据,红框为ID值重复的行,希望是仅保留Length1为最大的一行数据,如黑框标出的数据。(不一定为第一个,任选Length1的值为最大值的一行数据即可)。

请大神指教!十分感谢!
data.jpg
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:length leng 最大值 数据框 eng

沙发
owenqi 在职认证  学生认证  发表于 2021-3-28 07:06:50 |只看作者 |坛友微信交流群
你可以用dplyr来完成,见例子
  1. library(dplyr)
  2. df <- data.frame(id = rep(1:3,each = 3), val = rpois(9, 2))
  3. df %>% group_by(id) %>% summarise(max(val))
复制代码
已有 3 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
llb_321 + 5 精彩帖子
cheetahfly + 10 热心帮助其他会员
Sunknownay + 3 + 3 + 3 热心帮助其他会员

总评分: 论坛币 + 15  学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

使用道具

藤椅
llb_321 在职认证  发表于 2021-3-28 13:54:49 |只看作者 |坛友微信交流群
owenqi 发表于 2021-3-28 07:06
你可以用dplyr来完成,见例子
newGS<-df %>% group_by(EntrezGeneID1) %>% filter(Length1==max(Length1)) #这样直接些
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

使用道具

板凳
snile 发表于 2021-3-29 15:16:50 |只看作者 |坛友微信交流群
owenqi 发表于 2021-3-28 07:06
你可以用dplyr来完成,见例子
好的,谢谢大神指教!让我更加熟悉dplyr包的相关方法。谢谢!

使用道具

报纸
snile 发表于 2021-3-29 15:18:57 |只看作者 |坛友微信交流群
llb_321 发表于 2021-3-28 13:54
newGS% group_by(EntrezGeneID1) %>% filter(Length1==max(Length1)) #这样直接些
感谢大神指导!写法上的确更简洁明了,便于新手了解代码。十分感谢!!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-6-14 02:47