楼主: MISSCCC
7861 6

[问答] R语言_多变量筛选删除重复值 [推广有奖]

  • 1关注
  • 1粉丝

已卖:9份资源

硕士生

92%

还不是VIP/贵宾

-

威望
0
论坛币
304 个
通用积分
14.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1510 点
帖子
78
精华
0
在线时间
303 小时
注册时间
2014-9-17
最后登录
2022-5-21

楼主
MISSCCC 发表于 2017-1-24 19:11:36 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
已经解决,故清除
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:命名 如何

沙发
cheetahfly 在职认证  发表于 2017-1-25 09:26:00
  1. library(dplyr)

  2. # 第一种
  3. data %>%
  4.     group_by(ID, Accident) %>%
  5.     filter(row_number() == 1) %>%
  6.     ungroup()

  7. # 第二种
  8. data %>%
  9.     group_by(ID, Accident, index, Disease, Reason) %>%
  10.     summarise(Duration = Duration[1], Amount = sum(Amount)) %>%
  11.     ungroup()
复制代码


藤椅
小朝 发表于 2017-1-25 10:25:28
学习楼上代码
  1. library(dplyr)
  2. # 第一种
  3. data %>% distinct(ID,Accident, .keep_all = TRUE)
  4. # 第二种
  5. data %>% group_by(Insure,ID, Accident, index, Disease, Reason) %>% summarise(Duration = Duration[1], Amount = sum(Amount)) %>% ungroup()
复制代码
已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
youngyaoguai + 1 + 2 + 2 + 2 精彩帖子

总评分: 论坛币 + 1  学术水平 + 2  热心指数 + 2  信用等级 + 2   查看全部评分

板凳
MISSCCC 发表于 2017-1-25 11:02:07
cheetahfly 发表于 2017-1-25 09:26
十分感谢~
可以麻烦说明一下第二种方法吗?
第二种方法显示“unknown variable to group by : a”,尝试将其删除或是改成Insure数据结果不太对劲。
R语言小白,烦请大神赐教~
附:
方法二.PNG

报纸
MISSCCC 发表于 2017-1-25 11:17:39
小朝 发表于 2017-1-25 10:25
学习楼上代码
thx~
又了解了一个新语法distinct
第二种做法依然茫然中,可否麻烦赐教?

地板
cheetahfly 在职认证  发表于 2017-1-25 13:14:20
MISSCCC 发表于 2017-1-25 11:02
十分感谢~
可以麻烦说明一下第二种方法吗?
第二种方法显示“unknown variable to group by : a”,尝试 ...
'a'是笔误,应该去掉的,另外你试了几次,group_by()的参数都不一样,结果应该是不一样的,说明有些变量随着观测的重复有所不同,你要确定哪些哪些是要保留的,放在group_by()中,哪些是要舍弃的,与“Duration = Duration[1]”一样处理即可。

7
MISSCCC 发表于 2017-1-25 17:49:55
cheetahfly 发表于 2017-1-25 13:14
'a'是笔误,应该去掉的,另外你试了几次,group_by()的参数都不一样,结果应该是不一样的,说明有些变量随 ...
了解~~谢谢你

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-21 10:39