楼主: kamaduoluo
845 2

[问答] 请教各位老师一个关于数据筛选的问题。 [推广有奖]

  • 2关注
  • 0粉丝

本科生

73%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
1532 点
帖子
64
精华
0
在线时间
105 小时
注册时间
2015-2-15
最后登录
2022-3-15

5论坛币
各位老师好:

数据格式为

客户           日期              消费金额
A        2017/10/15        100
A        2017/10/16        123
A        2017/10/17        131
A        2017/10/18        213
B        2017/10/17        234
B        2017/10/18        141
B        2017/10/19        242
B        2017/10/20        12
C        2017/10/19        134
C        2017/10/20        242
C        2017/10/21        313

条件:筛选出每位客户,日期最近的消费金额(实际数据大致20万条)。

客户        日期        消费金额
A        2017/10/18        213
B        2017/10/20        12
C        2017/10/21        313

感谢各位老师。
关键词:数据筛选 数据格式 实际数据 筛选出
沙发
屋檐滴语 发表于 2017-10-30 14:59:17 |只看作者 |坛友微信交流群
  1. library(dplyr)
  2. df %>%
  3.   filter(客户=="A"|客户=="B"|客户=="C")%>%
  4.   group_by(客户)%>%
  5.   mutate(diff=as.numeric(Sys.Date()-as.Date(日期)))%>%
  6.   filter(diff==min(diff))%>%
  7.   select(客户,日期,消费金额)
复制代码
已有 1 人评分论坛币 收起 理由
jiangbeilu + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

使用道具

藤椅
kamaduoluo 发表于 2017-10-31 11:33:57 |只看作者 |坛友微信交流群
屋檐滴语 发表于 2017-10-30 14:59
非常感谢~

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-19 06:14