楼主: kamaduoluo
1070 2

[问答] 请教各位老师一个关于数据筛选的问题。 [推广有奖]

  • 2关注
  • 0粉丝

本科生

73%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
1532 点
帖子
64
精华
0
在线时间
105 小时
注册时间
2015-2-15
最后登录
2025-4-20

楼主
kamaduoluo 发表于 2017-10-30 14:59:16 |AI写论文
5论坛币
各位老师好:

数据格式为

客户           日期              消费金额
A        2017/10/15        100
A        2017/10/16        123
A        2017/10/17        131
A        2017/10/18        213
B        2017/10/17        234
B        2017/10/18        141
B        2017/10/19        242
B        2017/10/20        12
C        2017/10/19        134
C        2017/10/20        242
C        2017/10/21        313

条件:筛选出每位客户,日期最近的消费金额(实际数据大致20万条)。

客户        日期        消费金额
A        2017/10/18        213
B        2017/10/20        12
C        2017/10/21        313

感谢各位老师。
关键词:数据筛选 数据格式 实际数据 筛选出

沙发
屋檐滴语 发表于 2017-10-30 14:59:17
  1. library(dplyr)
  2. df %>%
  3.   filter(客户=="A"|客户=="B"|客户=="C")%>%
  4.   group_by(客户)%>%
  5.   mutate(diff=as.numeric(Sys.Date()-as.Date(日期)))%>%
  6.   filter(diff==min(diff))%>%
  7.   select(客户,日期,消费金额)
复制代码
已有 1 人评分论坛币 收起 理由
jiangbeilu + 5 精彩帖子

总评分: 论坛币 + 5   查看全部评分

藤椅
kamaduoluo 发表于 2017-10-31 11:33:57
屋檐滴语 发表于 2017-10-30 14:59
非常感谢~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 11:58