楼主: 5752
3449 5

[问答] 提取某段时间的数据 [推广有奖]

  • 1关注
  • 2粉丝

已卖:402份资源

讲师

53%

还不是VIP/贵宾

-

威望
0
论坛币
5513 个
通用积分
106.8498
学术水平
5 点
热心指数
6 点
信用等级
3 点
经验
14009 点
帖子
181
精华
0
在线时间
720 小时
注册时间
2015-9-9
最后登录
2025-5-22

楼主
5752 发表于 2018-6-20 14:57:24 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我有一个大的数据库,里面是有一列date是2017/01/01-2017/12/31,还有一个小的数据库,里面的时间是一段一段的,如2017/02/08-2017/02/20、  2017/03/011-2017/03/15、2017/05/21-2017/05/27,等等,很多段,长度不等,我想按照这些短的时间段,把大库里面的数据提取出来,如何操作? 因为时间段比较多,需要批量做一下,求大神的代码。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
5752 发表于 2018-6-22 09:11:14
顶一下

藤椅
万人往LVR 在职认证  发表于 2018-6-22 09:33:52
把date拆成起始时间和终止时间两列,再进行筛选
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

板凳
hifinecon 发表于 2018-6-22 10:05:02
good solution

报纸
5752 发表于 2018-6-22 12:13:39
万人往LVR 发表于 2018-6-22 09:33
把date拆成起始时间和终止时间两列,再进行筛选
没明白啊,能否具体一些

地板
万人往LVR 在职认证  发表于 2018-6-22 14:05:41
  1. library(rlist)
  2. library(stringr)
  3. library(dplyr)

  4. data1 <- data.frame(id=1:3,date=c('2017/01/01-2017/06/30','2017/03/01-2017/10/30','2016/01/01-2016/12/31'),value=11:13,stringsAsFactors=F)
  5. data2 <- data.frame(date=c('2017/02/08-2017/02/20', '2017/03/11-2017/03/15','2017/05/21-2017/05/27'),value=5:7,stringsAsFactors=F)

  6. data1[,c('start','end')] <- str_split(data1[['date']],'-') %>% list.rbind
  7. data2[,c('start','end')] <- str_split(data2[['date']],'-') %>% list.rbind

  8. lapply(1:nrow(data2),
  9.         function(i) filter(data1,start<=data2[['start']][i]&end>=data2[['end']][i])) %>%
  10.         list.rbind %>%
  11.         distinct(id,.keep_all=T)
复制代码

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 08:15