楼主: chloe0521
15129 15

[问答] 用R软件 如何补全 不连续的日期数据? [推广有奖]

  • 0关注
  • 0粉丝

高中生

92%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0001
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
319 点
帖子
5
精华
0
在线时间
71 小时
注册时间
2014-9-25
最后登录
2016-2-29

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
数据集中日期不连续的,有断层。比如:
2014-4-5    123
2014-4-6    234
2014-4-8     456
2014-4-10   345



现在需要补齐缺失的日期,补全后数据集为

2014-4-5    123
2014-4-6    234
2014-4-7
2014-4-8     456
2014-4-9
2014-4-10   345




数据集有近6万个数据量,有没有方法可以实现这个过程(R语言),求回答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:日期数据 r软件 数据集 R语言 有没有 如何 软件

沙发
万人往LVR 在职认证  发表于 2015-9-17 15:33:23 |只看作者 |坛友微信交流群
你的日期数据格式是哪种

使用道具

藤椅
chloe0521 发表于 2015-9-17 15:50:01 |只看作者 |坛友微信交流群
万人往LVR 发表于 2015-9-17 15:33
你的日期数据格式是哪种
就是as.Date()函数处理之后的格式

使用道具

板凳
jinkelazzz 发表于 2015-9-17 16:19:09 |只看作者 |坛友微信交流群
> library(lubridate)
> x<-ymd("2010-01-01")
> y<-ymd("2010-03-30")
> z<-as.numeric(y-x)
> DATE<-x+days(0:z)
> x
[1] "2010-01-01 UTC"
> y
[1] "2010-03-30 UTC"
> DATE
[1] "2010-01-01 UTC" "2010-01-02 UTC" "2010-01-03 UTC" "2010-01-04 UTC" "2010-01-05 UTC" "2010-01-06 UTC" "2010-01-07 UTC" "2010-01-08 UTC"
[9] "2010-01-09 UTC" "2010-01-10 UTC" "2010-01-11 UTC" "2010-01-12 UTC" "2010-01-13 UTC" "2010-01-14 UTC" "2010-01-15 UTC" "2010-01-16 UTC"
[17] "2010-01-17 UTC" "2010-01-18 UTC" "2010-01-19 UTC" "2010-01-20 UTC" "2010-01-21 UTC" "2010-01-22 UTC" "2010-01-23 UTC" "2010-01-24 UTC"
[25] "2010-01-25 UTC" "2010-01-26 UTC" "2010-01-27 UTC" "2010-01-28 UTC" "2010-01-29 UTC" "2010-01-30 UTC" "2010-01-31 UTC" "2010-02-01 UTC"
[33] "2010-02-02 UTC" "2010-02-03 UTC" "2010-02-04 UTC" "2010-02-05 UTC" "2010-02-06 UTC" "2010-02-07 UTC" "2010-02-08 UTC" "2010-02-09 UTC"
[41] "2010-02-10 UTC" "2010-02-11 UTC" "2010-02-12 UTC" "2010-02-13 UTC" "2010-02-14 UTC" "2010-02-15 UTC" "2010-02-16 UTC" "2010-02-17 UTC"
[49] "2010-02-18 UTC" "2010-02-19 UTC" "2010-02-20 UTC" "2010-02-21 UTC" "2010-02-22 UTC" "2010-02-23 UTC" "2010-02-24 UTC" "2010-02-25 UTC"
[57] "2010-02-26 UTC" "2010-02-27 UTC" "2010-02-28 UTC" "2010-03-01 UTC" "2010-03-02 UTC" "2010-03-03 UTC" "2010-03-04 UTC" "2010-03-05 UTC"
[65] "2010-03-06 UTC" "2010-03-07 UTC" "2010-03-08 UTC" "2010-03-09 UTC" "2010-03-10 UTC" "2010-03-11 UTC" "2010-03-12 UTC" "2010-03-13 UTC"
[73] "2010-03-14 UTC" "2010-03-15 UTC" "2010-03-16 UTC" "2010-03-17 UTC" "2010-03-18 UTC" "2010-03-19 UTC" "2010-03-20 UTC" "2010-03-21 UTC"
[81] "2010-03-22 UTC" "2010-03-23 UTC" "2010-03-24 UTC" "2010-03-25 UTC" "2010-03-26 UTC" "2010-03-27 UTC" "2010-03-28 UTC" "2010-03-29 UTC"
[89] "2010-03-30 UTC"
已有 1 人评分经验 收起 理由
李会超 + 80 精彩帖子

总评分: 经验 + 80   查看全部评分

使用道具

报纸
chloe0521 发表于 2015-9-17 16:45:42 |只看作者 |坛友微信交流群
jinkelazzz 发表于 2015-9-17 16:19
> library(lubridate)
> x y z DATE x
[1] "2010-01-01 UTC"
我的数据量比较大,而且中间的缺失量比较多,这个方法可能还是要先识别不连续时间的开始与结束,能不能有直接实现这个过程的函数或者其他方法?谢谢!
已有 1 人评分经验 收起 理由
李会超 + 80 精彩帖子

总评分: 经验 + 80   查看全部评分

使用道具

地板
jinkelazzz 发表于 2015-9-17 16:50:47 |只看作者 |坛友微信交流群
chloe0521 发表于 2015-9-17 16:45
我的数据量比较大,而且中间的缺失量比较多,这个方法可能还是要先识别不连续时间的开始与结束,能不能有 ...
你就列出头尾不就好啦。中间的不都是你要的么

使用道具

7
kazenogyosya 在职认证  发表于 2016-3-27 09:38:43 |只看作者 |坛友微信交流群
jinkelazzz 发表于 2015-9-17 16:50
你就列出头尾不就好啦。中间的不都是你要的么
意思是说,原数据观测不连续,怎么在原序列基础上加入观测值,数值用NA或者0代替

使用道具

8
jiangbeilu 学生认证  发表于 2016-3-27 10:03:42 |只看作者 |坛友微信交流群
kazenogyosya 发表于 2016-3-27 09:38
意思是说,原数据观测不连续,怎么在原序列基础上加入观测值,数值用NA或者0代替
给你按照这个思路来:
  1. x=seq(1,16,by=2)
  2. y=1:8

  3. df1 <- data.frame(x,y)
  4. # 产生一个新的data.frame
  5. df2 <- data.frame(x=1:16,c=NA)
  6. newdf <- merge(df1,df2,by="x",all=TRUE)
  7. newdf$c <- NULL
  8. newdf
复制代码
已有 2 人评分经验 学术水平 热心指数 信用等级 收起 理由
幽冥重腕 + 1 + 1 + 1 观点有启发
李会超 + 40 精彩帖子

总评分: 经验 + 40  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

使用道具

9
治感冒 发表于 2016-3-27 10:31:45 |只看作者 |坛友微信交流群
建立一个连续的时间序列,然后merge
已有 1 人评分经验 收起 理由
李会超 + 20 精彩帖子

总评分: 经验 + 20   查看全部评分

使用道具

10
pingguoxiao99 发表于 2016-4-26 13:44:14 |只看作者 |坛友微信交流群
jinkelazzz 发表于 2015-9-17 16:19
> library(lubridate)
> x y z DATE x
[1] "2010-01-01 UTC"
楼主~~为啥我使用ymd总是报错呢?为啥呢?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-9-20 18:07