楼主: syhlxhx1
1502 4

[问答] R语言 统计数据处理 时间序列分析 [推广有奖]

  • 0关注
  • 0粉丝

高中生

52%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
19793 点
帖子
18
精华
0
在线时间
27 小时
注册时间
2017-7-31
最后登录
2022-10-15

楼主
syhlxhx1 发表于 2022-5-20 16:51:09 |AI写论文
5论坛币
求教各位大神!
我有两列数据,第一列是年代,第二列是微量元素含量的变化
但这个数据年代不是等间距的

想请教,如何把数据转换为0-100,每5年一个间隔的数据呢?用线性插值的方法。

数据如图:

关键词:时间序列分析 数据处理 统计数据 时间序列 R语言

沙发
syhlxhx1 发表于 2022-5-20 16:52:12
图片好像没显示出来,重新上传!

微信图片_20220520165147.png (13.1 KB)

微信图片_20220520165147.png

藤椅
llb_321 在职认证  发表于 2022-5-21 08:20:01
数据是随机波动的,插值结果的准确性根本无法评估,那么插值结果也没有统计意义。除非数据量大,可以从中发现某种周期性模式。
就用原始数据吧。

板凳
syhlxhx1 发表于 2022-5-21 11:54:50
llb_321 发表于 2022-5-21 08:20
数据是随机波动的,插值结果的准确性根本无法评估,那么插值结果也没有统计意义。除非数据量大,可以从中发 ...
我只是举了一个数据的例子,数据量还是很大的。
我是做古环境的,是几万年来的数据。

报纸
llb_321 在职认证  发表于 2022-5-22 17:12:33
syhlxhx1 发表于 2022-5-21 11:54
我只是举了一个数据的例子,数据量还是很大的。
我是做古环境的,是几万年来的数据。
1. 插值的代码实现,没有技术障碍,可以利用tidyr包的full_seq()生成完整的时间序列,并与原缺失的时间序列合并,再用dplyr包的fill()简单填充,或采用均值或分位点填充。但是这种方式生成的数据,属于人造的,尤其是缺失值太多的话。
2. 换个思路,既然数据量很大,不如用原始数据,按固定时间间隔分组,再取各间隔的均值作为分析的基础,也就是做些平滑处理。当然也可以用这个均值作为上一种处理的插值。
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-9 08:13