楼主: ines333
4407 2

[问答] 多年数据如何计算变量? [推广有奖]

  • 0关注
  • 0粉丝

本科生

16%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0.0948
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
411 点
帖子
33
精华
0
在线时间
94 小时
注册时间
2021-7-6
最后登录
2024-1-17

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我的数据结构是省份、年份和变量值,要基于原始数据计算很多衍生变量。其中,增速指标会涉及其他年份的数据,我目前是把指标按年份增加标识,比如2020年的指标是GDP,2019年是GDP_P,2018年是GDP_PP,如果只是两年还好,但问题是我有10年的数据,要算近40个指标,这样PPP的加下去很乱,比如:
近三年GDP增长率均值=((地区生产总值指数_P-100)+(地区生产总值指数_PP-100)+(地区生产总值指数_PPP-100))/3
表结构如下,怎么才能快速的把这十年的指标都计算好呢,谢谢!!!
屏幕截图 2022-01-29 012719.jpg

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:生产总值指数 地区生产总值 GDP增长率 gdp增长 生产总值

沙发
owenqi 在职认证  学生认证  发表于 2022-1-29 13:49:54 |只看作者 |坛友微信交流群
还是要根据实际情况,比如你这里提到的计算近三年GDP平均增长值,你需要的是一个能计算滚动均值(rolling mean)的函数,举个例子
  1. df <- data.frame(area = rep(letters[1:3], each = 5),
  2.                  year = rep(2017:2021, 3),
  3.                  val = ceiling(runif(15, 1000, 2000)))

  4. library(dplyr)
  5. library(zoo)

  6. df %>% group_by(area) %>%
  7.   mutate(r3avg = rollmean(val, k = 3, align = 'right', fill = NA))
复制代码
已有 1 人评分学术水平 热心指数 信用等级 收起 理由
Sunknownay + 3 + 3 + 3 热心帮助其他会员

总评分: 学术水平 + 3  热心指数 + 3  信用等级 + 3   查看全部评分

使用道具

藤椅
ines333 发表于 2022-1-30 00:35:49 来自手机 |只看作者 |坛友微信交流群
owenqi 发表于 2022-1-29 13:49
还是要根据实际情况,比如你这里提到的计算近三年GDP平均增长值,你需要的是一个能计算滚动均值(rolling  ...
感谢!成功解决了!

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-27 21:40