楼主: rrrrubylu
4996 11

[问答] 如何在数据框中提取多个变量相等的子集? [推广有奖]

  • 0关注
  • 0粉丝

高中生

20%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
205 点
帖子
6
精华
0
在线时间
44 小时
注册时间
2016-2-27
最后登录
2019-6-18

楼主
rrrrubylu 学生认证  发表于 2018-6-11 12:40:23 |AI写论文
5论坛币
数据框中有多个变量,想把region、industry和year这三个变量相等的样本提取出来作为一个子集,就这个子集进一步分析,请问如何实现?因为region、industry分类过多,如果一个一个赋值等于的话工作量过大。求大神帮忙!!图片是数据形式~

Snip20180611_1.png

最佳答案

zerofung 查看完整内容

tidyverse的group_by()才是你需要的,就是df %>% group_by(Region, Industry, year)后面就要看你想做什么了,可能需要nest(),可能summarize()就得到你想要的了
关键词:如何实现 数据形式 进一步 工作量

沙发
zerofung 学生认证  发表于 2018-6-11 12:40:24
tidyverse的group_by()才是你需要的,就是df %>% group_by(Region, Industry, year)后面就要看你想做什么了,可能需要nest(),可能summarize()就得到你想要的了
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

藤椅
allain 在职认证  发表于 2018-6-11 14:17:47
tidyverse包的select函数了解一下
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

板凳
rrrrubylu 学生认证  发表于 2018-6-11 15:03:32
allain 发表于 2018-6-11 14:17
tidyverse包的select函数了解一下
谢谢回复!能否请问select下提取多个变量相等的语句是什么?查了一下没查到,谢谢!!

报纸
allain 在职认证  发表于 2018-6-11 15:11:42
rrrrubylu 发表于 2018-6-11 15:03
谢谢回复!能否请问select下提取多个变量相等的语句是什么?查了一下没查到,谢谢!!
select(data.frame,region,industry,year)
data.frame为数据名称

地板
rrrrubylu 学生认证  发表于 2018-6-11 15:34:09
allain 发表于 2018-6-11 15:11
select(data.frame,region,industry,year)
data.frame为数据名称
这个语句只是将year, industry, region三列选出来耶 没有把取值相等的变量筛出来

7
jgchen1966 发表于 2018-6-11 18:01:05
df %>% group_by(Region, Industry, year)%>% tidyr::nest()

   
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

8
jgchen1966 发表于 2018-6-11 18:40:41
tidyr:: nest  真是一个不错的函数,彻底了悟了其性质后,可建一个自已的更灵活的函数,可用于灵活的多变量任何时间点滚动统计分析!!
      正常的滚动函数,都是单变量的,且一算就要算数据集中所有时点。。
       但是,也许,用日交易数据,我只想算每年12月31日这一天前五年(约1000天)滚动统计值,而不是一年的每一天,这可节省200多倍计算时间。。

9
jgchen1966 发表于 2018-6-11 18:47:03
jgchen1966 发表于 2018-6-11 18:40
tidyr:: nest  真是一个不错的函数,彻底了悟了其性质后,可建一个自已的更灵活的函数,可用于灵活的多变量 ...
这种计算时间节省,对于3000多支股票,同时计算上百个多变量统计值,是惊人的!!

10
hifinecon 发表于 2018-6-11 22:19:01
jgchen1966 发表于 2018-6-11 18:47
这种计算时间节省,对于3000多支股票,同时计算上百个多变量统计值,是惊人的!!
very valuable comment, thanks
已有 1 人评分热心指数 收起 理由
jgchen1966 + 5 精彩帖子

总评分: 热心指数 + 5   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-26 04:17