人大经济论坛 › 论坛 › 数据科学与人工智能 › 数据分析与数据科学 › R语言论坛 › R语言怎么做循环

发帖

楼主: 阿璇tian

3986 15

[问答] R语言怎么做循环 [推广有奖]

0关注
0粉丝

硕士生

89%

还不是VIP/贵宾

威望: 0 级
论坛币: 8 个
通用积分: 2.8713
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 1959 点
帖子: 121
精华: 0
在线时间: 195 小时
注册时间: 2017-12-21
最后登录: 2023-3-27

楼主

阿璇tian 发表于 2018-12-3 16:45:37 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

老师们，我想请教一个R循环的问题。

我有两个表，表一：有两列，一共是311322条数据
日期                员工编号
2018-11-01       12345678
2018-11-01       234556
2018-11-01       23454678
2018-11-02       123456786
2018-11-02       23456786

表二：有四列，一共是80849条
日期                部门编码             部门开始编码             部门截止编码
2018-11-01       2345                   1234567889                1345678900
2018-11-01       2346                   1234567899                1345674567
2018-11-02       2345                   1234567889                1345678900

我想按天，看每天，每个部门编码，在这个部门开始编码、结束编码数值范围内的员工编码有多少个。生成下面三个变量
日期    部门编码       个数

我自己的想法是生成一个80849*311322的表，看每个员工编码是否在部门开始编码、部门截止编码范围内，再按照日期、部门编码分组求个数，但是这个表太大了，内存不够啊。。。

请问老师们有什么好办法吗？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：数值范围条数据问题。

相关帖子

沙发

阿璇tian 发表于 2018-12-3 17:04:53

是不是应该写了循环，日期、员工编号套两层，但我不知道怎么写，请问有老师知道吗？
谢谢~

藤椅

Whig

发表于 2018-12-3 18:19:38

部门开始、结束编码会变？

板凳

阿璇tian 发表于 2018-12-3 19:12:04

Whig 发表于 2018-12-3 18:19
部门开始、结束编码会变？

同一个部门的开始和结束编码不会变

报纸

Whig

发表于 2018-12-3 19:31:35

阿璇tian 发表于 2018-12-3 19:12
同一个部门的开始和结束编码不会变

像这种大数据量的不建议循环。你现在问题的关键是获取员工编码和部门编码的对应关系。首先用unique获取部门编码、部门起止编码。然后在员工表上，通过某种方式找到对应的部门。问题的难点就变成如何去找对应部门了。

已有 1 人评分	论坛币	收起理由
cheetahfly	+ 10	热心帮助其他会员

总评分: 论坛币 + 10 查看全部评分

地板

jgchen1966 发表于 2018-12-3 22:50:13

##  用一个简单的模仿数据集xda，将核心部分，例示如下：
##################

xda<-tibble::tibble(x=letters[1:5],y0=c(1,5,9,15,20),y1=c(4,8,14,19,25))
yda<-tibble::tibble(ys=seq(min(xda$y0),max(xda$y1),by=1))

xyda<-xda%>%
   dplyr::group_by(x)%>%
   dplyr::do( y=filter(yda,ys>=.$y0& ys<=.$y1))%>%
   tidyr::unnest()
###################
## 体会理解了，此问题，就很容易了  。。

已有 2 人评分	经验	论坛币	收起理由
cheetahfly		+ 10	热心帮助其他会员
刘彦楼	+ 100		热心帮助其他会员

总评分: 经验 + 100 论坛币 + 10 查看全部评分

7楼

jgchen1966 发表于 2018-12-3 22:53:57

##################
##  用一个简单的模仿数据集xda，将核心部分，例示如下：
#######
xda<-tibble::tibble(x=letters[1:5],y0=c(1,5,9,15,20),y1=c(4,8,14,19,25))
yda<-tibble::tibble(ys=seq(min(xda$y0),max(xda$y1),by=1)) ##################
####  #############
xyda<-xda%>%
   dplyr::group_by(x)%>%
   dplyr::do( y=filter(yda,ys>=.$y0& ys<=.$y1))%>% ##
   tidyr::unnest()
###################
## 体会理解了，此问题，就很容易了  。。无需显示循环

已有 1 人评分	经验	收起理由
刘彦楼	+ 100	热心帮助其他会员

总评分: 经验 + 100 查看全部评分

鹑居鷇食，鸟行无彰

8楼

jgchen1966 发表于 2018-12-3 22:55:22

jgchen1966 发表于 2018-12-3 22:53
##################
## 用一个简单的模仿数据集xda，将核心部分，例示如下：
#######

上述显示，将$ 改显为y 了 #######

9楼

jgchen1966 发表于 2018-12-3 22:56:40

jgchen1966 发表于 2018-12-3 22:55
上述显示，将$ 改显为y 了 #######

上述显示，将y前的$ 改显为没了 #不知何因，就这样吧，太烦######

10楼

jgchen1966 发表于 2018-12-3 23:00:15

jgchen1966 发表于 2018-12-3 22:53
##################
## 用一个简单的模仿数据集xda，将核心部分，例示如下：
#######

因为楼主的数据很大，需要用future 进行平行运行，速度至少可提高50倍以上

已有 2 人评分	经验	论坛币	学术水平	热心指数	收起理由
crystal8832		+ 10	+ 1	+ 1	热心帮助其他会员
刘彦楼	+ 100				热心帮助其他会员

总评分: 经验 + 100 论坛币 + 10 学术水平 + 1 热心指数 + 1 查看全部评分

返回列表

12 下一页

发帖

本版微信群

加好友,备注cda
拉您进交流群

京ICP备16021002号-2 京B2-20170662号京公网安备 11010802022788号论坛法律顾问：王进律师知识产权保护声明免责及隐私声明

[问答] R语言怎么做循环 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

[问答] R语言怎么做循环 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

本版微信群

扫码加我拉你入群