楼主: 阿璇tian
3871 15

[问答] R语言怎么做循环 [推广有奖]

  • 0关注
  • 0粉丝

硕士生

89%

还不是VIP/贵宾

-

威望
0
论坛币
8 个
通用积分
2.8713
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
1959 点
帖子
121
精华
0
在线时间
195 小时
注册时间
2017-12-21
最后登录
2023-3-27

楼主
阿璇tian 发表于 2018-12-3 16:45:37 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
老师们,我想请教一个R循环的问题。

我有两个表,表一:有两列,一共是311322条数据
日期                 员工编号
2018-11-01         12345678
2018-11-01         234556
2018-11-01         23454678
2018-11-02         123456786
2018-11-02         23456786

表二:有四列,一共是80849条
日期                 部门编码               部门开始编码               部门截止编码
2018-11-01         2345                    1234567889                 1345678900
2018-11-01         2346                    1234567899                 1345674567
2018-11-02         2345                    1234567889                 1345678900

我想按天,看每天,每个部门编码,在这个部门开始编码、结束编码数值范围内的员工编码有多少个。生成下面三个变量
日期     部门编码        个数

我自己的想法是生成一个80849*311322的表,看每个员工编码是否在部门开始编码、部门截止编码范围内,再按照日期、部门编码分组求个数,但是这个表太大了,内存不够啊。。。

请问老师们有什么好办法吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:数值范围 条数据 问题。

沙发
阿璇tian 发表于 2018-12-3 17:04:53
是不是应该写了循环,日期、员工编号套两层,但我不知道怎么写,请问有老师知道吗?
谢谢~

藤椅
Whig 在职认证  发表于 2018-12-3 18:19:38
部门开始、结束编码会变?

板凳
阿璇tian 发表于 2018-12-3 19:12:04
Whig 发表于 2018-12-3 18:19
部门开始、结束编码会变?
同一个部门的开始和结束编码不会变

报纸
Whig 在职认证  发表于 2018-12-3 19:31:35
阿璇tian 发表于 2018-12-3 19:12
同一个部门的开始和结束编码不会变
像这种大数据量的不建议循环。你现在问题的关键是获取员工编码和部门编码的对应关系。首先用unique获取部门编码、部门起止编码。然后在员工表上,通过某种方式找到对应的部门。问题的难点就变成如何去找对应部门了。
已有 1 人评分论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

地板
jgchen1966 发表于 2018-12-3 22:50:13
##  用一个简单的模仿数据集xda,将核心部分,例示如下:
##################

   xda<-tibble::tibble(x=letters[1:5],y0=c(1,5,9,15,20),y1=c(4,8,14,19,25))
   yda<-tibble::tibble(ys=seq(min(xda$y0),max(xda$y1),by=1))

   xyda<-xda%>%
       dplyr::group_by(x)%>%
       dplyr::do( y=filter(yda,ys>=.$y0& ys<=.$y1))%>%
       tidyr::unnest()
###################
## 体会理解了,此问题,就很容易了  。。
已有 2 人评分经验 论坛币 收起 理由
cheetahfly + 10 热心帮助其他会员
刘彦楼 + 100 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 10   查看全部评分

7
jgchen1966 发表于 2018-12-3 22:53:57
##################
##  用一个简单的模仿数据集xda,将核心部分,例示如下:
#######   
   xda<-tibble::tibble(x=letters[1:5],y0=c(1,5,9,15,20),y1=c(4,8,14,19,25))
   yda<-tibble::tibble(ys=seq(min(xda$y0),max(xda$y1),by=1))   ##################
####  #############
   xyda<-xda%>%
       dplyr::group_by(x)%>%
       dplyr::do( y=filter(yda,ys>=.$y0& ys<=.$y1))%>%   ##  
       tidyr::unnest()
###################
## 体会理解了,此问题,就很容易了  。。无需显示循环


已有 1 人评分经验 收起 理由
刘彦楼 + 100 热心帮助其他会员

总评分: 经验 + 100   查看全部评分

鹑居鷇食,鸟行无彰

8
jgchen1966 发表于 2018-12-3 22:55:22
jgchen1966 发表于 2018-12-3 22:53
##################
##  用一个简单的模仿数据集xda,将核心部分,例示如下:
#######
上述显示,将$ 改显为y 了 #######

9
jgchen1966 发表于 2018-12-3 22:56:40
jgchen1966 发表于 2018-12-3 22:55
上述显示,将$ 改显为y 了 #######
上述显示,将y前的$ 改显为没 了 #不知何因,就这样吧,太烦######

10
jgchen1966 发表于 2018-12-3 23:00:15
jgchen1966 发表于 2018-12-3 22:53
##################
##  用一个简单的模仿数据集xda,将核心部分,例示如下:
#######
因为楼主的数据很大,需要用future 进行平行运行,速度至少可提高50倍以上  
已有 2 人评分经验 论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 + 1 热心帮助其他会员
刘彦楼 + 100 热心帮助其他会员

总评分: 经验 + 100  论坛币 + 10  学术水平 + 1  热心指数 + 1   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-22 09:42