楼主: Ariel1991
331 2

[问答] rbind()后数据保存特别大??? [推广有奖]

  • 23关注
  • 1粉丝

硕士生

34%

还不是VIP/贵宾

-

威望
0
论坛币
2535 个
通用积分
4.9517
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
11051 点
帖子
62
精华
0
在线时间
193 小时
注册时间
2014-4-20
最后登录
2024-5-10

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
【背景】
之前遇到这个问题时,各种搜索都没有找到相同的情况。今天我在论坛中搜索了rbind() save也没有搜索到十分相关的帖子。

【具体问题】
我有两种类型的data.frame数据:
第一种类型中,单个数据的行数大约为9万行,将多个这样的数据合并后,可以正常地使用save()保存为新的Rdata;
第二种类型中,单个数据的行数大约为15万行,将多个这样的数据合并后,在使用save()保存为新的Rdata时,存在非常严重的问题,保存的新Rdata会达到几十个G的大小,当然,也需要超长的时间才能保存下来。

【非正规解决方案】
在导入第二种类型的数据时,先转换为矩阵,合并之后,再转为数据框,并添加列名称。
保存结果时间与大小均正常。

【补充说明】
数据为高速公路车辆检测器交通流数据,第一种类型数据的统计时间间隔为5min,第二种类型数据的统计时间为20sec。涉及协议,无法上传数据,请谅解。

【期望】
等大神指教,感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:rbind bind 数据保存 bin IND

沙发
abelus 发表于 2023-5-19 22:12:36 |只看作者 |坛友微信交流群
如果是每列数据都是同一类型,确实存为matrix会好一些。
另外,看看rbind之后,字段有没有发生什么变化。

理论上来说,一个数据15万行,十个数据也就150万行,RData是没太大问题的。

使用道具

藤椅
Ariel1991 发表于 2023-5-20 09:43:27 |只看作者 |坛友微信交流群
abelus 发表于 2023-5-19 22:12
如果是每列数据都是同一类型,确实存为matrix会好一些。
另外,看看rbind之后,字段有没有发生什么变化。 ...
谢谢。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-14 10:07