楼主: gaoyun2879
4389 5

[问答] 求助:比rbind更快的合并数据方式? [推广有奖]

  • 0关注
  • 0粉丝

大专生

70%

还不是VIP/贵宾

-

威望
0
论坛币
98 个
通用积分
3.0307
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
475 点
帖子
31
精华
0
在线时间
78 小时
注册时间
2015-1-23
最后登录
2016-12-18

楼主
gaoyun2879 发表于 2015-3-19 10:46:30 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教,现在需要合并上千个10M左右的csv文件,用循环rbind的方式到后来就太慢了,不知道有没有更好的方式?
感谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:rbind 合并数据 bind bin IND 左右

沙发
nuomin 发表于 2015-3-19 15:07:40
10G的表合并,合适的工具搜一下版主hubifeng?转载的文章,关于hadoop那个。
可以肯定的是,这样的工作,R不合适

藤椅
biohuang 发表于 2015-3-19 15:20:14
可以在R外面,用cat命令把csv串到一起,再用R读入。

非要用R做,我的方式是先初始化一个大的空matrix或data.frame,然后读一个csv填几行,慢慢填满。实测过,会比rbind快很多。
已有 1 人评分论坛币 收起 理由
admin_kefu + 30 热心帮助其他会员

总评分: 论坛币 + 30   查看全部评分

板凳
biohuang 发表于 2015-3-19 15:21:15
上千个10M左右的csv文件也就是几十GB,不算大数据

报纸
gaoyun2879 发表于 2015-3-19 16:15:47
biohuang 发表于 2015-3-19 15:20
可以在R外面,用cat命令把csv串到一起,再用R读入。

非要用R做,我的方式是先初始化一个大的空matrix或d ...
恩,两个主意都不错,谢谢啦。

地板
gaoyun2879 发表于 2015-3-19 16:16:37
nuomin 发表于 2015-3-19 15:07
10G的表合并,合适的工具搜一下版主hubifeng?转载的文章,关于hadoop那个。
可以肯定的是,这样的工作,R ...
谢谢,回头我去看一下。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 13:54