楼主: hubifeng?
9912 30

[学习分享] 如何处理大型数据集? [推广有奖]

11
Itachix 发表于 2014-11-10 07:36:29
好东西啊,顶一个

12
soccy 发表于 2014-11-11 09:45:00
1G内存处理8G的数据什么软件也快不了。ff可用,但是添内存才是硬道理。
已有 1 人评分经验 热心指数 信用等级 收起 理由
hubifeng? + 24 + 3 + 1 鼓励积极发帖讨论

总评分: 经验 + 24  热心指数 + 3  信用等级 + 1   查看全部评分

13
soccy 发表于 2014-11-11 09:46:06
ff的极限是你硬盘的尺寸。

14
hubifeng? 学生认证  发表于 2014-11-11 19:29:34
soccy 发表于 2014-11-11 09:46
ff的极限是你硬盘的尺寸。
有其他的方法可以分享...

15
soccy 发表于 2014-11-11 21:54:48
还有bigmemory系列。缺点是不如ff灵活。

16
soccy 发表于 2014-11-11 21:56:34
参考这个:http://www.cybaea.net/Blogs/Big-data-for-R.html
已有 2 人评分经验 论坛币 热心指数 收起 理由
李会超 + 60 + 12 分析的有道理
hubifeng? + 60 + 12 + 1 鼓励积极发帖讨论

总评分: 经验 + 120  论坛币 + 24  热心指数 + 1   查看全部评分

17
xucaifeng66 发表于 2014-11-13 16:32:58
看来还是要回几门语言才行啊
已有 1 人评分经验 收起 理由
hubifeng? + 60 鼓励积极发帖讨论

总评分: 经验 + 60   查看全部评分

18
jack001sd 发表于 2014-11-30 14:49:00
soccy 发表于 2014-11-11 09:45
1G内存处理8G的数据什么软件也快不了。ff可用,但是添内存才是硬道理。
硬件尤其是内存还是很重要的啊!

19
nuomin 发表于 2014-11-30 21:30:33
我也注册了kaggle,这是干嘛的?还要比赛?
已有 1 人评分经验 收起 理由
hubifeng? + 60 重在参与...

总评分: 经验 + 60   查看全部评分

20
jiangbeilu 学生认证  发表于 2014-11-30 22:35:46
读比较大的数据,可以试一下data.table包中的fread函数,上次我用这个来读2个G的数据,速度还是挺快的。
已有 1 人评分经验 热心指数 收起 理由
hubifeng? + 60 + 5 鼓励积极发帖讨论

总评分: 经验 + 60  热心指数 + 5   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 10:32