楼主: 万人往LVR
10691 13

[问答] 如何解决内存不够的问题? [推广有奖]

  • 1关注
  • 13粉丝

副教授

82%

还不是VIP/贵宾

-

威望
0
论坛币
5127 个
通用积分
816.1888
学术水平
70 点
热心指数
112 点
信用等级
40 点
经验
9088 点
帖子
625
精华
0
在线时间
1182 小时
注册时间
2013-7-18
最后登录
2023-12-6

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
推荐一本云计算的书:
https://bbs.pinggu.org/thread-3574343-1-1.html
推荐拿磁盘当内存用的ff包:
http://ff.r-forge.r-project.org/
RevoScaleR包:
http://blog.revolutionanalytics.com/2011/05/big-data-analysis-in-revolution-r.html

---------------------------------------------
最近利用文本数据做关联分析,发现内存不够。由于问题比较特殊,不适合进行抽样。请问如何解决内存不够的问题?比如程序会产生50G的数据,且无法优化、分步,64G的内存条太贵买不起,我技术比较菜鸟,没有接触过大数据,请问:
1.是否有利用电脑磁盘替代内存的方法?
2.云计算是否可以解决?如果有,R如何操作?





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Revolution Evolution Analytics R-Project Analytic 如何

回帖推荐

cheetahfly 发表于10楼  查看完整内容

我看到有两篇以上的书或文章都提到ff包。称其是解决大数据集(相对内存)的,比较直接和易用的解决方法,可以参考一下。
沙发
jiangbeilu 学生认证  发表于 2016-3-1 10:10:17 |只看作者 |坛友微信交流群
1.内存不够,先优化算法,看能否分步进行或者分块进行。
   换用别的存储方式也是可行的,比如用data.table而不是data.frame等
2.硬件方面,可以加内存条。

3.利用电脑磁盘,这个只有在linux系统中利用swap空间可以做到,windows没有尝试过。

使用道具

藤椅
万人往LVR 在职认证  发表于 2016-3-1 11:53:02 |只看作者 |坛友微信交流群
jiangbeilu 发表于 2016-3-1 10:10
1.内存不够,先优化算法,看能否分步进行或者分块进行。
   换用别的存储方式也是可行的,比如用data.tabl ...
谢谢提醒,已经修改问题的问法

使用道具

板凳
jiangbeilu 学生认证  发表于 2016-3-1 15:19:38 |只看作者 |坛友微信交流群
云计算可以解决吧,买服务器,在服务器上跑

使用道具

报纸
suimong 发表于 2016-3-1 21:27:09 |只看作者 |坛友微信交流群
Microsoft Azure有专门的跑Machine Learning的机器Azure ML以及其他Data Science相关的技术平台,非常牛逼
已有 1 人评分经验 论坛币 学术水平 收起 理由
jiangbeilu + 10 + 5 + 2 精彩帖子

总评分: 经验 + 10  论坛币 + 5  学术水平 + 2   查看全部评分

使用道具

地板
cheetahfly 在职认证  发表于 2016-3-1 22:08:30 |只看作者 |坛友微信交流群
太酷了

使用道具

7
万人往LVR 在职认证  发表于 2016-3-2 09:17:17 |只看作者 |坛友微信交流群
suimong 发表于 2016-3-1 21:27
Microsoft Azure有专门的跑Machine Learning的机器Azure ML以及其他Data Science相关的技术平台,非常牛逼
好的谢谢~

使用道具

8
soccy 发表于 2016-3-2 09:19:52 |只看作者 |坛友微信交流群
台式机内存条快成白菜价了。云计算还是要非不少力气进行配置,不一定划算。

使用道具

9
万人往LVR 在职认证  发表于 2016-3-2 09:23:07 |只看作者 |坛友微信交流群
soccy 发表于 2016-3-2 09:19
台式机内存条快成白菜价了。云计算还是要非不少力气进行配置,不一定划算。
只是举个例子,将来可能上T的运算总要用到

使用道具

10
cheetahfly 在职认证  发表于 2016-3-2 14:15:10 |只看作者 |坛友微信交流群
我看到有两篇以上的书或文章都提到ff包。称其是解决大数据集(相对内存)的,比较直接和易用的解决方法,可以参考一下。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 19:59