推荐一本云计算的书:
https://bbs.pinggu.org/thread-3574343-1-1.html
推荐拿磁盘当内存用的ff包:
http://ff.r-forge.r-project.org/
RevoScaleR包:
http://blog.revolutionanalytics.com/2011/05/big-data-analysis-in-revolution-r.html
---------------------------------------------
最近利用文本数据做关联分析,发现内存不够。由于问题比较特殊,不适合进行抽样。请问如何解决内存不够的问题?比如程序会产生50G的数据,且无法优化、分步,64G的内存条太贵买不起,我技术比较菜鸟,没有接触过大数据,请问:
1.是否有利用电脑磁盘替代内存的方法?
2.云计算是否可以解决?如果有,R如何操作?