楼主: guo.bailing
14695 10

[问答] 如何用R读取8G大的txt文件? [推广有奖]

区版主

大师

29%

还不是VIP/贵宾

-

TA的文库  其他...

文库1

文库2

文库3

威望
6
论坛币
1336375 个
通用积分
20283.0375
学术水平
558 点
热心指数
776 点
信用等级
515 点
经验
147046 点
帖子
4116
精华
24
在线时间
10749 小时
注册时间
2009-7-9
最后登录
2024-4-26

初级热心勋章 中级热心勋章 初级信用勋章 初级学术勋章

30论坛币
如题。

我有一个8G大小的数据集,其中变量个数13个,列与列之间用逗号分隔,需要读入到R中进行分析研究,但是常规的方法都读不了,求教高手帮忙解决,谢谢?

关键词:txt 如何用 变量个数 数据集 如何
自助者,天助之!
沙发
万人往LVR 在职认证  发表于 2015-9-2 09:05:31 |只看作者 |坛友微信交流群
8G的话一般电脑内存都不够的,如果能分批处理,可以直接用read.table
read.table有两个参数可以用,skip跳过几行,nrows最大提取的行数。这样可以分批处理1:10000,10000:20000行
已有 2 人评分论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 + 1 热心帮助其他会员
admin_kefu + 20 热心帮助其他会员

总评分: 论坛币 + 30  学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

藤椅
soccy 发表于 2015-9-2 10:16:15 |只看作者 |坛友微信交流群
ff package
已有 2 人评分论坛币 学术水平 热心指数 收起 理由
crystal8832 + 10 + 1 热心帮助其他会员
ryoeng + 1 + 1 热心帮助其他会员

总评分: 论坛币 + 10  学术水平 + 1  热心指数 + 2   查看全部评分

使用道具

板凳
liu7788414 在职认证  发表于 2015-9-2 11:11:37 |只看作者 |坛友微信交流群
8G不算啥,关键你的内存够多吗?   我用32G的内存,500G固态硬盘,64位R,data.table包,毫无压力。
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

使用道具

报纸
Tony_Liu 在职认证  发表于 2015-9-2 15:19:37 |只看作者 |坛友微信交流群
R直接调用内存,这点与SAS不同,所以硬盘多大是没用的,关键看内存
已有 1 人评分论坛币 收起 理由
admin_kefu + 10 热心帮助其他会员

总评分: 论坛币 + 10   查看全部评分

使用道具

地板
ryoeng 在职认证  发表于 2015-9-2 19:23:22 |只看作者 |坛友微信交流群

ff 程序包 (Final Fantasy?) 呵呵~

提示: 作者被禁止或删除 内容自动屏蔽

使用道具

7
ntsean 发表于 2015-9-3 03:16:40 |只看作者 |坛友微信交流群
先用spark预处理一下

使用道具

8
jjxm20060807 发表于 2015-9-4 09:47:40 |只看作者 |坛友微信交流群
感谢分享

使用道具

9
ariera 学生认证  发表于 2015-9-4 10:34:35 |只看作者 |坛友微信交流群
如果内存不够用的话 可以用数据库存储数据,并将计算得到的中间结果存储到数据库。...

使用道具

10
wangjiaodada 发表于 2019-9-24 10:04:00 |只看作者 |坛友微信交流群
万人往LVR 发表于 2015-9-2 09:05
8G的话一般电脑内存都不够的,如果能分批处理,可以直接用read.table
read.table有两个参数可以用,skip跳 ...
但是文件打不开的话,不知道一共有多少行呢

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 05:20