楼主: bbaakk1
15424 5

[问答] r语言快速读入数据的问题 [推广有奖]

  • 0关注
  • 0粉丝

学前班

90%

还不是VIP/贵宾

-

威望
0
论坛币
20 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
23 点
帖子
2
精华
0
在线时间
4 小时
注册时间
2014-9-3
最后登录
2014-9-9

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
本人R语言新手,请多指教
最近遇到一个问题
有一个output.txt文件,内容如下
item     change        p
1             0.1         0.5
2             0.2        0.02
3             -0.1      0.1
4             0.2        0.4
………
这样的数据有1千万行,我只是展示了其中一部分
我现在要将最后一列的p值读到一个数组之中,然后用一个函数处理它。
我试了两个程序,发现读入速度极慢,只有c语言的万分之一,我觉得可能是自己编写的方法不对,我把程序展示一下,请大神指点
(1)
con<-file("output.txt","r")
line<-readLines(con,n=1)
line<-readLines(con,n=1)
ptemp<-c()
while(length(line)!=0)
{
valueo<-strsplit(line,"\t")  
value<-as.numeric(valueo[[1]][6])
   
ptemp<-c(ptemp,value)

line<-readLines(con,n=1)

}
close(con)
(2)
library(qvalue)
qtemp<-read.table("output.txt",header=T)
qtemp<-qtemp[,3]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:读入数据 R语言 change output outpu change c语言 程序

已有 1 人评分论坛币 收起 理由
hubifeng? + 20 鼓励积极发帖讨论

总评分: 论坛币 + 20   查看全部评分

沙发
yywan0913 在职认证  发表于 2014-9-5 15:50:35 |只看作者 |坛友微信交流群
  1. library(data.table)
  2. fread()
复制代码
1千万行大概10秒
t=read.table("data.txt",colClasses =c("NULL","NULL","numeric"),skip=1)   #只读第三列
大概20秒
已有 1 人评分论坛币 学术水平 热心指数 收起 理由
hubifeng? + 4 + 1 + 1 热心帮助其他会员

总评分: 论坛币 + 4  学术水平 + 1  热心指数 + 1   查看全部评分

使用道具

藤椅
bbaakk1 发表于 2014-9-7 00:00:23 |只看作者 |坛友微信交流群
yywan0913 发表于 2014-9-5 15:50
1千万行大概10秒
t=read.table("data.txt",colClasses =c("NULL","NULL","numeric"),skip=1)   #只读第三列 ...
按照你的方法,成功读入了,用了1分钟,很快了,非常感谢!
我之前用程序的是R,很久都没反应,我这次用了R studio,就能读入了,看来好平台很重要。

使用道具

yywan0913 发表于 2014-9-5 15:50
1千万行大概10秒
t=read.table("data.txt",colClasses =c("NULL","NULL","numeric"),skip=1)   #只读第三列 ...
read.table(...skip=1)  skip属性是什么意思?谢谢

使用道具

yywan0913 发表于 2014-9-5 15:50
1千万行大概10秒
t=read.table("data.txt",colClasses =c("NULL","NULL","numeric"),skip=1)   #只读第三列 ...
你好想问你个问题:
如果数据文件比较大,读取时间会比较慢,因此想只读取一部分数据,该怎么做呢?
用read.table可以实现吗?或者有什么按条件读取的语句?谢谢讲解一下

假设数据文件是这样的,只希望读取2014年的数据。
Date                  income              outcome
1900-01-01         10                      20
2012-07-02         30                       50
...

2014-12-31         70                           30

使用道具

地板
snowhyzhang 发表于 2016-8-3 18:43:38 来自手机 |只看作者 |坛友微信交流群
试试看用data.table的fread

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-28 00:16