只需到最后结果:
> timeadr
list()
这是什么意思呢?网页内容信息去哪呢?
附代码:
###抓取RRD的数据
library(RCurl)
library(xlsx)
myheader=c(
"User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) ","Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
"Accept-Language"="en-us",
"Connection"="keep-alive",
"Accept-Charset"="GB2312,utf-8;q=0.7,*;q=0.7"
) #伪装成浏览器,武装自己的header
url="http://www.we.com/lend/loanList.action#page-1"
temp=getURL(url)
k=strsplit(temp,"\r\n") #切分
#write.table(k,"temp.txt") #把抓取的导出到txt文本里
#k=strsplit(temp,"\r\n")[[1]]
timeadr=k[grep("'loanId'",k)]


雷达卡


京公网安备 11010802022788号







