楼主: huyiustc
16668 16

[问答] R读取网页数据 [推广有奖]

11
olympic 发表于 2014-10-2 15:36:24
huyiustc 发表于 2014-10-2 13:11
你是用Rgui的吧,这样的在前面话加一句
setInternet(use=TRUE)
#  选用Internet2(Rstudio会默认选用, ...
哦哦~是命令行版,之前设置了Internet2,好像美起作用


科大胡义讲师住在瀛洲?

12
huyiustc 发表于 2014-10-2 16:26:09
olympic 发表于 2014-10-2 15:36
哦哦~是命令行版,之前设置了Internet2,好像美起作用
讲师是论坛等级的一种,我只是科大学生而已

13
希望的希望 发表于 2015-11-10 11:09:26
感谢分享 赞赞

14
2012今天 发表于 2015-11-11 13:23:38
学习了

15
何初见 发表于 2017-8-5 09:27:43
请问关于网址您是怎样转换成这样的格式的呀

16
何初见 发表于 2017-8-5 15:00:11
何初见 发表于 2017-8-5 09:27
请问关于网址您是怎样转换成这样的格式的呀
我知道啦,GitHub上有个“Raw''按钮,点击之后就可以获得跟您格式一样的网址啦,然后用read.table就可以成功啦

17
tmxk543 发表于 2017-8-11 12:58:12
library(rvest)
library(sqldf)
url1 <-'https://github.com/johnmyleswhite/ML_for_Hackers/blob/master/01-Introduction/data/census.csv'
webpage=read_html(url1)
rank_data_html_1 <- html_nodes(webpage,'th')
rank_data_1 <- html_text(rank_data_html_1)
ss1=t(as.matrix(rank_data_1))
rank_data_html_2 <- html_nodes(webpage,'td')
rank_data_2 <- html_text(rank_data_html_2)
ss2=matrix(as.matrix(rank_data_2[-which(nchar(as.list(rank_data_2))==0)]),nrow=50,ncol=4,byrow=T)
ss=rbind(ss1,ss2)
View(ss)

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-25 19:05