楼主: shengzhouwang
1384 0

[问答] Rvest无法循环,求助 [推广有奖]

  • 3关注
  • 8粉丝

w

已卖:614份资源

副教授

36%

还不是VIP/贵宾

-

威望
0
论坛币
5257 个
通用积分
13.0162
学术水平
18 点
热心指数
33 点
信用等级
10 点
经验
18440 点
帖子
516
精华
0
在线时间
1001 小时
注册时间
2011-12-19
最后登录
2026-1-6

楼主
shengzhouwang 发表于 2017-12-10 20:02:42 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
library(stringr)
library(xml2)
library(rvest) #加载包
i<-1:17 #设定抓取页数
xueshu_data<-data.frame()#创建数据框存储数据
#写个循环,对固定网页结构重复抓取
for (i in 1:17){
web<-read_html(str_c("http://xueshu.baidu.com/s?wd=%E8%89%BE%E6%A3%AE%E5%85%8B%2C%E7%BD%91%E7%BB%9C%E6%88%90%E7%98%BE&pn=",(i-1)*10,"&tn=SE_baiduxueshu_c1gjeupa&ie=utf-8&sc_f_para=sc_tasktype%3D%7BfirstSimpleSearch%7D&sc_hit=1"),encoding="UTF-8")#read_html函数解析网页并规定编码str_c函数对页数循环
title<-web%>%html_nodes(".c_font")%>%html_text()#"a"即为Selectorgadget定位节点信息
title[16]<-NA
title<-title[!is.na(title)]#将多余信息设置为NA并剔除
year<-web%>%html_nodes(".sc_time")%>%html_text()
title_inf<-data.frame(title,year)
xueshu_data<-rbind(xueshu_data,title_inf)
}
write.csv(title_inf,file="C:/Users/wangjie/Desktop/修改/title_inf.csv")#写入数据


做出来的数据总是不能循环,有人能帮我解答下吗?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Vest Est VES Library string

致力于教育测量改变教育现状

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-7 23:09