1198 2

[问答] 我想获取这个网站中,不同文章的信息,每个文章的页面不同。所以是多页面处理。 [推广有奖]

  • 0关注
  • 0粉丝

小学生

64%

还不是VIP/贵宾

-

威望
0
论坛币
0 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
20 点
帖子
1
精华
0
在线时间
15 小时
注册时间
2021-3-17
最后登录
2021-5-10

楼主
数据初学者1 发表于 2021-3-17 20:25:50 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
我想获取这个网站中,不同文章的信息,每个文章的页面不同,所以是多页面处理。但是这里一直报错,百度和谷歌都查不出来是什么原因。
library(rvest)
library(stringr)
library(dplyr)
library(xml2)

content = read_html("https://academic.oup.com/dnaresearch/issue/")
a= html_nodes(content, "#ArticleList")%>%html_nodes("a")%>%html_attr("href")
a=a[grepl("/article/", a)]
links=paste0("https://academic.oup.com",a)

year_list=html_nodes(content, "#YearsList")%>%html_nodes("option")%>%html_attr("value")
all_list=paste0("https://academic.oup.com",year_list)
issus_list=html_nodes(all_list, "#IssuesList")%>%html_nodes("option")%>%html_attr("value")


报错是最后一行和倒数第二行,错误如下
Error in UseMethod("xml_find_all") :
  "xml_find_all"没有适用于"character"目标对象的方法

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Character Academic Research Library Content

沙发
张夏冰 发表于 2021-3-18 08:59:53

藤椅
szxship 发表于 2021-3-19 10:03:21
最后一行改成
issus_list = lapply(all_list,function(x)html_nodes(read_html(x), "#IssuesList")%>%html_nodes("option")%>%html_attr("value"))
不知道这是不是你想要的结果

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-24 20:30