楼主: 雨茗jg
524 0

[统计软件] R rvest 无法成功抓取数据 [推广有奖]

  • 0关注
  • 0粉丝

初中生

9%

还不是VIP/贵宾

-

威望
0
论坛币
22 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
176 点
帖子
5
精华
0
在线时间
12 小时
注册时间
2019-5-16
最后登录
2019-9-11

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
在网站 https://journals.plos.org/ploson ... 3A59Z%5D&page=1 中 无法成功抓取左上角的“24,516 results for......” 也无法抓取article的链接信息
试图抓取以上数据
  1. homepage<-"https://journals.plos.org/plosone/search?q=publication_date%3A%5B2017-01-01T00%3A00%3A00Z+TO%202017-12-31T23%3A59%3A59Z%5D&page=1"
  2. read_homepage<-read_html(homepage)
  3. find_page<-html_nodes(read_homepage,'section.search-results-header div.results-number')%>%html_text

  4. link_part<-html_nodes(read_homepage,'dd p.search-results-doi')%>%html_attrs
  5. link_part<-html_nodes(read_homepage,'dl a')%>%html_attrs
  6. link_part<-html_nodes(read_homepage,'p.search-results-doi a')%>%html_attrs
复制代码
link_part 是我对抓取文章的链接的三种尝试 每次都失败了
请问针对这个网页 应该怎么抓取我需要的上述内容呢?感谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-2 01:54