楼主: cheetahfly
1773 2

[程序分享] R语言网络爬虫一列 [推广有奖]

  • 2关注
  • 72粉丝

版主

已卖:1份资源

院士

11%

还不是VIP/贵宾

-

威望
0
论坛币
63967 个
通用积分
1679.3337
学术水平
489 点
热心指数
598 点
信用等级
336 点
经验
127404 点
帖子
2099
精华
1
在线时间
3985 小时
注册时间
2010-10-27
最后登录
2026-1-5

楼主
cheetahfly 在职认证  发表于 2019-11-6 18:29:48 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

R语言网络爬虫一例

今天看到隔壁Python论坛有一篇文章,介绍网络爬虫的:
Python爬虫机器人

手痒,用R语言实现如下:

# 先准备好必要的packages
library(tidyverse)
library(httr)
library(rvest)

url <- "https://www.ivsky.com/tupian/gaoguai_laoren_v55393/pic_865178.html"

# 开始了
url %>%
    read_html() %>%
    html_nodes("#imgis") %>%
    html_attr("src") %>%
    paste0("https:", .) %>%
    download.file(., destfile = "D:\\out.jpg", method = "curl")

代码虽然不多,但主要的难点在于html_nodes("#imgis"),如何在网页代码的内容中准确定位到自己想要找的内容。在本案例中,由于我们要找的网址正好前面有个id="imgis",所以定位比较容易,但是,在实践中,比这复杂得多的情况比比皆是,要具体情况具体分析。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:网络爬虫 R语言 Packages download python爬虫

沙发
skyfx 发表于 2019-11-8 11:26:55
擅用chrome的开发者模式,基本没什么问题。
另,爬虫还是用py写吧,当心被封。

藤椅
黑丝刘盼 发表于 2024-10-11 16:23:20

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-6 05:50