发帖

楼主: cheetahfly

1868 2

[程序分享] R语言网络爬虫一列 [推广有奖]

2关注
72粉丝

版主

已卖：1份资源

院士

12%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 64595 个
通用积分: 1680.5476
学术水平: 489 点
热心指数: 598 点
信用等级: 336 点
经验: 127513 点
帖子: 2102
精华: 1
在线时间: 4009 小时
注册时间: 2010-10-27
最后登录: 2026-4-26

楼主

cheetahfly

发表于 2019-11-6 18:29:48 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

R语言网络爬虫一例

今天看到隔壁Python论坛有一篇文章，介绍网络爬虫的：
Python爬虫机器人

手痒，用R语言实现如下：

# 先准备好必要的packages
library(tidyverse)
library(httr)
library(rvest)

url <- "https://www.ivsky.com/tupian/gaoguai_laoren_v55393/pic_865178.html"

# 开始了
url %>%
    read_html() %>%
    html_nodes("#imgis") %>%
    html_attr("src") %>%
    paste0("https:", .) %>%
    download.file(., destfile = "D:\\out.jpg", method = "curl")

代码虽然不多，但主要的难点在于html_nodes("#imgis")，如何在网页代码的内容中准确定位到自己想要找的内容。在本案例中，由于我们要找的网址正好前面有个id="imgis"，所以定位比较容易，但是，在实践中，比这复杂得多的情况比比皆是，要具体情况具体分析。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

分享0 收藏1 回帖

关键词：网络爬虫 R语言 Packages download python爬虫

[程序分享] R语言网络爬虫一列 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

R语言网络爬虫一例

扫码加我拉你入群

相关帖子

浏览过的帖子

浏览过的版块

20周年荣誉勋章

本版微信群

[程序分享] R语言网络爬虫一列 [推广有奖]

经管之家送您一份

经管之家联合CDA

感谢您参与论坛问题回答

R语言网络爬虫一例

扫码加我 拉你入群

相关帖子

浏览过的帖子

浏览过的版块

20周年荣誉勋章

本版微信群

扫码加我拉你入群