楼主: fcfc2013
2876 2

[问答] 这是 对方网站设置的反爬 机制,还是我循环代码写的有问题??? [推广有奖]

  • 3关注
  • 1粉丝

已卖:1169份资源

博士生

76%

还不是VIP/贵宾

-

威望
0
论坛币
7223 个
通用积分
6.2147
学术水平
12 点
热心指数
26 点
信用等级
9 点
经验
14348 点
帖子
307
精华
0
在线时间
285 小时
注册时间
2013-2-13
最后登录
2020-2-7

楼主
fcfc2013 发表于 2018-3-17 23:20:37 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
> hospital_df <- data.frame()
> for (m in 1:length(hospital_url)){
+   fun2(url)
+   hospital_df <- rbind(hospital_df,fun2(url))
+ }
Hide Traceback

Rerun with Debug
Error in open.connection(x, "rb") : HTTP error 404.
10.
open.connection(x, "rb")
9.
open(x, "rb")
8.
read_xml.connection(con, encoding = encoding, ..., as_html = as_html,
    base_url = x, options = options)
7.
read_xml.character(x, encoding = encoding, ..., as_html = TRUE,
    options = options)
6.
read_xml(x, encoding = encoding, ..., as_html = TRUE, options = options)
5.
withCallingHandlers(expr, warning = function(w) invokeRestart("muffleWarning"))
4.
suppressWarnings(read_xml(x, encoding = encoding, ..., as_html = TRUE,
    options = options))
3.
read_html.default(str_c(url, "/tao.html"))
2.
read_html(str_c(url, "/tao.html"))
1.
fun2(url)


这是 对方网站设置的反爬 机制,还是我循环代码写的有问题???

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:length leng HOS url eng

沙发
fcfc2013 发表于 2018-3-18 07:21:22 来自手机
fcfc2013 发表于 2018-3-17 23:20
&gt; hospital_df  for (m in 1:length(hospital_url)){
+   fun2(url)
+   hospital_df
设置爬虫循环每次运行间隔的时间;
那个函数和设置方法?

藤椅
cheetahfly 在职认证  发表于 2018-3-19 08:13:10
先在浏览器中输入“http://要爬的网站/robots.txt”看看有没有禁止爬虫的协议?

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-3 19:20