楼主: renjunxiang
1849 4

[问答] rvest爬虫报错 [推广有奖]

  • 0关注
  • 3粉丝

svip1

博士生

47%

还不是VIP/贵宾

-

威望
0
论坛币
2806 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
14419 点
帖子
98
精华
0
在线时间
473 小时
注册时间
2012-10-14
最后登录
2024-2-12

50论坛币
工作需要爬一些品牌名称,今天爬中关村和汽车之家网站时遇到了一些问题。
url='http://www.zol.com.cn/brand.html'
shuma=html_session(url)
shuma_name=shuma %>% html_nodes("td li a") %>% html_text()
节点不管写什么都会报错,网上也没有找到原因。

Error in eval(substitute(expr), envir, enclos) :
   input conversion failed due to input error, bytes 0x95 0xAA 0xD3 0xCE [6003]

是编码问题还是什么呢?爬别的网站都没什么问题,求助大神!

关键词:Vest Est VES substitute conversion
沙发
renjunxiang 发表于 2016-11-9 14:14:38 |只看作者 |坛友微信交流群
没人回答吗?我查了可能因为编码是gb2312的原因。

使用道具

藤椅
renjunxiang 发表于 2016-11-9 14:43:25 |只看作者 |坛友微信交流群
感慨一句,求人不如求己...已解决~改为shuma=read_html(url,encoding='gbk')即可

使用道具

板凳
七彩空气 学生认证  发表于 2016-11-14 21:38:43 |只看作者 |坛友微信交流群
看到0x95 0xAA 0xD3 0xCE [6003]这样奇怪的鬼首先就得想到编码问题,恭喜楼主解决问题了!

使用道具

报纸
lisle 发表于 2023-7-7 17:26:40 |只看作者 |坛友微信交流群
renjunxiang 发表于 2016-11-9 14:43
感慨一句,求人不如求己...已解决~改为shuma=read_html(url,encoding='gbk')即可
谢谢啊。我也出现类似的问题,不过我改为encoding="gbk",仍然出错,只是代码不同。最后,我改成了,encoding="utf-8",问题解决。

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 10:28