楼主: jg_wx
3824 5

[程序分享] R语言read_html报错 [推广有奖]

  • 0关注
  • 0粉丝

初中生

14%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
1.0041
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
59 点
帖子
5
精华
0
在线时间
16 小时
注册时间
2017-8-11
最后登录
2019-3-27

楼主
jg_wx 发表于 2019-1-30 18:29:47 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
R语言
read_html(https://list.tmall.com/search_pr ... mp;type=pc#J_Filter)
报如下错误:
Error in doc_parse_raw(x, encoding = encoding, base_url = base_url, as_html = as_html,  :
  Input is not proper UTF-8, indicate encoding !
Bytes: 0xEC 0xC3 0xA8 0x74 [9]


有电脑就不报错,R的版本一样,求大神告知为什么,谢谢~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
铁锷未残 学生认证  发表于 2019-1-31 10:49:12
编码不是UTF-8格式,从源码来看是GBK格式的
使用guess_encoding()用来探测文档的编码
https://rdrr.io/cran/rvest/man/encoding.html
如果这可以帮助到你,请帮我评分,评分选项在我回复页面的右下方。

藤椅
jimozhegu 发表于 2019-1-31 12:14:04
网址是不是要加引号?我不加引号就报错,不过报错内容不一样

板凳
铁锷未残 学生认证  发表于 2019-1-31 14:14:40
jimozhegu 发表于 2019-1-31 12:14
网址是不是要加引号?我不加引号就报错,不过报错内容不一样
网址要加引号的。
请你把完整的代码和报错内容贴出来,以方便查找错误。
如果这可以帮助到你,请帮我评分,评分选项在我回复页面的右下方。

报纸
jg_wx 发表于 2019-2-2 09:38:27
jimozhegu 发表于 2019-1-31 12:14
网址是不是要加引号?我不加引号就报错,不过报错内容不一样
是要加引号的,你加了能正常运行吗 ?

地板
jg_wx 发表于 2019-2-2 09:39:54
铁锷未残 发表于 2019-1-31 10:49
编码不是UTF-8格式,从源码来看是GBK格式的
使用guess_encoding()用来探测文档的编码
https://rdrr.io/cr ...
不确定是不是编码的问题,搞不出来,还是谢谢你~

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-2-7 10:56