楼主: 潇夏
1208 0

[问答] 求教用R语言抓取网页总页数 [推广有奖]

  • 0关注
  • 0粉丝

大专生

91%

还不是VIP/贵宾

-

威望
0
论坛币
89 个
通用积分
1.0178
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
3756 点
帖子
29
精华
0
在线时间
90 小时
注册时间
2013-5-14
最后登录
2019-5-18

楼主
潇夏 发表于 2016-10-24 22:21:09 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
求教各位大神,我想用R语言抓取网页总页数,网址和代码如下,Tpage应该显示“共53页”的,可是出现乱码,请问是哪里错了该怎么处理?请有空的高人把以下代码放在自己的Rstudio上运行一下,帮我发现以下错误,谢谢了!
library(XML)
library(RCurl)
library(stringr)
url=getURL("http://search.51job.com/list/020000,000000,0000,00,4,99,%25E6%2595%25B0%25E6%258D%25AE%25E6%258C%2596%25E6%258E%2598,2,1.html?lang=c&stype=1&postchannel=0000&workyear=99&cotype=99&degreefrom=99&jobterm=99&companysize=99&lonlat=0%2C0&radius=-1&ord_field=0&confirmdate=9&fromType=&dibiaoid=0&address=&line=&specialarea=00&from=&welfare=")
html_job<-htmlParse(url,encoding="UTF-8")
rootNode_job<-xmlRoot(html_job)
Tpage<-xpathSApply(rootNode_job,"//div[@class='p_in']/span[1]",xmlValue)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:R语言 companys Library channel company 网页

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 05:54