楼主: trans
1908 1

[问答] 【求助】R爬京东手机页面信息,出点小问题,请高手指点! [推广有奖]

  • 1关注
  • 0粉丝

本科生

38%

还不是VIP/贵宾

-

威望
0
论坛币
205 个
通用积分
1.0059
学术水平
2 点
热心指数
0 点
信用等级
0 点
经验
679 点
帖子
48
精华
0
在线时间
75 小时
注册时间
2008-3-12
最后登录
2020-12-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
错误提示如下:

Error in brand[-c(1:(length(brand) - 60))] : only 0's may be mixed with negative subscripts

不知道哪里出问题,本人是初学者,还望哪位高手指点,谢谢!

源代码如下:
require(stringr)
require(rvest)
require(rjson)
myfun = function(x){
          url = str_c("http://list.jd.com/list.html?cat=9987,653,655=",x,"&JL=6_0_0")
          brand = url %>% html_session() %>% html_nodes(".right-extra .p-name a") %>% html_text()
          b = brand[-c(1:(length(brand) - 60))] %>% strsplit(" ")
          b1 = sapply(1:60,function(i) paste(b[][1],collapse = ''))
          b2 = sapply(1:60,function(i) paste(b[][2],collapse = ''))
          b3 = sapply(1:60,function(i) paste(b[][-c(1:2)],collapse = ''))
          evalue = url %>% html_session() %>% html_nodes(".evaluate a") %>% html_text() %>% str_extract("http://p.3.cn/prices/mgets?skuIds=",price1)
          dat = u %>% html() %>% html_nodes("p") %>% html_text()
          p = fromJSON(dat)
          price =sapply(1:60,function(i) p[]$p)         
          data.frame(品牌 = b1,型号 = b2,性能描述 = b3,评价 = evalue,价格 = price)
        }
dat = lapply(1:4,myfun)
total = do.call(rbind,dat)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:高手指点 小问题 function Collapse negative function require 源代码 Error 京东

不知道你的x是什么,我用“0”来试了一下,brand得到的是空的呢,爬取的页面源码里面没有.right-extra .p-name这些标签啊

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-13 02:23