楼主: trans
2057 1

[问答] 【求助】R爬京东手机页面信息,出点小问题,请高手指点! [推广有奖]

  • 1关注
  • 0粉丝

本科生

38%

还不是VIP/贵宾

-

威望
0
论坛币
205 个
通用积分
1.0059
学术水平
2 点
热心指数
0 点
信用等级
0 点
经验
679 点
帖子
48
精华
0
在线时间
75 小时
注册时间
2008-3-12
最后登录
2020-12-15

楼主
trans 发表于 2015-7-11 20:26:15 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
错误提示如下:

Error in brand[-c(1:(length(brand) - 60))] : only 0's may be mixed with negative subscripts

不知道哪里出问题,本人是初学者,还望哪位高手指点,谢谢!

源代码如下:
require(stringr)
require(rvest)
require(rjson)
myfun = function(x){
          url = str_c("http://list.jd.com/list.html?cat=9987,653,655=",x,"&JL=6_0_0")
          brand = url %>% html_session() %>% html_nodes(".right-extra .p-name a") %>% html_text()
          b = brand[-c(1:(length(brand) - 60))] %>% strsplit(" ")
          b1 = sapply(1:60,function(i) paste(b[][1],collapse = ''))
          b2 = sapply(1:60,function(i) paste(b[][2],collapse = ''))
          b3 = sapply(1:60,function(i) paste(b[][-c(1:2)],collapse = ''))
          evalue = url %>% html_session() %>% html_nodes(".evaluate a") %>% html_text() %>% str_extract("http://p.3.cn/prices/mgets?skuIds=",price1)
          dat = u %>% html() %>% html_nodes("p") %>% html_text()
          p = fromJSON(dat)
          price =sapply(1:60,function(i) p[]$p)         
          data.frame(品牌 = b1,型号 = b2,性能描述 = b3,评价 = evalue,价格 = price)
        }
dat = lapply(1:4,myfun)
total = do.call(rbind,dat)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:高手指点 小问题 function Collapse negative function require 源代码 Error 京东

沙发
fenglx46801028 发表于 2015-8-8 20:00:06
不知道你的x是什么,我用“0”来试了一下,brand得到的是空的呢,爬取的页面源码里面没有.right-extra .p-name这些标签啊

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-30 09:36