楼主: lovelifedanny
844 0

[统计软件] 关于Rvest爬取新闻评论的CSS定位选择 [推广有奖]

  • 0关注
  • 0粉丝

学前班

50%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
23 点
帖子
2
精华
0
在线时间
0 小时
注册时间
2017-9-18
最后登录
2017-9-18

楼主
lovelifedanny 发表于 2017-9-18 03:56:06 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
文科R小白请教群里的技术大牛,我想用R的Rvest包爬取网易新闻的评论(链接http://comment.news.163.com/news_guonei_bbs/5SAOMV780001124J.html)。参照了网上的几篇帖子(http://blog.csdn.net/wshsa/article/details/74157341
http://www.jianshu.com/p/543ce849eef6

但是按照上面的教程自己写的时候 却老是出错,如下:
> library(rvest)> Link<-'http://comment.news.163.com/news_guonei_bbs/5SAOMV780001124J.html' > Dlink<-read_html(Link) > comment<-html_nodes(Dlink,'#tie-data-4 > div > div > div')> comment{xml_nodeset (0)}> rm(comment)> comment<-Dlink%>%html_nodes('div.list div div')%>%html_text()> commentcharacter(0)> comment<-Dlink%>%html_nodes('div.body div')%>%html_text()> comment [1] "确 定"                                                                                                                                                                                                                                                                                     [2] "\r\n            \r\n            \r\n            \r\n            \r\n            \r\n        "                                                                                                                                                                                              [3] "\r\n            \r\n            \r\n                您的帐号存在异常操作,为保证您的帐号安全,请输入验证码进行下一步操作。\r\n                \r\n                    验证码:\r\n                    看不清,换一张\r\n                \r\n                 \r\n            \r\n        " [4] ""                                                                                                                                                                                                                                                                                          [5] "\r\n                您的帐号存在异常操作,为保证您的帐号安全,请输入验证码进行下一步操作。\r\n                \r\n                    验证码:\r\n                    看不清,换一张\r\n                \r\n                 \r\n            "                                             [6] "\r\n            确 定\r\n            \r\n            取 消\r\n        "                                                                                                                                                                                                                    [7] "\r\n            \r\n            分享成功\r\n            \r\n                \r\n                    帐号绑定已经过期\r\n                \r\n                \r\n                    请重新绑定>>\r\n                \r\n            \r\n        "                                          [8] "\r\n                \r\n                    帐号绑定已经过期\r\n                \r\n                \r\n                    请重新绑定>>\r\n                \r\n            "                                                                                                              [9] "\r\n            打开邀请函\r\n        "                                                                                                                                                                                                                                                   [10] "\r\n            继续\r\n            取消\r\n        "                 

我怀疑是定位的CSS selector出了问题。请问如果想要获取评论页面的“用户名” “评论内容” “点赞数”,具体定位的CSS selector应该怎么写? 期待各位大牛的回复,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-5 15:16