楼主: 只会上网
5006 21

[程序分享] 使用Rcurl得到到豆瓣评分 [推广有奖]

  • 1关注
  • 0粉丝

已卖:13份资源

硕士生

21%

还不是VIP/贵宾

-

威望
0
论坛币
2 个
通用积分
0.0600
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
7371 点
帖子
113
精华
0
在线时间
161 小时
注册时间
2010-9-14
最后登录
2016-7-1

楼主
只会上网 发表于 2015-6-6 17:05:32 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
  1. require(RCurl)
  2. library(XML)
  3. x='明日世界'
  4. search <- getForm("http://movie.**.com/subject_search", search_text = x)
  5. searchweb<-htmlParse(search)
  6. #乱码了 searchweb
  7. searchweb
  8. # 解析搜索结果页面
  9. resnodes<-getNodeSet(searchweb,"//div[@id='wrapper']//table[1]//a")
  10. #查找id为wrapper的div里面table第一第的数
  11. resurl<-xmlGetAttr(resnodes[[1]],name="href")
  12. #找到电影url地址
  13. resweb<-getURL(resurl,.encoding="UTF-8")  #上该电影主页
  14. #得到影片页面后第二次解析
  15. content<-htmlParse(resweb,encoding="UTF-8")
  16. resnodes<-getNodeSet(content,"//div[@id='interest_sectl']//p[@class='rating_self clearfix']//strong")
  17. namenodes<-getNodeSet(content,"//div[@id='content']//h1//span")
  18. #得到影片评分
  19. score<-xmlValue(resnodes[[1]])
  20. name<-xmlValue(namenodes[[1]])
  21. name;
  22. score;
复制代码

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Rcurl Curl url Library require library require search

已有 2 人评分经验 论坛币 热心指数 收起 理由
求证1加1 + 1 根据规定进行奖励
李会超 + 40 + 40 鼓励积极发帖讨论

总评分: 经验 + 40  论坛币 + 40  热心指数 + 1   查看全部评分

沙发
金融学爱好者 发表于 2015-6-7 01:29:11
在R中前两行就不能执行,应该还要下载哪些包呢?

藤椅
showmonki 在职认证  发表于 2015-6-7 04:01:20
金融学爱好者 发表于 2015-6-7 01:29
在R中前两行就不能执行,应该还要下载哪些包呢?
Rcurl 和XML两个包

板凳
金融学爱好者 发表于 2015-6-7 15:40:02
showmonki 发表于 2015-6-7 04:01
Rcurl 和XML两个包

报纸
金融学爱好者 发表于 2015-6-7 15:42:14
好像没有这个包哦

360截图20150607153806365.jpg (57.63 KB)

360截图20150607153806365.jpg

360截图20150607153806365.jpg (57.63 KB)

360截图20150607153806365.jpg

地板
金融学爱好者 发表于 2015-6-7 15:45:58
XML这个包也没有呢,怎么办呢?

360截图20150607154430578.jpg (26.3 KB)

360截图20150607154430578.jpg

7
showmonki 在职认证  发表于 2015-6-7 21:55:26
金融学爱好者 发表于 2015-6-7 15:45
XML这个包也没有呢,怎么办呢?
括号里的包要加双引号。

8
金融学爱好者 发表于 2015-6-7 23:00:22
Rcurl这个包加了双引号好像也不行哦,哪里出错了呢?

360截图20150607225823252.jpg (55.21 KB)

360截图20150607225823252.jpg

9
金融学爱好者 发表于 2015-6-7 23:01:54
showmonki 发表于 2015-6-7 21:55
括号里的包要加双引号。
麻烦您在看一下加了双引号还是不行呢?

10
金融学爱好者 发表于 2015-6-7 23:03:25
showmonki 发表于 2015-6-7 21:55
括号里的包要加双引号。
双引号和单引号均不行哦

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-2 11:21