楼主: konnery
1706 4

[问答] 用R语言,怎么抓取如图位置数字?新手入门,求详细代码~ [推广有奖]

  • 12关注
  • 2粉丝

高中生

92%

还不是VIP/贵宾

-

威望
0
论坛币
15447 个
通用积分
1.8402
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
11754 点
帖子
30
精华
0
在线时间
22 小时
注册时间
2016-4-3
最后登录
2024-4-22

楼主
konnery 在职认证  发表于 2017-7-10 11:15:17 |只看作者 |坛友微信交流群|倒序 |AI写论文
100论坛币
已解决,谢谢审核、版主、及解题的各位会员!

提问01.png (93.23 KB)

问题配图

问题配图

最佳答案

关键词:R语言 编程
沙发
小朝 发表于 2017-7-10 11:15:18 |只看作者 |坛友微信交流群
  1. library(rvest)
  2. library(dplyr)

  3. keyword <- c('大国崛起','资本的故事')

  4. keyword_num <- function(keyword){
  5.   baidu_url <- paste0('http://www.baidu.com/s?wd=',keyword)
  6.   web <- read_html(baidu_url,encoding="UTF-8")
  7.   text_res <- web %>% html_nodes("div.head_nums_cont_outer.OP_LOG > div > div.nums") %>% html_text()
  8.   res <- gsub('[^0-9]','',text_res) %>% as.integer()
  9.   return(res)
  10. }

  11. for(i in 1:length(keyword)){
  12.   df[i] <- keyword_num(keyword[i])
  13. }

  14. df_res <- data.frame(keyword=keyword,num=df)
复制代码

使用道具

藤椅
konnery 在职认证  发表于 2017-7-11 09:38:09 |只看作者 |坛友微信交流群
library(rvest)
web<-read_html("http://www.baidu.com/s?wd=大国崛起",encoding="UTF-8")
position<-web %>% html_nodes(".nums") %>% html_text()

用rvest,这么可以抓取那一句话下来,
怎么把这句话中的数据提取出来?
然后怎么将提取出的数据写入Excel?
如果,同一时间多提取几个数据,怎么依次写入同一个Excel文件?

使用道具

板凳
lww1993 发表于 2017-7-11 14:35:03 |只看作者 |坛友微信交流群
可以用stringr包中的str_extract()去提取数字。
用xlsx包中的write.xlsx()将你的数字写入excel文件中。

使用道具

报纸
colinxf 学生认证  发表于 2017-7-14 09:01:22 |只看作者 |坛友微信交流群
软件包XML,可以对网页数据进行爬虫,然后用stringr包对那句话中的数字进行提取

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-22 11:56