894 1

[有偿编程] 求助R语言批量抓取 [推广有奖]

  • 1关注
  • 0粉丝

已卖:5份资源

大专生

96%

还不是VIP/贵宾

-

威望
0
论坛币
1275 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
149 点
帖子
9
精华
0
在线时间
116 小时
注册时间
2015-3-8
最后登录
2020-10-10

楼主
赶晴天的雨笠 发表于 2019-9-25 16:28:01 |AI写论文
50论坛币
想批量抓取帖子内容,先把帖子超链接下载下来构造了一个向量,但是后面的循环不会写,求救

urlparty="http://dangjian.people.com.cn/n1/2019/0920/c117092-31363966.html"

list = read_html(urlparty) %>%
  html_nodes(".show_text a")%>%
  html_attr("href")

vector1 = c(list)

content = read_html(vector1)%>%

for (url in vector1){
  read_html(url)%>%html_nodes(".show_text p")%>%html_text()
}

最佳答案

cheetahfly 查看完整内容

read_html(content) %>% html_nodes(".show_text p") %>% html_text() %>% str_c(collapse = "") %>% str_remove_all("\t")
关键词:求助R语言 R语言 Content Vector People

沙发
cheetahfly 在职认证  发表于 2019-9-25 16:28:02
read_html(content) %>%
  html_nodes(".show_text p") %>%
  html_text() %>%
  str_c(collapse = "") %>%
  str_remove_all("\t")
已有 1 人评分论坛币 收起 理由
jiangbeilu + 10 精彩帖子

总评分: 论坛币 + 10   查看全部评分

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2025-12-29 09:53