又来请教了;
- library(dplyr)
- library(xml2)
- library(rvest)
- setwd("E://book//fang")
- url <- "http://wuhan.anjuke.com/community/p"
- url2 <- "http://wuhan.anjuke.com"
- #自定义爬取
- fun <- function(i, url){
- url <- paste0(url,i)
- web2 <- read_html(url)
- link <- web2 %>% html_nodes("div.li-itemmod") %>% html_attr("link")
- anjuke <- paste(url2, link, sep = "")
- }
- anjuke <- list()
- for (i in 1:100){
- fun(i,url)
- anjuke <- rbind(anjuke,fun(i,url))
- }
复制代码问题1: 我想返回 "anjuke”这个list 为1列,可是它回馈的是30列,如何转变为1列?
问题2:
- Village_name <- web2 %>% html_nodes("div.comm-cont h1") %>% html_text()
- Housing_prices <- web2 %>% html_nodes("em.comm-avg-price") %>% html_text() %>% as.numeric()
- Ring_ratio <- web2 %>% html_nodes("strong.up") %>% html_text()
- anjuke2 <- data.frame(Village_name, Housing_prices, Ring_ratio)
复制代码对“anjuke”列表中的 每个网址 爬取 3处的内容(Vilage_name,Housing_prices,Ring_ratio)这个我不知道怎么写代码了。
求教!
