网上看见有人统计安徽各市区PM2.5监测站数量,在大数据时代,这种累活应该交给机器去做。
library(rvest)
url = "http://www.aepb.gov.cn/Pages/Aepb14_SJZX.aspx"
anhui = url %>% html() %>% html_nodes("table") %>% .[[10]] %>% html_table()
city = anhui[1]
a = url %>% html() %>% html_nodes("table tbody a") %>% html_attrs()
a = as.character(a)
b = paste("http://www.aepb.gov.cn/Pages/",a,sep = "")
myfun = function(x) b[x] %>% html() %>% html_nodes("table") %>% .[[10]] %>% html_table(fill = T) %>% nrow()
site = sapply(1:length(b),myfun)
data = data.frame(城市 = city,监测站数量 = site)
data
城市 监测站数量
1 合肥 10
2 淮北 3
3 亳州 2
4 宿州 3
5 蚌埠 6
6 阜阳 3
7 淮南 6
8 滁州 3
9 六安 4
10 马鞍山 5
11 芜湖 4
12 宣城 3
13 铜陵 6
14 池州 3
15 安庆 4
16 黄山 3