楼主: zhou1_20
2533 6

[有偿编程] 怎么用R语言抓取浙江省各地级市近3年的PM2.5各项数据 [推广有奖]

已卖:689份资源

副教授

20%

还不是VIP/贵宾

-

威望
0
论坛币
18999 个
通用积分
1029.7754
学术水平
146 点
热心指数
166 点
信用等级
135 点
经验
36357 点
帖子
541
精华
0
在线时间
887 小时
注册时间
2015-9-25
最后登录
2025-12-4

楼主
zhou1_20 发表于 2016-6-19 13:49:36 来自手机 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
怎么用R语言抓取浙江省各地级市近3年的PM2.5各项数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:R语言 浙江省 地级市 浙江省

沙发
LIXUANHANK 学生认证  发表于 2016-6-19 13:52:01
爬虫!!!!!!!!

藤椅
zhou1_20 发表于 2016-6-19 13:53:03
LIXUANHANK 发表于 2016-6-19 13:52
爬虫!!!!!!!!
怎么编程

板凳
马甲1号 发表于 2016-6-19 16:47:51
有url么?

报纸
zhou1_20 发表于 2016-6-19 18:36:30
马甲1号 发表于 2016-6-19 16:47
有url么?
website = "http://www.cnpm25.cn"

地板
马甲1号 发表于 2016-6-19 21:40:55
zhou1_20 发表于 2016-6-19 18:36
website = "http://www.cnpm25.cn"
这个网站只有最新的,找不到历史。
倒是在http://www.aqistudy.cn/historydata/上有历史数据。

代码:
  1. library(rvest)
  2. library(dplyr)
  3. rooturl='http://www.aqistudy.cn/historydata/'

  4. aqi_list=lapply( c('杭州','宁波','金华','温州','嘉兴','湖州','绍兴','舟山','台州','丽水','衢州'),function(city){
  5.     message( city)
  6.     url=paste(rooturl, 'monthdata.php?city=', city,sep='')
  7.     tables=read_html(url,'UTF-8')  %>% html_table()
  8.     tbl=tables[[1]]
  9.     Encoding(names(tbl))='UTF-8'
  10.     Encoding(tbl$质量等级)='UTF-8'
  11.     tbl$city=city
  12.     tbl
  13. })

  14. aqi_df= rbind_all(aqi_list)
复制代码

数据:
    aqi.rar (8.27 KB) 本附件包括:
  • aqi.csv



   



已有 1 人评分论坛币 学术水平 热心指数 信用等级 收起 理由
zhou1_20 + 5 + 1 + 1 + 1 精彩帖子

总评分: 论坛币 + 5  学术水平 + 1  热心指数 + 1  信用等级 + 1   查看全部评分

7
zhou1_20 发表于 2016-6-20 11:53:32
马甲1号 发表于 2016-6-19 21:40
这个网站只有最新的,找不到历史。
倒是在http://www.aqistudy.cn/historydata/上有历史数据。
谢谢你的帮助
你哪里有关于用R抓取网页数据的资料吗?能给我发一份吗?我的QQ邮箱:1769138434@qq.com

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群
GMT+8, 2026-1-1 22:15