楼主: 憨搓搓
2469 7

[问答] 网页表格数据爬取 [推广有奖]

  • 1关注
  • 0粉丝

硕士生

12%

还不是VIP/贵宾

-

威望
0
论坛币
27 个
通用积分
14.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
5211 点
帖子
60
精华
0
在线时间
65 小时
注册时间
2014-3-1
最后登录
2020-4-21

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
请教论坛大神,有兴趣能否指点一下这个小project,

最近在学习python如何爬取网页数据表格,以下面链接为例,想爬取该网站的表格数据,并按“被投诉地区”分类统计。
因为要爬去近一年的数据,不知能程序能否能一并实现。

我的尝试:
1、excel爬取不可行
2、静态表格爬取不可行,动态的没找到请求爬取得对象——大佬可以继续尝试一下。
以上,谢谢热心的你!

http://travel315.people.com.cn/

微信截图_20190110142650.png

http://travel315.people.com.cn/

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝


沙发
渲潇依旧 发表于 2019-1-10 15:55:45 |只看作者 |坛友微信交流群
付费可以帮你搞

使用道具

藤椅
憨搓搓 学生认证  发表于 2019-1-10 16:44:42 |只看作者 |坛友微信交流群
或者指点下如何搜索也行

使用道具

板凳
仰望星空abc 学生认证  发表于 2019-1-10 19:26:56 |只看作者 |坛友微信交流群
这个很简单,不用爬,在谷歌开发者工具里就能找到包含信息的源文件,复制下来就行,只不过需要对json格式的数据进行规整化处理一下。

使用道具

报纸
憨搓搓 学生认证  发表于 2019-1-14 17:09:16 |只看作者 |坛友微信交流群
仰望星空abc 发表于 2019-1-10 19:26
这个很简单,不用爬,在谷歌开发者工具里就能找到包含信息的源文件,复制下来就行,只不过需要对json格式的 ...
我试了下 好像不行啊

使用道具

地板
仰望星空abc 学生认证  发表于 2019-1-14 18:39:05 |只看作者 |坛友微信交流群
估计是你没找到地儿

使用道具

7
gjinwei 发表于 2019-1-31 09:49:23 |只看作者 |坛友微信交流群
你要的数据地址:http://travel315.people.com.cn/interface/select/data_idx.php 处理一下返回的json就可以了

使用道具

8
cnpro 发表于 2019-2-1 17:55:18 |只看作者 |坛友微信交流群
gjinwei 发表于 2019-1-31 09:49
你要的数据地址:http://travel315.people.com.cn/interface/select/data_idx.php 处理一下返回的json就可以 ...
哇,厉害了,你是如何从网页上分析出这个地址的?

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-20 10:17