【学习笔记】9.17 Python爬虫 Part2 爬虫基本流程：获取网页源代码； ...

5关注
14粉丝

讲师

15%

还不是VIP/贵宾

-

0%

威望: 0 级
论坛币: 2362 个
通用积分: 1017.9744
学术水平: 0 点
热心指数: 0 点
信用等级: 0 点
经验: 1845 点
帖子: 345
精华: 0
在线时间: 9 小时
注册时间: 2020-5-24
最后登录: 2021-11-12

楼主

田JL 发表于 2020-9-17 23:52:06 来自手机 |AI写论文

是否 +2 论坛币

k人参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群

赵安豆老师微信：zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

立即领取

感谢您参与论坛问题回答

经管之家送您两个论坛币！

+2 论坛币

9.17
Python爬虫 Part2
爬虫基本流程：获取网页源代码；
                     提取信息；
                     保存数据。
抓取什么数据：HTML代码
                     Json字符串
                     二进制文件
                     各种扩展名的文件
JavaScript渲染页面
cookies
爬虫代理
检查robots.txt
tmp_bb306275c4f87ad4d4baa37c1f909e99bb9959c2664ac570.jpg