Python爬虫 Part2
爬虫基本流程:获取网页源代码;
提取信息;
保存数据。
抓取什么数据:HTML代码
Json字符串
二进制文件
各种扩展名的文件
JavaScript渲染页面
cookies
爬虫代理
检查robots.txt
|
楼主: 田JL
|
1068
2
[CDA3班] 【学习笔记】9.17 Python爬虫 Part2 爬虫基本流程:获取网页源代码; ... |
|
讲师 15%
-
|
| ||
|
|
扫码京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


