Python爬虫 Part3
爬虫库的使用
urllib:Python内置的http请求库,包括如下模块:
request:http请求模块,用来模拟发送请求,传入url及 额外参数
error:异常处理模块,如果出现请求错误,可以捕获异常
parse:提供url处理方法,如拆分、解析、合并等
robotparse:识别网站的robots.txt文件,判断哪些网站可以爬
发送请求:两种方法
urlopen()
Request
|
楼主: 田JL
|
562
1
[CDA3班] 【学习笔记】9.22 Python爬虫 Part3 爬虫库的使用 urllib:Python内置的http请 ... |
|
讲师 15%
-
|
| ||
|
|
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


