Python爬虫 Part1
网络爬虫分类——根据使用场景
1.通用爬虫
搜索引擎和Web服务商用的爬虫系统,是搜索引擎抓取系统的重要组成部分。主要目底是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。
2.聚焦爬虫
是面向特定主题需求的一种网络爬虫程序。它与通用搜索引擎爬虫的区别在于。聚焦爬虫在实施网页抓取时,会对内容进行处理筛选,尽量保证只抓取与需求相关的网页信息。
|
楼主: 田JL
|
1217
1
[CDA3班] 【学习笔记】9.14 Python爬虫 Part1 网络爬虫分类——根据使用场景 1.通用爬虫 ... |
|
讲师 15%
-
|
| ||
|
|
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


