韦玮《精通Python网络爬虫:核心技术、框架与项目实战》
这是一本实战性的网络爬虫秘笈,不仅讲解了如何编写爬虫,而且还讲解了流行的网络爬虫的使用。全书分为4个部分:第壹部分对网络爬虫做了概要性的介绍,主要介绍了网络爬虫的常识和所涉及的技术概览;第二部分是本书的重点之一,详细讲解了网络爬虫的核心技术,包括网络爬虫的实现原理与实现技术、Urllib库和URLError库的异常处理、正则表达式与Cookie的使用、Fiddler的使用、爬虫的浏览器伪装技术、爬虫的定向抓取技术等;第三部分讲解了流行的爬虫框架Scrapy的使用、架构和高级应用,是目前关于Scrapy详细的讲解;第四部分是3个实战案例,讲解了博客爬虫、图片爬虫和模拟登陆爬虫的编写方法。
https://www.amazon.cn/%E7%B2%BE%E9%80%9APython%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB-%E6%A0%B8%E5%BF%83%E6%8A%80%E6%9C%AF-%E6%A1%86%E6%9E%B6%E4%B8%8E%E9%A1%B9%E7%9B%AE%E5%AE%9E%E6%88%98-%E9%9F%A6%E7%8E%AE/dp/B06XXHJW23/ref=sr_1_1?ie=UTF8&qid=1501113045&sr=8-1&keywords=%E7%B2%BE%E9%80%9Apython%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB