Scrapy 1.2.2 发布了。
Scrapy 是一套纯python实现的爬虫框架,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片。
Scrapy 很容易入门,开发也非常简单 ,但功能却非常强大。
采取可读性更强的xpath代替正则
强大的统计和log系统
同时在不同的url上爬行(并发执行)
支持shell方式,方便独立调试
写middleware,方便写一些统一的过滤器
通过管道的方式存入数据库
Scrapy入门教程(含源码)
https://bbs.pinggu.org/thread-4864926-1-1.html