职位描述/要求:
职位描述:
1、负责网页爬虫平台的深入规划、设计及实现;
2、负责网页爬虫程序性能优化工作;
具体要求:
1、熟悉Java编程语言;
2、掌握网页抓取原理及技术,熟悉网络爬虫,熟悉Heritrix、Nutch、HTMLParser等搜索相关技术;
3、熟悉Lucene/Nutch/Heritrix等开源工具;
4、有2年以上相关系统开发经验;
5、熟悉分布式开发;
6、精通倒排索引、全文检索、分词、排序等相关技术优先;
7、熟悉Oracle、postgresql或MySql关系型数据库;
详情咨询:北京招聘会信息 http://www.bjzph.cn/