搜索引擎技术介绍
屈波
2007年8月
目录
一、搜索引擎总体介绍二、爬虫技术介绍三、中文分词和排序算法介绍四、查询/存储技术、Cache Server介绍五、内部、外部监控系统介绍六、移动通信运营商搜索引擎独特优势
一、搜索引擎总体介绍
(一)搜索引擎定义 “搜索引擎〞技术,完全来源于历史悠久的全文检索技术。 “搜索引擎〞从字面上可拆分为“搜〞、“索〞、“引擎〞三个含义。 “搜〞就是大量信息的抓取,抓取回来后的信息进行智能提取、排重、质量分析等处理。 “索〞就是大量处理后信息的存储、信息排序、快速查询等。 “引擎〞就是指系统不但能存储亿级的数据,而且还能有巨大的并发处理能力,这样的系统才有资格被叫着“引擎〞。


雷达卡




京公网安备 11010802022788号







