[硕士论文] 垂直搜索引擎的设计与实现
越少,但占用内存会很多。反之占用内存少,但文件Z/O操作频繁,索引速度会很慢。
2.3.3检索子系统
检索子系统包括检索器和用户接口。用户接口在接收用户的查询请求后,将
它转发给检索器,检索器根据查询项和索引数据库的内容,找到匹配的网页后,
进行排序,然后通过用户接口返回给用户。检索子系统也是本文研究的重点,详细内容将在第五章介绍。
2.4本章小结
本章首先介绍基于查询串方式的搜索引擎和分类目录式搜索引擎的整体结
构,然后在此基础上,设计了垂直搜索引擎的系统结构,并介绍了各部分应完成的工作。其中涉及的关键技术:Web搜集器、信息抽取技术、中文分词和检索技术方面的内容将分别在第三、四、五、六章详细介绍。14