[硕士论文] 垂直搜索引擎的设计与实现
西北工业大学硕士学位论文第一章绪论1.5论文的组织结构
本文中,各章的具体内容概括如下:
第二章介绍垂直搜索引擎的结构。首先,介绍基于查询串方式的搜索引擎和
分类目录式搜索引擎的整体结构;然后在此基础上,设计了垂直搜索引擎的系统结构,并介绍了各部分所完成的工作。
第三章详细讨论了实现搜集器的主要类结构以及数据库设计,然后描述了本
文设计的Web搜集器的执行流程,最后简述了Web搜集器的实现难点.
第四章详细介绍垂直搜索引擎采用的信息抽取技术——基于语法的信息抽
取技术。首先介绍HTML数据的语法特点及理论基础;然后,介绍本文所利用的下推自动机模型;最后,详细描述了模式获取算法(ExtractSchema,简写为ES)的实现。
第五章详细介绍垂直搜索引擎采用的中文分词技术。首先,将现有的中文分
词技术进行比较;然后,详细介绍本文所采用的中文分词技术——全二分最大匹配快速分词算法.
第六章介绍垂直搜索引擎采用的检索机制。首先介绍传统的信息检索技术;
然后在此基础上,设计了垂直搜索引擎检索子系统的结构;最后介绍本文提出的检索技术。第七章总结全文,并给出需要进一步改进的问题。