索引子系统的设计与实现
第二章 CnX索引子系统的需求分析
2.1 总体需求
CnX索引子系统需要实现的基本功能就是能够根据一定的索引数据模型构建中文XML文献的倒排索引,并能够根据Okapi BM25算法对索引进行评分。其中在构建中文XML文献倒排索引的时候,需要简单处理中文语句的语义和提取英文单词的词根,并通过添加用户词典或停用词过滤技术提高XML文献倒排索引的质量。系统还应该能够并行处理多个XML文档,提高处理效率,并能实时向用户反馈处理进程信息。
总体需求应该分为以下几个部分:
①人机交互接口(程序的用户界面):此部分的设计应该符合界面程序的标准,满足用户的需求,符合用户使用其它应用程序的习惯。
程序主要使用Java实现,所以界面可以采用Java的Swing[8]来实现,另外要求调用本地画图接口,实现本地程序风格,例如在Windows XP环境下的程序应产生XP风格的界面等,如图2-1和图2-2所示。
图2-1 Swing原生态风格的界面
图2-2 XP风格的界面