手机版

索引子系统的设计与实现(17)

发布时间:2021-06-08   来源:未知    
字号:

索引子系统的设计与实现

其中: ∑t∈nftf(t,n)K=k1 (1 b)+b avg∑t'ftf(t',n')n' (2-2) n为节点n下所有语词的集合,n'表示标签为A的结点。

在该子系统中,取k1为1.25,b为0.75。然后根据上述的Okapi BM25评分公式对所有文献进行全局的评分统计,最后得出每个元素(结点)的最大分数和全局语词对(tag-term)出现频率:

表2-7 elements_maxscores表

字段名

tag

maxelementscore 字段含义 名为tag的元素 最大分数

表2-8 dfvalues表

字段名

tag

term

df 字段含义 元素名 语词 语词对全局出现次数

评分是构建XML倒排索引过程中的很重要的一部分,它的构建是建立在前者(基本倒排索引)之上的,可以完全在关系数据库中完成评分的工作。到这里,XML的倒排索引就构建需求就分析完了。

索引子系统的设计与实现(17).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
×
二维码
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)