文档分类
索引子系统的设计与实现
它的数据模型如图3-4所示(其中的具体内容略)。
图3-4 XML文档树结构
其中方框表示带有属性的结点。这种原生态XML的树结构不容易进行操作,为了更好更方便的构建XML文档的倒排索引,就需要调整该树的结构,具体做法是将结点的属性映射为该结点的直接子结点,并位于所有已存在的直接子结点之后。在完成映射树的构建之后,直接进行前后序遍历更新树的信息[9],为构建倒排索引做必要的准备,完成此步后,映射树的样子如图3-5所示。
图3-5 带有冗余信息的XML结点树