第一章 概述
1.1文档图像检索系统
文档图像检索一般是指从大量的文档图像数据库中找出与输入文档图相匹配的图像。本文的研究工作是针对一个大规模中日文的文档图像检索系统(Chinese-Japanese Document Image Retrieval,简称CJDIR)中对倾斜的文档图像校正的要求展开的。文档图像的来源有两种:一种是各种类型的文档(.txt; .doc; .pdf; .xsl; .ppt等格式的文件)直接通过软件转换得到的,一般作为原始数据储存在数据库(DB_TGT)中。另一种是各种类型的文档经过打印,扫描得到的,作为被检索的对象(IKEY)。该系统是为了解决目前办公室中存在的难以从大量文档图像中进行查找的问题而进行研究和开发的。
1.1.1 系统结构
CJDIR系统的框架结构可用图1-1来表示:
图1-1 CJDIR系统的结构框架
Fig 1-1 Framework of CJDIR system
------------------------------------------------------------------------------