在上面的框架结构下可以有不同的算法实现,整个系统的算法框架可由图1-2
来表示:
图1-2 CJDIR系统的算法流程图
Fig 1-2 Algorithm flow chart of CJDIR system
下面对每一模块的功能作一下简要的说明:
Tiff2Bmp:将输入的文档图像自动转换成bmp格式进行读取,并将数据存入缓存区。
Binarization:对灰度和彩色的文档图像进行二值化。
Noise-Removal:尽量去除输入图像中的噪声。
Skew-Detection:对输入图像进行倾斜角度的检测,并予以校正。该模块也是本文的主要工作。
Layout-Analysis:利用自上向下的算法,对文档图像进行版面划分。 Similarity-Measurement:将前面分析得到的特征结果与数据库的数据作------------------------------------------------------------------------------