第二章 文档图像倾斜角度检测的基本方法
通过第一章的介绍和分析可见,文档图像的倾斜角度检测和校正在文档图像检索和OCR系统中是一项非常基础和重要的研究课题,因此吸引了国内外的科研人员开展相关工作,取得了许多成果。在这一章中,笔者将对几种比较典型的算法进行介绍,并对这些算法的性能做出定性的比较。
2.1 剖面投影法
2.1.1概述
这类算法的主要思想是:在文本中,沿文本行倾斜方向的剖面的某种特征的投影值最大[5][6][7]。因此,这类算法的一般做法是:
(1)选取特征,构造适当的能量函数。
(2)在文本中,对所有可能的倾斜角度,沿该角度形成的剖面,计算能量函数值。
(3)对计算结果求最值。对应能量函数值最大的候选角度即为倾斜角度。 这类算法一般只对纯文本文档图像有效。但也有一些以此思想为基础的改进算法,能从混有图表的文档图像中找出文本部分,获得较好的效果。
2.1.2基于局域复杂度的角度倾斜检测算法
在上一节中,笔者介绍了“剖面投影法”算法的主要思想,在这一小节中,笔者将介绍一种基于“剖面投影法”思想的改进算法——基于局域复杂度的角度倾斜检测算法[5]。
该算法定义了一个新的特征参数Ni。Ni表示沿某剖面上,黑白像素交替的次数。如图2-1所示:
------------------------------------------------------------------------------