(1)随机选取一个局部区域,对不同角度进行计算,得到V(θ)—θ曲线。
图2-2 V(θ)的分布特征
Fig.2-2 Features of V(θ) distributions
(2)计算V(θ)的分布是否存在明显的峰值。若存在,则说明该区域是属于纯文字区域,则计算最大值对应的θ,得到倾斜角度。
(3)若不存在明显的峰值,则说明该区域包含图或表。则不再对该区域进行操作,再选取下一个区域,转步骤(1),直到选到一个文字区域为止。
该算法巧妙的通过构造适当的能量函数V(θ),在一定程度上解决了对文字区域的判断问题,得到了较好的结果。但该算法仍然需要文档图像中有较大的文字区域。对于图表占较大部分的文档图像,由于无法选取到较好的文字区域,因而难以得到满意的结果。
2.1.3 算法评述
剖面投影法是角度倾斜检测中一种比较典型的思想。通过适当的构造能量函数,可以取得比较好的结果。但该算法在很大程度上依赖文字区域。对于文字区域较少的文档图像,无法得到满意的结果。
------------------------------------------------------------------------------