图2-1 特征参数Ni的计算
Fig.2-1 Calculation of feature parameter Ni
在一行中黑色像素和白色像素产生了9次交替,因此算得Ni=9。
沿文本的倾斜方向:对纯文本区域的文字行,黑白像素的交替次数应该是很多的;而对文字行间的空白,黑白交替次数是很少的(几乎都是白的,理想情况下为0)。一般的文档,文字部分的行和行间距大致等宽,因此,取若干行进行计算,沿着文本的倾斜方向的Ni,就具有较大的方差;而沿非文本的倾斜方向,由于没有明确的文字行和空白行,因而求得的方差会明显变小。由此,构造函数V(θ):
1n
(2.1) V(θ)=∑(Ni M) ni=1
其中: 2
1n
M=∑Ni (2.2) ni=1
对不同的可能角度求V(θ),得到V(θ)函数,求该函数的最大值,对应的θ即为倾斜角度。
对于包含图表的区域,沿任意方向求得的黑白像素交替次数均应较小,而且对若干角度进行计算,沿各个方向的方差都不会很大。因此无法检出明显的峰值。
如图2-2所示,文字区域算出的V(θ)具有明显的峰值,而带图的区域没有明显的峰值。这也成为了区分文字区域和图表区域的一个判断准则。
该算法的具体步骤如下:
------------------------------------------------------------------------------