手机版

指导教师推荐意见(18)

发布时间:2021-06-07   来源:未知    
字号:

图2-1 特征参数Ni的计算

Fig.2-1 Calculation of feature parameter Ni

在一行中黑色像素和白色像素产生了9次交替,因此算得Ni=9。

沿文本的倾斜方向:对纯文本区域的文字行,黑白像素的交替次数应该是很多的;而对文字行间的空白,黑白交替次数是很少的(几乎都是白的,理想情况下为0)。一般的文档,文字部分的行和行间距大致等宽,因此,取若干行进行计算,沿着文本的倾斜方向的Ni,就具有较大的方差;而沿非文本的倾斜方向,由于没有明确的文字行和空白行,因而求得的方差会明显变小。由此,构造函数V(θ):

1n

(2.1) V(θ)=∑(Ni M) ni=1

其中: 2

1n

M=∑Ni (2.2) ni=1

对不同的可能角度求V(θ),得到V(θ)函数,求该函数的最大值,对应的θ即为倾斜角度。

对于包含图表的区域,沿任意方向求得的黑白像素交替次数均应较小,而且对若干角度进行计算,沿各个方向的方差都不会很大。因此无法检出明显的峰值。

如图2-2所示,文字区域算出的V(θ)具有明显的峰值,而带图的区域没有明显的峰值。这也成为了区分文字区域和图表区域的一个判断准则。

该算法的具体步骤如下:

------------------------------------------------------------------------------

指导教师推荐意见(18).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
×
二维码
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)