手机版

基于BP神经网络的手写数字识别研究

发布时间:2024-11-12   来源:未知    
字号:

基于BP神经网络的手写数字识别研究

第25卷第4期

哈尔滨师范大学自然科学学报

NATURALSCIENCESJOURNALOFHARBINNORMALUNIVERSITY

Vol.25,No.42009

基于BP神经网络的手写数字识别研究

马 宁  常 (3

【摘要】 将,通过实验证实,该方法具有较高

;模式识别;图像处理;特征提取

0 引言

手写数字识别是光学字符识别技术的一个分支,研究如何利用电子计算机自动辨认人手写在纸张上的阿拉伯数字.由于手写体数字的随意性很大,例如,字体的大小、倾斜、笔画的粗细等等,

[1-3]

都会对识别结果造成影响.在过去的数十年中,研究者们提出了许多识别方法,取得了较大的

[4]

成果.手写数字识别技术的实用性很强,例如在大规模数据统计(人口普查、例行年检)、财务、保险、税务、邮件分拣等应用领域中都有广阔的应

[5~8]

用前景.手写数字识别一般通过基于结构的识别法及模板匹配法来进行处理,但识别率和可靠性都不高.为了提高识别率,就必须寻求新的方法和途径.近年来,BP神经网络技术取得了巨大发展,它是一种前馈反向型神经网络,具有并行处理信息、自组织、自学习信息等优点,特别适用于

[9]

模式识别领域.本文基于BP神经网络原理对手写数字进行识别,通过对1000个手写数字的识别,证实本方法在手写数字识别方面的有效性.

和功能以及若干基本特性,是一个高度复杂的非线性自适应动态处理系统.BP(BackPropagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一.BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程.它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小.BP神经网络模型拓扑结构包括输入层(input)、隐层(hidelayer)和输出层(outputlayer),如图1所示.

2 基于BP神经网络的手写数字识

2.1 输入向量与目标向量

1 BP神经网络

神经网络的概念、原理和设计是受生物、特别

是人脑神经系统的启发提出的.神经网络由大量简单的处理单元来模拟真实人脑神经网络的机构

收稿日期:2009-07-07

首先对手写数字图像进行预处理,包括二值化、去噪、倾斜校正、归一化和特征提取,生成BP神经网络的输入向量Alphabet和目标向量Tar2get.其中Alphabet选取40×10的矩阵,第1列到第10列代表0~9的数字.Target为10×10的单位矩阵,每个数字在其所排顺序位置输出1,其他位置输出0.

2.2 BP神经网络的构建

BP算法由数据流的前向计算(正向传播)和

3黑龙江省教育厅海外学人科研资助项目(1151HQ019);黑龙江省教育厅科研项目资助(11511138);黑龙江省教育厅重点学科

(081203);黑龙江省智能教育与信息工程重点实验室基金资助

基于BP神经网络的手写数字识别研究

90

哈尔滨师范大学自然科学学报2009

整wjk使全局误差E变小,即

Δwjk

p

(

=-=-Ep)=∑5wjk5wjkp=1

(5)

p

∑wjkp=1

式(5)中η为学习率.现定义误差信号为

(-δyj=-

ppj

=-Sjyjj

q

(6)

(3)=jq

t

j=1p

p

j

-yj)]

(7)

p2

=-图1 k=1

(tj-yj)

p

第二项为输出层传递函数f2(x)的偏微分

j’

=f2(Sj)Sj

将式(7)和(8)代入可得误差信号为

q

.正向传播时,传播方向为输入层→隐层→输出层,每层神经元的状态只影响下一层神经元.若在输出层得不到期望的输出,则转向误差信号的反向传播流程.通过这两个过程的交替进行,在权向量空间执行误差函数梯度下降策略,动态迭代搜索一组权向量,使网络误差函数达到最小值,从而完成信息提取和记忆过程.

首先考虑正向传播,设输入层有n个节点,隐层有p个节点,输出层有q个节点.输入层与隐层之间的权值为vki,隐层与输出层之间的权值为wjk.隐层的传递函数为f1(x),输出层的传递函数为f2(x),则隐层节点的输出为

n

(8)

δyj=

∑(t

j=1

p

p

j

-yj)f2(Sj)

p’

(9)

则输出层各神经元权值△wjk调整公式将式(9)代入可定义为

q

pj

Δwjk=

p=1

η(t∑∑

j=1

-yj)f2(Sj)zk

p’

(10)

在得到输出层权值调整公式后,需要定义隐层权值△vki调整公式Δvki

(

=-=-Ep)=∑5vki5vkip=1

p

pp=1

(-p

5vki

(11)

zk=f1(

∑v

i=1p

ki

xi) k=1,2,…,p(1)

根据输出层各神经元权值△wjk调整公式推导过程,可得△vki为

p

q

输出层节点的输出为

yf=f2(

k=0

wjkzk) j=1,2,…,q(2)

Δvki=

p=1

pp’’

η()()(Sk)xit-yfSwfjj2jjk1∑∑j=1

通过式(1)和(2)可得BP神经网络完成n维到q

维的映射.

其次考虑反向传播.在反向传播中,需要对不理想的权值进行调整,BP神经网络的核心要务即在于调权.定义误差函数,设输入P个学习样本,

12p

用x,x,…,x来表示.第p个样本输入网络得到

p

输出yj(j=1,2,…,q),其误差为

Ep=

p

(12)

2.3 网络的训练

神经网络的训练过程是识别字符的基础,十分重要,直接关系到识别率的高低.输送训练样本至BP神经网络训练,在梯度方向上反复调整权值使网络平方和误差最小.为使网络对输入向量有一定鲁棒性,可先用无噪声的样本对网络进行训练,直到其平方和误差最小,再用含噪声的样本进行训练,保证网络对噪声不敏感.训练完毕,把待识别数字送BP神经网络中进行仿真测试.

2

q

∑(t

j=1

pj

-yj)

p2

(3)

式中tj为期望输出.P个样本的全局误差为将式(3)代入得

ppq

pp2

(tj-yj)(4)E=∑Ep=∑∑2p=1p=1j=1

输出层权值的变化采用累计误差BP算法调

3 实验结果与分析

权值初始化为(-1,1)之间的随机数,期望

基于BP神经网络的手写数字识别研究

第4期基于BP神经网络的手写数字识别研究

91

表1 各数字识别率

误差为0.01,最大训练步数5000,动量因子为0.95,隐层和输出层均采用“logsig”函数,手写数字的识别结果如图2(a)~(e)所示,以数字4为例给出处理过程

.

数字识别率/%

093

194

293

393

494

592

693

792

894

994

4 结论

针对传统的手写数字识别中识别率和可靠性,提出了将,,P.

参 考 文 献

] 胡钟山,娄震,杨静宇.基于多分类器组合的手写体数字识

(a)读取的数字图像 (b)

二值化处理后的数字图像

别[J].计算机学报,1999(4).

[2] 张猛等.手写体数字识别中图像预处理的研究[J].微计算

机信息,2006(6).

(c)剪切等系列处理后的数字图像 (d)特征提取图像

  

[3] 姜珊.基于汉字原型的手写汉字识别[J].计算机研究与发

展,1996(8).

[4] 刘永红.神经网络理论的发展与前沿问题[J].信息与控

制,1999(1).

[5] 王磊,戚飞虎.多字体字符识别的模糊神经网络模型[J].

红外与毫米波学报,1999(5).

[6] PandyaAS,MacyRB.神经网络模式识别及其实现[M].

徐勇,荆涛译.北京:电子工业出版社,1999.

(e)最终识别的数字

[7] 朱小燕等.手写体字符识别研究[J].模式识别与人工智

图2

能,2000(2).

[8] 马少平等.基于模糊方向线索特征的手写体汉字识别[J].

对1000个手写数字(每个数字取100幅不同的图

像)进行识别,其识别结果如表1所示.

清华大学学报,1997(3).

[9] 王爱玲,叶明生,邓秋香.图像处理技术与应用[M].北京:

电子工业出版社,2008.

RESEARCHOFHANDWRITTENDIGITALRECOGNITIONBASEDONBACKPROPAGATIONNEURALNETWORK

MaNing ChangJi

(HarbinNormalUniversity)

ABSTRACT

Inthispaper,theBPneuralnetworkisusedinthehandwrittendigitalrecognition.Theexperimentalre2sultsprovethismethodhashighrecognitionrateandrecognitionreliability.

Keywords:BPneuralnetwork;Patternrecognition;Imageprocessing;Featureextraction

(责任编辑:李佳云)

基于BP神经网络的手写数字识别研究.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
    ×
    二维码
    × 游客快捷下载通道(下载后可以自由复制和排版)
    VIP包月下载
    特价:29 元/月 原价:99元
    低至 0.3 元/份 每月下载150
    全站内容免费自由复制
    VIP包月下载
    特价:29 元/月 原价:99元
    低至 0.3 元/份 每月下载150
    全站内容免费自由复制
    注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
    × 常见问题(客服时间:周一到周五 9:30-18:00)