文采用 i 层结构神经网络。如图 2 所示:输入层各节 点将输入信号经权重藕合到隐层的每个节点. 隐层各节点对来自前一层的信号加权, 经激发 函数转换后再藕合到输出层。 x1 x2 xn 图 2 含有一个隐层的神经网络 o1 o2 oi 4.基于遗传神经网络的语音识别 本文研究引用遗传算法对网络的初始连接权值进行优化处理, BP 算法完成给定精度 用 的学习。
4.1 个体编码方案 编码对于网络进化过程的性能和效率影响很大。因此.编码技术是连接权值进化过程中 学解决的首要问题和关键步骤。本文中考虑到 BP 网络的节点数和结构已经固定,可以采用 实数编码方案,将网络的权值和各节点的阀值依此排列得到一个向量。 假设一个具有 m 个节点的 n 层 BP 网络,如果第 i 个节点对应的权值分别为v i (v i [-l, +l]),则一个个体用实数向量表示为 X=[v 1 ,v 2 , v m ]。 4.2 适应度函数的选择 一个网络连接权值优劣的标准,是根据网络对一组输入得到的实际输出与期望输出之间 的误差大小来制定的。BP 网络中误差平分和小,则表示该网络性能比较好。本文中适应度 函数为: 其中,E 为神经网络的输出误差,即 [7] f(x ) = 1 1+E (4) E = ? ? (y k ? y k )2 ∑ n k =1 其中 n 为学习样本总数, y k , y k 为第 k 个个体的期望输出和实际输出向量。 ∧ 1 N ∧ (5) 4.3 进化参数 连接权的进化过程中所涉及到的主要进化参数有:种群规模、交叉率、变异率和进化代 数等等。交叉是最主要的进化操作,交叉率是指各代中交叉产生的后代数与种群规模之比。 常用的交叉率取值范围为 0.6—1.0。变异率是指种群中变异的基因数占总基因数的比例, 其值控制了新基因引入的比例。常用变异率的数量级范围为 0.1—0.00l。种群规模是连接 权进化过程首先需要确定的参数。是算法会否陷入局部解的主要影响因素。综合考虑 BP 网 络的初始连接权值和交叉率、变异率的选择,这里选择种群规模为 50。 5.仿真实验结果 仿真实验为针对非特定人的孤立数字词语音识别。语音数据由二男二女(O 到 9 共 10 个 数字的普通话发音)通过 PC 话筒输入,每个音每人发 20 遍。共计 1000 次发音,其中以每人 每个音的前 1O 次作训练样本,后 1O 次作测试样本,录音环境为安静实验室,采样频率为 11.025kHz。 经过反复实验。 小断改善实验环境. 基于演化神经网络的识别得到了相对较高的识别率。 对实验结果分析可知,结合了 GA 算法的 BP 网络通过 GA 全局搜索得到一个权值最优解,只 迭代 151 次便使得误差值为 O.00000l, 而普通 BP 算法要迭代 517 次才能勉强达到期望误差, [8] 由此可知。结合了 GA 算法的 BP 网络避免了局部极小,减低了学习速率,提高了收敛速度。 表 1 基于遗传神经网络和 BP 网络语音识别系统对比表 训练代数 普通 BP 神经网络 遗传神经网络 517 151 平均识别率 84.2% 87.8% 最高识别率 96.0% 96.0% 通过表 l 对比可知, 基于演化神经网络识别算法的语音识别系统无论是在训练时的收敛 速度还是在最后的识别率上,都要优于普通的 BP 网络语音识别系统。 6.结论 语音信号处理和神经网络均是目前研究的热点,文章主要针对语音识别的特点,结合人 工智能领域两种比较有效的方法——BP 网络和 GA 算法,构建了一种基丁遗传神经网络的语 音识别算法。仿真实验结果表明:该算法避免了传统 BP 算法容易陷入局部极小的缺点,减 低了训练时间,有效的提高了系统识别率。 参考文献 【1】K.H.Davis,R.Biddulph,and S.Balashek.Automatic Recognition of Spoken Digits【M】 .Acoust.Soc.Am. 952,24(6):637—642. ,1 【2】胡航.语音信号处理(第一版)【M】 .哈尔滨:哈尔滨工业大学出版社,2000. 【3】赵力.语音信号处理【M】 .北京:机械工业出版社,2003. 【4】蔡莲红,黄德智,蔡锐.现代语音技术基础于应用【M】 .北京:清华大学出版社,2003. 【5】孙宁,孙劲光,孙宁.基于神经网络的语音识别技术研究【J】 .计算机与数字工程, 2005,34(3):58—61. 【6】夏克文,李吕彪,沈钧毅.前向神经网络隐含层节点数的最优算法
【J】 .计算机科学, 2005,32(10):143—145. 【7】王万良.人工智能及其应用(第二版) 【M】北京:高等教育出版社,2008. 【8】Lippman R P. Review of Neural Network for Speech Recognition【J】 .Neural Computation,1989,l(1):l—38.