语音信号编解码器设计与简要分析
第一章 引 言
1.1语音编码的发展进程及现状
语音信号处理的研究工作最早可以追溯到1876年贝尔发明的电话,该发明首次用声电、电声转换技术实现了远距离的语音传输。1939年Dudley研制成功第一个声码器,从此奠定了语音产生模型的基础,这一工作在语音信号处理领域具有划时代的意义。本世纪30年代以前,语音信号的处理及传输均是以模拟的方式进行。1937年A.H.Reeves提出了脉冲编码调制PCM(Pulse Code Modulation)理论开创了语音数字化通信的历程。数字化语音的传输与存储可靠性、抗干扰、速交换、易保密等各方面都远胜于模拟语音。从最初的64kbps的标准PCM波形编码器到现在4kbps以下的参量编码的声码器,语音压缩编码在几十年里得到迅速发展。语音压缩编码的发展经历了以下几个阶段:波形编码、参量编码及二者相结合的混合编码。此外还有此基础上发展而来的增强多带激励声码器MBE(IMBE)算法。波形编码是将时间域信号直接变换为数字代码,力图使重建语音波形保持原语音信号的波形形状。
波形编码的基本原理是在时间轴上对模拟语音按一定的速率抽样,然后将幅度样本分层量化,并用代码表示。解码是相反过程,将接收的数字序列经解码和滤波后恢复成模拟信号。波形编码具有抗噪性能强、语音质量好等优点,但需要较高的数码率,一般为16kbps~ 64kbps。如果希望有较高的编码质量,当编码速率在下降时,其合成语音的性能会下降得很快。最近,对于波形编码器提出了一些新技术,例如后滤波器、改进激励程序等,使得语音质量有比较大的提高。
参数编码又称为声码器技术,它通过对语音信号进行分析,提取参数来对参数进行编码,在接收端能够用解码后的参数重构语音信号。参数编码主要是从听觉感知的角度注重语音的重现,即让解码语音听起来与输入语音是相同而不是保证其波形相同。这种编码方式一般对数码率的要求要比波形编码低很多,但只能达到合成语音的质量(即自然度、讲话者的可识别性都较差的语音),即使码率提高到与波形编码相当时,语音质量也不如波形编码。应用广泛的线性预测LPC(Linear Predictive Coding)声码器是典型的语音参数编码器。最新的参数编码器有正弦变换编码器、波形内插编码器等。在保证语音质量的前提下,进一步降低比特率,仍然是语音编码研究的主要焦点。然而,这是一个很复杂的问题,它受多种因素的限制,例如:语音信号所包含的信息内容。但是,作为一个速率低