语音信号编解码器设计与简要分析
限,临界信息速率应该是人理解信号所需要的最小速率,但这是一个还需要继续深入研究的问题。因为有关语音信号的某些信息,人能够感觉到有变化,而编码器却找不到对应的特征参量。反之,有时语音的波形和特征参量变化很大,而人同样可以理解。要达到理论上50bit/s确语音信息率最低限这个目标,对人脑感知信号的过程,必须有更深入的研究。
在中国,语音和语言处理技术的研发略晚于国外。中国科学院声学研究所的俞铁城教授应该说是中国最早涉足这一领域的人之一,他于1977年在《物理学报》发表了全国第一篇关于语音识别的论文。清华大学语音技术中心紧随其后,语音界老前辈方棣棠教授、吴文虎教授于1979年创立语音技术中心(原名语音实验室),现已有27年的历史。随后,全国各地从事这方面研究的机构越来越多,比较著名的有清华大学电子工程系、中国科学院自动化研究所、中国科技大学、中国社会科学院语言研究所(在语音学研究方面,吴宗济先生的起步更早)、北京大学、哈尔滨工业大学等等。在这些顶尖的学术机构的带动下,中国的语音和语言处理技术得到很大发展,并逐步在国际上引起注意。
1.2语音编码技术
语音编码的主要功能就是把语音的采样值编码成少量的比特(帧)。而且,在通信过程产生误码、网络抖动和突发传输时,这种方法必须具有健壮性(Robustness)。在接收端,语音帧先被解码为采样值,然后再转换成语音波形。语音编码的目的,是在给定的编码速率下,使得从解码恢复出的重构语音的质量尽可能高。语音编码主要可分为两种:波形编码和参数编码。波形编码就是根据语音的信号波形导出相应的数字编码形式,令在接收端的解码器能恢复出与输信号波形相一致的原始语音。波形编码的基本思路是忠实地再现语音的时域波形。为了降低比特率,波形编码会充分利用相邻抽样点之间的相关性,对差分信号进行编码。波形编码的方法简单,有较好的合成语音质量。但它的码率高,当码低于32kbps的时候音质明显降低。著名的波形编码标准有G.711(64kbps PCM编码调制)和G.726(16/24/32 kbps ADPCM自适应差分脉冲编码调制)。参数编码的原理和设计思想和波形编码完全不同。它根据对人的发声机理的第一章绪论分析,着眼于构造语音生成模型,该模型以一定的精度模拟发声者的声道,接收端根据该模型还原生成发声者的语音。编码器发送的主要信息是语音生成模型的参数,相当于语音的主要特征,而并非语音的波形幅值。参数编码器可以有效地降低编码比特率,目前小于16kbps的低比特率语音编码都采用参数编码。