手机版

一种基于非负矩阵分解的语音增强算法_隋璐瑛(3)

发布时间:2021-06-07   来源:未知    
字号:

20

军 事 通 信 技 术             2012年 

标函数关于y进行求导,得到的偏导数为同一函数,此偏导数用于计算最小目标函数D。B函数关于y的一次偏导数为:对于B∈R,有

B=yB-2(y-x)和H的偏导数分别为:

T[B-2]

=W((WH)õ(WH-V))=((WH)[B-2]õ(WH-V))HT

(5)(6)(4)

dB(xûy)的值随ûy-xû增大而增大,当y=x时,dB(xûy)的值达到最小。根据式(4)得到D(VûWH)关于W

  算法实施过程中,初始化矩阵W和H为任意非负矩阵,采用乘法梯度下降算法,通过增加偏导数前一次迭代得到的两个正矩阵中的较大部分[¨f(H)]1和较小部分[¨f(H)]2的比率分别对矩阵进行更新,即H←H [¨f(H)]1/[¨f(H)]2,此时,¨f(H)=[¨f(H)]2-[¨f(H)]1具有非负性,如此保证了矩阵在更新迭代过程中始终保持非负性。因此,得到下面的更新规则:

H←HõW(WH)

W←Wõ(WH)H

  本文中,主要考虑B=2时的LS-NMF算法和B=1时的KL-NMF算法。

[B-2]

T

T

[B-2]

(7)(8)

2 语音增强方案

本文提出的语音增强模型的关键思想是,通过提前训练噪声信号的模型,建立一个说话者独立系统。假设语音信号和噪声信号均为加性信号,则带噪语音信号y(t)可以表示为:

y(t)=s(t)+n(t)谱取幂计算,得到:

A=ûYû=ûFFT{y(t)}û

r

r

(9)

其中,s(t)为语音信号,n(t)为噪声信号,二者互相独立。对式(9)进行傅立叶变换,得到信号幅度谱,对幅度

(10)

其中,r∈(0,2]为幂次。

本文方案不需要VAD过程,也不需要对所有的独立信号进行建模,只需提前对噪声进行训练。使用NMF算法对语音进行重建,在低信噪比和快速变化的噪声环境下仍然适用。此增强模型主要包括两个阶段,训练阶段和增强阶段。增强系统框图如图1所示。

训练阶段将噪声转换到频域,并对其幅值取模后再进行取幂计算,以达到算法非负性的要求,然后通过NMF算法对噪声谱进行分解,得到噪声字典矩阵Wn,保存其作为增强阶段的先验信息。增强阶段,对带噪语音进行FFT变换后取幂,通过NMF算

图1 KL-NMF和LS-NMF语音增强算法总体框图法分解得到带噪语音的字典矩

阵和编码矩阵,联合先验信息,通过相应的迭代计算得到语音字典矩阵和编码矩阵,重建语音信号。

将非负矩阵分解算法应用于带噪语音,假设语音信号和噪声信号相互独立,则

一种基于非负矩阵分解的语音增强算法_隋璐瑛(3).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印
×
二维码
× 游客快捷下载通道(下载后可以自由复制和排版)
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能出现无法下载或内容有问题,请联系客服协助您处理。
× 常见问题(客服时间:周一到周五 9:30-18:00)