20
军 事 通 信 技 术 2012年
标函数关于y进行求导,得到的偏导数为同一函数,此偏导数用于计算最小目标函数D。B函数关于y的一次偏导数为:对于B∈R,有
B=yB-2(y-x)和H的偏导数分别为:
T[B-2]
=W((WH)õ(WH-V))=((WH)[B-2]õ(WH-V))HT
(5)(6)(4)
dB(xûy)的值随ûy-xû增大而增大,当y=x时,dB(xûy)的值达到最小。根据式(4)得到D(VûWH)关于W
算法实施过程中,初始化矩阵W和H为任意非负矩阵,采用乘法梯度下降算法,通过增加偏导数前一次迭代得到的两个正矩阵中的较大部分[¨f(H)]1和较小部分[¨f(H)]2的比率分别对矩阵进行更新,即H←H [¨f(H)]1/[¨f(H)]2,此时,¨f(H)=[¨f(H)]2-[¨f(H)]1具有非负性,如此保证了矩阵在更新迭代过程中始终保持非负性。因此,得到下面的更新规则:
H←HõW(WH)
W←Wõ(WH)H
本文中,主要考虑B=2时的LS-NMF算法和B=1时的KL-NMF算法。
[B-2]
T
T
[B-2]
(7)(8)
2 语音增强方案
本文提出的语音增强模型的关键思想是,通过提前训练噪声信号的模型,建立一个说话者独立系统。假设语音信号和噪声信号均为加性信号,则带噪语音信号y(t)可以表示为:
y(t)=s(t)+n(t)谱取幂计算,得到:
A=ûYû=ûFFT{y(t)}û
r
r
(9)
其中,s(t)为语音信号,n(t)为噪声信号,二者互相独立。对式(9)进行傅立叶变换,得到信号幅度谱,对幅度
(10)
其中,r∈(0,2]为幂次。
本文方案不需要VAD过程,也不需要对所有的独立信号进行建模,只需提前对噪声进行训练。使用NMF算法对语音进行重建,在低信噪比和快速变化的噪声环境下仍然适用。此增强模型主要包括两个阶段,训练阶段和增强阶段。增强系统框图如图1所示。
训练阶段将噪声转换到频域,并对其幅值取模后再进行取幂计算,以达到算法非负性的要求,然后通过NMF算法对噪声谱进行分解,得到噪声字典矩阵Wn,保存其作为增强阶段的先验信息。增强阶段,对带噪语音进行FFT变换后取幂,通过NMF算
图1 KL-NMF和LS-NMF语音增强算法总体框图法分解得到带噪语音的字典矩
阵和编码矩阵,联合先验信息,通过相应的迭代计算得到语音字典矩阵和编码矩阵,重建语音信号。
将非负矩阵分解算法应用于带噪语音,假设语音信号和噪声信号相互独立,则