OM-LSA算法,全称为optimally-modified log-spectral amplitude,中文有翻译为“最优改进对数谱幅度估计”,OMLSA算法相比较其它抑制算法有较少的音乐噪声残留(due to its superiorityin reducing musica noise phenomena)
先看系统框图
流程跟其它降噪方法什么不同,信号输入->STFT->噪声估计/增益计算->频谱修改->iSTFT
这里核心部分就是噪声估计然后计算频域增益了,这一步的框图如下
这里就主要分析增益函数的计算过程
y ( n ) = x ( n ) + d ( n ) y(n) = x(n)+d(n) y(n)=x(n)+d(n)
STFT
Y ( k , l ) = X ( k , l ) + D ( k , l ) Y(k,l)=X(k,l)+D(k,l) Y(k,l)=X(k,l)+D(k,l)
estimate is obtained by applying a specific gain function to each spectral component of the noisy speech signal
X ^ ( k , l ) = G ( k , l ) Y ( k , l ) \hat{X}(k,l)=G(k,l)Y(k,l) X^(k,l)=G(k,l)Y(k,l)
LSA估计器以最小化下式为优化目标
E { ( l o g A ( k , l ) − l o g A ^ ( k , l ) ) 2 } E\begin{Bmatrix}(logA(k,l)-log\hat{A}(k,l))^2\end{Bmatrix}{} E{(logA(k,l)−logA^(k,l))2}
其中, A ^ ( k , l ) ) \hat{A}(k,l)) A^(k,l))为估计得到的幅度谱
直接给出OM-LSA的表达式如下
G ( k , l ) = G H 1 ( k , l ) p ( k , l ) G m i n 1 − p ( k , l ) G(k,l)=G_{H_1}(k,l)^{p(k,l)}G_{min}^{1-p(k,l)} G(k,l)=GH1(k,l)p(k,l)Gmin1−p(k,l)
其中:
G H 1 G_{\mathrm{H}_{1}} GH1表示语音存在时候的条件增益
G m i n G_{min} Gmin为增益下限,也可以理解为当语音不存在时候的条件增益
p ( k , l ) p(k,l) p(k,l)为语音存在概率
继续给出增益函数中的未知量
G H 1 ( k , ℓ ) = ξ ( k , ℓ ) 1 + ξ ( k , ℓ ) exp ( 1 2 ∫ ν ( k , ℓ ) ∞ e − t t d t ) G_{\mathrm{H}_{1}}(k, \ell)=\frac{\xi(k, \ell)}{1+\xi(k, \ell)} \exp \left(\frac{1}{2} \int_{\nu(k, \ell)}^{\infty} \frac{\mathrm{e}^{-t}}{t} \mathrm{d} t\right) GH1(k,ℓ)=1+ξ(k,ℓ)ξ(k,ℓ)exp(21∫ν(k,ℓ)∞te−tdt)
ξ ( k , ℓ ) ≜ λ x ( k , ℓ ) λ d ( k , ℓ ) \xi(k, \ell) \triangleq \frac{\lambda_{x}(k, \ell)}{\lambda_{d}(k, \ell)} ξ(k,ℓ)≜λd(k,ℓ)λx(k,ℓ)
v ( k , ℓ ) ≜ γ ( k , ℓ ) ξ ( k , ℓ ) 1 + ξ ( k , ℓ ) v(k, \ell) \triangleq \frac{\gamma(k, \ell) \xi(k, \ell)}{1+\xi(k, \ell)} v(k,ℓ)≜1+ξ(k,ℓ)γ(k,ℓ)ξ(k,ℓ)
γ ( k , ℓ ) ≜ ∣ Y ( k , ℓ ) ∣ 2 λ d ( k , ℓ ) \gamma(k, \ell) \triangleq \frac{|Y(k, \ell)|^{2}}{\lambda_{d}(k, \ell)} γ(k,ℓ)≜λd(k,ℓ)∣Y(k,ℓ)∣2
其中,
ξ ( k , ℓ ) \xi(k, \ell) ξ(k,ℓ)为先验信噪比(priori SNR)
γ ( k , ℓ ) \gamma(k, \ell) γ(k,ℓ)为后验信噪比(posteriori SNR)