浅析TF-GSC

原文转载于http://blog.csdn.net/bellshape/article/details/65447099,非常感谢。

1.概述

  GSC(Generalized Sidelobe Canceller,广义旁瓣相消器)是麦克风阵列处理中实现语音增强的一种方法。本文主要关注arbitrary(任意的) ATF(Acoustical Transfer Function,声学传递函数)模型下基于频域的TF-GSC(Transfer Function Generalized Sidelobe Canceller,传递函数广义旁瓣相消器)的原理。 
  符号表示:对语音信号做短时傅里叶变换,用 k  表示各频点, l  表示帧编号, S(k,l) 表示desired signal(期望信号), Z(k,l)=(Z1(k,l),...,ZM(k,l))T 表示M个麦克风的观测信号, A(k)=(A1(k),...,AM(k))T 表示声源到各麦克风的ATF。 W(k,l)=(W1(k,l),...,WM(k,l))T 表示滤波器的系数。 Y(k,l) 表示TF-GSC的输出。

2.原理

1)优化问题

  TF-GSC的目标是求解如下优化问题: 

minW{WH(k,l)ϕZZW(k,l)}  
s.t.WH(k,l)A(k)=1.  

      其中 ϕZZ Z(k,l) 的PSD matrix(功率谱矩阵)。由于 Y(k,l)=WH(k,l)Z(k,l) ,因此minimize(最下化)的对象是 E{Y(k,l)Y(k,l)} ,而约束条件则保证了输出等于 S(k,l) ,因此TF-GSC的目标是求得 W使得保证完美dereverberation(去混响)的同时实现最大程度的noise reduction(降低噪声)。

2)TF-GSC结构


picture 
图1 

  如图1所示,TF-GSC由三部分组成:fixed beamformer(固定波束形成器)( W0 )、blocking matrix(矩塞矩阵)( H )、multichannel ANC(多通道自适应相消器)( G )。其中 W0(k,l)=A(k)/||A(k)||2 是上述约束等式的最小范数解,而BM的列张成 A(k) 的零空间,因此总滤波器系数 W(k,l)=W0(k,l)H(k,l)G(k,l) 总能满足上述约束条件。因此constrained(约束)最小化问题可以转化为如下unconstrained(不受约束)最小化问题: 

minG{[W0(k,l)H(k,l)G(k,l)]HϕNSNS(k,l)[W0(k,l)H(k,l)G(k,l)]}  

这个unconstrained最优化问题可以用LMS(least mean square,最下均差)求解。可以看出,fixed beamformer主要实现dereverberation,blocking matrix输出纯噪声,用于产生noise reference signals(噪声参考信号),multichannel ANC实现自适应降噪。

3)ATF估计

  求解fixed beamformer和blocking matrix需要已知ATF。在实际室内环境下,RIR(Room Impulse Response,房间冲激响应)非常长,难以估计。RTF(Relative Transfer Function,相关传递函数) A~(k)=A(k)/A1(k) 表示麦克风之间的传递函数,其对应的impulse response能量衰减比ATF快得多,更容易准确估计。[1]介绍了两种估计RTF的方法,思想是求某个等式的least square解,具体方法不再赘述。 
  需要注意的是fixed beamformer变为: W0(k,l)=A~(k)/||A~(k)||2 。这种情况下算法
无法实现dereverberation,因为约束条件只能保证恢复 A1(k)S(k,l)

以下为TF-GSC算法的简要概括:

浅析TF-GSC_第1张图片

3.MATLAB验证

  仿真环境:室内环境(RIR由Image method产生)、一位说话人,一个point source noise(点源噪声)。6个均匀排布的线阵麦克风,间距为6cm。对比某个麦克风的observed signal(观测信号)与TF-GSC的输出如图2所示。 


picture 
图2 

4.Q&A

  1. 为什么TF-GSC之后通常要加postfiltering(后置滤波)进一步降噪? 
      TF-GSC只能消除coherent noise(相干性噪声)(ANC的局限),实际noise field包括coherent noise、diffused noise(扩散噪声)、incoherent noise以及nonstationary noise。TF-GSC的ANC部分只能消除coherent noise和diffused noise的低频部分,在其他情况下,TF-GSC的ANC部分没起作用,降噪主要靠fixed beamformer,性能十分有限。加入postfiltering可以提高其他情况下的降噪性能。


5.参考文献

[1]: Gannot S, Cohen I. AdaptiveBeamforming and Postfiltering[M]. Springer Berlin Heidelberg, 2008.

[2]: Benesty J, Chen J, Huang Y.Microphone Array Signal Processing[M]. Springer Berlin Heidelberg, 2008.

[3]: Gannot S, Cohen I. Speech Enhancement Based on the GeneralTransfer Function GSC and Postfiltering[J].2004.

[4]:bellshape.http://blog.csdn.net/bellshape/article/details/65447099.

 





你可能感兴趣的:(Speech,enhancement)