麦克风阵列语音增强beamforming算法

delay and sum

关键步骤在于计算延时, 可以通过GCC-PHAT方法进行计算, 即广义互相关-相位变换方法.

  • GCC-PHAT(广义互相关-相位变换)

x(n) y(n) 的互相关函数是将 x(n) 保持不动, y(n) 左移m个样本点, 两个序列逐个相乘的结果, 顺序不能互换.
但是, 按照时域卷积的方式求互相关函数的方法计算复杂度较大, 所以将在频域进行操作(FFT和IFFT), 即线性卷积的FFT算法.

两个信号的互相关函数的频域等于x信号频域的共轭乘以Y信号的频域.

mvdr最小方差无失真响应滤波

  • MVDR主瓣约束自适应算法.

即在信号方向上的增益保持不变的情况下, 在非信号方向上试波束输出的功率最小. 实现方式是选择一组权矢量. 最优权矢量为:

wopt=R1xxCCHR1xxC

具体推导过程在文章MVDR自适应波束形成算法研究 中可以得出.其中, Rxx 是自相关函数, C是约束矩阵.

  • 参考相关代码, MVDR之前会进行VAD静音检测.

VAD算法具体可以采用, 计算语音段的能量与设置的某一阈值T0比较, 若连续N段语音是超过阈值T0的, 则确定为语音段, 否则为静音段.

gsc广义旁瓣消除

GSC算法分析

你可能感兴趣的:(语音增强)