阵列信号处理利用多个麦克风的的空间信息对接受信号做空域滤波和信号合成,是除时域和频域外的一种新的信号处理手段。常用的多麦克风波束形成技术有:
DSB(delay-sum beamforming), MVDR(minimum variance distortionless response), GSC(generalized sidelobe canceller).
在一个三维直角坐标系中,假设麦克风的位置为P坐标,当语音信号a从某个方位传递到位于各个P坐标的麦克风时,各个麦克风接受到的语音信号就可以表示成如图右边的列向量形式,这表明对于每个麦克风而言,我们可以以直角坐标的原点为参考点,计算语音信号在传播过程中,相对于坐标原点的时间延迟。
针对时延的计算,在已知入射波和Z轴的夹角和入射波和X,Y轴的平面夹角( 两个未知参数的估计在阵列信号处理中有专门的技术TDOA,这里略过),那么就可以通过上图的公式计算时延。
时域的延时等价与频域的相位,那么就可以得到频域表达式:
这个黄框中的列向量就称为阵列流形矢量,表征了原始语音谱和实际麦克风接受到的信号谱的关系。
ULA是最为简单的均匀线性阵列,假设现在有M个麦克风,均匀分布在Z轴上。
那么每个麦克风的时延就可以表示成
通过前面的描述,应该已经清楚。针对每一路麦克风的接收信号,其实就是原始信号在时间上的延迟,如果我们将这个延迟给补偿上,那么N路麦克风信号就会在时间上对齐了。
每个输入信号在时域乘上这个时间补偿函数,那么就会相当于在频域乘上对应的列向量
这种波束形成方式就称为延时求和波束形成方法。