麦克风阵列技术入门(1)

本文翻译自 Iain A McCowan 写的 Microphone Arrays, A tutorial。根据我自己的理解有些小的修改。


摘要

本文给出了麦克风阵列技术和波束形成理论的一些初步知识。所谓麦克风阵列就是放置在空间中不同位置的多个麦克风。根据声波传到理论,利用多个麦克风收集到的信号可以将某一方向传来的声音增强或抑制。利用这种方法,麦克风阵列可以将噪声环境中特定声音信号有效的增强。更进一步来说,这种增强效应只依赖与声源所在的位置,对噪声的类型、频谱等没有特殊的要求,因此可以用在非常广的应用领域。由于麦克风阵列技术具有很好的抑制噪声的能力,又不需要麦克风时刻指向声源方向,因此在语音处理领域具有非常好前景。

1. 阵列处理技术基础

1.1. 引言

所谓阵列处理技术就是利用多个传感器发射或接收信号。传感器阵列技术已经应用在了很广泛的领域,比如声呐、雷达、地震监测、射电天文学和层析成像领域中。本文,主要讨论利用麦克风阵列来接收声学信号,更进一步来说,接收语音信号。虽然利用麦克风阵列来处理语音信号属于一个相对较新的领域,但是其理论基础早就已经在其他类型的传感器阵列技术研究中建立好了。

简单的说,传感器阵列可以被认为是连续孔径的的离散采样,在此基础上可以很容易理解传感器阵列技术的工作原理。本节将讨论如下三个问题:

  • 波传播
  • 连续孔径
  • 离散传感器阵列

本节内容讨论的是各种传感器阵列的共性原理,但是讨论的范围和深度仅限于能够理解线性麦克风阵列工作原理。

1.1. 波传播

声波在液体和气体中是以纵波形式存在。基于牛顿力学原理可以发展处一套描述波传播的数学方程。描述真实环境中波传播的波动方程非常的复杂,如果忽略流体的粘滞性,波动方程可以简化为:

上式中x(t,r) 描述的是某一t时刻,空间中一点处的声压。

麦克风阵列技术入门(1)_第1张图片

波的传播速度c,取决于流体的压力和密度,在空气中近似为330m/s。利用分离变量法可以推导出各种不同条件下波动方程的解。对于单一频率平面波来说,波动方程的解如下:

上式中,A为波的振幅,k 为波数,给出了波的传播方向和波速信息

对于球面波,我们可以得到:

球面波的表达式表明波的振幅与距离成反比。这个关系在传感器阵列处理近场信号时是一个重要的考虑因素,后面章节将会详细的讨论这个问题。虽然从声波的产生机理来说大多数声波都是球面波,但是当距离声源较远时我们可以将其近似为平面波,利用平面波近似可以简化许多数学推导。

公式(3) 中的平面波有两个自变量,时间和空间变量。这两个自变量可以形成一个整体。如果我们将平面波的表达式改写为:

如果我们定义一个新的变量,那么上式可以写为:

对于球面波,做替换,我们可以获得一个类似的表达式:

由于波动方程满足线性叠加性,上述单一频率的解可以扩展为不同频率波动的叠加。

本节中,我们看到声音信号的传播可以表达为一个单变量函数。信号所携带的信息在传播过程被保留。基于上述两点可知,对于任何带宽有限信号,我们可以利用如下两种方法之一重构信号:

  • l 在空间中某固定点时域采样信号
  • l 在某个固定的时间点采集全空间的波形信号

后者构成了孔径和传感器阵列信号处理的理论基础。上面关于波传播特性分析中其他一些对阵列信号处理有影响的因素包括:

  • l 波的传播速度与介质的性质有关,对某种各项均匀的介质来说,波速是固定的。对于空气中传播的声波,波速近似为330m/s
  • l 一般来说,波是以球面波的形式传播的,幅度与传播距离成反比。
  • l 波动方程满足叠加性,多个振源产生的波动可以互不干扰的独立传播。利用时间和空间信息,可以将这些波动分开。

为了简化问题,上面的讨论中假设介质是各项同性、无耗散的,同时忽略了色散、散射和波速的变化。



你可能感兴趣的:(麦克风阵列技术入门(1))