基于麦克风阵列的混响环境下声源定位和波束形成技术的研究

摘要

随着通信产业以及人机交互接口的高速发展,声源定位已成为一个备受瞩目的研究课题和迫切需要。在实际应用中,语音信号处理系统在很多情况下会受到空间噪声以及室内混晌的影响。因此,噪声及混响背景下的声源定位,是麦克风阵列信号处理必然要面对的一个重要问题。

本文首先介绍了麦克风阵列相关的理论基础,如语音信号和噪声信号特性,以及适用于麦克风阵列研究的远近场信号模型、混响信号模型,空间采样定理等。而后系统阐述了当前声源定位以及波束形成技术的代表性算法原理,并基于声场混响模型,对麦克风阵列声源定位的远场时延估计算法进行了改进,使其在有色噪声环境下,也能保持良好性能,并在此基础上推导了自适应算法,提高了收敛速率,使其可以用于实时性要求较高的场合。而后结合波束形成语音增强算法,对改进的语音增强系统进行仿真,验证了算法的有效性。

关键词:麦克风阵列声源定位时延估计波束形成

第1章绪论

麦克风阵列处理技术,是阵列信号处理在语音信号处理上的具体应用。阵列信号处理从60年代的相控阵天线技术为起点,经历了将近50年的飞速发展,在通信、雷达、水下探测、语音、医学、声纳等诸多领域都有了自己的一席之地。语音信号处理已经是阵列信号处理的热点和重要内容n刁,并已广泛应用于许多音视频处理系统,如数字助听器等等。

麦克风阵列,是将一组麦克风传感器按某种方式放置在不同的空间位置上,在空间上接收声音信号。经过一定的处理过程,人们可以提取接收信号的有关特征信息,如幅度、频率、方向等。麦克风阵列按麦克风传感器在空间位置的不同分布,会有如下的拓扑结构:线性阵列、圆形阵列、球形阵列等等。

麦克风阵列在语音信号处理中的许多问题在天线阵列处理中可能已经有了关于相似问题的长时间的讨论和研究,但两者还是存在较大差异。

80年代起,包括Bell实验室在内的很多研究机构和企业,都开始了麦克风阵列语音信号处理的研究。比如欧洲的CHIL(Computers in the human interaction loop)I程,AMI工程,美国的VACE工程等。现今最大的麦克风阵列是由麻省理工学院计算机科学与人工智能实验室在LOUD项目中建造的具有1020个结点的麦克风阵列(图1.1)。微软公司的操作系统windows vista也实现了对麦克风阵列的支持以提高语音识别的准确度,所采用的是恒定束宽波束形成技术。TI公司提出的McASP协议可支持多达128个通道的音频输入,可以很好的支持麦克风阵列的各种应用。

麦克风阵列声源定位问题的研究现状

目前来说,利用麦克风阵列进行声源定位的代表性方法可以大致分为三类:基于波束形成的方法,基于子空间的方法和基于时延估计的方法。

波束形成技术在语音处理方面的研究现状及意义


波束形成是个由来已久的研究课题,在很多领域都有涉及:雷达,声纳,地震学,通信等等,可用于监测信号的存在,估计波达方向,增强被噪声、其他声源或混响污染的信号等。在声源定位系统中,波束形成主要应用在声源增强模块中,通过调整麦克风阵列的系数来改变阵列对不同方向上声音响应的波束指向。其研究始于80年代。经典的方法包括固定波束形成,自适应波束形成以及后置滤波等几大类,下面对这些麦克风阵列语音增强算法方法及其研究现状做一些进一步的介绍。

1固定波束形成方法

最早的固定波束形成方法是由美国学者Flanagan在1985年提出的延时求和波束形成方法f251,通过对麦克风阵列接收信号进行时延补偿,加权、求和,而后输出。该方法
在保持语音信号幅度不变的同时,衰减了干扰噪声信号。该类麦克风阵列语音增强方法实现简单,但需要较多麦克风才能得到较好的噪声抑制能力,因此实际中应用较少。

2自适应波束形成方法

1972年,斯坦福大学的Frost提出线性约束最小方差波束形成[261,该波束形成器也称为Frost波束形成器。该方法在满足约束阵列输出功率最小的条件下,实现特定方向目标信号频率响应,以达到抑制噪声的目的。1982年Griffiths与Jim提出了一种修正的线性约束波束形成器[271,即广义旁瓣抵消器(GSC,Generalized SidelobeCanceller),本质上是Widrow自适应噪声抵消的一个应用特例。其结构可以分为固定波束形成、阻塞矩阵和多通道噪声抵消三部分。使用数目较少的传感器却可以获得较强的干扰噪声抑制性能,使GSC成为大多数自适应波束形成语音增强方法的理论基础。为了解决GSC固有的信号泄漏问题,许多学者改进了阻塞矩阵的结构。Shannon提出了针对任意传递函数情况的广义旁瓣抵消器,扩大了GSC的使用范围;Hoshuyama等提出了基于自适应阻塞矩阵的鲁棒广义旁瓣抵消算法。2001年Gannot等人采用估计语音信号声学通道传递函数比率,构建时变阻塞矩阵来取代GSC中的阻塞矩阵,进而提出了另一种鲁棒GSC方法。



你可能感兴趣的:(基于麦克风阵列的混响环境下声源定位和波束形成技术的研究)