远场语音交互硬件声学性能测试标准

远场语音交互硬件声学性能测试标准

 

 

 

 

 

 

文档版本 V1.8

修改日期2019.11.26

 

 

谙声科技声学实验室

文档修改记录

版本

修改日期

修改人

批准人

批准日期

描述

V1.0

2018.10.12

 

 

 

 

V1.1

2018.10.29

 

 

 

修改测试顺序,MIC判定

V1.2

2018.11.09

 

 

 

增加术语定义

V1.3

2018.12.29

 

 

 

更新测试程序

V1.4

2019.03.05

 

 

 

底噪更新为信噪比

V1.7

2019.06.19

 

 

 

增加信噪比判定标准

V1.8

2019.06.26

 

 

 

更新信噪比判定标准

 

 

目录

一、术语定义

二、测试内容

三、测试设备要求

四、测试环境要求

五、测试项目

5.1 MIC密封性

5.2 时延一致性

5.3 回声消除

5.4 MIC相干一致性

5.5 声源定位同步性

5.6 信噪比

5.7 回采预处理(参考)

5.8 通道频响一致性(参考)

5.9 总谐波失真(参考)

 

 

一、术语定义

下列术语和定义适用于本标准。

 

1)声压(sound pressure)

p

瞬时压强与静压强之差。单位为帕斯卡(Pa)。

 

2)声压级(sound pressure level)

Lp

声压平方与基准声压平方之比,取以10为底的对数的10倍,用分贝(dB)表示。

(1.1)

式中,p0为基准值,p0=20uPa。

 

3) MIC(Microphone

指麦克风,学名为传声器,用拾取和传送声音,可以将声音信号转换为电信号。

本标准中的MIC如无特别注释,一般指待测设备中MIC阵列中的MIC。

 

4)灵敏度(Sensitivity)

单通道的输出电压与无干扰时校准位置处声压的比值为灵敏度。

 

5)频率响应(Frequency Response)

单通道灵敏度级随频率的变化关系曲线为频率响应,标识为FR,单位为dB。

灵敏度以10为底的对数乘以20为灵敏度级(Sensitivity Level),标识为S,单位dB。

(1.2)

式中,V指采集信号输出电压有效值,P指校准位置处声压有效值。

 

6) MIC同步性

MIC同步性又称MIC一致性,指各个MIC通道间接收到同一信号的时间差的稳定性。

 

7)时延(Delay)

任意两个通道间接收到同一信号的时间差,单位为采样点数。

 

8)参考通道时延稳定性

参考通道信号和MIC通道信号的时延差随时间变化保持稳定的能力。

 

9)总谐波失真(Total Harmonic Distortion)

输出电信号中谐波余量的有效值与谐波和基频的总的比值为总谐波失真,缩写为THD。

(1.3)

式中,Unf指n 次谐波分量电压,Ut指基频总电压。

 

10)截幅(Clipping)

因信号波形的幅度太大,而超出系统的线性范围的现象。

 

11)回声消除(Acoustic Echo Cancellation

待测设备在播放声音时,通过声学回路又被自身麦克风采集到的信号,在接收信号中减去该信号称为回声消除,简称AEC。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

、测试内容

远场语音交互硬件声学测试包括:AEC性能、时延、噪声级、相干性、谐波失真以及一致性。其中,时延、AEC性能、噪声级为强制指标,其它为参考指标,不作为评判硬件通过的标准,只用来帮助定位硬件问题点。

本标准所提测试项原则上均基于整机设备。

 

、测试设备要求

1)测试中需要的设备如表1所示

 

表1 测试设备

序号

名称

型号

用途

1

音频分析仪

ANST 8192D

信号采集/分析

2

标准MIC

ANST AN-M320

校准环境/接收信号

3

人工嘴

ANST M210

音频信号播放

4

测试软件

ANST.Audio SYS

信号处理

5

功放电源一体机

ANST AN-633A

MIC/人工嘴信号放大/供电

 

备注:该设备配置为最低配置标准,若客户需复现测试场景,测试设备要求需不低于该配置要求。

 

2)测试声卡要求:

采样率范围:16kHz/44.1kHz/48kHz;

采样深度:16bit/32bit/64bit;

模数转换失真≤0.001%;

模数转换动态范围≥113dBA;

 

3)标准MIC要求:

灵敏度≥-30dBV;

频率响应:20Hz~20kHz;

 

4)标准音箱要求:

灵敏度≥96dB;

频响在100Hz~8000Hz平直(容差小于2.5dB);

100Hz~500Hz谐波失真小于5%,500Hz谐波失真小于3%;

 

5)声级计要求:

符合标准IEC61672-1:2013;

准确度等级1级;

线性范围:20dBA~134dBA;

采样率:48kHz;

 

6)测试软件要求:

硬件测试软件使用《ANST远场语音交互硬件测试软件V2.0》;

 

 

、测试环境要求

1)一般在标准大气条件下测量:环境温度24±2℃,相对湿度15%~65%,气压86kpa~106kpa;

 

2)背景噪声≤35dBA;

 

3)房间混响(100Hz~8kHz)≤500ms;

 

4)待测设备放置到房间中间的支架上,建议扬声器离待测麦克风的距离为1m,扬声器中心距地面1.2m。待测设备麦克风阵列的中心位置与扬声器发音中心位置在一条水平线上,即声波的入射方向与参考轴方向夹角为90°。设备测试示意图如图1。

远场语音交互硬件声学性能测试标准_第1张图片

 

 

图1. 测试环境示意图

 

、测试项目

硬件测试项目包括密封性、时延一致性、回声消除特性、本底噪声级、通道相干性、MIC信号同步性、回采预处理特性、通道频响一致性以及总谐波失真特性。

 

5.1MIC密封性

定义:

MIC密封性,指待测设备MIC孔处通过物理密封隔绝外界噪声的能力,通常以物理密封MIC前后录到的音频时段的平均振幅差表征,单位为dB。

 

测试目的:

MIC密封性会影响MIC接收声信号的传播路径,MIC密封不好会影响声源定位。

 

测试方法:

标准音箱距离待测设备0.5米,使用标准音箱播放播放白噪声,待测设备MIC阵列处声压级80dB,使用待测设备的MIC阵列接收信号。使用黑胶堵住某一MIC孔保持10s,然后逆时针顺序到下一个MIC,依次堵完后,待测设备采集到的音频使用音频软件查看各MIC物理密封前后的平均振幅,求差得到各MIC的密封性数值。

 

判定:

Ⅰ级标准:各MIC的密封性数值均在20dB以上为合格。合格结果如下表所示。

Ⅱ级标准:各MIC的密封性数值均在15dB以上为合格。

 

表2. MIC密封性

 

1#MIC

2#MIC

3#MIC

4#MIC

5#MIC

6#MIC

密封性

20dB

20dB

20dB

20dB

20dB

20dB

 

5.2时延一致性

定义:

时延,指参考信号和MIC通道的时延差。时延稳定性即参考信号和MIC通道的时延差随时间变化保持稳定的能力。

 

测试目的:

判断MIC信号和参考信号之间测得信号的时间差是否随时间发生波动。

 

测试方法:

使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的delay_calc模块计算,得到MIC信号和参考信号的时延随时间变化的结果图。

 

判定:

Ⅰ级标准:chirp count的纵坐标单位为1/16000s,判定标准为chirp count的20个点稳定在同一个值,且该值范围在(0~512),且上下间波动最大不超过1个点认为合格。时延稳定合格如图2示例。

Ⅱ级标准: chirp count的20个点稳定在同一个值,且该值范围在(0~1000),且上下间波动最大不超过1个点认为合格。

远场语音交互硬件声学性能测试标准_第2张图片

 

图2.时延稳定性测试结果

 

 

5.3回声消除

定义:

回声消除定义:待测设备在播放声音时,通过声学回路又被自身麦克风采集到的信号,在接收信号中减去该信号称为回声消除(Acoustic Echo Cancellation),标识为AEC。

ERLE定义:回声返回损耗增益值(Echo Return Loss Enhancement)简称 ERLE,反映的是原回声信号与剩余回声残差的比值,单位为dB。

 

测试目的:

测试MIC阵列消除自身设备扬声器输出信号的能力。

 

测试方法:

在待测设备100%音量和50%音量下,使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的aec_calc模块计算,得到AEC性能图。

 

判定标准:

Ⅰ级标准:要求100%音量下所有MIC的ERLE数值大于23dB,50%音量下所有MIC的ERLE数值大于20dB为合格。合格结果如图3示例。

Ⅱ级标准:要求100%音量下所有MIC的ERLE数值大于18dB,50%音量下所有MIC的ERLE数值大于16dB。

远场语音交互硬件声学性能测试标准_第3张图片

 

图3. 100%音量下ERLE性能测试结果

 

 

远场语音交互硬件声学性能测试标准_第4张图片

 

图4. 信噪比测试结果

 

 

 

5.4MIC相干一致性

定义:

衡量两个变量之间的相关程度叫做相干性(Coherence)。在该项测试中,相干性衡量的是各MIC通道和REF通道之间的相关程度。

 

测试目的:

测试MIC信号和REF信号之间的相关程度,相关程度越小,说明MIC信号失真越大,噪音越多,AEC越差。

 

测试方法:

在100%音量下,使用待测设备播放使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的coherence_calc模块计算,得到不同音量下各MIC通道相对REF通道的相干性曲线。

 

判定:

Ⅰ级标准:200Hz~1000Hz范围内相干性值大于0.3,且各MIC通道间同频率值对应的的相干性差值不大于0.1。相干性测试合格结果如图5示例。

Ⅱ级标准:200Hz~1000Hz范围内各MIC通道间同频率值对应的的相干性差值不大于0.6。

远场语音交互硬件声学性能测试标准_第5张图片

 

图5. 100%音量下相干性测试结果

 

 

5.5声源定位同步性

定义:

声源定位同步性本质即MIC信号间的同步性,指各MIC之间接收信号的时间差随时间变化的稳定性。

 

测试目的:

测试MIC阵列不同MIC之间接收同一信号的时间差是否稳定。

 

测试方法:

声源距离待测设备距离1m,线阵MIC和声源的角度需测0°和45°两个角度,环阵需测两个角度,两个角度间隔90°。使用标准音箱播放“chirp+60s白噪”信号(文件名《同步_频响测试音频.wav》),使用待测设备的MIC阵列接收信号,录到的音频使用《ANST远场语音交互硬件测试软件V1.0》step1分析,得到MIC同步性结果图。

 

判定:

Ⅰ级标准:环型MIC阵列的定位声源角度(Angle)随时间波动≤±5°,测得两个角度的角度差90°±15°,合格结果如图2示例;线型MIC阵列定位声源角度(Angle)随时间波动≤±5°,测试声源角度和实际声源摆放角度差值小于10°。

Ⅱ级标准:环型MIC阵列的定位声源角度(Angle)随时间波动≤±10°,测得两个角度的角度差90°±20°;线型MIC阵列定位声源角度(Angle)随时间波动≤±10°,测试声源角度和实际声源摆放角度差值小于15°。

远场语音交互硬件声学性能测试标准_第6张图片

 

图6. 环型MIC阵列同步性测试结果

5.6信噪比

定义:

音源产生最大不失真声音信号强度与同时发出噪音强度之间的比率称为信号噪声比(signal-noise ratio),标识为SNR,单位为dB。

 

测试目的:

设备的信噪比越高表明它产生的噪声越少。信噪比越大,信号对算法的影响越小。

 

测试方法:

使用高保真音箱播放“ANST测试音频.wav”,距离待测设备1米距离,待测设备MIC处声压级94dBA。MIC阵列平面与高保真音箱喇叭平面平行,使每个mic到喇叭的距离相等。使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的SNR_calc模块计算,得到MIC通道和REF通道的信噪比性能图。

 

判定:

Ⅰ级标准:各MIC通道信噪比均大于50dB,MIC灵敏度大于-25dBFS。合格结果如图7示例。

Ⅱ级标准:各MIC通道信噪比均大于35dB,MIC灵敏度大于-32dBFS。

远场语音交互硬件声学性能测试标准_第7张图片

 

图7. 信噪比测试结果

远场语音交互硬件声学性能测试标准_第8张图片

 

图8. 底噪和灵敏度测试结果

 

 

5.7回采预处理(参考)

定义:

传递函数是指零初始条件下线性系统响应(即输出)量的拉普拉斯变换(或z变换)与激励(即输入)量的拉普拉斯变换之比。记作G(s)=Y(s)/U(s),其中Y(s)、U(s)分别为输出量和输入量的拉普拉斯变换。理论上,传递函数是由系统的本质特性确定的,与输入量无关。

 

测试目的:

测试音频信号是否经过DRC(动态范围压缩)处理。

 

测试方法:

在100%音量下,使用待测设备播放使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的transferfunction_calc模块计算,得到不同音量下各MIC通道的传递函数曲线。

 

判定:

回采预处理特性为参考指标,仅用于帮助定位问题点。整机谐波失真测试如图5示例,上图为回采通道传递函数曲线,下图为MIC通道传递函数曲线。上图表示回采通道存在自动增益控制(AGC),会影响回声消除,需关闭该功能。

远场语音交互硬件声学性能测试标准_第9张图片

 

图6. 回采预处理测试结果

 

 

5.8通道频响一致性(参考)

定义:

待测设备任意MIC通道间的频率响应及谐波失真的相关程度为MIC通道一致性(MIC Consistency),标识为Consistency。在该项测试中,MIC通道一致性可以用频率响应曲线和谐波失真曲线两个指标来表征。

 

测试目的:

判断MIC阵列中任意MIC间的频率响应是否一致,该项会影响声源定位。

 

测试方法:

在100%音量下,使用待测设备播放使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的transferfunction_calc模块计算,得到不同音量下各MIC通道的一致性结果。

 

判定:

MIC通道一致性为参考指标,仅用于帮助定位问题点。MIC通道一致性测试如图6示例,上图为频率响应一致性,下图为谐波失真一致性。

远场语音交互硬件声学性能测试标准_第10张图片

 

图6. MIC通道一致性测试结果

 

 

5.9总谐波失真(参考)

定义:

输出电信号中谐波余量的有效值与谐波和基频的总的比值,为总谐波失真(Total Harmonic Distortion),标识为THD。在该项测试中,整机谐波失真分为MIC通道谐波失真和REF通道谐波失真。

 

测试目的:

谐波失真会影响AEC性能,失真越大,AEC性能越差。

 

测试方法:

分别在100%音量和50%音量下,使用待测设备播放使用待测设备播放“ANST测试音频.wav”,使用待测设备的MIC阵列接收信号,待测设备采集到的音频使用《ANST远场语音交互硬件测试软件V2.0》中的transferfunction_calc模块计算,得到不同音量下各MIC通道的谐波失真曲线。

 

判定:

整机谐波失真为参考指标,仅用于帮助定位问题点。理论上,谐波失真越小越好。整机谐波失真测试如图5示例,上图为REF通道谐波失真,下图为MIC通道谐波失真。

远场语音交互硬件声学性能测试标准_第11张图片

 

图6. 整机谐波失真测试结果

 

 

 


叶金生

Mobile:13823318060 

Company:深圳市谙声科技有限公司

Address:深圳市龙华区观澜桂月路302号新桂园工业园A3栋

 ANST   HTTP://www.audio-s.com

你可能感兴趣的:(远程语音交互及声学测试,人工智能,信号处理,语音识别,软件测试,深度学习)