一段声音的旅程(五)信号处理五大不安因素-腔体

作者 秋半仙,哼哼

各位童鞋们好,本半仙的分(xia)享(bibi)会又如期上线了~

上期我们分享了信号处理五大不安因素中的空间,今天继续聊聊五大刺头中的第三个——腔体(或ID,即工业设计)。

说到腔体,就不得不将它与它的姐妹花空间做个区分。上一篇聊到的空间指的是外部环境,而腔体则与设备的内部环境环境相关,即目标硬件产品的具体ID设计。这两大姐妹花一个主外一个主内,在为语音识别提供九九八十一难的道路上发光发热~

一段声音的旅程(五)信号处理五大不安因素-腔体_第1张图片
Δ 图片源自网络

咳咳,言归正传,让我们把聚光灯转回腔体身上。

我们先做个实验:把家里的电视音量调大一些,“收听者”在听“说话人”的声音。首先,收听者和电视保持一段距离,这时可以听清说话人的声音。然后收听者不断向电视靠近,这时会发现,说话人的声音会变得越来越难以听清,因为收听者离噪声源越来越近,噪声的干扰也会越来越大;同理,收听者越靠近说话人,就会越容易听见说话人的声音。具体如下图所示:

一段声音的旅程(五)信号处理五大不安因素-腔体_第2张图片

在设备中,采集声音的是麦克风,播放声音的是扬声器。上面的小实验告诉我们,麦克风和扬声器的相对位置,是会影响“听清楚”的效果的。而且,相对位置越近影响越大,反之越小。同理,原则上,麦克风与声源之间的距离,也会影响“听清楚”的效果,且麦克风离声源越近效果越好,越远则效果越差。我们一般把声源和麦克风之间的距离在“一米”以内的场景,称之为“近场场景”或“近讲场景”,大于“一米”的,称之为“远场场景”或“远讲场景”。注意这里的“一米”是一个参考值。比如打电话时手持电话贴近耳朵的场景被定义为近讲场景,而调戏Siri时即便人离手机不到一米也被定义为远讲场景。(不要问我为什么能秒想起调戏Siri的例子……)

一段声音的旅程(五)信号处理五大不安因素-腔体_第3张图片
Δ 图片源自网络

针对“近讲”和“远讲”的场景,有些语音公司可能会使用两种不同的识别模型来更好识别清楚。所以,建议童鞋们一定要在产品的初期,就要确立明确的场景定位(如果语音公司是一套识别模型打天下的,就忽略这个部分)。

原则上,场景定义为近讲,则一般使用单麦方案;若为远讲,则使用麦克风阵列方案。麦克风阵列是远距离语音交互的主要手段。

“半仙,那什么时候该选近讲,什么时候该选远讲呢?”

“哎,这位童鞋问到点子上啦!这个问题主要还是取决于设备本身,比如——”

1. 手机。一般手机使用的是近讲。(注意,现在有些手机定位自己是远讲,也在使用麦克风阵列方案,比如土豪的苹果爸爸,所以具体情况还要具体看的。还有,手机里用的前后麦克风的组合方式,目的是为了用后麦克风采集环境噪音,去帮助消除前麦克风采集音频里的背景音。本半仙在此处认为前后麦的使用场景依然是近讲)

2. 电视遥控器、智能后视镜、智能穿戴,一般使用的是近讲,还有一些低端音箱,要按下语音键才能用语音的,也会定义自己为近讲;

3. 汽车、IoT、音箱、机器人、电视(特指电视上的麦克风阵列)、机顶盒等等,一般都是远讲;现在大部分智能硬件都是远讲,像语音地铁买票之类的也属于远讲。

一段声音的旅程(五)信号处理五大不安因素-腔体_第4张图片

Δ 图片源自网络

说完近讲和远讲场景后,我们再来看看ID设计的问题。除了麦克风和扬声器的距离需要ID设计师多注意以外,设计师们还要注意麦克风摆放的位置。比如在音箱里,一般会建议麦克风放置在上方,方向朝上或者朝向人;扬声器放置在下方,扬声器的朝向避免向上,原理已经在上面的小实验中解释过了。

在上一篇关于空间的讨论中我们聊到了声音的反射。这里也会遇到一样的问题,也就是声音也可能在腔体内部反射到麦克风中。所以本半仙也建议童鞋们在做ID设计时能对麦克风做一定的密封处理,尽量减少扬声器的声音通过腔体内反射到麦克风中,从而给信号处理减减压~

Δ 图片源自网络

什么叫一定的密封处理呢?还有什么地方是不密封吗?仔细看看手机有麦克风的地方,发现没,是不是有一个圆形孔?为了能更好采集声音,在ID设计时,会为麦克风的地方,留一个圆形孔,不要小看这么一个小小空间,这里也有很多坑。

首先是麦克风的固定方式。如果麦克风固定不牢,在某些情况下,比如开车在颠簸的路边行驶时,麦克风就可能在设备里面晃荡。这个时候,你会发现采集的音频里会出现一些很奇怪的磕磕碰碰的声音。其它的零件之间也可能会发出一些金属碰撞摩擦的声音,是不是real 抓狂?而这些声音要处理掉也不太容易。

一段声音的旅程(五)信号处理五大不安因素-腔体_第5张图片
Δ 图片源自网络

其次是麦克风的封闭空间。如果封闭空间太大,就会导致麦克风的空间也出现了一个小腔体,这无疑又给采集声音挖了个大坑。

还有一些近讲情况时,比如用遥控器时,人会比较靠近麦克风说话,这个时候就会出现喷麦的现象(回忆一下唱K的时候),然后听众就会是介样的——

一段声音的旅程(五)信号处理五大不安因素-腔体_第6张图片
Δ 图片源自网络

秋半仙温馨建议:

对于这些问题,本半仙在此给一些个人建议。如果真的发生了,还是建议童鞋们和专业的童鞋沟通商议解决办法;

1. 麦克风尽可能接近腔体表面,如果可能的话直接做在腔体表面里也行;

2. 建议在麦克风和腔体壁之间,增加一些缓冲用的胶垫,可以避免麦克风晃动;

3. 如果想防止喷麦,可以考虑在麦克风孔中放一些海绵;

4. 注意要尽量避免麦克风和外壁之间形成一些小腔体,这这对信号处理是有一些影响的;

5. 特别注意,扬声器发声是会引发震动的,要做好减震的处理;

6. 特别特别特别提醒,除了要注意麦克风和扬声器之间的距离,还要注意麦克风与麦克风之间的距离。同时,麦克风阵列的麦克风是要固定在同一个水平面上的,这一点也是非常重要滴~

一段声音的旅程(五)信号处理五大不安因素-腔体_第7张图片

你可能感兴趣的:(一段声音的旅程(五)信号处理五大不安因素-腔体)