音视频知识-掩蔽效应

写在前面

如果大家对音视频相关知识感兴趣,可以订阅我的专题 视频播放器和音视频基础知识。

正文

掩蔽效应概念

所谓的掩蔽效应是指: 一个较弱的声音的听觉感受被另一个较强的声音影响的现象,我们就称之为人耳的“掩蔽效应”。“掩蔽效应”在实际声学应用中有很重要的作用。

我们假设安静的环境下,听清楚声音A的阈值为30dB,若此时又能同时听见声音B,这时由于B的影响,使得 A的阈值提高到了40dB,即比原来提高了10dB。此时,我们就称B为掩蔽声,A为被掩蔽声。被掩蔽声听阈提高的分贝数称为掩蔽量,即上述10dB为掩蔽量,40dB称为掩蔽阈。

掩蔽可分成频域掩蔽和时域掩蔽。

频域掩蔽

事实上,掩蔽效应并不仅仅是个音量问题,因为当掩蔽音与被掩蔽音的频率不相同的时候,掩蔽作用并不那么严重。但一个响亮的纯音很容易就把另一个频率更高的纯音给掩蔽掉。

一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽(simultaneous masking),如图1所示。

从图1中可以看到,声音频率在300 Hz附近、声强约为60 dB的声音掩蔽了声音频率在150 Hz附近、声强约为40 db的声音。又如,一个声强为60 dB、频率为1000 Hz的纯音,另外还有一个1100 Hz的纯音,前者比后者高18 dB,在这种情况下我们的耳朵就只能听到那个1000 Hz的强音。如果有一个1000 Hz的纯音和一个声强比它低18 dB的2000 Hz的纯音,那么我们的耳朵将会同时听到这两个声音。要想让2000 Hz的纯音也听不到,则需要把它降到比1000 Hz的纯音低45 dB。一般来说,弱纯音离强纯音越近就越容易被掩蔽。

!图1 声强为60 dB、频率为1000 Hz纯音的掩蔽效应

在图2中的一组曲线分别表示频率为250 Hz,1 kHz和4 kHz纯音的掩蔽效应,它们的声强均为60 dB。从图2中可以看到:

1)在250 Hz,1 kHz和4 kHz纯音附近,对其他纯音的掩蔽效果最明显。

2)低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显。

!图2 不同纯音的掩蔽效应曲线

由于声音频率与掩蔽曲线不是线性关系,为从感知上来统一度量声音频率,引入了“临界频带(critical band)”的概念。通常认为,在20 Hz到16 kHz范围内有24个临界频带,临界频带的单位叫Bark(巴克),

1 Bark = 一个临界频带的宽度

f(频率)< 500 Hz的情况下,1 Bark≈f/100

f(频率) > 500 Hz的情况下,1Bark≈9 + 4log(f/1000)

以上我们讨论了响度、音高和掩蔽效应,尤其是人的主观感觉。其中掩蔽效应尤为重要,它是心理声学模型的基础。

音视频知识-掩蔽效应_第1张图片

时域掩蔽

除了同时发出的声音之间有掩蔽现象之外,在时间上相邻的声音之间也有掩蔽现象,并且称为时域掩蔽。时域掩蔽又分为超前掩蔽(pre-masking)和滞后掩蔽(post-masking),如图3所示。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间。一般来说,超前掩蔽很短,只有大约5~20 ms,而滞后掩蔽可以持续50~200 ms。
!图3 时域掩蔽

除了频域掩蔽和时域掩蔽外,还存在一种被称之为“时间掩蔽”的效应。

同步掩蔽效应和不同频率声音的频率和相对音量有关,而时间掩蔽则仅仅和时间有关。
如果两个声音在时间上特别接近,我们在分辨它们的时候就会有困难。例如,如果一个很响的声音后面紧跟着一个很弱的声音,后一个声音就很难听到。但是如果在第一个声音停止后过一段时间再播放第二个声音,后一个声音就可以听到。对纯音一般来讲,这个间隔时间是5毫秒。当然如果在时序上反过来,效果是一样的。如果一个较低的声音出现在一个较高的声音之前,而且间隔很短,那个较低的声音我们也听不到。

掩蔽效应的应用

掩蔽效应是指人的耳朵只对最明显的声音反应敏感,而对于不敏感的声音,反应则较不为敏感。例如在声音的整个频率谱中,如果某一个频率段的声音比较强,则人就对其它频率段的声音不敏感了。

应用此原理,人们发明了mp3等压缩的数字音乐格式,在这些格式的文件里,只突出记录了人耳朵较为敏感的中频段声音,而对于较高和较低的频率的声音则简略记录,从而大大压缩了所需的存储空间。

MP3用户可以指定每一秒的音乐是用多少个bit来存储。而MP3编解码器只关心频率之间和音量之间的相互关系。

编码过程中,信号中的“无用分量”被拿来和人类心理声学的数学模型,以及压缩使用的比特率作比较,以决定要扔掉哪些数据。当前MP3压缩使用的比特率一般是128kbps。编码器在输出每一帧数据的时候都会考虑到这个数字,如果比特率比较低,那么“无关”和“冗余”数据的定义就会被放宽,导致大量的数据被认为是无用数据,此时压缩后的音频会丢失大量细节,导致音质下降。相反,如果使用较高的比特率编码,“无关”和“冗余”的标准就会被限定的更严格,细节会被保留,但是文件更大。

除此之外,听觉的掩蔽效应在电声领域也被广泛应用。如动态降噪,就是根据不同的节目对噪声的掩蔽不同的原理设计的。

掩蔽效应不仅是听觉生理现象,也是心理现象,“鸡尾酒效应”就是其中的一例。鸡尾酒效应是指当注意力十分集中时,或对比较熟悉的声音,人的听觉可以从相当严重的掩蔽噪声下,有选择地倾听想要听的声音。在许多人相聚的鸡尾酒会中,可以对特定人的的讲话听的最清楚,这在实际录音中也有很多的应用。

你可能感兴趣的:(音视频)