导读:音频效果器一般是指某些通过改变声音信号来实现某些特殊效果的设备或者算法模块。随着直播、短视频等应用的爆发,娱乐应用中对音频效果器的需求也受到越来越多的关注。
文|陈耀斌
网易智企云信音视频开发专家
音频效果器一般是指某些通过改变声音信号来实现某些特殊效果的设备或者算法模块。常见音频效果器包括变速变调,混响,滤波均衡,调制,振幅/压限,延迟,方位调节,还有一些失真或者非线性类的特殊处理。随着直播、短视频等应用的爆发,娱乐应用中对音频效果器的需求也受到越来越多的关注。
网易云信音视频通话产品最新版本中集成了基于音频效果器的变声美声系列功能,便于娱乐社交用户开发相关应用。下面我们就来简要介绍这些音效功能。
音频效果器进化过程
音频效果器作为专业人士使用的工具历史悠久,多数时间内都只被小范围人群接触。得益于数字处理能力的提升和个人计算设备算力的提高,历史上需要专门硬件或者大型处理设备进行的数字音频处理模块逐渐被通用平台上运行的数字音效处理模块替代。
以混响为例,早期曾经使用混响室录音实现混响效果,其后也曾经出现机械式和模拟/数字电路式。目前常见的软件内集成混响模块的形式出现时间很短。我们常见的混响功能是以下软件界面:
Audition中的房间混响界面
但是历史上他们曾经是这样:
诞生于1957年的第一台平板混响器
也曾经是这样:
一台带混响功能的数字调音台
随着科技的不断进步,体积庞大、价格昂贵并且功能单一的分立式效果器最终演变成单台个人计算设备上集成多个音频效果器并共同使用的形式,制作者可以方便的利用这些效果器尽情展示自己的能力。
常用音频效果器简介
音频效果器的种类很多,同类效果器之中由于实现方法的不同,效果也有细微差别。常用的几个或者说几类效果器主要有均衡、混响、压限、时间拉伸等,下面进行简要介绍。
1. 均衡
均衡器的表现看起来很简单,简要描述就是调整需要调整频带的增益。均衡器的应用场合很多,比如房间声学缺陷调整,设备频响补足,录音中的人声瑕疵修饰,声音美化,播放时候的听感偏好增强等,往往会和其它效果器一起使用。
常见均衡器从实现方式上来说,可以分为频域实现和时域实现。一般频域实现有FFT均衡器,时域可按滤波器类型分为IIR和FIR型,主要差别在于对相位的影响不一样,IIR型的均衡器一般用在音频处理的后级。
软件中的图示均衡器界面
上图所示均衡器的使用和效果非常直观,在频谱所对应的位置直接拖动滑块即可,滑块位置即为均衡器调整指示。
三段式图示均衡器示意图
上图即为一个最简单的图示均衡器的基本架构,增加更多的中间频段控制即可获得更加精细的处理效果,常见的除图中的三段式均衡器外,还有10段,20段,30段等。
2. 混响
混响是一种物理现象,房间中从声源发出的声波能量,在传播过程中由于不断被壁面吸收而逐渐衰减。声波在各方向来回反射,而又逐渐衰减的现象称为室内混响。混响器通过使用技术手段模拟真实世界中的混响效果。
这里要提一下回声这个词。混响和回声是两个极为相似的现象。时间上反射声和直达声连在一起无法分开是混响,可以明显听出来间断是回声。
混响和回声的区别
混响效果的数字实现方式比较多,一般有卷积法、镜像法、射线追踪法、滤波器法等。音频效果器中常用滤波器法,偶见卷积法。镜像法和射线追踪法等多见于理论研究中的声场模拟。
一些传统音频巨头如Sony等都出过采样混响,所谓采样混响全部是真实采样得来的wave文件,可以存放与任何存储器,采样混响的IR都是录音采样得来。在想要获得混响特征的地方,例如小礼堂、音乐厅舞台上安置音箱,座位席中安置立体声话筒,然后播放一系列测试信号,以脉冲信号为主,各种速度的全频段正弦波连续扫描为辅,录得声音,然后经过计算得到IR。用这种采样方法得到的IR,是最真实也是效果最好的一种,对应的缺点就是成本高和灵活性差。
目前常见的数字混响效果器以及软件混响以滤波器类型较多。这类混响器虽然不是来自真实场景,优点是却可以通过改变各种参数来修改脉冲响应,灵活的控制混响效果。Feedback Delay Network (FDN) 混响器也是近年来比较流行的一种结构。
以下是几种经典混响器结构
Schroeder型混响器
Moorer型混响器结构
FeedbackDelay Network (FDN) 混响器
3. 时间尺度变换效果
常见的时间尺度变换算法包括两大类,分别是基于OLA类算法和Phase Vocoder,也有文献提及结合时域和频域特性进行处理,但是没有在产品中确认有成熟应用。从OLA(Overlap and Add)的名字上就可以看出是一类基于时域的算法,这一类中包括SOLA, SOLA-FS, TD-PSOLA, WSOLA等一大堆改进型算法,主要是利用语音的短时平稳特性,在时间域上直接改变某一段时间内声音的长度并保持较好听感的方法。
Phase Vocoder则是在频域上对各个频率成分分别进行插值,从而改变整体时间长度的算法,对瞬态声音处理能力较弱。
时间尺度变换和重采样结合可以较容易的实现变调,并以此为基础,进一步结合其它模块实现各种变声算法。
4. 压限器
压限器是压缩与限制器的简称,它是一种幅度处理算法模块。很多压限器会包括压缩器、限制器、噪声门、放大等单一模块。压缩器的处理可以理解为对超过某一阈值范围的信号幅度进行压缩,限制器是压缩比例非常大的压缩器。噪声门可以对某一阈值以下的声音进行压制。
压限器的听感等。在一些情况下会作为功能性模块使用,例如抑制过大声音,一些情况下也会作为效果器,比如提高整体能量平均值,制作一些饱满的听感等。
网易云信中的音频效果器
网易云信音视频通话最新版本中包含了基于EQ、混响、时域尺度变换等一系列技术的变声美声模块,在最新版本中可以方便快捷的进行调用,受到用户的好评。我们后续还会继续增加新的音频效果,为用户提供更多好玩好用的功能。
作者介绍
陈耀斌,网易智企云信音视频开发专家。曾在松下电器研究开发(中国)有限公司,思科系统(中国)研究开发有限公司等企业从事音频算法研发。主要项目经历包括声传播特性研究,声场预测,广播级音频设备研发,声音分类,麦克风阵列,实时通话系统音频算法的研发和优化。