声音是最早被数码化记录的物理量,但经过MP3时代之后,移动音频领域已经很久没有新的突破。公众和很多厂商对音频技术的都不太上心,早期连安卓系统本身都存在SRC采样率转换导致音质劣化的问题,各种问题导致移动设备的音频编码和解码能力,仅仅只能达到能用的水平。
但实际上,无论是VoLTE通话降噪、HiFi音乐、高清电影、移动录像/录音,还是面向未来的无线音频、语音唤醒/语音助手、VR/AR等需求,都迫切要求移动设备在音频技术上有重大突破。
移动音频的本质,概括起来就是声音录制和声音回放这两个功能。前者是把真实的声音转换为模拟信号后,由设备转换为电子化的数字信号;后者则是把视频/音乐文件中的数字信号,转化为扬声器/耳机等发声部件能使用的模拟信号。
一录一放,这两个我们已经习以为常的功能和过程,涉及到了声音的编码与解码,对应ADC(模拟转数字信号编码芯片)和DAC(数字装模拟信号解码芯片)。而音频使用过程还会涉及AMP(功率放大器)、DSP(数字信号处理器)、codec(编解码器)、耳放、运放等多种芯片和功能模块的配合。
移动音频技术:从野蛮发展到巨头发力
在手机/平板等移动领域,最核心的音频应用毫无疑问就是音频解码了。最早的移动设备在一颗codec芯片中,同时集成ADC(编码)、DAC(解码)、AMP和其他相关的音频模块,从而规避功耗和体积的限制。
要在一块小芯片完成这么多工作,还要控制功耗,其代价是编解码电路上的多种妥协。这个时期,移动音频的水准仅仅只能称作是“从无到有”而已。此外,早期安卓直接套用Linux系统的音频构架,存在大量的先天性音频性能、功耗问题,甚至连音频延迟和爆音问题都无法解决。当中的恶名昭著的例子,是SRC采样率转换算法,其强行让基于44.1khz采样率的音乐文件,非整数倍转换为转成视频数码格式常用的48khz,导致大量的音频细节损失。
在高速发展过程中,各路厂商开始针对安卓系统阵营的问题进行改进。SRC问题在系统层面的解决,以及vivo等部分手机厂商开始大规模地在手机中使用独立的DAC芯片,是这个阶段最大的里程碑。
ESS、AKM、Cirrus Logic这三大音频芯片厂和手机厂商定制的独立DAC产品大规模投入应用后,手机HiFi时代的序幕才缓缓拉开。vivo Xplay 3S、小米Note顶配版、魅族MX4 Pro搭载的ES9018K2M、努比亚Z9系列、vivo X6手上的AK4375、vivo Xshot、vivo X5系列搭载的CS4398,都是这个时期的著名产品。
独立DAC的最大好处,肯定是更好的供电和更优秀的解码电路构架,对音质的提升立竿见影,轻松逆袭苹果之外,中后期的产品甚至已经追上了入门机的音乐播放器。但代价也很明显,独立芯片和外围电路,无法避免地导致功耗提升,而额外的芯片布板和音频调试,对于很多厂商来说也是无法逾越的技术门槛。
为了平衡功耗问题,后期又出现了整合运放芯片的独立DAC,AKM的AK4376、ESS的ES9118都是这个思路的产品。但在这条路线最后还是败给了整体增强后的codec方案。codec芯片,特别是高通自家的Aqstic音频解码芯片系列,因为是和手机/平板最核心的SoC同厂设计配套,其在功耗之外,电路布板难度、调音等技术门槛、产品推广上,都有难以超越的优势。
在音频芯片上,高通早期把codec放在CPU,从APQ8064开始演化出WCD9310/9320等外置的codec,在骁龙820上又演化成高通Aqstic音频解码器。华为海思系列用的是自家的HI系列,联发科则是把codec放在电源管理芯片上。没有音频控制力的厂商,如苹果,则一直在用Cirrus Logic的定制codec,三星用的则是欧盛。而用早已退出移动领域的Nvida,则交由厂商自己搭配,用Cirrus Logic、瑞昱的都有。
但无论是传统如ESS、AKM、Cirrus Logic这三大音频芯片厂,还是联发科、华为海思这些SoC厂商,还是苹果三星这些手机厂。它们在音频技术的普及和推广上,都有各自的缺陷。要最终推动移动音频的整体发展,还是得靠最上游且移动芯片占比最高的高通。
高通Aqstic与aptX:巨头的低调耕耘
说起高通,大家第一印象很可能都是骁龙处理器和骁龙调制解调器,但这个几乎成为移动通讯代名词的厂商,同时也是最早投入音频领域的厂商之一。毕竟,在移动通讯的早起,传递声音才是手机最本质的功能。
围绕高通骁龙移动计算平台,后来的高通形成了一整套音频解决方案,包括高通Aqstic与aptX两个音频子系统。高通Aqstic技术负责有线部分(包括Aqstic音频编解码器与扬声放大器),aptX负责无线部分。
高通Aqstic最核心的是高通的WCD系列codec音频解码芯片和WSA系列扬声放大器。经过了几代的发展,这一代骁龙835中配套的WCD9341 codec,其部分客观参数指标已经具备与独立DAC一较高下的能力。
WCD9341包含了 DAC、ADC、运放等功能,在前代WCD9335的基础上,高通继续提升信噪比和采样率。其最高支持32位384kHz采样规格,同时支持音乐领域的44.1kHz和视频领域的48kHz两种采样规格,在DAC 模式下动态范围达到了 130dB,总谐波失真THD+N只有-109dB,其还史无前例地在codec中加入了原生支持 DSD硬解。
在表现升级的同时,其依旧维持了高性能模式下34mW、低功耗模式下6mW和语音换新仅需0.65mA的节能表现,这些都是独立DAC方案所无法企及的。
而在无线音频领域,aptX已经是个庞大的音频生态系统,全球包括430个品牌协议,330个许可方、20亿个编码器和7500万解码器。2015年,高通收购了在物联网、蓝牙通讯和音频处理芯片领域上有拥有领导地位的CSR公司后,发布了aptX、aptX HD和aptX Low Latency(低延迟)等多套解决方案,并把aptX整合到了骁龙的音频解决方案上。
aptX HD通过蓝牙传输24位音频,在4个接受子频带中使用额外的2个数据位来确保音频信号的精确,从而达到更高信噪比,减少失真,显著提升了蓝牙传输的音质水平。而低延迟版aptX则用于适应游戏、观看视频和VR等场合。
重点升级音频,但又远远不止音频
把MP3扔进历史垃圾桶的是手机,但在手机涵盖用户生活方方面面之后,用户的需求飞速增长,又对音频系统的提出了截然不同的要求。除了异构化计算的布局外,高通对移动音频需求的布局,同样因为用户需求的变化而变得多样化。
从最基础的语音通话,到音乐播放、移动影院、录像,再到次时代的语音交互和VR等场合,音频都是不可或缺,甚至是至关重要的部分。除了手机自带扬声器外放之外,有线耳机和近年来高速崛起的蓝牙耳机、音箱,都是移动音频的不同展现和配合方式。
高通最早的音频研究始于通话,即便时至今日,通话相关的音频优化还在继续,最开始的双麦克风降噪、后来的ANC自动降噪,现在的多麦克风降噪等技术相继被投入使用。高通在骁龙820时代开始引入Fluence HD和Fluence Pro降噪技术,可以进行回声消除和噪音抑制,即便手机横向或纵向免提时也能保证通话质量。其也让降噪技术也从被动进化到了主动降噪,主动抑止周围噪音并自动放大对话的人声,几乎所有通话中都直接使用该技术。
杜比、dts等主流音效的支持外,高通Aqstic的硬件素质,让视频播放时的虚拟环绕声、自定义音效、主动降噪成为可能。另外,在iOS平台刚刚才支持全天候语音唤醒的时候,高通Aqstic已经能把语音唤醒电流压低到0.65mA,让这一代安卓旗舰,可以保持灵敏度更高的全天候语音待命,而且功耗更低。
高通Aqstic甚至也可以用在摄像和VR领域,WCD9341录音时动态范围同样达到109dB,总谐波失真只有-103dB,24位192kHz的编码,可以录制5.1环绕声,在清晰度和信息量上提升巨大。配合多麦克风提供的降噪和远距离拾音,手机甚至能配合摄像头画面的拉近,对音频也进行变焦。
手机之外,最近Amazon Echo、Google Home等智能音箱大热,高通也终于出手,于今年6月推出了两个智能音频平台,以及面向高解析度音频设备的下一代DDFA音频放大器技术,彻底打乱了现时的智能音箱市场布局。
其搭载高通的Aqstic和aptX音频技术,支持蓝牙和WiFi传输,具备高度响应的语音激活与波束成形技术,提供多麦克风远场拾音、回音消除、噪声抑制和语音“打断”功能,在吵闹、嘈杂或者远离设备的环境中能提供更高的可用度。
在国内大力推展智能语音系统的百度DuerOS,也有与高通合作推出专门的SDK开发套件。配合高通的硬件平台,小型硬件企业可以节省大量研发、测试的时间和资金成本,专心搞自己擅长的部分。高通毕竟是上游的芯片供应商,无论是底层的开放程度、OEM厂商门槛,还是第三方音频解决方案的支持度,都有具有巨大竞争优势的重要原因。
总结
声与画,是我们和数码世界交流的主要途径,也是VR、AR等次时代的沉浸式体验的核心。手机HiFi、视频回放、高清录音这些领域自不必说,在VR/AR/MR中,逼真的真实模拟少不了环绕式有层次和距离的声音表现。
而作为未来最被看好的交互方式之一的语音交互,就更需要高通Aqstic这样的音频技术,即便是简单如“Hi Google”这样的语音唤醒,也需要远场适应、降噪等多种工作的配合。
音频技术的重要性怎么突出都不为过,从最基础的语音通话,到音乐播放、移动观影、移动录像,再到未来可能成为主流的语音交互、VR/AR/MR,都需要各自的音频技术支撑。但可惜的是,现在意识到并已经推出全套音频技术的芯片厂商,仅有高通一家。