如何在嘈杂的环境中(类如厨房/客厅/健身房的环境中)获取干净的人声,是智能设备做语音交互和语音通话必须要解决的问题。然而在现实生活中,嘈杂的环境中,有多种噪声的存在,也阻碍了智能设备有效地获取人声:这些噪声包含了:
•设备自身播放的声音,如电视/机顶盒/Sound bar等智能设备正在播放音乐
•环境中的稳态和非稳态的,发散的噪声,如风扇/空调等环境基础噪声
•环境空间内的点噪声,如固定在某个位置的电视发出的声音等噪声
一个高性能的语音接口在这种设备中,就显得尤为重要。P3610-2MIC 除了解决噪声问题,可同时提供远距离拾音和语音打断(Barge-in)。
这样的前端语音接口便可输出干净且有效的人声进行语音交互(ASR)和会议通话(Communication)。
在智能设备中, P3610-2MIC 作为高性价比的语音接口设备,可以非常快速地应用到语音交互(ASR)和语音通话(Communication)使用;尤其它专门优化了SR的前端处理,极大提高了语音打断和语音识别的性能。非常适合应用于智能音响,智能电视,机顶盒以及智能网关中。
P3610-2MIC 是两麦阵列高性价的方案,其内置了2-Mic 阵列算法和复杂的 DSP 算法处理,能够在远处和嘈杂的环境,清晰地获取到有效的人声语音信号。
P3610-2MIC 语音接口方案的主控为 XVF3610-QF60B-C,且已经过了Amazon的AVS认证,其为单芯片解决方案,外接2个PDM麦克风即可实现2-mic阵列的前端声音信号处理。本方案重点能够同时处理两种方向的前端处理信号,分别为用于语音识别和用于会议通话,是市面上为数不多的语言接口方案。
为了能够在复杂恶劣的声学环境中捕捉语音信号,P3610-2MIC集成了三种降噪算法,能够最大程度的降低设备自身的声音与环境噪声,提供高质量的语音输入。
● AEC回音消除:消除设备自身的播放的声音,以实现能够语音打断和提高SNR
● IC噪声源消除:扫描设备所在的空间内的声音情况并且消除房间所有的点噪声
● NS噪声抑制:去除所有的背景(包含发散的和反射的)噪声
P3610-2MIC 提供了两种语音信号输出,能够同时对于ASR和通话两种场景实现不同的语音处理, 并且USB Type-C 接口快速应用到各个智能终端设备中。
● ASR语音识别:在复杂噪声环境中,提升人声信噪比,以提高识别率
● Comms会议通话:对背景声和噪声抑制更大,频谱较为干净,以提高人声的清晰度(相对ASR输出有较大的失真,不建议做语音识别用)
● ADEC算法能够实时调整AEC参考信号延时,可灵活移动喇叭扬声器的位置
易于集成
P3610尺寸非常小巧,能够快速地嵌入soundbar,视频会议摄像机等设备。并且在结构上为客户预留了麦克风的密封垫。
● 预留了固定孔位,方便用户固定开发板,快速开发结构;
● 预留了MEMS麦克风旁的空间,方便用户做声学屏蔽,提高麦克风的密封性;
● 提供了2ch 立体声3.5mm音频模拟输出,便于接入外置扬声器;
● 48kHz/16kHz
• 以PCM音频格式实时地传输输入输出音频信号
• 支持48kHz/16kHz的音频采样率以及24bit位深
• 通过不同的固件实现(USBDFU可更新固件)
● 尺寸大小
• 尺寸:90mm x 18mm x 6mm(最高处)
• 麦克风:底部拾音,间距 71 mm,孔径1mm
● DSP能力
• XMOS XVF3610主控,2400 MIPS速度,高性能运行AEC, IC, NS, AGC和ADC等多种DSP算法,同时提供两种高质量的语音输出
• 全平台免驱动运行,实现~70ms低延时传输
● 音频接口
• USB Type-C接口5V(电流Max 143mA)供电以及UAC1.0 音频传输
• 3.5 mm 耳机座进行Stereo Line-out (2V rms) 模拟播放
从上到下依次为:
• 机顶盒(Set up box)
• 智能网关(Gate way)
• 智能电视(Smart TV)
P3610-2MIC 双麦阵列板可针对个人/企业应用,非常适合用于语音识别的相关应用,例如智能音响,智能电视,以及soundbar,家庭中控台等。
木瓜电子将可为用户提供售前和售后的技术服务,了解更多可登录:www.pawpaw.cn ;也可登录木瓜技术网站:docs.pawpaw.ltd 查询相关资料。