在前不久的苹果 WWDC 2019 全球开发者大会,有一项更新可能很多人没太多关注,那就是 HomePod 加入了声纹识别功能,可以通过声纹识别特定的用户。
最近也有消息称 Siri 也将加入声纹识别,当你说出「Hey Siri」的时候,Siri 可以知道是不是主人在喊它。这或许并非只是传言,毕竟去年苹果就曾在技术博客上发文,披露了关于 Siri 的声纹识别技术细节。
声纹识别(Voiceprint Recognition),也叫做说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术。由于每个人的发声器官(舌、牙齿、喉头、肺、鼻腔)在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。
那么我们在经历从指纹识别到人脸识别后,声音是不是会成为新主流密码认证模式呢?虽然目前声纹识别还没在智能手机这样的消费级产品中普及,但其实在银行交易和国防安全等领域已经广泛应用。
据市场调查得知,国内平安集团、广大银行、华瑞银行、交通银行等多家银行目前都支持声纹识别,这些银行背后的技术服务商为老牌声纹识别厂家--快商通,基于快商通在声纹识别技术里的国际领先技术实力,目前在登录、支付、业务核身、信贷等银行场景中已有非常成熟的落地应用。
你可能没想到,最青睐这项新技术的人群居然是老年人。一些国外的银行表示老年的注册人数激增,因为声纹识别让他们不用记住密码,也降低了被欺诈的可能性。英国汉普郡一位退休音乐教师 Michael Wallis 曾经被骗子盗取账户信息后从账户里转账,银行建议他使用声纹识别技术, Michael 目前已经用声纹识别来进行了 100 多次交易和查询余额,他表示这让他更加放心。
其实声纹识别技术最早的大规模应用是在国防安全领域,据 The Intercept 报道,美国国家安全局(NSA)2006 年 1 月的机密备忘录显示,NSA 分析员通过一种「用声音识别人的技术」,在音频文件与电话监控中识别出一位间谍。
这里面所用到显然就是声纹识别技术,而且由于 NSA 的特殊地位,得以建立一个庞大的声纹库,进一步提高了识别效率,即使监控对象使用的是未知号码或者不同的语言,算法都可以与声纹库的数据匹配。
一家向军事和情报部门提供声纹识别技术的公司 Nuance 表示,他们可以建立一个全国范围内的生物声纹识别系统,能从数百万个声纹快速且准确地识别出一个人的声音。目前 Nuance 的声纹识别技术还应用到了银行交易、车遭语音助手等领域。
在国内,声纹识别技术目前在公安系统里的应用也非常广泛,主要有以下几个应用场景:
1.重点人员声纹采集和建库
建立重点人员声纹数据库,在110接警、重点区域范围、重大活动期间等,一旦发现重点人员、黑名单人员声纹信息,即进行预警,有效进行事前预防,目前行业做的比较好的有快商通、科大等,快商通的声纹采集器已通过公安部质量检测。
2.侦查破案
利用声纹识别技术海量筛查优势,进行“案查人”、“人查案”、“案查案”与“人查人”等多种排查方式,缩小侦查范围,提高办案效率。
3.反电信诈骗
利用声纹鉴定技术对电信诈骗等案件中的涉案语音进行个体、团伙的识别,确定犯罪嫌疑人身份,为侦查破案、案件诉讼提供技术支撑。
4.治安防控
利用“语种识别”、“内容识别”、“声纹特征识别”等声纹综合分析技术,对重点人员进行布控,一旦出现立即进行关注控制。
现在类似的声纹识别技术也被应用到更多消费级产品,最为常见的就是智能音箱,亚马逊的 Echo,苹果的 HomePod 和阿里的天猫精灵都已经支持,而且国人最常用的微信其实在 2015 年就推出了基于声纹识别技术的声音锁。
不过消费电子产品领域,大多数消费者对于声纹识别技术的接受度还不高。比如上线了 4 年微信声音锁,有不少用户吐槽识别率不高,而且安全性也有待提高。据新京报报道,乱读、读错或播放录音都有可能打开微信声音锁,随后微信方面也承认「确实存在一定的隐患」。
这也是声纹识别技术在消费级领域还不够成熟的一个体现,清华大学语音和语言技术中心主任郑方在接受媒体采访时表示:
目前在声纹识别这个领域,不同技术或产品提供商参差不齐、差异很大;与此同时,声纹识别不再是单一强调准确性,而是变得更为成熟、完备和可用。
如果声纹识别技术在智能手机和众多应用中普及,还可能引发更多关于隐私的问题。这意味 app 通过「偷听」我们的话来给我们进行个性化推荐有可能成为现实。
去年 Facebook 的一项新的专利就可以在远程激活手机的麦克风,从而对用户的对话和周围环境音进行录音,然后将数据传回 Facebook 进行分析。
尽管有许多问题需要解决,但不可否认声纹识别确实有着更广泛的应用前景。生物特征认证技术已经被认为将取代各种明文密码,而声纹比起其他声纹特征也有着特殊的优势,除了更加安全和方便,语音的采集和识别的成本也比面部识别要低,其实更加适合用于密码认证。
在声纹技术研发企业中,位于厦门的快商通,成立于2009年,以声纹识别等智能生物识别、自然语言处理等人工智能技术为核心,投入声纹识别研发超过6年。以李海洲教授领衔的团队,包括来自声学所、新加坡国立大学、清华大学、厦门大学、剑桥大学等全球顶级名校的众多博士和硕士。
产品生态矩阵涵盖针对公安系统的声纹标准采集终端、声纹数据库、声纹反欺诈系统、智能声纹鉴定专家工作站、声纹采集建库平台、社保远程资格综合认证平台、声纹识别引擎、仿真营销客服机器人、智能营销客服系统等等,先后参与了公安部牵头起草的《安全防范声纹识别应用程序接口规范》、《安全防范声纹识别应用网络语音样本技术要求》等多项声纹技术方面的国家标准,与中国标准化研究院合作建立了国内首个国家级“声纹识别技术标准化研究基地”与“自然语言处理技术应用标准化研究基地”。