浅谈声纹识别应用:声音被模仿,声音识别身份可靠吗?

继“刷脸”之后,声纹识别也已进入我们的生活。近日,快商通与交通银行、中国移动等签署了声纹合作项目,将在银行预防欺诈、提供优质服务方面和运营商不良信息治理上发挥作用。此前,市场监管总局、人民银行两部委发文,决定将支付技术产品认证扩展为金融科技产品认证,并确定了《金融科技产品认证目录(第一批)》,该认证目录中也包括声纹识别系统。

浅谈声纹识别应用:声音被模仿,声音识别身份可靠吗?_第1张图片

那么,什么是声纹?它会被模仿导致识别设备误判吗?

声纹是生物识别特征的一种,是在说话人发声时提取出来的,可以作为说话人的表征和标识,能与其他人相互区别的语音特征,以及基于这些特征或参数所建立的语音模型的总称。

声纹识别又称为说话人识别,是从说话人发出的声音频谱图中提取身份特征信息和声纹特征,再把声信号转换成电信号,用计算机通过相关算法进行比对识别的技术。

清华大学信息技术研究院教授郑方说,语音信号之所以被形容为“形简意丰”,是因为声音包含有内容、身份、情感、年龄及健康状况等丰富的信息。再加上人类语言的产生要经过人体语言中枢与发音器官间复杂的生理物理过程,理论上说,每个人说话时的短时频谱、声源、时序动态、韵律、语言学特征等都有差异。因此,声纹就像指纹一样具有唯一性和独特性。

与人脸、指纹和虹膜识别相比,声纹识别有着诸多优势,比如声纹语料收集方式自然,无须进行眨眼、摆动脸部等特定动作,不受光线或隐私等特定场景的约束,人们接受度更高;声纹识别可以随机改变朗读内容,即便曾在网上或其他地方留下语音信息,也不易被复制或盗用。同时,被识别人不需要近距离接触识别设备,声纹可以通过电话、APP等渠道传达语音到后台进行识别,并且可以在用户语音对话过程中自动完成识别,使用成本低而且方便快捷。

听起来相似不等于声纹相似 声纹识别准确率已超过99%

登录手机银行APP,开启声纹验证,用户只要准确说出随机动态码,系统录制语音信息、验证声纹及随机动态码后,就能进行转账、支付等交易……目前,声纹识别已经在部分银行开始使用了。

不过,生活中声音相似的人有很多,有些配音演员还可以模仿他人的声音,用声纹作为金融产品认证会不会很不安全?对此,快商通声纹专家解释说,总体来说,声纹是稳定的生物特征。除了人一生中的某些年龄段如少年变声期,声纹可能会有所变化,大多数情况下声纹特征是稳定的。

由于每个人在说话时使用的发声器官,如舌头、牙齿、口腔、声带、肺、鼻腔等在尺寸和形态方面有所差异,以及年龄、性格、语言习惯等多种原因,在发音时千姿百态,导致这些器官每个人发出的声音必然有着各自的特点。特别是,每个人在说话过程中所蕴含的个性特征,如发音习惯等几乎是独一无二的,就算被模仿,也改变不了说话者最本质的特性。

浅谈声纹识别应用:声音被模仿,声音识别身份可靠吗?_第2张图片

根据测算结果,公安部发布《GA/T 1179-2014安防声纹确认应用算法技术要求和测试方法》标准,声纹科技产品依据该标准进行数据采集。目前,用户如果按照事先指定的文本读出内容,声纹识别准确率已达99.8%;如不照读事先指定的文本内容而随意发声,声纹识别准确率也能达到99.1%。“虽然准确率不低,但还是存在误判的可能,在设计使用场景和流程时,需要考虑到声纹识别并非100%准确率的现实。”快商通声纹专家说,声纹作为金融产品的认证,需要看具体场景。对于辅助核实身份、名单识别、防欺诈、声纹锁登录等场景使用是合适的;但在大额支付类的场景中,如果将声纹作为唯一的认证手段,就需要充分评估风险。

目前,除了金融领域外,声纹正在进入公共安全领域。快商通面向公安领域推出的 BioVoice 2.0 标准声纹采集设备正是专门为标准声纹采集场景研发的声纹采集设备,采用智能化麦克风集群,支持单向/全向拾音、多种文本采集方式。配套集采集、多标签入库、分类存储、实时检索功能于一体智能化声纹采集系统,可连续性创建采集,批量入库,缩短多人采集入库时间成本,保证声纹信息采集内容的完整性和真实性,提高声纹采集的质量和效率。一次语音录入即可采集到符合公安机关声纹建库要求的高质量声纹数据,为声纹鉴定和比对提供坚实的基础。

浅谈声纹识别应用:声音被模仿,声音识别身份可靠吗?_第3张图片

   快商通标准声纹采集终端和智能声纹采集系统

快商通 BioVoice 2.0 标准声纹采集设备满足公安部《声纹数据采集终端技术要求》。对接快商通智能声纹识别引擎、智能声纹鉴定专家工作站等,可以轻松实现声纹识别1:1身份确认、声纹识别1:N嫌疑人排查、声纹辨认等功能。同时可以进行实时比对和声纹鉴定。仅凭一通电话录音或微信语音即可快速确定嫌疑人和缩小侦查范围。 

浅谈声纹识别应用:声音被模仿,声音识别身份可靠吗?_第4张图片

 快商通标准声纹采集终端优势功能

除了标准声纹采集设备,快商通同时研发了“猎擎”声纹数据库系统。这一款对声纹数据进行储存、管理和应用的数据管理系统。可用于辖区声纹数据质量管理、重点人员声纹库建设、身份查询与核验、刑事案件侦破、反电信诈骗、声纹大数据分析等场景,助力公安有效遏制与打击犯罪,降低犯罪率,构建和强化安全的社会公众环境。

浅谈声纹识别应用:声音被模仿,声音识别身份可靠吗?_第5张图片

快商通“猎擎”声纹数据库系统

 “猎擎”声纹数据库系统搭配快商通自主研发的声纹识别引擎,荣获世界权威声纹大赛 NIST SRE 2018大中华区第一、全球第三的佳绩!声纹识别引擎提供1:N大库检索比对,支持千万库容建设,是目前市面上唯一支持亿级规模库实时检索比对的声纹识别系统,检索时间小于1s,声纹识别准确率超过99%,适应不同的语音检材类型,语音信息来源支持标准化采集、手机、网络软件、固定电话、录音笔等采集方式、或声音文件导入。在不同噪声环境、文本类型、跨信道等条件下算法性能稳定。

你可能感兴趣的:(声纹采集,声纹数据库,声纹识别)