浅谈公安部声纹数据库的建设与应用

一、什么是声纹识别?

声纹识别,也叫做说话人识别,是一项根据语音波形中反映说话人生理和行为特征的语音参数,来识别语音说话者身份的技术。由于每个人的发声器官(舌、牙齿、喉头、肺、鼻腔)在尺寸和形态方面不尽相同,因此声纹也就成为一种鉴别说话人身份的识别手段。

浅谈公安部声纹数据库的建设与应用_第1张图片

二、声纹自动识别技术

目前声纹鉴定技术分为专家鉴定和自动识别两大领域。

专家鉴定方面,主要采用语音学分析方法,应用语音学及统计分析技术,通过语音工作站测量、分析说话人的语音声学特征(如声源特征、发音时的声道形状特征、发音时的口腔及双唇特征以及语音信号时变频谱特征等),然后采用统计判别方法对说话人语音是否同一作出判定。语音学分析法是目前国内外司法领域说话人普遍采用的方法,我国开展声纹鉴定的机构绝大多数均采用此方法。

声纹自动识别也称语音信号处理法,其基本原理是由系统对说话人语音的特征参数进行分离提取和线性或非线性处理,建立语音模型,然后由系统运算进行模式匹配,确定出与其最接近的若干已知说话人语音,得出相似度的结果,其结果是多选的。还可以进一步细分为说话人辨认( Speaker Identification)和说话人确认( Speaker Verification)

浅谈公安部声纹数据库的建设与应用_第2张图片

声纹特征的唯一性可以用来唯一确定一个用户的身份,是人体重要的生物特征之一。近年来随着互联网的发展,电信诈骗案件呈现井喷趋势,声纹特征在公共安全领域的应用价值日益凸显。

为了解决这些困难,公安部面向全国推广声纹技术,与指纹库、DNA库类似,声纹库建设是一项有着重要实战价值的工作,具体表现在声纹特征具有非接触式采集的优点,和已有DNA库、指纹库相结合,可形成立体生物特征库,建成后直接为多警种服务,是利用高科技手段在侦破案件和诉讼活动中应用的一个新的增长点,将能有效提高公安机关侦查破案的效率和能力,成为落实科技强警的重要实践之一,各地公安机关均在努力提升声纹信息的实战应用效能,加强公安机关声纹技术的应用工作,因此声纹数据库建设的工作,迫在眉睫。

三、声纹数据库的建设过程和应用场景

声纹数据库的建设过程和典型的应用场景为:首先,基于标准的声纹信息采集流程,对被采集人员的声纹进行采集入库,这中间涉及到标准声纹采集(通过标准声纹采集设备采集的语音)和非标准声纹采集(如微信语音、电信运营商通话语音等)。

当声纹数据库建设完成后,即可以基于声纹数据库做声纹识别1:1身份确认、声纹识别1:N嫌疑人排查、多场景跨通讯识别等应用,典型的应用模式是:当获得检材后,基于声纹检索技术,从声纹库中获得与检材声纹最相似的前若干候选(列表),将这些候选(列表)提交给鉴定专家进行进一步的声纹鉴定以确定目标人或为案件侦查提供重要线索。

浅谈公安部声纹数据库的建设与应用_第3张图片

四、声纹库建设需要注意的内容

(1)声纹采集设备的研制及标准的制定

首先必须确保入库声纹的质量。通过科学、系统的研究来制定针对自然人的声纹信息标准采集流程,研制声纹采集的标准设备,并建立可操作的声纹采集标准流程,形成公共安全行业标准,确保采集入库的每个声纹能够发挥应有的价值。

(2)高性能声纹检索引擎的研发

高性能声纹检索引擎是声纹库建设及价值发挥的核心。应用人工智能、大数据、云计算等新技术建设高精度声纹比对检索引擎,提供高质量、高效率的海量声纹快速检索、比对碰撞、综合研判等应用服务。

(3)两级联动声纹库管理系统的研制

声纹库管理系统是声纹库建设的重要工作,采取部、省两级架构进行建设,并作为刑侦信息专业应用系统的子系统接入。省级声纹库与部级声纹库通过公安专网完成数据接入,实现声纹数据的上报下发与业务联动。

浅谈公安部声纹数据库的建设与应用_第4张图片

(4)被采集人员声纹信息的采集选用

“公安部刑事技术产品质量监督检验中心”检测合格的采集设备,开展数据采集工作,并依据标准的规范接口上报声纹数据库,努力提升声纹数据入库规模,这是一项需长期持续的工作。

五、首批满足公安部《声纹采集终端要求》的声纹识别技术厂商

声纹数据库建设是集成了现代化声纹技术、信息技术和科学管理的公安业务基础性工作,能够为处置重大突发事件、侦破重大、疑难案件提供特殊而重要的技术支撑,是一项专业技术性强、应用领域广、建设难度大的系统工程。

因此,国家对声纹采集设备的要求非常高,需满足公安局发布的《声纹数据采集终端系统参数和项目要求》,包括功能要求、技术参数要求、验收要求、技术培训要求以及质量保修期和售后服务要求。

快商通成立于2009年,以声纹识别等智能生物识别、自然语言处理等人工智能技术为核心,投入声纹识别研发超过6年。以李海洲教授领衔的团队,包括来自声学所、新加坡国立大学、清华大学、厦门大学、剑桥大学等全球顶级名校的众多博士和硕士。

快商通是国家声纹识别和自然语言处理技术与应用标准化研究基地唯一承建单位,中国标准化研究院战略合作单位,公安部第一研究所战略合作单位。是国内声纹识别和自然语言处理技术的行业标准制定者。

(1) BioVoice 2.0 标准声纹采集设备

快商通推出的 BioVoice 2.0 标准声纹采集设备,是专门为公安应用场景研发的标准声纹采集设备,是首批通过公安部刑事技术产品质量监督检验中心检测的声纹采集终端。

浅谈公安部声纹数据库的建设与应用_第5张图片

BioVoice 2.0 采用智能化麦克风集群,支持单向/全向拾音、多种文本采集方式。配套集采集、多标签入库、分类存储、实时检索功能于一体智能化声纹采集系统,可连续性创建采集,批量入库,缩短多人采集入库时间成本,保证声纹信息采集内容的完整性和真实性,提高声纹采集的质量和效率。一次语音录入即可采集到符合公安机关声纹建库要求的高质量声纹数据,为声纹鉴定和比对提供坚实的基础。

图片

快商通 BioVoice 2.0 标准声纹采集设备满足公安部《声纹数据采集终端技术要求》,对接快商通智能声纹识别引擎、智能声纹鉴定专家工作站等,可以轻松实现声纹识别1:1身份确认、声纹识别1:N嫌疑人排查、声纹辨认等功能。同时可以进行实时比对和声纹鉴定。仅凭一通电话录音或微信语音即可快速确定嫌疑人和缩小侦查范围。

浅谈公安部声纹数据库的建设与应用_第6张图片

(2)“猎擎”声纹数据库系统

“猎擎”声纹数据库系统是一款对声纹数据进行储存、管理和应用的数据管理系统。可用于辖区声纹数据质量管理、重点人员声纹库建设、身份查询与核验、刑事案件侦破、反电信诈骗、声纹大数据分析等场景,助力公安有效遏制与打击犯罪,降低犯罪率,构建和强化安全的社会公众环境。

浅谈公安部声纹数据库的建设与应用_第7张图片

“猎擎”声纹数据库系统搭配的快商通自主研发的声纹识别引擎,荣获世界权威声纹大赛 NIST SRE 2018大中华区第一、全球第三的佳绩!声纹识别引擎提供1:N大库检索比对,支持千万库容建设,是目前市面上唯一支持亿级规模库实时检索比对的声纹识别系统,检索时间小于1s,声纹识别准确率超过99%,适应不同的语音检材类型,语音信息来源支持标准化采集、手机、网络软件、固定电话、录音笔等采集方式、或声音文件导入。在不同噪声环境、文本类型、跨信道等条件下算法性能稳定。

你可能感兴趣的:(声纹采集,声纹数据库,声纹识别)