中国力量,又双叒夺冠了。
这一次,是在全球规模最大、最全面的语音顶会INTERSPEECH 2020上。
挑战比拼内容,则是当前语音研究领域最火热的议题之一——“声纹识别”。
最新公布成绩的SdSV声纹识别比赛中,网易AI Lab从众多国际顶级队伍中脱颖而出,获文本相关声纹识别赛道综合排名第一、单模型第一的双料冠军。
SdSV声纹识别比赛是业界权威性赛事,参赛队伍来自全球多所知名高校与企业,包括近两年全球各项声纹识别比赛中的“常胜将军”:布尔诺工业大学、新加坡通信研究院、约翰霍普金斯大学等。
能在与众多好手的较量中脱颖而出,网易AI着实秀了一把技术“肌肉”。
SdSV Challege 2020的主要目的,是评估在短时场景下针对文本相关(TD)和文本无关(TI)说话者验证(SV)的新技术。
今年,全球共有67支队伍注册参与挑战。
比赛中,网易 AI Lab基于常见的X-Vector和PLDA算法,创新地提出了一种ASR-free的文本相关声纹识别算法。
相比传统的Deep Speaker Embedding方法,该算法不需要依赖语音识别,就能够在多语言环境下,同时完成说话人和文本内容的验证。
比赛采用MinDCF(最小检测代价)和EER(等错误率)作为评测指标。
网易AI Lab的单模型在两个指标均为最佳,其中EER达到了1.67%,相比第二名降低了11.6%,并远低于比赛 X-Vector基线系统(EER=9.05%)。
这样的好成绩,对于网易AI Lab来说,并不是福至心灵的运气,而是确有长期的技术积累。
声纹识别是生物识别技术的一种,也称为说话人识别,是一种通过声音判别说话人身份的技术。
目前,人工智能主要有三个研究方向:视觉识别、智能语音、NLP自然语言处理。
其中,在语音研究领域,声纹识别属于相对蓝海市场,解决的主要是“我是我”的身份认证问题,多应用在安全验证场景。
从近几年的市场趋势来看,银行,金融服务,保险已成为声纹识别应用的领导领域。
可以说,随着技术的不断成熟和融合,声纹识别技术正在逐渐融入日常生活,像指纹识别、面部识别一样成为人人触手可及的AI技术。应用潜力巨大。
而成立于2017年的网易 AI Lab,早已将声纹识别技术运用到了游戏场景中。
除了进行游戏身份验证,还能够针对音色对用户进行分类、丰富玩家画像,从而更加精准地为玩家推荐志趣相投的好友、匹配实力相当的对手,为玩家带来更好的游戏体验。
目前,网易AI Lab在杭州、广州、上海均设有分部,主要运用AI黑科技为旗下各大游戏工作室助力,并赋能给更多产品。
总的来说,网易AI Lab的研究方向包括三大方面:
计算机视觉和图形学研究
语音语言处理研究
游戏AI研究
当前,已有不少研发技术处于行业领先地位,并接入了多款游戏。
在前不久刚刚落幕的2020世界人工智能大会上,网易CEO丁磊曾表示,人工智能选对了应用场景,发挥的效率就会非常高。
而新鲜摘下的冠军果实,也彰显了网易AI的技术能力。
网易AI,未来可期。
— 完 —
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
报名 | 智慧生活行业私享会
欢迎报名,与峰瑞资本、石头科技、网易有道、思必驰、九号机器人、视感科技、云丁科技等企业高管,共同探讨如何借力资本市场、把握行业趋势,打造全场景智慧生活:
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !