专访SpeakIn陈昊亮:用声纹识别为更多行业赋能

专访SpeakIn陈昊亮:用声纹识别为更多行业赋能_第1张图片


《新时代创业方法论 改革开放40年(1978-2018) 希鸥网采访广深创投圈40位创业者》 系列五


SpeakIn 创始人兼CEO:陈昊亮

2013年,陈昊亮在读研究生时参与到Google glass的一些人机交互项目,发现从巨大的PC屏幕,到手机这样的手持终端,再到google glass这种只有指甲盖大的屏幕,人机交互中机器屏幕能展示出来的信息越来越少。

而另一方面,身边出现了越来越多的智能设备,其中有些不适合输入数字密码,有些不适合触控,这些变化要求原本单一的登录方式变得更加多元化……在这种趋势下,SpeakIn创始人兼CEO陈昊亮看到了声纹的前景。

专访SpeakIn陈昊亮:用声纹识别为更多行业赋能_第2张图片

1、声纹识别是什么?

声纹识别(又称说话人识别)是从说话人发出的语音信号中提取声纹信息,并对说话人进行身份验证的生物识别技术。

人的发声器官实际上存在着大小、形态及功能上的差异,这些微小差异导致发声气流的改变,造成了音质、音色上的差别;成年后,人的声音可保持长期相对稳定不变,所以声纹具有唯一性和稳定性的特征,这是声纹得以成为人类生物信息ID的基础。语音是人最自然、最日常的沟通方式,我们随时随地都要说话,这让用Voice ID(声纹身份)登录智能设备成为一种非常符合人类行为习惯的操作方式。

和指纹、人脸、虹膜等其他生物识别方式相比,声纹识别有许多天然优势。

专访SpeakIn陈昊亮:用声纹识别为更多行业赋能_第3张图片

除表格中显示的外,语言作为人类沟通最自然的工具具有指令性。传统智能语音技术的瓶颈在于它不能区分说话人身份,也就是能识别命令内容,却不知道下命令的人是谁,因而也就无法提供针对性的个性化服务,实现真正意义的交互。语音场景下要解决身份识别的问题,需要基于声纹生物资讯ID的声纹识别技术支持,这让以声纹作为天然入口成为万物互联时代一个可见的爆点。

此外声纹还具备“内容变化”的特点。在身份识别过程中,与固定的指纹和只能做简单动作的人脸相比,语音具有内容变化,可以随机改变朗读内容,所以即便在网上或其他地方留下的声音资讯,也难以被复制和盗用,因此声纹识别的防攻击性更高,更加安全。

相较于人脸识别需要摄像头,声纹识别只需要麦克风,后者的造价和安装成本也低很多,对于商务来说更容易使用,也就更方便推广和使用。

不过,每一种生物资讯ID都有其优势和劣势,适用于不同的场景。所以可以预见未来会是多生物识别手段融合的趋势,尤其在涉及隐私、支付等安全场景时提升安全系数,避免不必要的潜在风险。

2、声纹识别的应用

从发展历史上讲,声纹并不是一个新概念,但由于技术原因,声纹在早期只被当做Password(密码)来使用,而不能成为ID,成为ID的条件是在大规模数据下具有稳定的唯一性。

过去做声纹的方式都是数字信号处理,而现在是机器学习和DNN(深度神经网络),这是一个划时代的改变,也让声纹成为ID得以实现。所以陈昊亮及其团队现在就专注于声纹这个领域。

自成立以来,SpeakIn一直以声纹识别为落脚点,结合不同产业原生的产品和服务,为不同行业提供声纹识别和身份安全的解决方案。目前SpeakIn的核心业务主要有两个领域:国家安全和物联网。

在国家安全领域,根据中国互联网络信息中心发布的《中国互联网络发展状况统计报告》,截至2017年6月,中国网民规模达到7.51亿,中国真正进入了全民互联的时代。伴随这一趋势,近几年物理世界里的犯罪呈下降趋势,但是虚拟空间犯罪在上升。声音作为人类最自然的沟通方式成为了侦破、反恐、反电信诈骗、重点人员监管、身份查询与核验等的突破口。

声纹识别因此成为公安和司法机关打击犯罪、维护社会治安最有效的方法之一。凭借着全球领先的声纹识别技术,SpeakIn通过建立重点人员声纹数据库、声纹鉴定和声纹自动识别系统等协助执法人员进行重点管控人员监管、反电信诈骗、反恐、刑事案件侦破、身份查询与核验等等。

通过大规模的声纹检索以及动态的布控,有效的协助公安机关遏制和打击犯罪。比如,SpeakIn跟某省的公安厅合作,解决关于电信诈骗的问题。通过电信诈骗留下的声音证据,在抓到嫌疑人后帮助执法人员进行对比确认,提高刑侦的效率和准确率。

专访SpeakIn陈昊亮:用声纹识别为更多行业赋能_第4张图片

在物联网领域,从人机交互的发展来看,从电脑的大屏,到智能手表的小屏,再到没有屏幕的智能音箱,语音操作成为人机交互最自然的趋势。

要让机器更懂人,最优地链接人和信息服务,就需要在网络层面解决人作为自然个体而非数字ID的唯一登录与访问,声纹生物信息ID就成为最好的选择。在技术与人文的交叉口,AI更应该与人紧密结合,让人的操作和应用习惯返璞归真。

SpeakIn在智能硬件、车载和智能家居等领域与国际国内众多品牌广泛合作,探索“物物有声纹”。比如,SpeakIn为腾讯Qrobot小Q机器人第二代提供了声纹识别方案,强化了小Q的应用场景,帮助它可以准确识别用户身份并提供个性化的服务,做到“闻声识人”。

专访SpeakIn陈昊亮:用声纹识别为更多行业赋能_第5张图片

除此之外,SpeakIn在社保、金融、电信等领域也做了很多探索和尝试,用声纹识别技术为更多行业赋能。

3、声纹识别的未来

得益于近几年机器学习和深度神经网络(DNN)的发展,声纹识别技术也逐步成熟,从工业化领域走进了民用视野,成为进行身份识别和保障身份安全的“黑科技”。

在技术层面,声纹识别的准确率是声纹识别最重要的指标之一,SpeakIn在过去的两年中深耕大规模工业级的声纹识别系统,使用目前学术界最前沿、基于深度学习(Deep Learning)的iVector技术,实现了短自有文本和短数字的高识别率和高抗干扰性(如噪音等),同时极大的提高了声纹提取和验证的速度,准确率远高于行业平均水平。

在产业落地方面,SpeakIn通过产业研发和技术创新打造出一系列具有大规模、开放性、1:N场景下应用的复杂产品。针对公安和司法机构专属定制的“搏音”声纹综合作战平台和动态布控系统全面涵盖布控、预警、破案、追逃等核心安防应用场景,目前已在实际应用中为公安和司法部门服务,帮助打击犯罪,保护人民人身和财产安全。

同时,SpeakIn在智能硬件、车载和智能家居等领域加强与国内外品牌的合作用声纹识别赋能更多产业用声纹生物信息ID解决人作为自然个体而非数字ID的唯一登录与访问,最优地链接人和信息,让机器更懂人,实现“物物有声纹”。

陈昊亮认为,PC时代,网页/WebIP是基础节点,搜索与链接服务都是围绕这个静态的节点,去搭建基础的网络拓扑关系;Mobile时代,人的元素在网络上被加强了。人以APP为载体,以大量且不同数字ID出现在网络上代表自己,与同样在网络上的信息与服务构成了复杂的无中心多层次的网络拓扑关系。

这个时候,人的需求与偏好也是被这个多层的网络拓扑关系所割裂开。而如今,我们正在进入以人为本的时代,网络世界与物理世界将会高度融合,返璞归真回归到最符合人自然行为习惯的本质。

随着各个领域对声纹识别技术的需求都在增强,SpeakIn通过深入发掘专业细分市场的特点和垂直领域的场景,为客户量身定制身声纹识别和身份安全的解决方案,在商业化的道路上真正做到与行业深度结合,为客户带来最大的价值。


专访SpeakIn陈昊亮:用声纹识别为更多行业赋能_第6张图片

点击图片,查看区块链培训活动详情


MORE | 更多精彩文章


吉影科技黄俊平:水下机器人,继无人机之后的一片新蓝海


众库创始人邓翔:科技驱动新零售,“星星之火,可以燎原”


从区块链媒体的井喷看到的:草根创业者的新创业机会惨遭屠杀


创业维艰你们还去出轨,这锅创业者该背吗?


腾讯创始人曾李青朋友圈怼贾跃亭,马化腾点赞秦朔吐口水......





本文为希鸥网原创内容。希鸥网是国内领先的社群驱动型创业媒体,平台拥有15万创业者粉丝和12000名会员。了解希鸥会,入会联系微信:heisceo专访SpeakIn陈昊亮:用声纹识别为更多行业赋能_第7张图片

你可能感兴趣的:(专访SpeakIn陈昊亮:用声纹识别为更多行业赋能)