小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow

11月22日,IEEE 公布了2023年 Fellow 名单,小米集团语音首席科学家 Daniel Povey 凭借在语音识别和声学建模方面的杰出贡献成功入选!

小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow_第1张图片

IEEE(Institute of Electrical and Electronics Engineers,国际电气与电子工程师协会)于1963年成立,是致力于电气、电子、计算机工程与科学有关领域的开发和研究的国际学术组织。在电气及电子工程、计算机及控制技术领域中,IEEE发表的文献在全球占近1/3。在太空、计算机、电信、生物医学、电力及消费性电子产品等领域已制定了1300多个行业标准,在学界和业界具有巨大影响力。

IEEE Fellow 是 IEEE 授予成员的最高荣誉,每年由同行专家在做出突出贡献的会员中评选出,当选人数不超过IEEE会员总人数的0.1%。当选科学家需要对工程科学与技术进步或应用作出重大贡献,为社会带来重大价值,入选 IEEE Fellow 是技术界公认的崇高荣誉和职业成就。

Daniel Povey为何能获此殊荣?新一代Kaldi进行了哪些技术升级?这项技术的应用已经为我们每个人乃至整个行业带来了什么变化?这就带大家一起来了解一下

01 

Daniel Povey 

小米集团语音首席科学家

Kaldi之父、小米集团首席语音科学家 Daniel Povey

入选理由:在语音识别声学建模方面的贡献

Daniel Povey 是国际语音识别和AI领域的知名教授,语音识别开源工具 Kaldi 之父。博士毕业于剑桥大学,先后任职于美国 IBM 和微软公司,从事计算机语音识别的相关工作,后加入约翰斯 · 霍普金大学担任语言和语音处理中心副教授,于2019年加入小米,担任小米集团语音首席科学家。

Kaldi 是工业界和学术界著名的语音识别开源工具,Daniel 是 Kaldi 的主要开发者和维护者。Kaldi 集成了多种语音识别模型,包括隐马尔可夫和最新的深度学习神经网络,几乎所有的语音团队都曾或正在使用 Kaldi 引擎来开发智能解决方案,可以说,Kaldi 是业界语音识别框架的基石。

在学界,有关于介绍 Kaldi 的论文被引用6000多次,Daniel 的论文也被引用了36000多次;他还对语音识别做出了许多科学贡献,包括助力判别训练(现称序列训练)的早期发展等。

02 

新一代Kaldi

带来的技术成果

加入小米之后,Daniel 在原有的语音识别开源项目 Kaldi 基础之上,带领团队研发出新一代 Kaldi。目前包含核心算法库 k2、通用语音数据处理工具包 Lhotse、语音识别完整解决方案 Icefall 以及服务端引擎 Sherpa 四个子项目。

小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow_第2张图片

作为高效且实用的开源语音识别方案,新一代 Kaldi 在缩短训练时间提高识别率加速解码等方面取得可喜成果:

  • Daniel 提出的 pruned RNN-T 损失函数相比 Pytorch 中的实现不仅使用更少的显存,而且快了一个数量级;

  • 近期发布的 ZipFormer 模型取得了超过当前最好模型 Conformer 的识别率;

  • 新一代Kaldi 创新性地实现了基于GPU的Fsa解码方法,极大地提高了解码效率;

  • 新一代Kaldi 中提出的诸如低时延端到端模型训练方法、大模型蒸馏算法等,均受到社区开发者的广泛好评。

2021年8月30日,新一代 Kaldi 在语音识别国际顶级会议 Interspeech 上发布首个正式版本,自上线至今,在科技界和学术界已产生了重要影响。超过 12 篇在Interspeech、ICASSP等国际顶级会议上发表的论文使用新一代 Kaldi 进行实验或引用新一代 Kaldi。

在今年的中国国际数字博览会上,“新一代 Kaldi”项目凭借全自研的创新成果和突出的社会价值,荣获“数博会领先科技成果奖·新技术”奖项。另外,在 Magichub 重口音对话语音识别挑战赛上,新一代 Kaldi 凭借最低的CER(字符错误率)获得了一等奖。

小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow_第3张图片

03 

新一代 Kaldi

推动行业发展

新一代 Kaldi 也深刻地影响着整个行业,并使智能语音服务惠及更多普通老百姓。

一方面,新一代 Kaldi 能够显著降低语音识别技术的研发成本,提高识别准确率和解码效率,加速小爱同学的更新迭代。

另一方面,作为一项兼具“易用性”和“实用性”的开源项目,新一代 Kaldi 致力于帮助整个行业更加高效地构建AI语音系统,推动同类语音产品朝着更为智能的方向发展,为每一个人带来更加美好的语音识别产品体验。

小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow_第4张图片

再次祝贺 Daniel Povey 入选 IEEE 2023年新晋 Fellow!小米始终坚持“技术为本”,希望每个人都能够享受技术带来的美好生活。新一代 Kaldi 在语音识别上的技术突破,在不断优化用户体验的同时,也推动着智能语音服务触手可及。

小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow_第5张图片

小米集团语音首席科学家Daniel Povey入选2023 IEEE Fellow_第6张图片

你可能感兴趣的:(语音识别,人工智能)