了解《语音识别》必看的6篇论文【附打包下载地址】

论文推荐

“ 《SFFAI 78期-语音识别专题》来自中科院自动化研究所的田正坤同学推荐的文章主要关注于语音识别领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。

关注文章公众号

回复"SFFAI78"获取本主题精选论文

01

了解《语音识别》必看的6篇论文【附打包下载地址】_第1张图片

推荐理由:本文介绍单调注意力机制,通过限制注意力机制的单调性,实现了语音识别的流式解码。

—— 田正坤

02

推荐理由:本文的思路与百度SMLTA相似,利用CTC的尖峰对编码序列进行切分,在切分块上计算注意力机制来实现流式解码。

—— 田正坤

03

了解《语音识别》必看的6篇论文【附打包下载地址】_第2张图片

推荐理由:本文是信息累积的思路。通过判断是否达到触发的阈值,如果达到阈值则在当前位置进行切分,如果没有达到阈值,则记录当前位置所包含的信息量,然后跳转到下一时刻并重复上述计算。

—— 田正坤

04

了解《语音识别》必看的6篇论文【附打包下载地址】_第3张图片

推荐理由:本文通过逐块解码的方式来实现流式解码,将编码序列切分为等长的块,在块内进行注意力的计算,如果预测得到空格标记则表示当前块解码完成,并跳转到下一个块,重复上述计算直到最后一个块解码结束。

—— 田正坤

05

了解《语音识别》必看的6篇论文【附打包下载地址】_第4张图片

推荐理由:本文最先将非递归网络引入语音识别任务,并提出了使用两种非递归网络的解码思路。

—— 田正坤

06

了解《语音识别》必看的6篇论文【附打包下载地址】_第5张图片

推荐理由:本文将CTC模型引入非递归网络的计算中,使用CTC的尖峰来预测目标序列的长度,并辅助模型收敛。

—— 田正坤

参会须知

会议主题

语音识别专题

会议简介

语音识别作为人机互动的重要接口,长期受到学界和业界的关注。从隐马尔可夫模型,到深度神经网络,再到端到端技术的兴起;从对准确率的竞争,再到用户体验的关注,语音识别的能力正在被逐步提升并实际应用。本期论坛我们邀请到了来自中科院自动化研究所的田正坤同学,对流式端到端技术和非自回归模型进行综述。

会议时间

2020年9月6日(周日)

20:00 -- 21:00

报名方式

公众号二维码

请同学们扫码关注本公众号,对话框回复“SFFAI78”,获取入群二维码。

SFFAI的介绍

现代科学技术高度社会化,在科学理论与技术方法上更加趋向综合与统一,为了满足人工智能不同领域研究者相互交流、彼此启发的需求,我们发起了人工智能前沿学生论坛SFFAI,邀请一线科研人员分享、讨论人工智能各个领域的前沿思想和最新成果,使专注于各个细分领域的研究者开拓视野、触类旁通。SFFAI目前主要关注机器学习、计算机视觉、自然语言处理等各个人工智能垂直领域及交叉领域的前沿进展,进行学术传播,同时为讲者塑造个人影响力。

SFFAI还在构建人工智能领域的知识森林—AI Knowledge Forest。通过汇总各位参与者贡献的领域知识,沉淀人工智能前沿精华,使AI Knowledge Tree枝繁叶茂,为人工智能社区做出贡献。SFFAI自2018年9月16日举办第一期,每周一期学术分享交流,截止目前已举办77期学术交流活动,共有100+位讲者分享了他们的真知灼见,来自100多家单位的同学参与了现场交流,通过线上推文、网络直播等形式,50000+人次参与了人工智能前沿学生论坛。SFFAI自发起以来,迅速成长壮大,已经成为人工智能学生交流的第一品牌,有志同道合的论坛核心志愿者团队、乐于学术分享的讲者伙伴,还有许多认可活动价值、多次报名参加现场交流的观众,大家通过参与人工智能前沿学生论坛,收获了宝贵的知识和友谊,SFFAI致力于帮助大家解决在学术中遇到的相关问题,拓展学术人脉,为大家营造专业、开放的学术交流环境!

历史文章推荐

  • 李永露:PaStaNet:Toward Human Activity Knowledge Engine

  • 杨传广:高效设计图像分类模型:混合连通性的门限卷积神经网络

  • 朱时超:图平滑样条神经网络

  • 曾仙芳:通过自监督解耦身份和姿态特征实现人脸再扮演任务

  • 张杰:针对图像处理网络的模型水印

  • 牛广林:规则引导的知识图谱组合式表示学习

  • 王玫:自然环境下的多种族人脸:利用信息最大化自适应网络去减少种族偏差

  • 傅朝友:Domain-Aware Diverse Face Manipulation

  • 申磊:多轮对话中的上下文信息建模

  • 方杰民:Recent Advances and Highlights of NAS

  • 张志鹏:SiamDW Real-Time Visual Tracking

  • 周龙:同步双向文本生成

  • 王亦宁:Multilingual Neural Machine Translation

  • 呼奋宇:深度层次化图卷积神经网络

分享、点赞、在看,给个三连击呗!

你可能感兴趣的:(人工智能,神经网络,深度学习,语音识别,计算机视觉)