论文阅读笔记“Attention-based Audio-Visual Fusion for Rubust Automatic Speech recognition”
关于论文的阅读笔记论文的题目是“Attention-basedAudio-VisualFusionforRubustAutomaticSpeechrecognition”,翻译成中文为基于注意力的视听融合技术实现鲁棒自动语音识别(这是用谷歌翻译的。。。。。)摘要文章介绍提出了一种音-视融合方案,这种方案超越了简单的特征融合,可以实现两种模式的自动对齐,进而实现了不论在嘈杂还是安静环境下识别精度的提