CTC学习笔记(四) 解码-WFST


类似于HCLG的wfst结构,EESEN: END-TO-END SPEECH RECOGNITION USING DEEP RNN MODELS AND WFST-BASED DECODING文章提出了TLG的网络结构

Grammar

CTC学习笔记(四) 解码-WFST_第1张图片

Lexicon

有两种形式,可以基于characters和phonemes。
CTC学习笔记(四) 解码-WFST_第2张图片

Token

对应于传统的state,前后添加blank,而且状态存在自旋
CTC学习笔记(四) 解码-WFST_第3张图片

网络

S=Tmin(det(LG))

结论

相比于传统的hybrid方法,准确率差不多,解码速度有三倍以上的提升。原因在于,状态数从几千个降到了几十个,减小了网络复杂度。

你可能感兴趣的:(神经网络)