CVTE在线识别搭建(效果很差)

在src/online2bin输入以下命令: ./online2-wav-nnet3-latgen-faster --do-endpointing=false --online=false --feature-type=fbank --fbank-config=../../egs/cvte/s5/conf/fbank.conf --max-active=7000 --beam=15.0 --lattice-beam=6.0 --acoustic-scale=1.0 --word-symbol-table=../../egs/cvte/s5/exp/chain/tdnn/graph/words.txt ../../egs/cvte/s5/exp/chain/tdnn/final.mdl ../../egs/cvte/s5/exp/chain/tdnn/graph/HCLG.fst 'ark:echo utter1 utter1|' 'scp:echo utter1 ../../egs/cvte/s5/data/wav/00030/2017_03_07_16.57.22_1175.wav|' ark:/dev/null

解出来的结果……呵呵呵,相当的不准,感谢kaldi群中的俊峰同学!

我认为还得自己摸索,看看它的训练,用到的特征,毕竟它用了cmvn的特征,而这个在线解码器中并没有。(这里的在线解码指的是输入wav文件,输出识别结果到控制台)

最近在摸索关键词检索,出错了,群主说可能是beam调的不对导致的lat文件出错,但我对此抱有怀疑,beam不对只会影响效果,也会影响一些硬性的输出吗?有待考证。

kaldi群里和我一批的小伙伴已经有俩放弃了,目前还有一个新认识的,新加了一堆大神,都很谦虚柔和,很好。

你可能感兴趣的:(CVTE在线识别搭建(效果很差))