语音识别GMM-HMM中的GMM的作用

关于GMM作用的理解:

  • GMM是为了后续HMM所服务的
  • GMM是对所有的triphone进行聚类,输入是MFCC,输出是在不同triphone下的概率值
  • MFCC能够通过GMM确定属于哪一个triphone
  • 因为无法对齐,所以GMM不能直接训练聚类
  • GMM需要确定对齐方式后才能计算,然后通过参数更新对齐方式,直到模型收敛

若有理解有误的地方还请指出,谢谢!

参考文章:
语音识别中的HMM-GMM模型:从一段语音说起

传统语音识别(GMM+HMM)

你可能感兴趣的:(kaldi)