台大数位语音处理第四课part1

本节课主要内容HMM三个基本问题如何求解

首先明确两种observe有两种,离散/连续。语音识别中使用连续状态(MFCC特征值是连续的)。连续的比较复杂,需要用函数(GMM)拟合。离散的简单,用矩阵描述即可。


台大数位语音处理第四课part1_第1张图片
离散/连续状态

review三个基本问题


台大数位语音处理第四课part1_第2张图片
三个基本问题

1. Evaluation

粗暴解法:遍历每一种可能的hidden state/observe组合,求加和求概率。


台大数位语音处理第四课part1_第3张图片
粗暴解法

优化解法Forward:类似数学归纳法。找到n和n+1之间的关系,再计算第一项。避免重复计算。


台大数位语音处理第四课part1_第4张图片
image.png

2.decoding

backward:和forward相反


台大数位语音处理第四课part1_第5张图片
image.png

区别1:在时间t,beta看到的是t+1及以后的,必须从i隐状态出发,后面无所谓。alpha是已知0到t,求t+1
区别2:qt在alpha里是待计算概率,在beta里是条件

台大数位语音处理第四课part1_第6张图片
近似

近似:假设B和A无关,也就是0-t和t+1以后无关

3. Train

EM算法,回头来补充

你可能感兴趣的:(台大数位语音处理第四课part1)