GMM-HMM总结

最近在做毕设,所以查了很多的资料。有paper有博客,牛人太多了,浙大的一个妹子真的是太厉害了,而且长的也女神~~废话不多,接下来总结一下

GMM-HMM是两个算法,GMM和HMM。

其中GMM是混合高斯模型(Gauss of mixture models),什么意思呢。意思是说,给出一堆观察序列(可以是多维的可以是一维的),用几个高斯函数模拟一个模型,这个模型产生这些观察序列的概率最大,其中组合在一起的每个高斯函数都有一个权重设为Pi,所有Pi的和是1.那么通过EM算法的学习方法,把所有高斯函数的参数都给学习出来。高斯函数的限定只有两个参数我们称之为[mu,sigma],学过高斯人都应该知道,mu是中心点也就是均值,sigma代表了高斯函数的胖瘦,还有一个参数就是权重Pi。当模型搭建好了,用一个test序列跑一下,可以得出每个高斯函数的概率。GMM也是一个聚类过程,几个高斯函数就是几个中心。学习过程就是训练聚类的训练过程。

HMM是隐马尔科夫模型,是在不知道实际状态变化过程的情况下可以看到观察序列。

        之前一直不知道为啥要引入GMM,原来是HMM分为离散马尔科夫和连续的马尔科夫。比如说,离散的我可以穷举出所有的观察可能值,但是连续的就有无穷多观察值,这样Observe就不能确定了。那么需要引入GMM。

GMM把所有的训练样本学习一遍。把类似离散马尔科夫中的发射矩阵训练出来。也就是状态->观察值(可以是数,向量等)。这样HMM再训练自己的状态转移矩阵等,这样HMM就可以用了。

对于每个单词训练一个HMM的类型。只要将信号通过MFCC提取特征值,MFCC可以得到一个 特征维数*帧数 的矩阵。也就是说观察序列为特征维数*帧数 的矩阵。

你可能感兴趣的:(GMM-HMM总结)