一、基本内容
1.隐马尔可夫模型
1.1. 假定所有关心的变量集合为Y,可观测变量集合为O,其他变量集合为R,
生成式模型考虑联合分布P(Y,R,O),判别式模型考虑条件分布P(Y,R|O),给定一组观测变量值,推断就是要由P(Y,R,O)或者P(Y,R|O)得到条件概率分布P(Y,O).
1.2. 概率图模型大致分为两类:第一类是使用有向无环图表示变量间的依赖关系,称为有向图模型或贝叶斯网;第二类是使用无向图表示变量间的相关关系,称为无向图模型或马尔可夫网
1.3. 隐马尔可夫模型(Hidden Markov Model,简称HMM)是结构最简单的动态贝叶斯网,这是一种著名的有向图模型。
2.马尔可夫随机场(Markov Random Field, 简称MRF):是典型的马尔可夫网,这是一种著名的无向图模型。
2.1 极大团,势函数
2.2 全局马尔可夫性,推论:局部马尔可夫性,成对马尔可夫性
3.条件随机场(Conditional Random Field, 简称CRF):是一种判别式无向图模型
4.学习与推断
变量消去,信念传播
5.近似推断
两类:1.采样:通过使用随机化方法完成近似2.使用确定性近似完成近似推断,典型代表为变分推断
5.1 MCMC采样(马尔可夫链蒙特卡罗方法(Markov Chain Monte Carlo))
MCMC方法的关键就在于通过构造“平稳分布为p的markov chain”来产生sample。
Metropolis-Hastings(MH)算法是MCMC的重要代表。
吉布斯采样
5.2 变分推断
盘式记法