机器学习花书--图模型之HMM、MRF、CRF学习

背景

0.概率图:用图来表达变量之前相关关系的概率模型。其中图中的点表示一组随机变量,边表示随机变量之间的概率相关关系
1.有向图模型/贝叶斯网:有向无环图。当变量之间有明确的因果关系时使用
2.无向图模型/马尔科夫网:无向图。当变量之间有关系,但难以获得明确的因果关系时使用
3.生成式模型:对联合概率进行建模,如隐马尔可夫模型、马尔可夫随机场
4.判别式模型:对条件概率进行建模,如条件随机场

HMM(隐马尔可夫模型)

1 隐马尔可夫模型图结构

定义

状态空间:{S1,S2,......,SN}
观测空间:{O1,O2,......OM} // 观测变量可离散可连续,为方便,此处仅讨论离散型
马尔可夫链:系统下一时刻的状态仅由当前时刻状态决定,不依赖以往的任何状态

三组参数

1.状态转移概率
指模型在各个状态间的转移概率


2.输出观测概率
指模型根据当前状态得到各个观测值的概率

3.初始状态概率
指模型在初始时刻各状态的概率

模型

通过指定状态空间、观测空间、上述三组参数,就可以确定一个隐马尔可夫模型。
三个基本问题:
1.如何评估观测序列与已有模型的匹配程度?
2.如何根据观测序列及已有模型,获得概率最大的状态序列?
3.如何根据观测序列及状态序列,学习给定观测序列,使得状态序列概率最大的模型参数?
对应解决方法:
《待添加》

MRF(马尔可夫随机场)

1.团:一个图的某一个子图,其内部节点两两连接,则该子图中的节点组成一个团
2.极大团:若图中,除团外,加入任一个节点,都不构成团,则该团为极大团
3.非极大团的特性也反映在极大团中,因此,所有节点的联合概率可以用极大团表示:


所有变量联合概率

其中

是定义在Q上的势函数,对Q中的变量关系进行建模。

马尔可夫性

1.全局马尔可夫性:
给定两个变量子集的分离集,则这两个变量子集条件独立。



2.局部马尔可夫性:
给定某变量的邻接变量,则该变量相对其他变量条件独立。
3.对称马尔可夫性:
给定所有其他变量,两个非邻接变量条件独立。
另,为了满足非负性,指数函数常被用作势函数。




其中第一项考虑每一对节点之间的关系,第二项仅考虑单节点。

CRF(条件随机场)

若图G中所有变量都满足马尔可夫性,

则(y,x)构成一个条件随机场。

常用的链式条件随机场结构如下:

通过选用指数势函数并引入特征函数,条件概率公式表示如下:
其中第一部分用于刻画相邻标记变量之间的相关关系及观测变量对它们的影响,第二部分用于刻画观测变量对标记变量的影响。其中exp(*)是势函数,t和s是特征函数。

特征函数通常是实值函数,用来刻画一些很可能成立或者期望成立的经验特性,以词性标注任务为例:


转移特征函数
状态特征函数

对比MRF和CRF,都是使用团上的势函数来定义概率,只是一个是联合概率,一个是条件概率。

引用

1.机器学习 周志华

注:
1.本来使用latex编辑了公式,但是发布的时候图片上传失败了,只能再截图了,以后看看有没有其他方法。
2.这里主要是模型的相关理论知识,后续对应用、代码也要补充一下。

你可能感兴趣的:(机器学习花书--图模型之HMM、MRF、CRF学习)