关于条件随机场的一些补充

原文:机器学习:《统计学习方法》笔记(二)—— 条件随机场(CRF)

参考:概率无向图模型

1. 概率无向图的因子分解

注:有一点笔者仍然不明白,《统计学习方法》是定义P(Y)的乘积是在最大团上进行,而有材料说明乘积是在极大团上进行。

无向图中的极大团的结点个数可以是不同的,只要满足“不能再加进任何一个结点”的条件,就是极大团。

因子分解是图中所有极大团的势函数的乘积规范化后的结果。计算公式如下

P(Y)=\frac{1}{Z} \prod_{C} \psi_{C}\left(Y_C \right )

Z=\sum_{Y} \prod_{C}\psi_C(Y_C)

\psi_C(Y_C)=\exp\{-E(Y_C)\}

关于条件随机场的一些补充_第1张图片

针对上图,最大团有C_1=\left \{ x_1,x_2,x_3 \right \}, C_2=\left \{ x_3,x_4 \right \}, C_3=\left \{ x_3,x_5 \right \}

联合概率分布为

P(x_1,x_2,...,x_5)=\frac{1}{Z}\psi_{C1}(x_1,x_2,x_3) \psi_{C2}(x_3,x_4) \psi_{C3} (x_3,x_5)
Z为每个节点所在团块的势函数乘积的和

Z=\psi(C_1)+\psi(C_1)+\psi(C_1)\psi(C_2)\psi(C_3)+\psi(C_2)+\psi(C_3)

上式理解为每个节点所在所有极大团的乘积和,x_1在C1中,x_2在C2中,x_3在C1、C2、C3中,x_4在C2中,x_5在C3中。

2. 概率无向图公式P(Y)与条件随机场P(Y|X)的联系

条件随机场是给定X的条件下,随机变量Y的马尔可夫随机场,即Y是满足马尔可夫性的。这里Y的条件概率分成P(Y|X)构成条件随机场。

线性条件随机场中,最大团是C_1=\left \{ y_1,y_2 \right \}, C_2=\left \{ y_2,y_3 \right \}, ...,C_n=\left \{ y_{n-1},y_n \right \}。所以按照概率无向图的因子分解公式,可知

P(y_1,y_2,...,y_n)=\frac{1}{Z}\psi_{C_1}(x_1,x_2)\psi_{C_2}(x_2,x_2)...\psi_{C_n}(x_{n-1},x_{n-2})

\psi_{C_i}(x_{i-1},x_{i})=\exp(\lambda_k t_k(y_{i-1},y_i,x,i)+\mu_l s_l(y_i,x,i))

所以线性条件随机场的参数形式为

P(y|x)=\frac{1}{Z(x)}\exp(\sum_{i,k}\lambda_k t_k(y_{i-1},y_i,x,i)+\sum_{i,l} \mu _l s_l (y_i,x,i))

你可能感兴趣的:(机器学习,机器学习理论及应用)