机器学习笔记(十八)——HMM的参数估计

一、HMM中的第三个基本问题

    参数估计问题:给定一个观察序列 O=O1O2OT ,如何调节模型 μ=(A,B,π) 的参数,使得 P(O|μ) 最大化:

argmaxμP(Otraining|μ)

模型的参数是指构成 μ πi,aij,bj(k) 。本文的前序两节讲的EM算法就是为了解决模型参数的最大化问题。其基本思想是,初始时随机地给模型参数赋值,该赋值遵循模型对参数的限制,例如,从某一状态出发的所有转移概率之和为1.给模型参数赋初值后,得到模型 μ0 , 然后根据 μ0 可以得到模型中隐变量的期望值。例如,从 μ0 得到某一状态到另一状态的期望次数,用期望次数来替代实际次数,这样可以得到模型参数的重新估计值,由此得到新的模型 μ1 。然后重复上述过程,直到参数收敛于最大似然估计值。

二、算法介绍

    给定HMM的参数 μ 和观察序列 O=O1O2OT 在时间 t 位于状态 si ,时间 t+1 位于状态 sj 的概率:

ξt(i,j)=P(qt=si,qt+1=sj|O;μ)(1tT,1i,jN)

可由下面的公式计算获得:
ξt(i,j)=P(qt=si,qt+1=sj,O;μ)P(O;μ)=at(i)aijbj(Ot+1)βt+1(j)P(O;μ)=at(i)aijbj(Ot+1)βt+1(j)Ni=1Nj=1at(i)aijbj(Ot+1)βt+1(j)(181)

    给定HMM的参数 μ 和观察序列 O=O1O2OT 在时间 t 位于状态 si 的概率 γt(i) 为:
γt(i)=j=1Nξt(i,j)182

由此, μ 的参数可由下式估计:
πi¯=P(q1=si|O;μ)=γ1(i)a¯ij=QqiqjQqiqj=T1t=1ξt(i,j)T1t=1γt(i)b¯j(k)=QqjvkQqj=Tt=1γt(j)δ(Ot,vk)Tt=1γt(j)

三、前向后向算法

    根据上述思路,给出前向后向算法:
1. 初始化:随机地给参数 πi,aij,bj(k) 赋值,使得满足如下约束:

i=1Nπi=1j=1Naij=1,1iNk=1Mbj(k)=1,1jN

由此,得到模型 μ0 .令 i=0 ,执行下面的EM估计。
2. EM计算
E步:由模型 μi 根据公式18-1和18-2计算 ξt(i,j) γt(i)
M步:用E步得到的期望值重新估计模型参数 πi,aij,bj(k) ,得到模型 μi+1
3. 循环计算:
i=i+1 , 重复EM计算,直到 πi,aij,bj(k) 收敛。

你可能感兴趣的:(机器学习,自然语言处理)