马尔科夫链模型快速理解

隐马尔科夫链:

    机器学习最重要的任务就是通过已知证据(训练样本)来对未知变量进行评估和推测。

    将已知变量推测未知变量任务解释为基于计算变量的概率分布模型。核心就是如何根据已知变量推测未知变量的条件分布。根据预测模型,分为:生成式模型(联合分布)和判别式模型(条件分布)。实现原理:给定一组观测变量值,根据两种模型之一推断得到条件概率分布。

    为了进一步描述变量相关关系的概率模型,使用一种概率图模型。分为两类:有向无环图(有向图模型或贝叶斯网)和无向图(无向图模型或马尔科夫链)

    隐马尔科夫链(hidden markov model)是结构最简单的动态贝叶斯网,一种著名的有向图模型,应用于时序数据建模,语音识别,自然语言处理。

   


^HMM模型包括两种变量和三组概率参数简称五元组:

1.状态变量也成隐变量yi

2观测变量xi

3.状态转移概率矩阵A:描述模型在各个状态间转换的概率。

4.输出观测概率矩阵B:根据当前状态获得各个观测值的概率。也叫两态转移矩阵

5.初始状态概率π:初始时刻各状态出现的概率。

那么重点来了!!!

实际应用中,我们常关注的HMM的三个基本问题:

1.用给定的λ=(A,B,π)表示三元组参数,马尔科夫链模型表示为如何求产生观测序列xi的概率P(x/λ)问题。换句话说,如何评估模型与观测序列之间的匹配程度。天气预报

2.给定λ和观测序列xi,如何找到去观测序列最匹配的的状态序列yi。也就是说如何根据观测序列推断隐藏的模型状态。(词性标准 中文分词)

3.给定xi,如何调整参数λ使得该序列的概率p(X/λ)最大。也就是如何训练模型能最好的描述观测数据。=模型调参

你可能感兴趣的:(马尔科夫链模型快速理解)