第九章 马尔可夫模型——统计自然语言处理基础笔记

1. 马尔可夫模型

特征:

  1. 有限历史假设
    该随机变量的概率,只取决于前面一个随机变量
  1. 时间不变性
    时间变化不影响各随机变量的概率

但是n-gram模型是马尔可夫模型的特殊情况,n大于等于2时候就违反了有限历史假设。此时马尔可夫可以改造成

马尔可夫模型形式化表达:


分别是初始状态概率,状态集,转移矩阵。其实就是个一个非确定的有限自动机。

2. 隐马尔可夫模型

所谓隐马尔可夫模型,就是看不见的马尔可夫模型。马尔可夫模型的所处的状态是不可见的,但是状态会以一定的概率产生观测值。(可能一个状态只对应一个观测值,也可能对应多个)。

所以,隐马尔可夫可以描述现实中很多情况。我们有一个黑箱(马尔可夫模型),不知道内部的运行机制,只能看到黑箱的输出(观测值)。隐马尔可夫主要需要解决的问题就是如何从观测值推知黑箱的运行机制(即马尔可夫模型的各个参数)。

2.1 隐马尔可夫模型形式化定义

Q:状态集合
V:观测集合

π:初始状态概率矩阵
A:转移概率矩阵(Aij,就是从状态 i 转移到状态 j 的概率)
B:观测概率矩阵(Bij,就是从状态 i 产生观测 j 的概率)

2.2 隐马两个基本假设

  1. 齐次马尔可夫假设:当前状态只和上一状态有关


  2. 观测独立性假设:任意时刻的观测只依赖于该时刻的马尔可夫链状态


2.3 隐马三个基本问题

  1. 概率计算问题:就是在此模型下,输出某观测序列概率
  1. 学习问题:已知观测序列求模型参数
  1. 预测问题:知道模型和观测序列求状态序列

你可能感兴趣的:(第九章 马尔可夫模型——统计自然语言处理基础笔记)