A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition(第二部分翻译)

2. 离散马尔可夫过程

考虑这样一个系统,这个系统在任何时刻都处在某一状态,这个状态属于包含N个状态的状态集合,这N个不同的状态分别是S1, S2 . . . , SN,该系统用图1表示如下(为了简化,N等于5):

图1 有个五个状态(被标识为S1到S5)并标有状态转移的一个马尔可夫链。

在任何时间点,系统都经历一次状态改变(可能变为相同的状态),状态的改变根据与这个状态相关联的一个状态转移概率集合发生。我们把与状态改变相关联的时间实例表示为t = 1, 2,. . . ,把时间t的实际状态表示为qt。上诉系统的完整的概率描述通常需要指定当前状态(时间t时的状态)和所有之前的状态。对离散马尔可夫链这个特例,完整的概率描述被简化为当前状态和上一个状态,也就是说:

P[qt=Sj|qt-1=Si,qt-2=Sk,....]=P[qt=Sj|qt-1=Si] (1)

此外,我我们只考虑这些过程,(1)中等号右边是相会独立,从而得出状态转移概率集合aij

aij=P[qt=Sj|qt-1=Si]  1<= i, j <= N (2)

状态转移系数有如下特性:

aij>=0 (3a)

(3b)

因为它们符合标准随机限制。

上面的随机过程可以被称为可观察的马尔可夫过程,因为过程的输出是每一个时间实例的状态,这里的每个状态对应着一个可观察的物理事件。为了说明观点,考虑一个简单的三状态马尔可夫过程。我们假设,一天(比如,中午),天气可以被观察到,是下面的天气状态之一:

State 1: rain or (snow)
State 2: cloudy
State 3: sunny.。

我们假设天t的天气被描述为三面三个状态中的一个描述,有状态转移概率矩阵A:

A Tutorial on Hidden Markov Models and Selected Applications in Speech Recognition(第二部分翻译)_第1张图片

假设天气在天1(t=1)的天气是sunny(状态3),我们可以问一个问题:通过这个模型,接下来七天的天气是"sun-sun-rain-rain-sun-cloudy-sun..."的概率是多少?还可以这样形式化描述,我们可以定义观察序列O为:

0 = {S3,S3, S3, S1, S1, S3, S2, S3},

相应的时间是:

t = 1, 2, . . . , 8

我们希望通过给定的模型确定O的可能性。这个可能性可以为表达为(和计算):

这里,我们使用记号:

πi=P[q1=Si], 1<=i<=N (4)

表示初始状态概率。

另一个我们可以问(或者通过这个模型回答)的有趣的问题是:模型处在一个已知的状态,它处在这个状态d天的概率是多少?这个概率可以通过计算下面这个观察序列的概率得到:

通过这个模型,它的概率是:

pi(d)是状态i持续d天的离散概率密度函数。这个指数持续密度(exponential duration density)是马尔可夫链中状态持续的描述。基于pi(d),在以这个状态开始这个条件下,我们可以计算观察持续处在一个状态的平均天数(期望):


因此,通过这个模型,连续的sunny天气的期望天数是1/(0.2) = 5,对于cloudy,是2.5,对于rain,是1.67。


你可能感兴趣的:(隐含马尔可夫模型)