2. 离散马尔可夫过程
考虑这样一个系统,这个系统在任何时刻都处在某一状态,这个状态属于包含N个状态的状态集合,这N个不同的状态分别是S1, S2 . . . , SN,该系统用图1表示如下(为了简化,N等于5):
图1 有个五个状态(被标识为S1到S5)并标有状态转移的一个马尔可夫链。
在任何时间点,系统都经历一次状态改变(可能变为相同的状态),状态的改变根据与这个状态相关联的一个状态转移概率集合发生。我们把与状态改变相关联的时间实例表示为t = 1, 2,. . . ,把时间t的实际状态表示为qt。上诉系统的完整的概率描述通常需要指定当前状态(时间t时的状态)和所有之前的状态。对离散马尔可夫链这个特例,完整的概率描述被简化为当前状态和上一个状态,也就是说:
P[qt=Sj|qt-1=Si,qt-2=Sk,....]=P[qt=Sj|qt-1=Si] (1)
此外,我我们只考虑这些过程,(1)中等号右边是相会独立,从而得出状态转移概率集合aij:
aij=P[qt=Sj|qt-1=Si] 1<= i, j <= N (2)
状态转移系数有如下特性:
aij>=0 (3a)
因为它们符合标准随机限制。
上面的随机过程可以被称为可观察的马尔可夫过程,因为过程的输出是每一个时间实例的状态,这里的每个状态对应着一个可观察的物理事件。为了说明观点,考虑一个简单的三状态马尔可夫过程。我们假设,一天(比如,中午),天气可以被观察到,是下面的天气状态之一:
State 1: rain or (snow)
State 2: cloudy
State 3: sunny.。
我们假设天t的天气被描述为三面三个状态中的一个描述,有状态转移概率矩阵A:
假设天气在天1(t=1)的天气是sunny(状态3),我们可以问一个问题:通过这个模型,接下来七天的天气是"sun-sun-rain-rain-sun-cloudy-sun..."的概率是多少?还可以这样形式化描述,我们可以定义观察序列O为:
0 = {S3,S3, S3, S1, S1, S3, S2, S3},
相应的时间是:
t = 1, 2, . . . , 8
我们希望通过给定的模型确定O的可能性。这个可能性可以为表达为(和计算):
这里,我们使用记号:
πi=P[q1=Si], 1<=i<=N (4)
表示初始状态概率。
另一个我们可以问(或者通过这个模型回答)的有趣的问题是:模型处在一个已知的状态,它处在这个状态d天的概率是多少?这个概率可以通过计算下面这个观察序列的概率得到:
通过这个模型,它的概率是:
pi(d)是状态i持续d天的离散概率密度函数。这个指数持续密度(exponential duration density)是马尔可夫链中状态持续的描述。基于pi(d),在以这个状态开始这个条件下,我们可以计算观察持续处在一个状态的平均天数(期望):
因此,通过这个模型,连续的sunny天气的期望天数是1/(0.2) = 5,对于cloudy,是2.5,对于rain,是1.67。