by ldc
前言:该笔记为北京大学数学科学学院应用随机过程课程的复习笔记和内容总结。主要参考课程讲义编写而成。该复习笔记截止期中,主要介绍了马氏链的概念,并且非常详细地讲解了时齐马氏链的各个性质。由于是总结性质的笔记,因此该总结中的结论不加证明地给出,如果需要查询证明的话可以参考以下两本书,也可以自行谷歌:
————————————分割线——————————————
马尔科夫链是最基本的随机过程之一,刻画了一类广泛、简单、但是性质丰富的随机过程。下面简称马氏链。
马氏链:一列随机变量 { X n } n = 0 ∞ \{X_n\}_{n=0}^{\infty} {Xn}n=0∞
性质:
P ( X n + 1 = j ∣ X n = i , ( X 0 , . . . , X n − 1 ) = z ⃗ ) P(X_{n+1}=j|X_n=i,(X_0,...,X_{n-1})=\vec{z}) P(Xn+1=j∣Xn=i,(X0,...,Xn−1)=z)与向量 z ⃗ \vec{z} z无关。
在马氏链 { X n } \{X_n\} {Xn}上,一个取值为 Z + ∪ { 0 } Z^+ \cup \{0\} Z+∪{0}的变量 γ \gamma γ称为一个停时,当且仅当对于任意的 n , i 0 , . . . . , i n ∈ S n,i_0,....,i_n\in S n,i0,....,in∈S,以下两个式子中恰有一个成立:
{ X 0 = i 0 , . . . . , X n = i n } ⊂ { γ ≤ n } \{X_0=i_0,....,X_n=i_n\}\subset \{\gamma \leq n\} {X0=i0,....,Xn=in}⊂{γ≤n}
{ X 0 = i 0 , . . . . , X n = i n } ⊂ { γ > n } \{X_0=i_0,....,X_n=i_n\}\subset \{\gamma > n\} {X0=i0,....,Xn=in}⊂{γ>n}
特别地,首达时 γ i = inf { n ≥ 0 , X n = i } \gamma_i=\inf\{n\geq 0, X_n=i\} γi=inf{n≥0,Xn=i}和首入时 σ i = inf { n ≥ 1 , X n = i } \sigma_i=\inf\{n\geq 1, X_n=i\} σi=inf{n≥1,Xn=i}都是停时
如果 γ \gamma γ为一个停时,则马氏链具有强马氏性:
在 { γ < ∞ , X γ = i } \{\gamma<\infty, X_{\gamma}=i\} {γ<∞,Xγ=i}的条件下, { Y 0 , Y 1 , . . . , Y n } ≜ { X γ , X γ + 1 , . . . , X γ + n } \{Y_0,Y_1,...,Y_n\}\triangleq \{X_{\gamma},X_{\gamma+1},...,X_{\gamma+n}\} {Y0,Y1,...,Yn}≜{Xγ,Xγ+1,...,Xγ+n}是从i出发的马氏链,并且与 Z ⃗ = ( X 0 , . . . , X γ ) \vec{Z}=(X_0,...,X_{\gamma}) Z=(X0,...,Xγ)独立
如果 P ( X n + 1 = j ∣ X n = i , ( X 0 , . . . , X n − 1 ) = z ⃗ ) P(X_{n+1}=j|X_n=i,(X_0,...,X_{n-1})=\vec{z}) P(Xn+1=j∣Xn=i,(X0,...,Xn−1)=z)与n也无关,即 P ( X n + 1 = j ∣ X n = i , ( X 0 , . . . , X n − 1 ) = z ⃗ ) = p i , j P(X_{n+1}=j|X_n=i,(X_0,...,X_{n-1})=\vec{z})=p_{i,j} P(Xn+1=j∣Xn=i,(X0,...,Xn−1)=z)=pi,j,则称这个马氏链P是时齐的
如果变量序列 { X n } n = 0 ∞ \{X_n\}_{n=0}^{\infty} {Xn}n=0∞中 X n X_n Xn的取值空间S是可数的离散空间,则称为离散马氏链。特别的,如果|S|是有限的,则称为有限状态马氏链。有限状态马氏链具有一些很好的性质。
在本篇内容中我们只讨论离散时齐的马氏链。
马氏链上存在两种比较特殊的分布:
满足 π = π P \pi=\pi P π=πP的测度 π \pi π称为不变测度。其中,测度是指在状态空间S上的一个不全为0的非负向量。特别地,如果一个测度的各个分量和为1,则称其为状态空间S上的一个分布。满足 π = π P \pi=\pi P π=πP的分布 π \pi π称为不变分布。
满足 ∀ i , j , π i p i j = π j p j i \forall i,j, \pi_{i}p_{ij}=\pi_j p_{ji} ∀i,j,πipij=πjpji(细致平衡条件)的测度 π \pi π称为配称测度。特别地,如果这个一个测度的各个分量和为1,则称其为状态空间S上的一个分布。满足 π = π P \pi=\pi P π=πP的分布 π \pi π称为可逆分布。拥有可逆分布的马氏链P称为可逆的。
不变分布:
有限状态马氏链:解方程 π = π P \pi=\pi P π=πP
无限状态马氏链:取特殊的 A ⊂ S A\subset S A⊂S,对进出A的概率论使用均衡方程: ∑ i ∈ A , j ∉ A π i p i j = ∑ i ∈ A , j ∉ A π j p j i \sum_{i\in A, j\notin A}\pi_ip_{ij}=\sum_{i\in A, j\notin A} \pi _jp_{ji} ∑i∈A,j∈/Aπipij=∑i∈A,j∈/Aπjpji
可逆分布:
随便取一个状态o,设 π o = x \pi_o=x πo=x,使用细致平衡条件求解出 π ( x ) \pi(x) π(x)即可,然后对任意i,j验证细致平衡条件,如果均满足则得到一个配称测度,如果该测度可以归一化则得到一个可逆分布。
一个马氏链的状态空间S中包含的状态具有一些特殊的性质:
i → j i\rightarrow j i→j: i i i可达 j j j,如果存在 n n n, p i j ( n ) > 0 p_{ij}^{(n)}>0 pij(n)>0;如果 i → j i\rightarrow j i→j且 j → i j \rightarrow i j→i,则称i和j互通
互通关系是一个等价关系,因此S可以被分划为若干个互通类。若将一个互通类看做一个顶点,则S中的互通类构成一个有向无环图。如果一个互通类中没有连向外部顶点的便,则称该互通类为闭集。因此,这个图的所有叶子节点就是所有的闭集。因此,有限状态马氏链必然有闭集,但是无限状态马氏链则不一定,因为叶子节点可能在无穷远处。
不可约:
一个马氏链称为不可约,如果其自身构成一个互通类。
定义从一个马氏链访问一个状态i的总次数
V i = ∑ n = 0 ∞ 1 { X n = i } = ∣ { n ≥ 0 : X n = i } ∣ V_i=\sum_{n=0}^\infty 1_{\{X_n=i\}}=|\{n\geq 0: X_n=i\}| Vi=∑n=0∞1{Xn=i}=∣{n≥0:Xn=i}∣,
并且定义从i出发的回访概率 ρ i = P i ( σ i < ∞ ) \rho_i=P_i(\sigma_i<\infty) ρi=Pi(σi<∞),
则有以下二择一定律:
{ ρ i = 1 ⇔ P i ( V i = ∞ ) = 1 ⇔ E i V i = ∞ 常返 ρ i = 0 ⇔ P i ( V i < ∞ ) = 1 ⇔ E i V i < ∞ 非常返 \left\{ \begin{aligned} \rho_i&=1 \Leftrightarrow P_i(V_i=\infty)=1 \Leftrightarrow E_iV_i=\infty\quad \text{常返}\\ \rho_i&=0 \Leftrightarrow P_i(V_i<\infty)=1 \Leftrightarrow E_iV_i<\infty\quad \text{非常返} \end{aligned} \right. {ρiρi=1⇔Pi(Vi=∞)=1⇔EiVi=∞常返=0⇔Pi(Vi<∞)=1⇔EiVi<∞非常返
常返性在互通类下封闭;在不可约马氏链下,所有状态要么全都常返,要么全不常返,因此可以直接讨论一个不可约马氏链是否常返。
有限状态不可约马氏链必定常返。
如果 π \pi π为不变分布,j非常返,则 π j = 0 \pi_j=0 πj=0
P不可约, π \pi π为P的不变分布,则 π i \pi_i πi>0,并且 π i = 1 E i σ i \pi_i=\frac{1}{E_i\sigma_i} πi=Eiσi1
为了区分是否存在不变分布,引入正常返/零常返的概念:
{ 正常返: E i σ i < ∞ 零常返: E i σ i = ∞ \left\{ \begin{aligned} \text{正常返:} E_i\sigma_i<\infty \\ \text{零常返:} E_i\sigma_i=\infty \end{aligned} \right. {正常返:Eiσi<∞零常返:Eiσi=∞
正常返也是互通类的性质
则:一个不可约马氏链的不变分布存在等价于其正常返
不可约有限状态马氏链必定存在不变分布
马氏链P不可约,正常返:
P μ ( lim n → ∞ ∑ i = 0 n − 1 f ( X i ) n = ∑ i ∈ S π i f ( i ) ) = 1 P_\mu (\lim_{n\rightarrow \infty} \frac{\sum_{i=0}^{n-1}f(X_i)}{n}=\sum_{i\in S}\pi_i f(i))=1 Pμ(n→∞limn∑i=0n−1f(Xi)=i∈S∑πif(i))=1
一个不可约马氏链是周期的,若其可以分为 d ≥ 2 d\geq 2 d≥2个状态,使得其在充分多次后在这d个状态之间循环移动;否则称其为非周期的
判定:
如果 ∃ i , p i i > 0 \exists i, p_{ii}>0 ∃i,pii>0,则P必然是周期的
马氏链P不可约,非周期,正常返:
lim n → ∞ ∑ j ∈ S ∣ ( μ P n ) j − π j ∣ = 0 \lim_{n\rightarrow \infty} \sum_{j\in S}| (\mu P^n)_j-\pi_j| =0 n→∞limj∈S∑∣(μPn)j−πj∣=0
马氏链P不可约,周期d,正常返:
lim n → ∞ p i j n d + s = d π j \lim_{n\rightarrow \infty} p_{ij}^{nd+s}=d\pi_j n→∞limpijnd+s=dπj
马氏链P不可约,零常返:
lim n → ∞ p i j n = 0 \lim_{n\rightarrow \infty} p_{ij}^n=0 n→∞limpijn=0
收敛速度:指数
如果P不可约,非周期,正常返,有限状态,则存在 C , β > 0 C,\beta>0 C,β>0
d T V ( μ P n , π ) ≤ C e − β n d_{TV}(\mu P^n,\pi)\leq Ce^{-\beta n} dTV(μPn,π)≤Ce−βn
d T V d_{TV} dTV为分布的全变差距离: d T V ( μ , ν ) = 1 2 ∑ i ∈ S ∣ μ i − ν i ∣ d_{TV} (\mu,\nu)=\frac{1}{2}\sum_{i\in S} |\mu_i-\nu_i| dTV(μ,ν)=21∑i∈S∣μi−νi∣
————————————分割线——————————————
在阐明了基本概念后,我们给出一个系统性的总结:
马氏链的本质:马氏性,停时,强马氏性
马氏链的分布:不变分布,可逆分布
马氏链的性质:有限状态,可约,常返(正常返,零常返,非常返),周期
不变分布:
有限状态马氏链至少有一个不变分布:
a个:构造矩阵P,使得方程 π ( P − I ) = 0 \pi(P-I)=0 π(P−I)=0恰有a个解,即 d i m ( P − I ) = n − a dim(P-I)=n-a dim(P−I)=n−a
可约无限状态马氏链可以有任意个不变分布:
0个:从0出发,p=1的随机游动(一直向正无穷迁移)
a个:取一个有限状态马氏链作为子链即可
不可约无限状态非/零常返马氏链没有不变分布
不可约无限状态正常返马氏链恰有一个不变分布: π i = 1 E i σ i \pi_i=\frac{1}{E_i \sigma _i} πi=Eiσi1
————————————分割线——————————————
由于结论均为手算,一些结论可能存在错误之处,如有疑问请不吝赐教。
等待更新