人寿保险公司把人的健康状态分为健康和疾病两种,以一年为一个时段,研究健康状态的转变。假设对某一年龄段的人来说,今年健康,明年继续保持健康的概率为0.8,即明年转为疾病的概率为0.2;而今年患病,明年转为健康的概率为0.7,即明年继续保持疾病状态的概率为0.3。
由于投保人处于健康和疾病状态是随机的,故设Xn表示第n年的状态,Xn=1表示健康,Xn=2表示疾病,n=0,1,2,3,….ai(n)表示第n年处于状态i的概率,i=1,2,即an(i)=P{Xn=i},用pij来表示今年处于状态i来年处于状态j的概率,即pij=P(Xn+1=j|Xn=i),i=1,2.绘制成链图,见图(1)。
将上面的描述写成表格,如表1,
称P=(pij)2×2为状态转移概率矩阵。
由此可见,投保人第n+1时段的身体健康状态的概率,只与第n时段的状态概率和转移概率有关,与第n-1,n-2,…以前的状态概率无关,这种性质称为无后效性,也称为马尔可夫性质。
记a(n)为第n时段投保人的身体健康状态的概率分布向量,则公式【1】可以简写为矩阵和向量的形式【2】
称公式【1】或【2】为状态转移方程,矩阵P称为状态转移矩阵
下面假定投保人初始阶段的身体健康状态分布向量,分别取a(0)=[1,0]T,a(0)=[0,1]T,a(0)=[0,75,0.25]T,分别代入公式【2】,计算结果保留在表2中
p=[0.8 0.2;0.7 0.3];
a01=[1,0];a02=[0,1];a03=[0.75,0.25];
A01=[a01;a01*p;a01*p^2;a01*p^3;a01*p^4;a01*p^8];
A02=[a02;a02*p;a02*p^2;a02*p^3;a02*p^4;a02*p^8];
A03=[a03;a01*p;a03*p^2;a03*p^3;a03*p^4;a03*p^8];
A=[A01;A02;A03];
表2 不同初始状态状态转移数据
n |
0 |
1 |
2 |
3 |
4 |
… |
∞ |
a1(n) |
1 |
0.8 |
0.78 |
0.778 |
0.7778 |
… |
0.777778 |
a2(n) |
0 |
0.2 |
0.22 |
0.222 |
0.2222 |
… |
0.222222 |
a1(n) |
0 |
0.7 |
0.77 |
0.777 |
0.7777 |
… |
0.777778 |
a2(n) |
1 |
0.3 |
0.23 |
0.223 |
0.2223 |
… |
0.222222 |
a1(n) |
0.75 |
0.8 |
0.7775 |
0.77775 |
0.777775 |
… |
0.777778 |
a2(n) |
0.25 |
0.2 |
0.2225 |
0.22225 |
0.222225 |
… |
0.222222 |
从表2可以看出
- 无论初始状态的概率分布如何,经过有限次转移后,都会稳定在一个固定的概率分布;
- 从ai(∞)>0,i=1,2可以看出,无论初始状态i如何,总能以概率大于0达到所有状态j;(对于满足(2)的马氏链,称为正则马氏链。)
- 状态转移的每个阶段,转移矩阵P都相同,称为马氏链的时齐性,没有特殊说明,一般研究的马氏链都具有时齐性。
保险公式将人的生存状态定义为三种:健康、疾病和死亡(第三中状态),用Xn=3表示.今年健康,明年可能突发疾病或偶然事件而死亡;今年疾病,明年可能继续疾病、健康或死亡,而一旦死亡,则不能再转为健康或疾病。根据统计,三种状态相互转化的概率如表3.
表3 三状态的状态转移 记ai(n)=P{Xn=i},pij=P{X(n+1)=i|X(n)=j},i,j=1,2,3;n=0,2,…则,此案例中的状态转移方程为【3】
将初始状态X01=[1,0,0]T,X02=[0,1,0]T和X03=[0.75,0.25,0]T代入公式【3】,经计算,结果填入表4.
X1=[1,0,0];X2=[0,1,0];X3=[0.75,0.25,0];
p=[0.8 0.18 0.02;0.25 0.65 0.1;0 0 1];
A1=[X1;X1*p;X1*p^2;X1*p^3;X1*p^30;X1*p^60];
A2=[X2;X2*p;X2*p^2;X2*p^3;X2*p^30;X2*p^60];
A3=[X3;X3*p;X3*p^2;X3*p^3;X3*p^30;X3*p^60];
A=[A1,A2,A3]'
表4 不同初始状态的转移结果的数据对比
时段n |
0 |
1 |
2 |
3 |
30 |
60 |
∞ |
a1(n) |
1 |
0.8000 |
0.6850 |
0.6133 |
0.1431 |
0.0307 |
0 |
a2(n) |
0 |
0.1800 |
0.2610 |
0.2930 |
0.0859 |
0.0184 |
0 |
a3(n) |
0 |
0.0200 |
0.0540 |
0.0938 |
0.7711 |
0.9509 |
1 |
a1(n) |
0 |
0.2500 |
0.3625 |
0.4069 |
0.1192 |
0.0256 |
0 |
a2(n) |
1 |
0.6500 |
0.4675 |
0.3691 |
0.0715 |
0.0154 |
0 |
a3(n) |
0 |
0.1000 |
0.1700 |
0.2240 |
0.8092 |
0.9590 |
1 |
a1(n) |
0.75 |
0.6625 |
0.6044 |
0.5617 |
0.1371 |
0.0294 |
0 |
a2(n) |
0.25 |
0.2975 |
0.3126 |
0.3120 |
0.0823 |
0.0177 |
0 |
a3(n) |
0 |
0.0400 |
0.0830 |
0.1264 |
0.7806 |
0.9529 |
1 |
从表4可以看出:无论初始状态如何,通过状态转移之后,终究会定格在状态3不改变;若转移概率矩阵中pii=1,称状态i为吸状态,称这样的马氏链为吸收链。
按系统的发展进程,时间离散化为n=0,1,2,…,对每个n,系统的状态为随机变量Xn表示,可以取k个值,Xn=1,2,…,k,记ai(n)=P{Xn=i},即状态概率(分布),从Xn=i到xn+1=j的概率记为pij=P{Xn+1=j|Xn=i},即转移概率。若Xn+1的取值取决于Xn的取值和转移概率,与前面的xn-1,xn-2,…的取值无关,称这种离散状态按照时间转移的过程为马氏链。
在上述公式中,每个两个阶段的状态转移概率矩阵都是同一个矩阵P,称这种性质为马氏链的时齐性。
2.1 正则链定义:从任意状态出发,通过有限次转移,都能到另外的状态。
2.2 马氏链为正则链的充分必要条件←→状态转移矩阵P满足PN>0,即PN的每个分量都大于0.
2.3 正则链存在唯一的极限状态概率w=[w1,w2,…,wk],使得称w为稳态概率,满足不难看出,w就是P转置矩阵的征值为1的特征向量的(标准化)行写法。
若状态转移概率矩阵P中,有pii=1,则称i为吸收态。若马氏链中包含吸收态,则从任何一个非吸收态出发,经过有限次转移,都会以一个正概率到大吸收态。称这样的马氏链为吸收链。
记fij(n)为从状态i出发,经过n次转移,首次到大状态j的首达概率,于是从i到j的平均转移次数为μii称为平均首次返回次数。
若吸收链有r个吸收态,则转移矩阵P可以写为
且I-Q可逆,满足设列向量的第i分量表示从第i个非吸收态出发,被某个吸收态吸收的平均转移次数。
由于状态一旦进入吸收态,就不会再进入非吸收态,所以,从某个非吸收态i出发,进入某个吸收态j,实际上首达概率fij(n)实际表示从i出发,经过n次转移被j吸收的概率,而则表示从非吸收态i出发终将被吸收态j吸收的概率。