对 n n n阶方阵 A A A,如果满足 A x = λ x (1) Ax=\lambda x \tag{1} Ax=λx(1)其中 x x x为 n n n维非0向量, λ \lambda λ为常数(可以为复数)
则称 λ \lambda λ为 A A A的特征值, x x x为 A A A属于 λ \lambda λ的特征向量
式(1)的几何意义是:向量 x x x经过转换矩阵 A A A后,依然保持原来的方向,只有 λ \lambda λ倍伸缩的变化
对式(1)稍作变形,有
( A − λ I ) x = 0 (2) (A-\lambda I)x=0 \tag{2} (A−λI)x=0(2)
要使得式(2)有非0解,则 A − λ I A-\lambda I A−λI为奇异矩阵,即
d e t ( A − λ I ) = 0 (3) det(A-\lambda I)=0 \tag{3} det(A−λI)=0(3)
求解式(3),可以得到所有特征值 λ i \lambda_i λi
将特征值代入式(2),可以求得对应的特征向量 x i x_i xi
如果 n n n阶方阵 A A A有 n n n个线性无关的特征向量,则
A = S Λ S − 1 (7) A=S\Lambda S^{-1} \tag{7} A=SΛS−1(7)
其中
S S S是由 A A A的 n n n个特征向量(列向量)组成的特征矩阵
Λ \Lambda Λ是由 A A A的 n n n个特征值组成的对角阵
证明:
设 S = [ x 1 , x 2 , . . . x n ] S=[x_1,x_2,...x_n] S=[x1,x2,...xn], Λ = d i a g ( λ 1 , λ 2 , . . . λ n ) \Lambda=diag(\lambda_1,\lambda_2,...\lambda_n) Λ=diag(λ1,λ2,...λn)
其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn是 A A A的特征值, x 1 , . . . , x n x_1,...,x_n x1,...,xn是对应的线性无关的特征向量,有:
A S = A [ x 1 , x 2 , . . . x n ] = [ λ 1 x 1 , λ 2 x 2 , . . . λ n x n ] = [ x 1 , x 2 , . . . , x n ] d i a g ( λ 1 , λ 2 , . . . , λ n ) = S Λ (8) \begin{aligned}AS=&A[x_1,x_2,...x_n]\\=&[\lambda_1x_1,\lambda_2x_2,...\lambda_nx_n]\\=&[x_1,x_2,...,x_n]diag(\lambda_1,\lambda_2,...,\lambda_n)\\=&S\Lambda\end{aligned} \tag{8} AS====A[x1,x2,...xn][λ1x1,λ2x2,...λnxn][x1,x2,...,xn]diag(λ1,λ2,...,λn)SΛ(8)
由(8)式易得(7)式
由式(7),易得
A k = S Λ k S − 1 (9) A^k=S\Lambda^kS^{-1} \tag{9} Ak=SΛkS−1(9)
也就是说,方阵的k次幂不改变特征向量,特征值是原来的k倍
由式(9),如果 A A A所有的特征值 ∣ λ i ∣ < 1 |\lambda_i|<1 ∣λi∣<1,那么 A k → 0 a s k → ∞ A^k\to0\ as\ k\to\infty Ak→0 as k→∞
由 A u k = u k + 1 Au_k=u_{k+1} Auk=uk+1可知
u k = A k u 0 (10) u_k=A^ku_0 \tag{10} uk=Aku0(10)
令 x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn是 A A A的 n n n个线性无关的特征向量,则 u 0 u_0 u0可分解为
u 0 = c 1 x 1 + c 2 x 2 + . . . + c n x n (11) u_0=c_1x_1+c_2x_2+...+c_nx_n \tag{11} u0=c1x1+c2x2+...+cnxn(11)
式(11)两边左乘 A k A^k Ak,有
A k u 0 = u k = c 1 λ 1 k x 1 + c 2 λ 2 k x 2 + . . . + c n λ n k x n (12) A^ku_0=u_k=c_1\lambda_1^kx_1+c_2\lambda_2^kx_2+...+c_n\lambda_n^kx_n \tag{12} Aku0=uk=c1λ1kx1+c2λ2kx2+...+cnλnkxn(12)
一个例子
斐波那契数列: 0 , 1 , 1 , 2 , 3 , 5 , 8... 0,1,1,2,3,5,8... 0,1,1,2,3,5,8...,求 F 100 F_{100} F100
首先建立方程组
F k + 2 = F k + 1 + F k F k + 1 = F k + 1 (13) \begin{aligned}F_{k+2}=&F_{k+1}+F_k\\F_{k+1}=&F_{k+1}\end{aligned} \tag{13} Fk+2=Fk+1=Fk+1+FkFk+1(13)
(第二个等式的意义是使得 A A A为方阵)
令 u k = [ F k + 1 F k ] u_k=\left[\begin{matrix}F_{k+1}\\F_k\end{matrix}\right] uk=[Fk+1Fk],则有
u k + 1 = [ 1 1 1 0 ] u k (14) u_{k+1}=\left[\begin{matrix}1&1\\1&0\end{matrix}\right]u_k \tag{14} uk+1=[1110]uk(14)
令 A = [ 1 1 1 0 ] A=\left[\begin{matrix}1&1\\1&0\end{matrix}\right] A=[1110],其特征值和对应的特征向量分别为:
λ 1 = 1 2 ( 1 + 5 ) , x 1 = [ λ 1 1 ] λ 2 = 1 2 ( 1 − 5 ) , x 2 = [ λ 2 1 ] \lambda_1=\frac{1}{2}(1+\sqrt{5}),x_1=\left[\begin{matrix}\lambda_1\\1\end{matrix}\right]\\ \lambda_2=\frac{1}{2}(1-\sqrt{5}),x_2=\left[\begin{matrix}\lambda_2\\1\end{matrix}\right] λ1=21(1+5),x1=[λ11]λ2=21(1−5),x2=[λ21]
根据式(12),有
u 100 = c 1 λ 1 100 x 1 + c 2 λ 2 100 x 2 (15) u_{100}=c_1\lambda_1^{100}x_1+c_2\lambda_2^{100}x_2 \tag{15} u100=c1λ1100x1+c2λ2100x2(15)
又因为 λ 2 < 1 \lambda_2<1 λ2<1,所以 λ 2 100 → 0 \lambda_2^{100}\to 0 λ2100→0,有
u 100 ≈ c 1 λ 1 100 x 1 (16) u_{100}\approx c_1\lambda_1^{100}x_1 \tag{16} u100≈c1λ1100x1(16)
即
[ F 101 F 100 ] ≈ c 1 λ 1 100 [ λ 1 1 ] (17) \left[\begin{matrix}F_{101}\\F_{100}\end{matrix}\right]\approx c_1\lambda_1^{100}\left[\begin{matrix}\lambda_1\\1\end{matrix}\right] \tag{17} [F101F100]≈c1λ1100[λ11](17)
从而 F 100 ≈ c 1 λ 1 100 F_{100}\approx c_1\lambda_1^{100} F100≈c1λ1100
马尔科夫链是指:在一个系统中某些因素第 n n n次结果只受第 n − 1 n-1 n−1次结果的影响。描述这种状态转移的矩阵称为马尔科夫矩阵
表1. 天气转移概率表
晴 | 阴 | 雨 | |
---|---|---|---|
晴 | 3/4 | 1/2 | 1/4 |
阴 | 1/8 | 1/4 | 1/2 |
雨 | 1/8 | 1/4 | 1/4 |
表1中行表示今天的天气,列表示明天的天气
如行2列3的1/2表示今天阴明天雨的概率为1/2
由表1得到对应的马尔科夫矩阵
A = [ 3 / 4 1 / 2 1 / 4 1 / 8 1 / 4 1 / 2 1 / 8 1 / 4 1 / 4 ] (18) A=\left[\begin{matrix}3/4&1/2&1/4\\1/8&1/4&1/2\\1/8&1/4&1/4\end{matrix}\right] \tag{18} A=⎣⎡3/41/81/81/21/41/41/41/21/4⎦⎤(18)
观察上式可以得出马尔科夫矩阵的2条性质:
此外从特征分解方面来看,马尔科夫矩阵的特征值有2个性质:
从定义可以看出,上一节中 u k + 1 = A u k u_{k+1}=Au_k uk+1=Auk的 A A A就是马尔科夫矩阵,因为它连接了前后两个状态
由此,在已知马尔科夫矩阵后便可以利用式(10-12)计算状态的变化趋势
一个例子:
假设 A 2 × 2 A_{2\times 2} A2×2矩阵表示加州和麻省的人口迁移概率:
[ U 加 U 麻 ] t = k + 1 = [ 0.9 0.2 0.1 0.8 ] [ U 加 U 麻 ] t = k (21) \left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=k+1}=\left[\begin{matrix}0.9&0.2\\0.1&0.8\end{matrix}\right]\left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=k} \tag{21} [U加U麻]t=k+1=[0.90.10.20.8][U加U麻]t=k(21)
并假定人口初始状态为 [ U 加 U 麻 ] t = 0 = [ 0 1000 ] \left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=0}=\left[\begin{matrix}0\\1000\end{matrix}\right] [U加U麻]t=0=[01000]
式(21)表示0.9概率的人留加州0.1概率的人迁移麻省,0.8概率的人留麻省0.2概率的人迁移加州(可以看出,加州的人会越来越多)
从式(21)可以得到2个特征值 λ 1 = 1 \lambda_1=1 λ1=1, λ 2 = 0.7 \lambda_2=0.7 λ2=0.7
根据式(12),可以得到 k k k次迁移后的人口状况:
u k = c 1 [ 2 1 ] + c 2 ( 0.7 ) k [ − 1 1 ] (22) u_k=c_1\left[\begin{matrix}2\\1\end{matrix}\right]+c_2(0.7)^k\left[\begin{matrix}-1\\1\end{matrix}\right] \tag{22} uk=c1[21]+c2(0.7)k[−11](22)
式(22)代入初始状态,可以求得 c 1 = 1000 / 3 c_1=1000/3 c1=1000/3, c 2 = 2000 / 3 c_2=2000/3 c2=2000/3
又因为 0. 7 k → 0 0.7^k\to 0 0.7k→0,因此有
u ∞ = 1000 3 [ 2 1 ] u_{\infty}=\frac{1000}{3}\left[\begin{matrix}2\\1\end{matrix}\right] u∞=31000[21]
求傅里叶级数展开式(23)各个系数 a i a_i ai
f ( x ) = a 0 + a 1 cos x + a 2 sin x + a 3 cos 2 x + a 4 sin 2 x + . . . (23) f(x)=a_0+a_1\cos{x}+a_2\sin{x}+a_3\cos{2x}+a_4\sin{2x}+... \tag{23} f(x)=a0+a1cosx+a2sinx+a3cos2x+a4sin2x+...(23)
可以发现,上式中各个组成是正交基: 1 、 cos x 、 sin x 、 cos 2 x . . . 1、\cos{x}、\sin{x}、\cos{2x}... 1、cosx、sinx、cos2x...
对于连续函数,向量内积变成了函数积分:
∫ 0 2 π s i n x c o s x = 0 \int_0^{2\pi}sinxcosx=0 ∫02πsinxcosx=0
将式(23)两边与 cos x \cos{x} cosx做积分,根据标准正交基性质,有
∫ 0 2 π cos x f ( x ) = ∫ 0 2 π a 0 cos x + a 1 cos 2 x + a 2 sin x cos x + . . . = a 1 ∫ 0 2 π cos 2 x (24) \begin{aligned}\int_0^{2\pi}\cos{x}f(x)=&\int_0^{2\pi}a_0\cos{x}+a_1\cos^2{x}+a_2\sin{x}\cos{x}+...\\ =&a_1\int_0^{2\pi}\cos^2{x}\end{aligned} \tag{24} ∫02πcosxf(x)==∫02πa0cosx+a1cos2x+a2sinxcosx+...a1∫02πcos2x(24)
得 a 1 = ∫ 0 2 π f ( x ) cos x d x π a_1=\frac{\int_0^{2\pi}f(x)\cos{x}dx}{\pi} a1=π∫02πf(x)cosxdx
以此类推,可以得到各个系数