线性代数(5)

目录

  • 特征值和特征向量
        • 特征向量与特征值的求解
        • 特征向量的性质
        • 方阵 A A A S Λ S − 1 S\Lambda S^{-1} SΛS1分解
        • A u k = u k + 1 Au_k=u_{k+1} Auk=uk+1的推导
  • 特征值在马尔科夫链中的应用
  • 傅里叶级数的求解


特征值和特征向量

n n n方阵 A A A,如果满足 A x = λ x (1) Ax=\lambda x \tag{1} Ax=λx(1)其中 x x x n n n维非0向量, λ \lambda λ为常数(可以为复数)
则称 λ \lambda λ A A A的特征值, x x x A A A属于 λ \lambda λ的特征向量

式(1)的几何意义是:向量 x x x经过转换矩阵 A A A后,依然保持原来的方向,只有 λ \lambda λ倍伸缩的变化


特征向量与特征值的求解

对式(1)稍作变形,有
( A − λ I ) x = 0 (2) (A-\lambda I)x=0 \tag{2} (AλI)x=0(2)
要使得式(2)有非0解,则 A − λ I A-\lambda I AλI奇异矩阵,即
d e t ( A − λ I ) = 0 (3) det(A-\lambda I)=0 \tag{3} det(AλI)=0(3)
求解式(3),可以得到所有特征值 λ i \lambda_i λi
将特征值代入式(2),可以求得对应的特征向量 x i x_i xi


特征向量的性质

  1. 所有特征值的和(迹)等于矩阵对角线之和
    t r ( A ) = ∑ λ i = ∑ a k k (4) tr(A)=\sum{\lambda_i}=\sum{a_{kk}} \tag{4} tr(A)=λi=akk(4)
  2. 所有特征值的乘积等于矩阵的行列式
    ∏ λ i = ∣ A ∣ (5) \prod{\lambda_i}=|A| \tag{5} λi=A(5)
  3. 对角矩阵三角矩阵的特征值是其对角线上的元素
    λ i = a i i (6) \lambda_i=a_{ii} \tag{6} λi=aii(6)
  4. n n n阶的方阵,如果其有 n n n个不同的特征值,那么对应的 n n n个特征向量线性无关(充分不必要条件)

方阵 A A A S Λ S − 1 S\Lambda S^{-1} SΛS1分解

如果 n n n阶方阵 A A A n n n线性无关的特征向量,则
A = S Λ S − 1 (7) A=S\Lambda S^{-1} \tag{7} A=SΛS1(7)
其中
S S S是由 A A A n n n个特征向量(列向量)组成的特征矩阵
Λ \Lambda Λ是由 A A A n n n个特征值组成的对角阵

证明:
S = [ x 1 , x 2 , . . . x n ] S=[x_1,x_2,...x_n] S=[x1,x2,...xn] Λ = d i a g ( λ 1 , λ 2 , . . . λ n ) \Lambda=diag(\lambda_1,\lambda_2,...\lambda_n) Λ=diag(λ1,λ2,...λn)
其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1,...,λn A A A的特征值, x 1 , . . . , x n x_1,...,x_n x1,...,xn是对应的线性无关的特征向量,有:
A S = A [ x 1 , x 2 , . . . x n ] = [ λ 1 x 1 , λ 2 x 2 , . . . λ n x n ] = [ x 1 , x 2 , . . . , x n ] d i a g ( λ 1 , λ 2 , . . . , λ n ) = S Λ (8) \begin{aligned}AS=&A[x_1,x_2,...x_n]\\=&[\lambda_1x_1,\lambda_2x_2,...\lambda_nx_n]\\=&[x_1,x_2,...,x_n]diag(\lambda_1,\lambda_2,...,\lambda_n)\\=&S\Lambda\end{aligned} \tag{8} AS====A[x1,x2,...xn][λ1x1,λ2x2,...λnxn][x1,x2,...,xn]diag(λ1,λ2,...,λn)SΛ(8)

由(8)式易得(7)式

由式(7),易得
A k = S Λ k S − 1 (9) A^k=S\Lambda^kS^{-1} \tag{9} Ak=SΛkS1(9)
也就是说,方阵的k次幂不改变特征向量,特征值是原来的k倍

由式(9),如果 A A A所有的特征值 ∣ λ i ∣ < 1 |\lambda_i|<1 λi<1,那么 A k → 0   a s   k → ∞ A^k\to0\ as\ k\to\infty Ak0 as k


A u k = u k + 1 Au_k=u_{k+1} Auk=uk+1的推导

A u k = u k + 1 Au_k=u_{k+1} Auk=uk+1可知
u k = A k u 0 (10) u_k=A^ku_0 \tag{10} uk=Aku0(10)
x 1 , x 2 , . . . , x n x_1,x_2,...,x_n x1,x2,...,xn A A A n n n个线性无关的特征向量,则 u 0 u_0 u0可分解为
u 0 = c 1 x 1 + c 2 x 2 + . . . + c n x n (11) u_0=c_1x_1+c_2x_2+...+c_nx_n \tag{11} u0=c1x1+c2x2+...+cnxn(11)
式(11)两边左乘 A k A^k Ak,有
A k u 0 = u k = c 1 λ 1 k x 1 + c 2 λ 2 k x 2 + . . . + c n λ n k x n (12) A^ku_0=u_k=c_1\lambda_1^kx_1+c_2\lambda_2^kx_2+...+c_n\lambda_n^kx_n \tag{12} Aku0=uk=c1λ1kx1+c2λ2kx2+...+cnλnkxn(12)

一个例子

斐波那契数列: 0 , 1 , 1 , 2 , 3 , 5 , 8... 0,1,1,2,3,5,8... 0,1,1,2,3,5,8...,求 F 100 F_{100} F100

首先建立方程组
F k + 2 = F k + 1 + F k F k + 1 = F k + 1 (13) \begin{aligned}F_{k+2}=&F_{k+1}+F_k\\F_{k+1}=&F_{k+1}\end{aligned} \tag{13} Fk+2=Fk+1=Fk+1+FkFk+1(13)
(第二个等式的意义是使得 A A A为方阵)
u k = [ F k + 1 F k ] u_k=\left[\begin{matrix}F_{k+1}\\F_k\end{matrix}\right] uk=[Fk+1Fk],则有
u k + 1 = [ 1 1 1 0 ] u k (14) u_{k+1}=\left[\begin{matrix}1&1\\1&0\end{matrix}\right]u_k \tag{14} uk+1=[1110]uk(14)

A = [ 1 1 1 0 ] A=\left[\begin{matrix}1&1\\1&0\end{matrix}\right] A=[1110],其特征值和对应的特征向量分别为:
λ 1 = 1 2 ( 1 + 5 ) , x 1 = [ λ 1 1 ] λ 2 = 1 2 ( 1 − 5 ) , x 2 = [ λ 2 1 ] \lambda_1=\frac{1}{2}(1+\sqrt{5}),x_1=\left[\begin{matrix}\lambda_1\\1\end{matrix}\right]\\ \lambda_2=\frac{1}{2}(1-\sqrt{5}),x_2=\left[\begin{matrix}\lambda_2\\1\end{matrix}\right] λ1=21(1+5 ),x1=[λ11]λ2=21(15 ),x2=[λ21]
根据式(12),有
u 100 = c 1 λ 1 100 x 1 + c 2 λ 2 100 x 2 (15) u_{100}=c_1\lambda_1^{100}x_1+c_2\lambda_2^{100}x_2 \tag{15} u100=c1λ1100x1+c2λ2100x2(15)
又因为 λ 2 < 1 \lambda_2<1 λ2<1,所以 λ 2 100 → 0 \lambda_2^{100}\to 0 λ21000,有
u 100 ≈ c 1 λ 1 100 x 1 (16) u_{100}\approx c_1\lambda_1^{100}x_1 \tag{16} u100c1λ1100x1(16)

[ F 101 F 100 ] ≈ c 1 λ 1 100 [ λ 1 1 ] (17) \left[\begin{matrix}F_{101}\\F_{100}\end{matrix}\right]\approx c_1\lambda_1^{100}\left[\begin{matrix}\lambda_1\\1\end{matrix}\right] \tag{17} [F101F100]c1λ1100[λ11](17)
从而 F 100 ≈ c 1 λ 1 100 F_{100}\approx c_1\lambda_1^{100} F100c1λ1100


特征值在马尔科夫链中的应用

马尔科夫链是指:在一个系统中某些因素第 n n n次结果只受第 n − 1 n-1 n1次结果的影响。描述这种状态转移的矩阵称为马尔科夫矩阵

                                      表1. 天气转移概率表

3/4 1/2 1/4
1/8 1/4 1/2
1/8 1/4 1/4

表1中行表示今天的天气,列表示明天的天气
如行2列3的1/2表示今天阴明天雨的概率为1/2

由表1得到对应的马尔科夫矩阵
A = [ 3 / 4 1 / 2 1 / 4 1 / 8 1 / 4 1 / 2 1 / 8 1 / 4 1 / 4 ] (18) A=\left[\begin{matrix}3/4&1/2&1/4\\1/8&1/4&1/2\\1/8&1/4&1/4\end{matrix}\right] \tag{18} A=3/41/81/81/21/41/41/41/21/4(18)
观察上式可以得出马尔科夫矩阵的2条性质

  1. 所有值均不大于1
    0 ≤ a i j ≤ 1 (19) 0\leq a_{ij}\leq 1 \tag{19} 0aij1(19)
    因为描述的都是概率
  2. 矩阵每列之和为1
    ∑ i = 1 n a i j = 1 (20) \sum_{i=1}^n{a_{ij}} = 1 \tag{20} i=1naij=1(20)
    条件概率

此外从特征分解方面来看,马尔科夫矩阵的特征值有2个性质:

  1. λ = 1 \lambda=1 λ=1是一个特征值
  2. 其余特征值满足 ∣ λ i ∣ < 1 |\lambda_i|<1 λi<1

从定义可以看出,上一节中 u k + 1 = A u k u_{k+1}=Au_k uk+1=Auk A A A就是马尔科夫矩阵,因为它连接了前后两个状态

由此,在已知马尔科夫矩阵后便可以利用式(10-12)计算状态的变化趋势

一个例子:
假设 A 2 × 2 A_{2\times 2} A2×2矩阵表示加州和麻省的人口迁移概率:
[ U 加 U 麻 ] t = k + 1 = [ 0.9 0.2 0.1 0.8 ] [ U 加 U 麻 ] t = k (21) \left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=k+1}=\left[\begin{matrix}0.9&0.2\\0.1&0.8\end{matrix}\right]\left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=k} \tag{21} [UU]t=k+1=[0.90.10.20.8][UU]t=k(21)
并假定人口初始状态为 [ U 加 U 麻 ] t = 0 = [ 0 1000 ] \left[\begin{matrix}U_加\\U_麻\end{matrix}\right]_{t=0}=\left[\begin{matrix}0\\1000\end{matrix}\right] [UU]t=0=[01000]

式(21)表示0.9概率的人留加州0.1概率的人迁移麻省,0.8概率的人留麻省0.2概率的人迁移加州(可以看出,加州的人会越来越多)

从式(21)可以得到2个特征值 λ 1 = 1 \lambda_1=1 λ1=1 λ 2 = 0.7 \lambda_2=0.7 λ2=0.7
根据式(12),可以得到 k k k次迁移后的人口状况:
u k = c 1 [ 2 1 ] + c 2 ( 0.7 ) k [ − 1 1 ] (22) u_k=c_1\left[\begin{matrix}2\\1\end{matrix}\right]+c_2(0.7)^k\left[\begin{matrix}-1\\1\end{matrix}\right] \tag{22} uk=c1[21]+c2(0.7)k[11](22)

式(22)代入初始状态,可以求得 c 1 = 1000 / 3 c_1=1000/3 c1=1000/3 c 2 = 2000 / 3 c_2=2000/3 c2=2000/3
又因为 0. 7 k → 0 0.7^k\to 0 0.7k0,因此有
u ∞ = 1000 3 [ 2 1 ] u_{\infty}=\frac{1000}{3}\left[\begin{matrix}2\\1\end{matrix}\right] u=31000[21]


傅里叶级数的求解

求傅里叶级数展开式(23)各个系数 a i a_i ai
f ( x ) = a 0 + a 1 cos ⁡ x + a 2 sin ⁡ x + a 3 cos ⁡ 2 x + a 4 sin ⁡ 2 x + . . . (23) f(x)=a_0+a_1\cos{x}+a_2\sin{x}+a_3\cos{2x}+a_4\sin{2x}+... \tag{23} f(x)=a0+a1cosx+a2sinx+a3cos2x+a4sin2x+...(23)

可以发现,上式中各个组成是正交基 1 、 cos ⁡ x 、 sin ⁡ x 、 cos ⁡ 2 x . . . 1、\cos{x}、\sin{x}、\cos{2x}... 1cosxsinxcos2x...

对于连续函数,向量内积变成了函数积分
∫ 0 2 π s i n x c o s x = 0 \int_0^{2\pi}sinxcosx=0 02πsinxcosx=0

将式(23)两边与 cos ⁡ x \cos{x} cosx做积分,根据标准正交基性质,有
∫ 0 2 π cos ⁡ x f ( x ) = ∫ 0 2 π a 0 cos ⁡ x + a 1 cos ⁡ 2 x + a 2 sin ⁡ x cos ⁡ x + . . . = a 1 ∫ 0 2 π cos ⁡ 2 x (24) \begin{aligned}\int_0^{2\pi}\cos{x}f(x)=&\int_0^{2\pi}a_0\cos{x}+a_1\cos^2{x}+a_2\sin{x}\cos{x}+...\\ =&a_1\int_0^{2\pi}\cos^2{x}\end{aligned} \tag{24} 02πcosxf(x)==02πa0cosx+a1cos2x+a2sinxcosx+...a102πcos2x(24)
a 1 = ∫ 0 2 π f ( x ) cos ⁡ x d x π a_1=\frac{\int_0^{2\pi}f(x)\cos{x}dx}{\pi} a1=π02πf(x)cosxdx
以此类推,可以得到各个系数

你可能感兴趣的:(数据挖掘)