矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵

一、线性变换

1.1 什么是线性变换

首先给出一个比较抽象的解释方式:
对 于 一 个 变 换 A , 找 两 个 向 量 , 如 果 这 个 变 换 满 足 可 加 性 与 齐 次 性 : 对于一个变换A,找两个向量,如果这个变换满足可加性与齐次性: A
A ( α + β ) = A α + A β A(\alpha+\beta)=A\alpha+A\beta A(α+β)=Aα+Aβ
A ( k α ) = k ( A α ) A(k\alpha)=k(A\alpha) A(kα)=k(Aα)
那 么 这 个 变 换 就 是 线 性 变 换 那么这个变换就是线性变换 线

1.2 从函数角度理解

1.2.1 首先复习下函数

函数客观的讲就是把x轴上的点映射到曲线上,以下是一个正弦函数:
矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第1张图片

1.2.2 线性函数

有的函数,比如y=x,是把x轴上的点映射到直线上,这种称之为线性函数:
矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第2张图片

1.3 从线性函数到线性变换

线性函数其实就是线性变换,为了看起来更像线性变换,这里换一种标记方法:

之前的y=x,可以认为是把 ( a , 0 ) (a,0) (a,0)映射到了 ( 0 , a ) (0,a) (0,a)点,这被称为线性变换T,记作:
在这里插入图片描述
矩阵的形式如下:
在这里插入图片描述
这里将 ( a , 0 ) (a,0) (a,0)替换为平面内所有的点 ( a , b ) (a,b) (a,b),我们就可以对整个平面做变换,该线性变换记作:
在这里插入图片描述
写成矩阵的形式:
在这里插入图片描述
我们记:
在这里插入图片描述
这时可以得到一个更简便的记法(这种形式看起来更像线性方程 y = a x y=ax y=ax):
在这里插入图片描述
我们已经假定 y → , x → \overrightarrow{y},\overrightarrow{x} y ,x 指代了平面上所有的点,所以干脆可以更简化为:

线性变换通过矩阵A来表示

而y=x不过是这个A的一个特殊情况

1.4 矩阵A与基

刚才的结论其实是不完整的,还缺少了一个信息:
y=x是基于直角坐标系的,通过这个转换:
在这里插入图片描述
得到的A也是基于直角坐标系的。
只是在线性变换中,我们不称之为直角坐标系,而是叫做标准正交基。
标准正交基是:
在这里插入图片描述
它们张成的线性空间如下:

矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第3张图片
这里,对前面的结论进行一个补充:

线性变换通过指定基下的矩阵A来表示

注意这个”指定基“,这说明基不一定固定为正交基,由此引出相似矩阵的概念。

二、相似矩阵

2.1 定义:

A , B A,B A,B都是n阶矩阵,若有n阶可逆矩阵 P P P,使:
在这里插入图片描述
则称 B B B A A A的相似矩阵,或者说 A A A B B B相似。

2.2 解释

矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第4张图片
那怎么得到不同基下的矩阵呢? 这里看下具体的变换细节。

2.2.1 细节

首先看一个图,下面给出关于图的解释:
矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第5张图片

  • 有两个基: V 1 : { i → , j → } V_1:\{\overrightarrow{i},\overrightarrow{j}\} V1:{i ,j } { i ′ → , j ′ → } \{\overrightarrow{i'},\overrightarrow{j'}\} {i ,j }
  • V 1 → V 2 V1\to V2 V1V2,可以通过 P − 1 P^{-1} P1转换
  • V 2 → V 1 V2\to V1 V2V1,可以通过 P P P转换

整个转换的核心如下:

矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第6张图片
对上面的图进行解释:

  • v ′ → \overrightarrow{v'} v V 2 V_2 V2的点
  • v ′ → \overrightarrow{v'} v 通过 P P P变为 V 1 V_1 V1下的点,即 P v ′ → P\overrightarrow{v'} Pv
  • V 1 V_1 V1下,通过矩阵 A A A完成线性变换,即 A P v ′ → AP\overrightarrow{v'} APv
  • 通过 P − 1 P^{-1} P1变回 V 2 V_2 V2下的点,即 P − 1 A P v ′ → P^{-1}AP\overrightarrow{v'} P1APv

综上,我们可以有:
在这里插入图片描述
我们可以认为:
在这里插入图片描述
那么B和A互为相似矩阵。

这里还有一个细节: V 2 → V 1 V_2\to V_1 V2V1的转换矩阵 P P P是什么?
首先看空间中的一个点,假设为 m m m点:
矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第7张图片
这时我们知道,不管有没有基,这个点都是客观存在的,然后给出其在 i ′ → , j ′ → \overrightarrow{i'},\overrightarrow{j'} i ,j 的坐标 v ′ → \overrightarrow{v'} v
矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第8张图片
为了表示 v ′ → \overrightarrow{v'} v i ′ → , j ′ → \overrightarrow{i'},\overrightarrow{j'} i ,j 下的坐标,我们写成这样:
在这里插入图片描述
如果我们知道了 i ′ → , j ′ → \overrightarrow{i'},\overrightarrow{j'} i ,j i → , j → \overrightarrow{i},\overrightarrow{j} i ,j 下的坐标:
矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第9张图片
那么有:
v ′ → = a i ′ → + j ′ → = a ( c i → + d j → ) + b ( e i → + f j → ) \overrightarrow{v'}=a\overrightarrow{i'}+\overrightarrow{j'}=a(c\overrightarrow{i}+d\overrightarrow{j})+b(e\overrightarrow{i}+f\overrightarrow{j}) v =ai +j =a(ci +dj )+b(ei +fj )

此时,实际上m点的坐标,已经变到了 i → , j → \overrightarrow{i},\overrightarrow{j} i ,j 下的 v → \overrightarrow{v} v
矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第10张图片
继续推导:
矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第11张图片
所以P其实就是:
在这里插入图片描述
这里的 i ′ → , j ′ → \overrightarrow{i'},\overrightarrow{j'} i ,j 是在 i → , j → \overrightarrow{i},\overrightarrow{j} i ,j 下的坐标。

2.2.2 对角矩阵

为什么我们需要相似矩阵呢?
比如A这个矩阵:
在这里插入图片描述
可以这样分解:
在这里插入图片描述
其中:

在这里插入图片描述
B就是对角矩阵,看上去好看很多,相似变换其实就是坐标转换,转换到一个更方便计算的简单坐标系。

https://www.matongxue.com/madocs/491.html

2.3 相似的性质:

  1. 反身性: A ∽ A ( I − 1 A I = A ) A\backsim A\quad(I^{-1}AI=A) AA(I1AI=A)
  2. 对称性: A ∽ B ⇒ B ∽ A A\backsim B\rArr B\backsim A ABBA
    ( A ∽ B ⇒ P − 1 A P = B ⇒ A = ( P − 1 ) − 1 B P − 1 ) (A\backsim B\rArr P^{-1}AP=B\rArr A=(P^{-1})^{-1}BP^{-1}) (ABP1AP=BA=(P1)1BP1)
  3. 传递性: A ∽ B , B ∽ C , ⇒ A ∽ C A\backsim B,B\backsim C,\rArr A\backsim C AB,BC,AC
    P 1 − 1 A P 1 = B , P 2 − 1 B P 2 = C P_1^{-1}AP_1=B,P_2^{-1}BP_2=C P11AP1=B,P21BP2=C
    ∴ P 2 − 1 P 1 − 1 A P 2 P 1 = C \therefore P_2^{-1}P_1^{-1}AP_2P_1=C P21P11AP2P1=C
    ∴ ( P 1 P 2 ) − 1 A ( P 1 P 2 ) = C \therefore (P_1P_2)^{-1}A(P_1P_2)=C (P1P2)1A(P1P2)=C
  4. 相似矩阵的秩相同

三、对角矩阵

3.1 矩阵可对角化

如果矩阵 A A A能与对角矩阵相似,则称 A A A可对角化
例子:
A = [ 1 1 2 2 ] , P = [ 1 − 1 2 1 ] A=\begin{bmatrix}1&1\\2&2\end{bmatrix},P=\begin{bmatrix}1&-1\\2&1\end{bmatrix} A=[1212],P=[1211] ,则有:
P − 1 A P = [ 3 0 0 0 ] P^{-1}AP=\begin{bmatrix}3&0\\0&0\end{bmatrix} P1AP=[3000]
即: A ∽ [ 3 0 0 0 ] A\backsim\begin{bmatrix}3&0\\0&0\end{bmatrix} A[3000]
从而 A A A可对角化

3.2 可对角化的条件

3.2.1 定理1:n阶矩阵A可对角化的充分必要条件是A有n个线性无关的特征向量

证明:
必要性:
如果A可对角化,则存在可逆矩阵P,使得:
A = [ λ 1 0 0 … 0 0 λ 2 0 … 0 ⋮ … … ⋱ ⋮ 0 0 0 … λ n ] A=\begin{bmatrix}\lambda_1&0&0&\dots&0\\0&\lambda_2&0&\dots&0\\\vdots&\dots&\dots&\ddots&\vdots\\0&0&0&\dots&\lambda_n\end{bmatrix} A=λ1000λ2000000λn

将P按列分块得到 P = [ X 1 , X 2 , . . . , X n ] P=[X_1,X_2,...,X_n] P=[X1,X2,...,Xn],从而有:

A P = A [ X 1 , X 2 , . . . , X n ] = P [ λ 1 0 … 0 0 λ 2 … 0 ⋮ … ⋱ ⋮ 0 0 … λ n ] = [ X 1 , X 2 , . . . , X n ] [ λ 1 0 … 0 0 λ 2 … 0 ⋮ … ⋱ ⋮ 0 0 … λ n ] AP=A[X_1,X_2,...,X_n]=P\begin{bmatrix}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&\lambda_n\end{bmatrix}=[X_1,X_2,...,X_n]\begin{bmatrix}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&\lambda_n\end{bmatrix} AP=A[X1,X2,...,Xn]=Pλ1000λ2000λn=[X1,X2,...,Xn]λ1000λ2000λn
因此有:
A X i = λ i X i ( i = 1 , 2 , . . . , n ) AX_i=\lambda_iX_i\quad(i=1,2,...,n) AXi=λiXi(i=1,2,...,n),所以 X i X_i Xi是A的属于特征值 λ i \lambda_i λi的特征向量,又由P可逆,知 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn线性无关,故A有n个线性无关的特征向量。

3.2.2 定理2:矩阵A的属于不同特征值的特征向量是线性无关的
3.2.3 推论1:若n阶矩阵有n个互不相同的特征值 λ 1 , λ 2 , . . . , λ n \lambda_1,\lambda_2,...,\lambda_n λ1,λ2,...,λn,则A可对角化,且:

矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第12张图片

3.2.4 定理三

矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第13张图片

https://wenku.baidu.com/view/58dcd9d376eeaeaad1f33024.html

3.3 对角矩阵的性质

3.3.1 对角矩阵的秩等于其对角线上非零元素的个数。

四、可逆矩阵

4.1 定义

设A为n阶方阵,若存在n阶方阵B,使得:
A B = B A = I AB=BA=I AB=BA=I
则称A为可逆矩阵,B为A的逆矩阵,记为 A − 1 = B A^{-1}=B A1=B

单位矩阵I:
I − 1 = I I^{-1}=I I1=I
( k I ) − 1 = 1 k I , ( k ≠ 0 ) (kI)^{-1}={1\over k}I,(k\ne0) (kI)1=k1I,(k=0)

对角矩阵:

D= [ d 1 0 … 0 0 d 2 … 0 ⋮ … ⋱ ⋮ 0 0 … d n ] , ( d 1 , d 2 , . . . d n ≠ 0 ) ; D − 1 = [ 1 d 1 0 … 0 0 1 d 2 … 0 ⋮ … ⋱ ⋮ 0 0 … 1 d n ] \begin{bmatrix}d_1&0&\dots&0\\0&d_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&d_n\end{bmatrix},(d_1,d_2,...d_n\ne0);\quad D^{-1}=\begin{bmatrix}{1\over d_1}&0&\dots&0\\0&{1\over d_2}&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&{1\over d_n}\end{bmatrix} d1000d2000dn,(d1,d2,...dn=0);D1=d11000d21000dn1

4.2 定理

4.2.1 定理1:设A可逆,则它的逆是唯一的

证明:
设有B和C满足:AB=BA=I,AC=CA=I
则:B=BI=B(AC)=(BA)C=IC=C

4.2.2 定理2:设A为n阶矩阵,则下列命题等价:
  1. A是可逆的
  2. AX=0只有零解
    1 → 2 : 设 A 是 可 逆 的 , 且 X 是 A X = 0 的 解 , 则 : 1\to2:设A是可逆的,且X是AX=0的解,则: 12AXAX=0
    X = I X = ( A − 1 A ) X = A − 1 ( A X ) = A − 1 0 = 0 X=IX=(A^{-1}A)X=A^{-1}(AX)=A^{-1}0=0 X=IX=(A1A)X=A1(AX)=A10=0
    所以,AX=0只有零解
  3. A与I行等价
    2 → 3 : A 经 过 初 等 行 变 换 到 B ( 行 阶 梯 矩 阵 ) 2\to3:A经过初等行变换到B(行阶梯矩阵) 23AB
    B X = 0 只 有 零 解 , B 的 对 角 元 均 非 零 , 否 则 B 的 最 后 一 行 的 元 全 为 零 , 则 B X = 0 有 非 零 解 ( 矛 盾 ) BX=0只有零解,B的对角元均非零,否则B的最后一行的元全为零,则BX=0有非零解(矛盾) BX=0BBBX=0
    则 , B 经 初 等 行 变 换 后 得 到 的 行 最 简 化 矩 阵 = I 则,B经初等行变换后得到的行最简化矩阵=I B=I
  4. A可表为有限个初等矩阵的乘积
    3 → 4 : 由 3 , 可 得 A 可 经 初 等 行 变 换 得 到 I , 所 以 存 在 初 等 矩 阵 E 1 , E 2 , . . . E k , 使 得 E k , . . . E 1 A = I 3\to4:由3,可得A可经初等行变换得到I,所以存在初等矩阵E_1,E_2,...E_k,使得E_k,...E_1A=I 343AIE1,E2,...Ek使Ek,...E1A=I
    A = E 1 − 1 . . . . E k − 1 I = E 1 − 1 . . . E k − 1 A=E_1^{-1}....E_k^{-1}I=E_1^{-1}...E_k^{-1} A=E11....Ek1I=E11...Ek1
4.2.3 推论:设A为n阶矩阵,则AX=b有唯一解的充要条件是A可逆

证明:
充分性:
A X = b 有 唯 一 解 : X = A − 1 b AX=b有唯一解:X=A^{-1}b AX=bX=A1b
必要性:
设 A X = b 有 唯 一 解 X , 但 A 不 可 逆 设AX=b有唯一解X,但A不可逆 AX=bXA
A 不 可 逆 ⇒ A X = 0 有 非 零 解 Z A不可逆\rArr AX=0有非零解Z AAX=0Z
令 Y = X + Z 令Y=X+Z Y=X+Z
A Y = A ( X + Z ) = A X + A Z = b + 0 = b AY=A(X+Z)=AX+AZ=b+0=b AY=A(X+Z)=AX+AZ=b+0=b
则 Y 为 A X = b 的 解 , 矛 盾 则Y为AX=b的解,矛盾 YAX=b
所以可得A可逆

4.3 性质

设A,B皆为n阶可逆矩阵,数 λ ≠ 0 \lambda\ne0 λ=0,则:

  1. A − 1 A^{-1} A1可逆,且 ( A − 1 ) − 1 = A (A^{-1})^{-1}=A (A1)1=A
  2. λ A \lambda A λA可逆,且 ( λ A ) − 1 = 1 λ A − 1 (\lambda A)^{-1}={1\over\lambda}A^{-1} (λA)1=λ1A1
  3. A B AB AB可逆,且 ( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)1=B1A1
    ( A B ) ( B − 1 A − 1 ) = A ( B B − 1 ) A − 1 = A A − 1 = I (AB)(B^{-1}A^{-1})=A(BB^{-1})A^{-1}=AA^{-1}=I (AB)(B1A1)=A(BB1)A1=AA1=I
  4. A T A^T AT可逆,且 ( A T ) − 1 = ( A − 1 ) T (A^T)^{-1}=(A^{-1})^T (AT)1=(A1)T
    A T ( A − 1 ) T = ( A − 1 A ) T = I A^T(A^{-1})^T=(A^{-1}A)^T=I AT(A1)T=(A1A)T=I
  5. 逆矩阵行列式和原矩阵行列式的关系
    矩阵知识:线性变换、相似矩阵、对角矩阵、逆矩阵_第14张图片

https://wenku.baidu.com/view/84eda27b27284b73f24250ce.html?sxts=1591611918853

五、过渡矩阵

过渡矩阵是基与基之间的一个可逆线性变换,在一个空间V下可能存在不同的基。假设有两组基分别为A,B。由基A到基B可以表示为B=AP,过渡矩阵 P = A − 1 B P=A^{-1}B P=A1B,它表示的是基与基之间的关系。

你可能感兴趣的:(矩阵)