首先给出一个比较抽象的解释方式:
对 于 一 个 变 换 A , 找 两 个 向 量 , 如 果 这 个 变 换 满 足 可 加 性 与 齐 次 性 : 对于一个变换A,找两个向量,如果这个变换满足可加性与齐次性: 对于一个变换A,找两个向量,如果这个变换满足可加性与齐次性:
A ( α + β ) = A α + A β A(\alpha+\beta)=A\alpha+A\beta A(α+β)=Aα+Aβ
A ( k α ) = k ( A α ) A(k\alpha)=k(A\alpha) A(kα)=k(Aα)
那 么 这 个 变 换 就 是 线 性 变 换 那么这个变换就是线性变换 那么这个变换就是线性变换
函数客观的讲就是把x轴上的点映射到曲线上,以下是一个正弦函数:
有的函数,比如y=x,是把x轴上的点映射到直线上,这种称之为线性函数:
线性函数其实就是线性变换,为了看起来更像线性变换,这里换一种标记方法:
之前的y=x,可以认为是把 ( a , 0 ) (a,0) (a,0)映射到了 ( 0 , a ) (0,a) (0,a)点,这被称为线性变换T,记作:
矩阵的形式如下:
这里将 ( a , 0 ) (a,0) (a,0)替换为平面内所有的点 ( a , b ) (a,b) (a,b),我们就可以对整个平面做变换,该线性变换记作:
写成矩阵的形式:
我们记:
这时可以得到一个更简便的记法(这种形式看起来更像线性方程 y = a x y=ax y=ax):
我们已经假定 y → , x → \overrightarrow{y},\overrightarrow{x} y,x指代了平面上所有的点,所以干脆可以更简化为:
线性变换通过矩阵A来表示
而y=x不过是这个A的一个特殊情况
刚才的结论其实是不完整的,还缺少了一个信息:
y=x是基于直角坐标系的,通过这个转换:
得到的A也是基于直角坐标系的。
只是在线性变换中,我们不称之为直角坐标系,而是叫做标准正交基。
标准正交基是:
它们张成的线性空间如下:
线性变换通过指定基下的矩阵A来表示
注意这个”指定基“,这说明基不一定固定为正交基,由此引出相似矩阵的概念。
设 A , B A,B A,B都是n阶矩阵,若有n阶可逆矩阵 P P P,使:
则称 B B B是 A A A的相似矩阵,或者说 A A A和 B B B相似。
整个转换的核心如下:
综上,我们可以有:
我们可以认为:
那么B和A互为相似矩阵。
这里还有一个细节: V 2 → V 1 V_2\to V_1 V2→V1的转换矩阵 P P P是什么?
首先看空间中的一个点,假设为 m m m点:
这时我们知道,不管有没有基,这个点都是客观存在的,然后给出其在 i ′ → , j ′ → \overrightarrow{i'},\overrightarrow{j'} i′,j′的坐标 v ′ → \overrightarrow{v'} v′:
为了表示 v ′ → \overrightarrow{v'} v′是 i ′ → , j ′ → \overrightarrow{i'},\overrightarrow{j'} i′,j′下的坐标,我们写成这样:
如果我们知道了 i ′ → , j ′ → \overrightarrow{i'},\overrightarrow{j'} i′,j′在 i → , j → \overrightarrow{i},\overrightarrow{j} i,j下的坐标:
那么有:
v ′ → = a i ′ → + j ′ → = a ( c i → + d j → ) + b ( e i → + f j → ) \overrightarrow{v'}=a\overrightarrow{i'}+\overrightarrow{j'}=a(c\overrightarrow{i}+d\overrightarrow{j})+b(e\overrightarrow{i}+f\overrightarrow{j}) v′=ai′+j′=a(ci+dj)+b(ei+fj)
此时,实际上m点的坐标,已经变到了 i → , j → \overrightarrow{i},\overrightarrow{j} i,j下的 v → \overrightarrow{v} v:
继续推导:
所以P其实就是:
这里的 i ′ → , j ′ → \overrightarrow{i'},\overrightarrow{j'} i′,j′是在 i → , j → \overrightarrow{i},\overrightarrow{j} i,j下的坐标。
为什么我们需要相似矩阵呢?
比如A这个矩阵:
可以这样分解:
其中:
B就是对角矩阵,看上去好看很多,相似变换其实就是坐标转换,转换到一个更方便计算的简单坐标系。
https://www.matongxue.com/madocs/491.html
如果矩阵 A A A能与对角矩阵相似,则称 A A A可对角化
例子:
设 A = [ 1 1 2 2 ] , P = [ 1 − 1 2 1 ] A=\begin{bmatrix}1&1\\2&2\end{bmatrix},P=\begin{bmatrix}1&-1\\2&1\end{bmatrix} A=[1212],P=[12−11] ,则有:
P − 1 A P = [ 3 0 0 0 ] P^{-1}AP=\begin{bmatrix}3&0\\0&0\end{bmatrix} P−1AP=[3000]
即: A ∽ [ 3 0 0 0 ] A\backsim\begin{bmatrix}3&0\\0&0\end{bmatrix} A∽[3000]
从而 A A A可对角化
证明:
必要性:
如果A可对角化,则存在可逆矩阵P,使得:
A = [ λ 1 0 0 … 0 0 λ 2 0 … 0 ⋮ … … ⋱ ⋮ 0 0 0 … λ n ] A=\begin{bmatrix}\lambda_1&0&0&\dots&0\\0&\lambda_2&0&\dots&0\\\vdots&\dots&\dots&\ddots&\vdots\\0&0&0&\dots&\lambda_n\end{bmatrix} A=⎣⎢⎢⎢⎡λ10⋮00λ2…000…0……⋱…00⋮λn⎦⎥⎥⎥⎤
将P按列分块得到 P = [ X 1 , X 2 , . . . , X n ] P=[X_1,X_2,...,X_n] P=[X1,X2,...,Xn],从而有:
A P = A [ X 1 , X 2 , . . . , X n ] = P [ λ 1 0 … 0 0 λ 2 … 0 ⋮ … ⋱ ⋮ 0 0 … λ n ] = [ X 1 , X 2 , . . . , X n ] [ λ 1 0 … 0 0 λ 2 … 0 ⋮ … ⋱ ⋮ 0 0 … λ n ] AP=A[X_1,X_2,...,X_n]=P\begin{bmatrix}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&\lambda_n\end{bmatrix}=[X_1,X_2,...,X_n]\begin{bmatrix}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&\lambda_n\end{bmatrix} AP=A[X1,X2,...,Xn]=P⎣⎢⎢⎢⎡λ10⋮00λ2…0……⋱…00⋮λn⎦⎥⎥⎥⎤=[X1,X2,...,Xn]⎣⎢⎢⎢⎡λ10⋮00λ2…0……⋱…00⋮λn⎦⎥⎥⎥⎤
因此有:
A X i = λ i X i ( i = 1 , 2 , . . . , n ) AX_i=\lambda_iX_i\quad(i=1,2,...,n) AXi=λiXi(i=1,2,...,n),所以 X i X_i Xi是A的属于特征值 λ i \lambda_i λi的特征向量,又由P可逆,知 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn线性无关,故A有n个线性无关的特征向量。
https://wenku.baidu.com/view/58dcd9d376eeaeaad1f33024.html
设A为n阶方阵,若存在n阶方阵B,使得:
A B = B A = I AB=BA=I AB=BA=I
则称A为可逆矩阵,B为A的逆矩阵,记为 A − 1 = B A^{-1}=B A−1=B
单位矩阵I:
I − 1 = I I^{-1}=I I−1=I
( k I ) − 1 = 1 k I , ( k ≠ 0 ) (kI)^{-1}={1\over k}I,(k\ne0) (kI)−1=k1I,(k=0)
对角矩阵:
D= [ d 1 0 … 0 0 d 2 … 0 ⋮ … ⋱ ⋮ 0 0 … d n ] , ( d 1 , d 2 , . . . d n ≠ 0 ) ; D − 1 = [ 1 d 1 0 … 0 0 1 d 2 … 0 ⋮ … ⋱ ⋮ 0 0 … 1 d n ] \begin{bmatrix}d_1&0&\dots&0\\0&d_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&d_n\end{bmatrix},(d_1,d_2,...d_n\ne0);\quad D^{-1}=\begin{bmatrix}{1\over d_1}&0&\dots&0\\0&{1\over d_2}&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&{1\over d_n}\end{bmatrix} ⎣⎢⎢⎢⎡d10⋮00d2…0……⋱…00⋮dn⎦⎥⎥⎥⎤,(d1,d2,...dn=0);D−1=⎣⎢⎢⎢⎡d110⋮00d21…0……⋱…00⋮dn1⎦⎥⎥⎥⎤
证明:
设有B和C满足:AB=BA=I,AC=CA=I
则:B=BI=B(AC)=(BA)C=IC=C
证明:
充分性:
A X = b 有 唯 一 解 : X = A − 1 b AX=b有唯一解:X=A^{-1}b AX=b有唯一解:X=A−1b
必要性:
设 A X = b 有 唯 一 解 X , 但 A 不 可 逆 设AX=b有唯一解X,但A不可逆 设AX=b有唯一解X,但A不可逆
A 不 可 逆 ⇒ A X = 0 有 非 零 解 Z A不可逆\rArr AX=0有非零解Z A不可逆⇒AX=0有非零解Z
令 Y = X + Z 令Y=X+Z 令Y=X+Z
A Y = A ( X + Z ) = A X + A Z = b + 0 = b AY=A(X+Z)=AX+AZ=b+0=b AY=A(X+Z)=AX+AZ=b+0=b
则 Y 为 A X = b 的 解 , 矛 盾 则Y为AX=b的解,矛盾 则Y为AX=b的解,矛盾
所以可得A可逆
设A,B皆为n阶可逆矩阵,数 λ ≠ 0 \lambda\ne0 λ=0,则:
https://wenku.baidu.com/view/84eda27b27284b73f24250ce.html?sxts=1591611918853
过渡矩阵是基与基之间的一个可逆线性变换,在一个空间V下可能存在不同的基。假设有两组基分别为A,B。由基A到基B可以表示为B=AP,过渡矩阵 P = A − 1 B P=A^{-1}B P=A−1B,它表示的是基与基之间的关系。