以清华大学林润亮老师的ppt为基础进行整理
主要用来进行知识点回顾和快速复习
线性代数是建立在向量的 加法
和 数乘
这两种所谓 线性运算
上的
两个向量相等 ⟺ \iff ⟺ 两者长度相等, 方向相同
向量加法和数乘的运算性质: 交结零负一乘分分
分别是: 向量加法交换律, 向量加法结合律, 零向量, 反向量, 1 数乘向量, 两个数乘数乘向量, 两个数加数乘向量, 一个数数乘两个向量
a = ( a 1 a 2 ⋮ a n ) \boldsymbol{a}= \begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix} a=⎝⎜⎜⎜⎛a1a2⋮an⎠⎟⎟⎟⎞
其中 a i a_i ai 为向量 a \boldsymbol{a} a 的第 i i i 个分量
设 v 1 , ⋯ , v m \boldsymbol v_1,\cdots,\boldsymbol v_m v1,⋯,vm 为 m m m 个 n n n 维向量, 称 c 1 v 1 + ⋯ + c m v m c_1\boldsymbol v_1+\cdots +c_m\boldsymbol v_m c1v1+⋯+cmvm 为向量 v 1 , ⋯ , v m \boldsymbol v_1,\cdots,\boldsymbol v_m v1,⋯,vm 的一个线性组合
在 3 维空间中,一般,对于向量 u , v , w \boldsymbol u,\boldsymbol v,\boldsymbol w u,v,w
{非零向量 u \boldsymbol u u} 的所有线性组合是一条直线;
{不共线的 u , v \boldsymbol u,\boldsymbol v u,v} 的所有线性组合是一个平面;
{不共面的 u , v , w \boldsymbol u,\boldsymbol v,\boldsymbol w u,v,w} 的所有线性组合是整个三维空间.
向量 v \boldsymbol v v 的长度或模定义为 ∥ v ∥ = v ⋅ v \left\|\boldsymbol v\right \|=\sqrt{\boldsymbol v\cdot \boldsymbol v} ∥v∥=v⋅v
若 v ⋅ w = 0 \boldsymbol v\cdot \boldsymbol w=0 v⋅w=0, 则称向量 v \boldsymbol v v 和 w \boldsymbol w w 垂直 / 正交. 记作 v ⊥ w \boldsymbol v\perp \boldsymbol w v⊥w
∣ v ⋅ w ∣ = ∥ v ∥ ∥ w ∥ |\boldsymbol v\cdot \boldsymbol w|=\left \|\boldsymbol v\right \|\left \|\boldsymbol w\right \| ∣v⋅w∣=∥v∥∥w∥, 等号成立当且仅当一个向量是另一个向量的倍数.
∥ v + w ∥ ≤ ∥ v ∥ + ∥ w ∥ \left\|\boldsymbol v+ \boldsymbol w\right \|\le \left\|\boldsymbol v\right\|+\left\|\boldsymbol w\right\| ∥v+w∥≤∥v∥+∥w∥, 等号成立当且仅当 v , w \boldsymbol v, \boldsymbol w v,w 之一为另一向量的非负倍数.
A x A \boldsymbol x Ax
理解1
得到 A A A 各列向量的一个线性组合;
理解2
列向量 $ \boldsymbol x$ 与 A A A 各行向量做内积
A x = b A \boldsymbol x=\boldsymbol b Ax=b
理解1
求 A A A 列向量的线性组合, 使之等于 b \boldsymbol b b;
理解2
求向量 x \boldsymbol x x, 使之与 A A A 的行向量内积分别为 b \boldsymbol b b 中的元素
若 A x = b A \boldsymbol x=\boldsymbol b Ax=b( n n n 个方程, n n n 个未知数) 对任意向量 b \boldsymbol b b 有唯一解, 则称方阵 A \boldsymbol A A 可逆
若 A = ( u , v , w ) A=(\boldsymbol u, \boldsymbol v, \boldsymbol w) A=(u,v,w) 可逆, 则 u , v , w \boldsymbol u, \boldsymbol v, \boldsymbol w u,v,w 的全部线性组合所得空间是整个三维空间, 这时向量 u , v , w \boldsymbol u, \boldsymbol v, \boldsymbol w u,v,w 线性无关 / 不共面, 相应 A x = b A \boldsymbol x=\boldsymbol b Ax=b 只有零解
行图
(二维) 两直线交点
列图
两列向量的线性组合
对方程组 A x = b A \boldsymbol x=\boldsymbol b Ax=b, 消元法涉及以下三种同解变形:
相应地对增广矩阵作以下三种行变换 (即: 初等行变换):
对线性方程组 A x = b A \boldsymbol x=\boldsymbol b Ax=b 做消元法, 即用一系列初等矩阵在左边, 去乘增广矩阵 ( A ∣ b ) (A | \boldsymbol b) (A∣b)
将单位阵中某个 0 0 0 变为非零的数得到的矩阵称为消去矩阵, 消去矩阵是一类初等矩阵
如 P 12 = ( 0 1 0 1 0 0 0 0 1 ) P_{12}=\begin{pmatrix} 0&1&0 \\ 1&0&0 \\ 0&0&1 \end{pmatrix} P12=⎝⎛010100001⎠⎞
置换阵 P P P 满足 P − 1 = P T P^{-1}=P^{T} P−1=PT
满足结合律, 左分配律, 右分配律
矩阵的乘法一般不可交换, 消去律一般也不成立
若 A T = A A^T=A AT=A 则称 A A A 是一个对称矩阵
若 A T = − A A^T=-A AT=−A 则称 A A A 是一个反对称矩阵
若 R R R 为 m × n m\times n m×n 矩阵 (实数域), 则 R R T RR^T RRT 为 m × n m\times n m×n 对称矩阵, 且其对角元均非负
对方阵 A A A, 若存在矩阵 B B B, 满足 A B = B A = I AB=BA=I AB=BA=I, 则称 A A A 是可逆的. 称 B B B 是 A A A 的逆矩阵, 记作 A − 1 A^{-1} A−1.
可逆矩阵也称为非奇异矩阵, 不可逆矩阵也称为奇异矩阵
将矩阵分解成一个下三角矩阵和一个上三角矩阵的乘积
E A = U , A = E − 1 U = L U EA=U, A=E^{-1}U=LU EA=U,A=E−1U=LU
A = E − 1 D U = L D U A=E^{-1}DU=LDU A=E−1DU=LDU 其中 L L L 和 U U U 的对角元为 1 1 1
设可逆矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n 的顺序主子式 A k = ( a i j ) k × k ( k = 1 , ⋯ , n ) A_k = (a_{ij})_{k\times k}(k=1,\cdots ,n) Ak=(aij)k×k(k=1,⋯,n) 均为可逆阵, 则 A A A 有 L U LU LU 分解. 若 l i i = 1 , u i i ≠ 0 ( 1 ≤ i ≤ n ) l_{ii}=1, u_{ii}\neq 0(1\le i\le n) lii=1,uii=0(1≤i≤n), 则分解唯一
设 A A A 是一个 n n n 阶可逆阵, 则存在置换阵 P P P 使得 P A = L U PA=LU PA=LU
设 V V V 是 R n \mathbb R^n Rn 的非空子集, 且 V V V 关于向量加法和数乘运算封闭 ( ∀ α , β ∈ V , ∀ c 1 , c 2 ∈ R ⟹ c 1 α + c 2 β ∈ V \forall \alpha ,\beta\in V,\forall c_1,c_2\in \mathbb R \Longrightarrow c_1\alpha+c_2\beta\in V ∀α,β∈V,∀c1,c2∈R⟹c1α+c2β∈V), 则称 V V V 是 R n \mathbb R^n Rn 的一个向量子空间
在由称为“向量”的元素构成的非空集合 V V V 中, 若定义了加法和数乘运算, 且对任意向量 a , b , c \boldsymbol{a}, \boldsymbol{b}, \boldsymbol{c} a,b,c 及数域 F \mathbb{F} F, k , l ∈ F k,l\in \mathbb{F} k,l∈F 满足以下八条性质:
则称 V V V 为定义在数域 F \mathbb{F} F 上的向量空间
A A A 的列向量所有线性组合构成的空间称为 A A A 的列空间, 记作 C ( A ) C(A) C(A)
C ( A ) = { c 1 α 1 + c 2 α 2 + ⋯ + c n α n ∣ c i ∈ R } = { y ∈ R m ∣ y = A x , x ∈ R n } C(A)=\{c_1 \boldsymbol \alpha_1+ c_2 \boldsymbol \alpha_2+\cdots+ c_n \boldsymbol \alpha_n | c_i\in \mathbb R\}=\{\boldsymbol y\in\mathbb R^m | \boldsymbol y=A \boldsymbol x,\boldsymbol x\in \mathbb R^n\} C(A)={c1α1+c2α2+⋯+cnαn∣ci∈R}={y∈Rm∣y=Ax,x∈Rn}
A x = b A \boldsymbol x=\boldsymbol b Ax=b 有解 ⟺ b ∈ C ( A ) \iff \boldsymbol b\in C(A) ⟺b∈C(A)
求列空间: 将矩阵化为阶梯形, 阶梯形中主元所在的的列 / 原矩阵中主元所在的列的线性组合就是列空间
N ( A ) = { x ∣ A x = 0 } ⊂ R n N(A)=\{\boldsymbol x | A \boldsymbol x= \boldsymbol 0\}\subset \mathbb R^n N(A)={x∣Ax=0}⊂Rn
求零空间: 将矩阵化为阶梯形 / 简化行阶梯形 (RREF), 将主元所在的列对应解 x \boldsymbol x x 位置的数字标记为 1, 通过 A x = 0 A \boldsymbol x=\boldsymbol 0 Ax=0 确定 x \boldsymbol x x 其他位置的数字得到基础解系, 进行组合得到零空间
向量组的极大线性无关组: 从原向量组中选出一部分向量构成的线性无关向量组, 并且再填入原向量组中的任一向量就线性相关
向量组的秩: 向量组的极大线性无关组中向量的个数.
定理: 两组向量若能互相线性表出, 则它们的秩相等
A A A 的行秩 = A A A 的列秩 = A A A 的秩
将矩阵化为 RREF 后令自由变量为 0, 解出主元对应位置的数字即可
v 1 , v 2 , ⋯ , v n ∈ V \boldsymbol v_1, \boldsymbol v_2, \cdots , \boldsymbol v_n\in V v1,v2,⋯,vn∈V 且 v 1 , v 2 , ⋯ , v n \boldsymbol v_1, \boldsymbol v_2, \cdots , \boldsymbol v_n v1,v2,⋯,vn 线性无关, 且 ∀ α ∈ V , α \forall \alpha\in V,\alpha ∀α∈V,α 是 v 1 , v 2 , ⋯ , v n \boldsymbol v_1, \boldsymbol v_2, \cdots , \boldsymbol v_n v1,v2,⋯,vn 的线性组合, 则称 { v 1 , v 2 , ⋯ , v n } \{\boldsymbol v_1, \boldsymbol v_2, \cdots , \boldsymbol v_n\} {v1,v2,⋯,vn} 是 V V V 的一组基
可逆矩阵与一组基相乘得到的还是一组基
r ( A B ) ≤ min { r ( A ) , r ( B ) } r(AB)\le \min \{r(A),r(B)\} r(AB)≤min{r(A),r(B)}
r ( A ) = r ( A T ) r(A)=r(A^T) r(A)=r(AT)
r ( A + B ) ≤ r ( A ) + r ( B ) r(A+B)\le r(A)+r(B) r(A+B)≤r(A)+r(B)
列空间 C ( A ) = { y ∈ R m ∣ y = A x , x ∈ R n } C(A)=\{\boldsymbol y\in\mathbb R^m | \boldsymbol y=A \boldsymbol x,\boldsymbol x\in \mathbb R^n\} C(A)={y∈Rm∣y=Ax,x∈Rn}
行空间 C ( A T ) = { y ∈ R n ∣ y = A T x , x ∈ R m } C(A^T)=\{\boldsymbol y\in\mathbb R^n | \boldsymbol y=A^T \boldsymbol x,\boldsymbol x\in \mathbb R^m\} C(AT)={y∈Rn∣y=ATx,x∈Rm}
零空间 N ( A ) = { x ∈ R n ∣ A x = 0 } N(A)=\{\boldsymbol x \in \mathbb R^n| A \boldsymbol x= \boldsymbol 0\} N(A)={x∈Rn∣Ax=0}
左零空间 N ( A T ) = { x ∈ R m ∣ A T x = 0 } N(A^T)=\{\boldsymbol x \in \mathbb R^m| A^T \boldsymbol x= \boldsymbol 0\} N(AT)={x∈Rm∣ATx=0}
C ( A ) C(A) C(A) 和 N ( A T ) N(A^T) N(AT) 是 R m \mathbb R^m Rm 的子空间
C ( A T ) C(A^T) C(AT) 和 N ( A ) N(A) N(A) 是 R m \mathbb R^m Rm 的子空间
R R E F RREF RREF 中主元所在的列 / 对应原矩阵中的列是 C ( A ) C(A) C(A) 的一组基
用 “上面行的倍数加到下面行” 化 A A A 为阶梯形 (忽略中间的全零行), 阶梯形非零行标号对应 A A A 的行即为 C ( A T ) C(A^T) C(AT) 的一组基
A A A 的基础解系构成 N ( A ) N(A) N(A) 的一组基
A T A^T AT 的基础解系构成 N ( A T ) N(A^T) N(AT) 的一组基
d i m ( C ( A ) ) = d i m ( C ( A T ) ) = r dim(C(A))=dim(C(A^T))=r dim(C(A))=dim(C(AT))=r
d i m ( N ( A ) ) = n − r dim(N(A))=n-r dim(N(A))=n−r
d i m ( N ( A T ) ) = m − r dim(N(A^T))=m-r dim(N(AT))=m−r
d i m W 1 + d i m W 2 = d i m ( W 1 ∩ W 2 ) + d i m ( W 1 + W 2 ) dim W_1+dim W_2=dim(W_1 \cap W_2)+dim(W_1+W_2) dimW1+dimW2=dim(W1∩W2)+dim(W1+W2)
C ( A T ) ⊥ N ( A ) , C ( A T ) + N ( A ) = R n C(A^T)\perp N(A), C(A^T)+ N(A)=\mathbb R^n C(AT)⊥N(A),C(AT)+N(A)=Rn
C ( A ) ⊥ N ( A T ) , C ( A ) + N ( A T ) = R m C(A)\perp N(A^T), C(A)+ N(A^T)=\mathbb R^m C(A)⊥N(AT),C(A)+N(AT)=Rm
定理: 若 A x = b A \boldsymbol x=\boldsymbol b Ax=b 有解, 则 A x = b A \boldsymbol x=\boldsymbol b Ax=b 在 C ( A T ) C(A^T) C(AT) 中有唯一解
若 A x = b A \boldsymbol x=\boldsymbol b Ax=b 无解, 能够找到 x ^ ∈ R n \hat{\boldsymbol x}\in \mathbb R^n x^∈Rn, 使得 ∥ A x ^ − b ∥ \left \| A \hat{\boldsymbol x}-\boldsymbol b \right \| ∥Ax^−b∥ 最小
直观上, A x = b A \boldsymbol x=\boldsymbol b Ax=b 无解 ⟺ b ∉ C ( A ) \iff \boldsymbol b\notin C(A) ⟺b∈/C(A). 上述问题意味着求 C ( A ) C(A) C(A) 上距离 b \boldsymbol b b 最近的点 A x ^ A\hat{\boldsymbol x} Ax^, 它是 b \boldsymbol b b 在 C ( A ) C(A) C(A) 上的投影点
点 v v v 在平面 π = C ( A ) \pi=C(A) π=C(A) 上的投影 p p p:
投影 p = A x ^ ∈ C ( A ) ⟹ v − p = e ⊥ C ( A ) ⟹ A T ( v − A x ^ ) = 0 \boldsymbol p=A\hat{\boldsymbol x}\in C(A)\Longrightarrow \boldsymbol v- \boldsymbol p=\boldsymbol e\perp C(A) \Longrightarrow A^T(\boldsymbol v-A\hat{\boldsymbol x})=\boldsymbol 0 p=Ax^∈C(A)⟹v−p=e⊥C(A)⟹AT(v−Ax^)=0
⟹ x ^ \Longrightarrow \hat{\boldsymbol x} ⟹x^ 是 A T A x = A T v A^TA \boldsymbol x=A^T \boldsymbol v ATAx=ATv 的解
若 A A A 列满秩, A T A A^TA ATA 是可逆阵 ⟹ x ^ = ( A T A ) − 1 A T v , p = A ( A T A ) − 1 A T v \Longrightarrow \hat{\boldsymbol x}=(A^TA)^{-1}A^T \boldsymbol v, \boldsymbol p=A(A^TA)^{-1}A^T \boldsymbol v ⟹x^=(ATA)−1ATv,p=A(ATA)−1ATv
将 $ P=A(ATA){-1}A^T $ 称为投影矩阵
若 A T A A^TA ATA 可逆, 投影阵 $ P=A(ATA){-1}A^T $ 满足 P 2 = P , P T = P P^2=P,P^T=P P2=P,PT=P
一般的, 一个矩阵 P P P 满足 P 2 = P , P T = P P^2=P, P^T=P P2=P,PT=P, 则称 P P P 为投影矩阵
若 A x = b A \boldsymbol x=\boldsymbol b Ax=b 无解, 将 A T A x ^ = A T b A^TA\hat{\boldsymbol x}=A^T \boldsymbol b ATAx^=ATb 称为正规方程组. 解出 x ^ \hat{\boldsymbol x} x^, 得到 b \boldsymbol b b 在 C(A) 上的投影 p = A x ^ \boldsymbol p=A\hat{\boldsymbol x} p=Ax^
目标:
给定 V ∈ R n V\in \mathbb R^n V∈Rn 为一个子空间, v 1 , v 2 , ⋯ , v k \boldsymbol v_1,\boldsymbol v_2,\cdots ,\boldsymbol v_k v1,v2,⋯,vk 是 V V V 的一组基, 把它们化成一组正交的向量 w 1 , w 2 , ⋯ , w k \boldsymbol w_1,\boldsymbol w_2,\cdots ,\boldsymbol w_k w1,w2,⋯,wk, 满足:
w 1 = v 1 w 2 = v 2 − w 1 T v 2 w 1 T w 1 w 1 w 3 = v 3 − w 1 T v 3 w 1 T w 1 w 1 − w 2 T v 3 w 2 T w 2 w 2 \boldsymbol w_1=\boldsymbol v_1 \\ \boldsymbol w_2=\boldsymbol v_2-\frac{{\boldsymbol w_1}^T \boldsymbol v_2}{{\boldsymbol w_1}^T \boldsymbol w_1}\boldsymbol w_1 \\ \boldsymbol w_3=\boldsymbol v_3-\frac{{\boldsymbol w_1}^T \boldsymbol v_3}{{\boldsymbol w_1}^T \boldsymbol w_1}\boldsymbol w_1-\frac{{\boldsymbol w_2}^T \boldsymbol v_3}{{\boldsymbol w_2}^T \boldsymbol w_2}\boldsymbol w_2 w1=v1w2=v2−w1Tw1w1Tv2w1w3=v3−w1Tw1w1Tv3w1−w2Tw2w2Tv3w2
再进行单位化 q i = w i ∥ w i ∥ \boldsymbol q_i=\frac{\boldsymbol w_i}{\left \| \boldsymbol w_i \right \|} qi=∥wi∥wi
举例:
A = ( v 1 , v 2 , v 3 ) = ( 1 1 0 1 0 1 0 1 1 ) A=(\boldsymbol v_1,\boldsymbol v_2, \boldsymbol v_3)=\begin{pmatrix}1&1&0 \\ 1&0&1 \\ 0&1&1 \end{pmatrix} A=(v1,v2,v3)=⎝⎛110101011⎠⎞
A = Q R = ( 1 2 1 6 − 1 3 1 2 − 1 6 1 3 0 2 6 1 3 ) ( 2 2 1 2 1 2 0 3 6 1 6 0 0 2 3 ) A=QR=\begin{pmatrix} \frac{1}{\sqrt 2}&\frac{1}{\sqrt 6}&-\frac{1}{\sqrt 3} \\ \frac{1}{\sqrt 2}&-\frac{1}{\sqrt 6}&\frac{1}{\sqrt 3}\\0&\frac{2}{\sqrt 6}&\frac{1}{\sqrt 3} \end{pmatrix}\begin{pmatrix} \frac{2}{\sqrt 2}&\frac{1}{\sqrt 2}&\frac{1}{\sqrt 2} \\ 0&\frac{3}{\sqrt 6}&\frac{1}{\sqrt 6}\\0&0&\frac{2}{\sqrt 3} \end{pmatrix} A=QR=⎝⎜⎛2121061−6162−313131⎠⎟⎞⎝⎜⎛220021630216132⎠⎟⎞
R R R 是对角元为正数的上三角矩阵
二阶行列式的几何意义: 平面四边形的“有向”面积
三阶行列式的几何意义: 平行六面体的“有向”体积
推论:
M i j M_{ij} Mij 是 A A A 划去第 i i i 行第 j j j 列得到的 n − 1 n-1 n−1 阶矩阵
余子式: det M i j \det M_{ij} detMij
代数余子式: C i j = ( − 1 ) i + j det M i j C_{ij}=(-1)^{i+j}\det M_{ij} Cij=(−1)i+jdetMij
det A = ∣ a i j ∣ n × n = a i 1 C i 1 + a i 2 C i 2 + ⋯ + a i n C i n , ∀ i , j = 1 , ⋯ , n \det A=|{a_{ij}}|_{n\times n}=a_{i1}C_{i1}+a_{i2}C_{i2}+\cdots+a_{in}C_{in},\forall i,j=1,\cdots,n detA=∣aij∣n×n=ai1Ci1+ai2Ci2+⋯+ainCin,∀i,j=1,⋯,n
化为上三角或下三角, 计算对角元乘积即为行列式值
通过行列式展开定理展开进行不断降阶后计算行列式值
D n = ∣ 1 1 1 ⋯ 1 x 1 x 2 x 3 ⋯ x n x 1 2 x 2 2 x 3 2 ⋯ x n 2 ⋮ ⋮ ⋮ ⋱ ⋮ x 1 n − 1 x 2 n − 1 x 3 n − 1 ⋯ x n n − 1 ∣ = ∏ 1 ≤ i < j ≤ n ( x j − x i ) D_{n}=\left|\begin{array}{ccccc} 1 & 1 & 1 & \cdots & 1 \\ x_{1} & x_{2} & x_{3} & \cdots & x_{n} \\ x_{1}^{2} & x_{2}^{2} & x_{3}^{2} & \cdots & x_{n}^{2} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ x_{1}^{n-1} & x_{2}^{n-1} & x_{3}^{n-1} & \cdots & x_{n}^{n-1} \end{array}\right|=\prod_{1 \leq i
∑ k = 1 n a i k C j k = { D , i = j 0 , i ≠ j \sum_{k=1}^{n}a_{ik}C_{jk}=\left\{\begin{array}{c} D,i=j \\ 0,i\neq j \end{array} \right. k=1∑naikCjk={D,i=j0,i=j
下面的矩阵称为 A A A 的伴随矩阵
A ∗ = a d j ( A ) = ( C 11 C 21 ⋯ C n 1 C 12 C 22 ⋯ C n 2 ⋮ ⋮ ⋮ C 1 n C 2 n ⋯ C n n ) A^*=adj(A)=\left(\begin{array}{cccc} C_{11} & C_{21} & \cdots & C_{n 1} \\ C_{12} & C_{22} & \cdots & C_{n 2} \\ \vdots & \vdots & & \vdots \\ C_{1 n} & C_{2 n} & \cdots & C_{n n} \end{array}\right) A∗=adj(A)=⎝⎜⎜⎜⎛C11C12⋮C1nC21C22⋮C2n⋯⋯⋯Cn1Cn2⋮Cnn⎠⎟⎟⎟⎞
( A ∗ ) T (A^*)^T (A∗)T: A A A 的代数余子式矩阵
A − 1 = a d j ( A ) ∣ A ∣ A^{-1}=\frac{adj(A)}{|A|} A−1=∣A∣adj(A)
一般地, 若不使用行列式, A A A 可逆时, A x = b A \boldsymbol x=\boldsymbol b Ax=b 解的表达式将非常复杂.
定理 (Cramer’s Rule): 设 A A A 是 n n n 阶可逆阵, b ∈ R n \boldsymbol b \in \mathbb{R}^{n} b∈Rn, 令 B k B_{k} Bk 是将 A A A 的 第 k k k 列换成向量 b \boldsymbol b b 后所得的矩阵. 则 A x = b A \boldsymbol {x}=\boldsymbol {b} Ax=b 的唯一解为
x = ( x 1 , ⋯ , x n ) T , x 1 = det ( B 1 ) det A , ⋯ , x n = det ( B n ) det A \boldsymbol {x}=\left(x_{1}, \cdots, x_{n}\right)^{T}, \quad x_{1}=\frac{\operatorname{det}\left(B_{1}\right)}{\operatorname{det} A}, \cdots, x_{n}=\frac{\operatorname{det}\left(B_{n}\right)}{\operatorname{det} A} x=(x1,⋯,xn)T,x1=detAdet(B1),⋯,xn=detAdet(Bn)
u = ( u 1 u 2 u 3 ) , v = ( v 1 v 2 v 3 ) \boldsymbol u=\begin{pmatrix}u_1\\u_2\\u_3\end{pmatrix},\boldsymbol v=\begin{pmatrix}v_1\\v_2\\v_3\end{pmatrix} u=⎝⎛u1u2u3⎠⎞,v=⎝⎛v1v2v3⎠⎞, u × v \boldsymbol u\times \boldsymbol v u×v 是与 u \boldsymbol u u 和 v \boldsymbol v v 都垂直且成右手关系的向量
有 u × v = − v × u \boldsymbol u\times \boldsymbol v=-\boldsymbol v\times \boldsymbol u u×v=−v×u
( u 1 + u 2 ) × v = u 1 × v + u 2 × v (\boldsymbol u_1+\boldsymbol u_2)\times \boldsymbol v=\boldsymbol u_1\times \boldsymbol v+\boldsymbol u_2\times \boldsymbol v (u1+u2)×v=u1×v+u2×v
混合积 u × v ⋅ w \boldsymbol u\times \boldsymbol v\cdot \boldsymbol w u×v⋅w , 几何上表示三向量组成的平行六面体的有向体积.
性质: u × v ⋅ w = v × w ⋅ u = w × u ⋅ v \boldsymbol u\times \boldsymbol v\cdot \boldsymbol w=\boldsymbol v\times \boldsymbol w\cdot \boldsymbol u=\boldsymbol w\times \boldsymbol u\cdot \boldsymbol v u×v⋅w=v×w⋅u=w×u⋅v
定理: u × v ⋅ w = det ( u , v , w ) \boldsymbol u\times \boldsymbol v\cdot \boldsymbol w=\det (\boldsymbol u,\boldsymbol v,\boldsymbol w) u×v⋅w=det(u,v,w)
对 A A A, 若存在数 λ \lambda λ 和非零向量 x \boldsymbol x x, 满足 A x = λ x A \boldsymbol x=\lambda \boldsymbol x Ax=λx, 则称 λ \lambda λ 为 A A A 的特征值, x \boldsymbol x x 为 A A A 的属于特征值 λ \lambda λ 的特征向量
数 λ \lambda λ 为方阵 A A A 的特征值 ⟺ det ( A − λ I ) = 0 \iff \det (A-\lambda I)=0 ⟺det(A−λI)=0
det ( A − λ I ) = 0 \det (A-\lambda I)=0 det(A−λI)=0 是关于 λ \lambda λ 的多项式, 求解多项式得到 λ \lambda λ, 之后将解出的 λ \lambda λ 分别带回 ( A − λ I ) x = 0 (A-\lambda I)\boldsymbol x=\boldsymbol 0 (A−λI)x=0 即可解出特征值对应的特征向量
举例: 投影矩阵的特征值是 0 0 0 和 1 1 1
∑ i = 1 n λ i = t r ( A ) = ∑ i = 1 n a i i \sum_{i=1}^{n}\lambda_i=tr(A)=\sum_{i=1}^{n}a_{ii} ∑i=1nλi=tr(A)=∑i=1naii
∏ i = 1 n = det A \prod_{i=1}^n=\det A ∏i=1n=detA
设 n × n n\times n n×n 矩阵 A A A 有 n n n 个线性无关的特征向量 x 1 , x 2 , ⋯ , x n , A x i = λ i x i \boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_n, A \boldsymbol x_i=\lambda_i \boldsymbol x_i x1,x2,⋯,xn,Axi=λixi, 令 S = ( x 1 , x 2 , ⋯ , x n ) S=(\boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_n) S=(x1,x2,⋯,xn), 则 S − 1 A S S^{-1}AS S−1AS 是一个对角矩阵 Λ \Lambda Λ, 其对角元素是 A A A 的特征值
S − 1 A S = Λ = ( λ 1 ⋱ λ n ) S^{-1}AS=\Lambda=\begin{pmatrix}\lambda_1& & \\ & \ddots& \\ & &\lambda_n\end{pmatrix} S−1AS=Λ=⎝⎛λ1⋱λn⎠⎞
若存在可逆矩阵 S S S, 使得 S − 1 A S S^{-1}AS S−1AS 为对角矩阵, 则称矩阵 A A A 是可对角化的
n × n n\times n n×n 矩阵 A A A 可对角化的充要条件是 A A A 有 n n n 个线性无关的特征向量 x 1 , x 2 , ⋯ , x n , A x i = λ i x i \boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_n, A \boldsymbol x_i=\lambda_i \boldsymbol x_i x1,x2,⋯,xn,Axi=λixi
定理:
设 λ 1 , λ 2 , ⋯ , λ k \boldsymbol \lambda_1 ,\boldsymbol \lambda_2,\cdots, \boldsymbol \lambda_k λ1,λ2,⋯,λk 是 A A A 的互异特征值, x 1 , x 2 , ⋯ , x k \boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_k x1,x2,⋯,xk 是相应特征向量, 则 x 1 , x 2 , ⋯ , x k \boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_k x1,x2,⋯,xk 线性无关
推论:
具有 n n n 个两两互异特征值的 n × n n\times n n×n 矩阵可以对角化
定义: 设 det ( A − λ I ) = ( λ 1 − λ ) n 1 ⋯ ( λ k − λ ) n k \operatorname{det}(A-\lambda I)=\left(\lambda_{1}-\lambda\right)^{n_{1}} \cdots\left(\lambda_{k}-\lambda\right)^{n_{k}} det(A−λI)=(λ1−λ)n1⋯(λk−λ)nk , 其中 λ i ≠ λ j ( i ≠ j ) \lambda_{i} \neq \lambda_{j}(i \neq j) λi=λj(i=j). 称 n i n_{i} ni 为特征值 λ i \lambda_{i} λi 的代数重数, 记作 A M ( λ i ) = n i AM\left(\lambda_{i}\right)=n_{i} AM(λi)=ni. 称 dim N ( A − λ i I ) \operatorname{dim} N\left(A-\lambda_{i} I\right) dimN(A−λiI) 为特征值 λ i \lambda_{i} λi 的几何重数, 记作 G M ( λ i ) = dim N ( A − λ i I ) G M\left(\lambda_{i}\right)=\operatorname{dim} N\left(A-\lambda_{i} I\right) GM(λi)=dimN(A−λiI)
G M ( λ i ) ≤ A M ( λ i ) G M\left(\lambda_{i}\right)\le AM\left(\lambda_{i}\right) GM(λi)≤AM(λi)
定理: 复方阵 A A A 可对角化 ⟺ \iff ⟺ 对任意特征值 λ i \lambda_i λi , G M ( λ i ) = A M ( λ i ) G M\left(\lambda_{i}\right)= AM\left(\lambda_{i}\right) GM(λi)=AM(λi)
快速计算 A k A^k Ak
定理: 实对称矩阵的特征值都是实数
定理: 任何实对称矩阵都正交相似于对角阵, 即对实对称阵 A A A, 存在正交阵 Q Q Q, 使 Q T A Q Q^TAQ QTAQ 为对角阵
特征值全是正数的实对称矩阵称为正定矩阵
在 n n n 阶行列式中任选 k k k 行: 第 i 1 , i 2 , ⋯ , i k i_1,i_2,\cdots,i_k i1,i2,⋯,ik 行, 再取相应的第 i 1 , i 2 , ⋯ , i k i_1,i_2,\cdots,i_k i1,i2,⋯,ik 列. 由上述选取的 k k k 行 k k k 列交汇处元素组成的新矩阵称
为 k k k 阶主子阵; 主子阵的行列式, 称为 n n n 阶行列式的一个 k k k 阶主子式.
在 n n n 阶行列式中由第 1 , ⋯ , k 1,\cdots,k 1,⋯,k 行和第 1 , ⋯ , k 1,\cdots,k 1,⋯,k 列所确定的主子式称为 k k k 阶顺序主子式.
若实对称矩阵 A A A 的特征值均非负,那么称 A A A 为半正定矩阵
对 n n n 维实向量 x ∈ R n \boldsymbol x \in \mathbb R ^{n} x∈Rn 及 n 阶实矩阵 A, 称数值函数
f ( x ) = x T A x = x T ( a i j ) n × n x = ∑ i = 1 n ∑ j = 1 n a i j x i x j f(\mathbf{x})=\mathbf{x}^{T} A \mathbf{x}=\mathbf{x}^{T}\left(a_{i j}\right)_{n \times n} \mathbf{x}=\sum_{i=1}^{n} \sum_{j=1}^{n} a_{i j} x_{i} x_{j} f(x)=xTAx=xT(aij)n×nx=i=1∑nj=1∑naijxixj
为一个 (实) 二次型, 它是关于 x 1 , ⋯ , x n x_1,\cdots,x_n x1,⋯,xn 的二次齐次多项式
设 A A A 是一个 n n n 阶实对称矩阵, 则存在正交变量代换 x = Q y \mathbf x = Q\mathbf y x=Qy, 使得二次型
x T A x = y T Λ y = ∑ i = 1 n λ i y i 2 \mathbf{x}^{T} A \mathbf{x}=\mathbf{y}^{T} \Lambda \mathbf{y}=\sum_{i=1}^{n} \lambda_{i} y_{i}^{2} xTAx=yTΛy=i=1∑nλiyi2
变为对角形的二次型, 其中 Q T A Q = Λ = diag ( λ 1 , ⋯ , λ n ) Q^{T} A Q=\Lambda=\operatorname{diag}\left(\lambda_{1}, \cdots, \lambda_{n}\right) QTAQ=Λ=diag(λ1,⋯,λn), λ 1 , ⋯ , λ n \lambda_{1}, \cdots, \lambda_{n} λ1,⋯,λn 为 A A A 的所有特征值.
一个二次型 f ( x ) = x T A x f(\mathbf{x})=\mathbf{x}^{T} A \mathbf{x} f(x)=xTAx 是:
两个 n n n 阶矩阵 A A A, B B B, 若存在 n n n 阶可逆矩阵 C C C, 使得 C T A C = B C^{T} A C=B CTAC=B, 则称矩阵 A A A 与 B B B 合同, 记为 A ≅ B A\cong B A≅B
主轴定理可表述为: 任何实对称矩阵都正交合同于对角阵
引言: 如何“对角化” m × n m\times n m×n 矩阵
设 A A A 是一个 m × n m\times n m×n 矩阵, 则存在 m m m 阶正交矩阵 U U U 和 n n n 阶正交矩阵 V V V, 满足:
A = U ( σ 1 ⋱ σ 2 0 ) V T = U Σ V T A=U\begin{pmatrix}\sigma_1&&&\\&\ddots&&\\&&\sigma_2&\\&&&\boldsymbol 0\end{pmatrix}V^T=U\Sigma V^T A=U⎝⎜⎜⎛σ1⋱σ20⎠⎟⎟⎞VT=UΣVT
其中 r = r a n k ( A ) r=rank(A) r=rank(A). 习惯上, 取 σ 1 ≥ σ 2 ≥ ⋯ ≥ σ r ≥ 0 \sigma_1≥\sigma_2≥\cdots≥\sigma_r≥0 σ1≥σ2≥⋯≥σr≥0, 称 σ 1 , σ 2 , ⋯ , σ r \sigma_1, \sigma_2 ,\cdots,\sigma_r σ1,σ2,⋯,σr 为奇异值, 称 U U U 和 V V V 的前 r r r 列向量为奇异向量. 这个分解称为奇异值分解, 简称 S V D SVD SVD.
有 A v i = σ i u i A \boldsymbol v_i=\sigma_i \boldsymbol u_i Avi=σiui, A T u i = σ i v i A^T \boldsymbol u_i=\sigma_i \boldsymbol v_i ATui=σivi
有 A T A v i = σ i 2 v i A^T A \boldsymbol v_i={\sigma_i}^2 \boldsymbol v_i ATAvi=σi2vi
u i = A v i σ i \boldsymbol u_i=\frac{A \boldsymbol v_i}{\sigma_i} ui=σiAvi
{ u 1 , ⋯ , u r } \{\boldsymbol u_1, \cdots, \boldsymbol u_r\} {u1,⋯,ur} 为 C ( A ) C(A) C(A) 的一组单位正交基
{ v 1 , ⋯ , v r } \{\boldsymbol v_1, \cdots, \boldsymbol v_r\} {v1,⋯,vr} 为 C ( A T ) C(A^T) C(AT) 的一组单位正交基
设 A = U Σ V T A=U\Sigma V^T A=UΣVT 是 m × n m\times n m×n 实矩阵 A A A 的奇异值分解, r = r ( A ) r=r(A) r=r(A), 则
设 V , W V,W V,W 是数域 F \mathbb F F 上的向量空间, V V V 到 W W W 的映射 T : V → W T:V\to W T:V→W 若保持加法和数乘计算, 即
T ( x + y ) = T ( x ) + T ( y ) , T ( k x ) = k T ( x ) , ∀ x , y ∈ V , ∀ k ∈ F T(\boldsymbol x+ \boldsymbol y)=T(\boldsymbol x)+T(\boldsymbol y),\ T(k \boldsymbol x)=kT(\boldsymbol x), \ \forall \boldsymbol x,\boldsymbol y\in V,\ \forall k\in \mathbb F T(x+y)=T(x)+T(y), T(kx)=kT(x), ∀x,y∈V, ∀k∈F, 则称 T : V → W T:V\to W T:V→W 是一个线性变换
向量空间 V V V 到 W W W 的全体线性变换构成一个向量空间, 记为 L ( V , W ) \mathcal L (V,W) L(V,W)
定义: 设 τ ∈ L ( U , V ) , σ ∈ L ( V , W ) . \tau \in \mathcal{L}(U, V), \sigma \in \mathcal{L}(V, W) . τ∈L(U,V),σ∈L(V,W). 定义线性变换的乘积 σ τ : U → W \sigma \tau: U \rightarrow W στ:U→W 为:
( σ τ ) ( u ) = σ ( τ ( u ) ) , ∀ u ∈ U (\sigma \tau)(\mathbf{u})=\sigma(\tau(\mathbf{u})), \quad \forall \mathbf{u} \in U (στ)(u)=σ(τ(u)),∀u∈U
直接验证得 σ τ ∈ L ( U , W ) \sigma \tau \in \mathcal{L}(U, W) στ∈L(U,W)
设 τ ∈ L ( V , V ) \tau \in \mathcal{L}(V, V) τ∈L(V,V), 若存在 τ ∈ L ( V , V ) \tau \in \mathcal{L}(V, V) τ∈L(V,V) 使得 σ τ = τ σ = I \sigma \tau=\tau \sigma=I στ=τσ=I, 则称 σ \sigma σ 是可逆线性变换, τ \tau τ 为 σ \sigma σ 的逆变换
T ( v 1 , … , v n ) = ( T ( v 1 ) , … , T ( v n ) ) = ( w 1 , … , w m ) ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n ) T\left(\mathbf{v}_{1}, \ldots, \mathbf{v}_{n}\right)=\left(T\left(\mathbf{v}_{1}\right), \ldots, T\left(\mathbf{v}_{n}\right)\right)=\left(\mathbf{w}_{1}, \ldots, \mathbf{w}_{m}\right)\left(\begin{array}{cccc}a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{m 1} & a_{m 2} & \cdots & a_{m n}\end{array}\right) T(v1,…,vn)=(T(v1),…,T(vn))=(w1,…,wm)⎝⎜⎜⎜⎛a11a21⋮am1a12a22⋮am2⋯⋯⋯a1na2n⋮amn⎠⎟⎟⎟⎞
称 m × n m\times n m×n 矩阵 A A A 为线性变换 T T T 在 V V V 中给定基 v 1 , ⋯ , v n \boldsymbol v_1,\cdots ,\boldsymbol v_n v1,⋯,vn 和 W 中给定基 w 1 , ⋯ , w m \boldsymbol w_1,\cdots ,\boldsymbol w_m w1,⋯,wm 下的矩阵表示
注: A A A 中第 j j j 列恰是 T ( v j ) T(\boldsymbol v_j) T(vj) 在基 w 1 , ⋯ , w m \boldsymbol w_1,\cdots ,\boldsymbol w_m w1,⋯,wm 下的坐标 ’
定理: 设 v 1 , ⋯ , v n \boldsymbol v_1,\cdots ,\boldsymbol v_n v1,⋯,vn 是 n n n 维空间 V V V 的一组基, w 1 , ⋯ , w m \boldsymbol w_1,\cdots ,\boldsymbol w_m w1,⋯,wm 是 m m m 维向量空间 W W W 的一组基, A A A 是任一 m × n m\times n m×n 矩阵, 则有唯一的线性变换 σ \sigma σ 满足: σ ( v 1 , ⋯ , v n ) = ( w 1 , ⋯ , w m ) A \sigma (\boldsymbol v_1,\cdots ,\boldsymbol v_n)=(\boldsymbol w_1,\cdots ,\boldsymbol w_m)A σ(v1,⋯,vn)=(w1,⋯,wm)A
恒同变换: 对应矩阵 I n I_n In
有线性变换 σ : V → W \sigma:V\to W σ:V→W
线性变换的核: ker σ = { v ∈ V ∣ σ ( v ) = 0 } \ker \sigma=\{\boldsymbol v\in V | \sigma (\boldsymbol v)=\boldsymbol 0\} kerσ={v∈V∣σ(v)=0}
线性变换的像 (值域): Im σ = { σ ( v ) ∣ v ∈ V } \operatorname{Im} \sigma = \{\sigma ( \boldsymbol v)|\boldsymbol v\in V\} Imσ={σ(v)∣v∈V}
dim ( ker σ ) \dim (\ker \sigma) dim(kerσ) 称为线性变换 σ \sigma σ 的零度
dim ( Im σ ) \dim (\operatorname{Im} \sigma) dim(Imσ) 称为线性变换 σ \sigma σ 的秩