线性代数 | 复习笔记

文章目录

  • 1 向量及其运算
      • 线性代数
      • 两向量相等
      • 向量运算性质
      • 列向量
      • 向量的线性组合
      • 向量的长度
      • 向量正交
      • Cauchy-Schwarz 不等式
      • 三角不等式
  • 2 矩阵与线性方程组
      • 对矩阵与向量乘积的理解
      • 对线性方程组的理解
      • 可逆矩阵
      • 线性方程组的行图和列图
  • 3 高斯消元法
      • 矩阵的初等行变换
      • 增广矩阵
      • 消去矩阵
      • 置换阵
  • 4 矩阵的运算
      • 矩阵乘法的性质
      • 分块矩阵
      • 矩阵的转置
  • 5 矩阵的逆
      • 逆矩阵
      • 性质
  • 6 LU 分解
      • LU 分解的存在性和唯一性
      • 对称矩阵的 L D L T LDL^T LDLT 分解
  • 7 向量空间
      • 向量子空间
      • 推广的向量空间的定义
      • 列空间
      • 零空间
      • 阶梯形
  • 8 求解齐次线性方程组
      • A x = 0 A \boldsymbol x=\boldsymbol 0 Ax=0 的基础解系
  • 9 求解非齐次线性方程组
      • 极大线性无关组
      • 求特解 x ∗ \boldsymbol x^* x
  • 10 无关性、基与维数
      • 基与维数
      • 关于秩的不等式
  • 11 四个基本子空间的基与维数
      • 四个基本子空间
      • 子空间的基和维数
      • 维数公式
  • 12 四个基本子空间的正交性
      • A x = b A \boldsymbol x=\boldsymbol b Ax=b C ( A T ) C(A^T) C(AT) 中解的唯一性
  • 13 投影
      • 引言
      • 投影矩阵
  • 14 最小二乘法
  • 15 Gram-Schmidt 正交化
      • 正交化过程
      • QR 分解
  • 16 行列式的基本性质
      • 行列式的几何意义
      • 行列式性质
      • 行列式与初等变换
  • 17 行列式的计算
      • 行列式展开定理
      • 典型计算方法
      • n 阶范德蒙德行列式
  • 18 Cramer 法则及行列式的几何意义
      • 代数余子式的重要性质
      • 伴随矩阵
      • 求逆矩阵公式
      • 线性方程组的公式解
      • 向量的叉积 / 外积
      • 混合积
  • 19 特征值和特征向量
      • 特征值
      • 特征值的性质
  • 20 矩阵的对角化
      • 特征值的代数重数和几何重数
      • 对角化的应用
  • 22 实对阵矩阵
  • 1 正定矩阵
      • 实对称矩阵 A 正定的充要条件
      • 半正定矩阵
      • 半正定矩阵的判别条件
      • 二次型
      • 主轴定理
      • 二次型的分类
      • 矩阵的合同
  • 3 奇异值分解
      • 奇异值分解
      • 奇异值分解的应用
  • 4 线性变换 I
      • 线性变换的乘积
      • 线性变换的逆
      • 线性变换的矩阵表示
  • 5 线性变换 II

以清华大学林润亮老师的ppt为基础进行整理
主要用来进行知识点回顾和快速复习

1 向量及其运算

线性代数

线性代数是建立在向量的 加法数乘 这两种所谓 线性运算 上的

两向量相等

两个向量相等    ⟺    \iff 两者长度相等, 方向相同

向量运算性质

向量加法和数乘的运算性质: 交结零负一乘分分
分别是: 向量加法交换律, 向量加法结合律, 零向量, 反向量, 1 数乘向量, 两个数乘数乘向量, 两个数加数乘向量, 一个数数乘两个向量

列向量

a = ( a 1 a 2 ⋮ a n ) \boldsymbol{a}= \begin{pmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{pmatrix} a=a1a2an
其中 a i a_i ai 为向量 a \boldsymbol{a} a 的第 i i i 个分量

向量的线性组合

v 1 , ⋯   , v m \boldsymbol v_1,\cdots,\boldsymbol v_m v1,,vm m m m n n n 维向量, 称 c 1 v 1 + ⋯ + c m v m c_1\boldsymbol v_1+\cdots +c_m\boldsymbol v_m c1v1++cmvm 为向量 v 1 , ⋯   , v m \boldsymbol v_1,\cdots,\boldsymbol v_m v1,,vm 的一个线性组合

在 3 维空间中,一般,对于向量 u , v , w \boldsymbol u,\boldsymbol v,\boldsymbol w u,v,w
{非零向量 u \boldsymbol u u} 的所有线性组合是一条直线;
{不共线的 u , v \boldsymbol u,\boldsymbol v u,v} 的所有线性组合是一个平面;

{不共面的 u , v , w \boldsymbol u,\boldsymbol v,\boldsymbol w u,v,w} 的所有线性组合是整个三维空间.

向量的长度

向量 v \boldsymbol v v 的长度或模定义为 ∥ v ∥ = v ⋅ v \left\|\boldsymbol v\right \|=\sqrt{\boldsymbol v\cdot \boldsymbol v} v=vv

向量正交

v ⋅ w = 0 \boldsymbol v\cdot \boldsymbol w=0 vw=0, 则称向量 v \boldsymbol v v w \boldsymbol w w 垂直 / 正交. 记作 v ⊥ w \boldsymbol v\perp \boldsymbol w vw

Cauchy-Schwarz 不等式

∣ v ⋅ w ∣ = ∥ v ∥ ∥ w ∥ |\boldsymbol v\cdot \boldsymbol w|=\left \|\boldsymbol v\right \|\left \|\boldsymbol w\right \| vw=vw, 等号成立当且仅当一个向量是另一个向量的倍数.

三角不等式

∥ v + w ∥ ≤ ∥ v ∥ + ∥ w ∥ \left\|\boldsymbol v+ \boldsymbol w\right \|\le \left\|\boldsymbol v\right\|+\left\|\boldsymbol w\right\| v+wv+w, 等号成立当且仅当 v , w \boldsymbol v, \boldsymbol w v,w 之一为另一向量的非负倍数.

2 矩阵与线性方程组

对矩阵与向量乘积的理解

A x A \boldsymbol x Ax
理解1 得到 A A A 各列向量的一个线性组合;
理解2 列向量 $ \boldsymbol x$ 与 A A A 各行向量做内积

对线性方程组的理解

A x = b A \boldsymbol x=\boldsymbol b Ax=b
理解1 A A A 列向量的线性组合, 使之等于 b \boldsymbol b b;
理解2 求向量 x \boldsymbol x x, 使之与 A A A 的行向量内积分别为 b \boldsymbol b b 中的元素

可逆矩阵

A x = b A \boldsymbol x=\boldsymbol b Ax=b( n n n 个方程, n n n 个未知数) 对任意向量 b \boldsymbol b b 有唯一解, 则称方阵 A \boldsymbol A A 可逆

A = ( u , v , w ) A=(\boldsymbol u, \boldsymbol v, \boldsymbol w) A=(u,v,w) 可逆, 则 u , v , w \boldsymbol u, \boldsymbol v, \boldsymbol w u,v,w 的全部线性组合所得空间是整个三维空间, 这时向量 u , v , w \boldsymbol u, \boldsymbol v, \boldsymbol w u,v,w 线性无关 / 不共面, 相应 A x = b A \boldsymbol x=\boldsymbol b Ax=b 只有零解

线性方程组的行图和列图

行图(二维) 两直线交点
列图两列向量的线性组合

3 高斯消元法

矩阵的初等行变换

对方程组 A x = b A \boldsymbol x=\boldsymbol b Ax=b, 消元法涉及以下三种同解变形:

  1. 把一个方程减去另一个方程的倍数;
  2. 交换两个方程的位置;
  3. 用一个非零数乘一个方程.

相应地对增广矩阵作以下三种行变换 (即: 初等行变换):

  1. 把一行减去另一行的倍数;
  2. 交换两行;
  3. 用一个非零数乘一行.

增广矩阵

对线性方程组 A x = b A \boldsymbol x=\boldsymbol b Ax=b 做消元法, 即用一系列初等矩阵在左边, 去乘增广矩阵 ( A ∣ b ) (A | \boldsymbol b) (Ab)

消去矩阵

将单位阵中某个 0 0 0 变为非零的数得到的矩阵称为消去矩阵, 消去矩阵是一类初等矩阵

置换阵

P 12 = ( 0 1 0 1 0 0 0 0 1 ) P_{12}=\begin{pmatrix} 0&1&0 \\ 1&0&0 \\ 0&0&1 \end{pmatrix} P12=010100001
置换阵 P P P 满足 P − 1 = P T P^{-1}=P^{T} P1=PT

4 矩阵的运算

矩阵乘法的性质

满足结合律, 左分配律, 右分配律
矩阵的乘法一般不可交换, 消去律一般也不成立

分块矩阵

矩阵的转置

A T = A A^T=A AT=A 则称 A A A 是一个对称矩阵
A T = − A A^T=-A AT=A 则称 A A A 是一个反对称矩阵
R R R m × n m\times n m×n 矩阵 (实数域), 则 R R T RR^T RRT m × n m\times n m×n 对称矩阵, 且其对角元均非负

5 矩阵的逆

逆矩阵

对方阵 A A A, 若存在矩阵 B B B, 满足 A B = B A = I AB=BA=I AB=BA=I, 则称 A A A 是可逆的. 称 B B B A A A 的逆矩阵, 记作 A − 1 A^{-1} A1.
可逆矩阵也称为非奇异矩阵, 不可逆矩阵也称为奇异矩阵

性质

  1. n n n 阶阵 A A A 可逆等价于 A A A n n n 个主元
  2. 方阵的逆唯一
  3. A A A 可逆, 则 A x = b A\boldsymbol x=\boldsymbol b Ax=b 有唯一解 x = A − 1 b \boldsymbol x=A^{-1}\boldsymbol b x=A1b
  4. A x = 0 A\boldsymbol x=\boldsymbol 0 Ax=0 有非零解, 则 A A A 不可逆
  5. 二阶阵 A = ( a b c d ) A=\begin{pmatrix} a&b \\ c&d \end{pmatrix} A=(acbd) 可逆等价于 a d − b c ≠ 0 ad-bc\neq0 adbc=0, 且 A − 1 = 1 a d − b c ( d − b − c a ) A^{-1}=\frac{1}{ad-bc}\begin{pmatrix} d&-b \\ -c&a \end{pmatrix} A1=adbc1(dcba)
  6. 对角阵可逆等价于对角元均不为 0 0 0
  7. ( A − 1 ) − 1 = A (A^{-1})^{-1}=A (A1)1=A
  8. ( A B ) − 1 = B − 1 A − 1 (AB)^{-1}=B^{-1}A^{-1} (AB)1=B1A1

6 LU 分解

将矩阵分解成一个下三角矩阵和一个上三角矩阵的乘积
E A = U , A = E − 1 U = L U EA=U, A=E^{-1}U=LU EA=U,A=E1U=LU
A = E − 1 D U = L D U A=E^{-1}DU=LDU A=E1DU=LDU 其中 L L L U U U 的对角元为 1 1 1

LU 分解的存在性和唯一性

设可逆矩阵 A = ( a i j ) n × n A=(a_{ij})_{n\times n} A=(aij)n×n 的顺序主子式 A k = ( a i j ) k × k ( k = 1 , ⋯   , n ) A_k = (a_{ij})_{k\times k}(k=1,\cdots ,n) Ak=(aij)k×k(k=1,,n) 均为可逆阵, 则 A A A L U LU LU 分解. 若 l i i = 1 , u i i ≠ 0 ( 1 ≤ i ≤ n ) l_{ii}=1, u_{ii}\neq 0(1\le i\le n) lii=1,uii=0(1in), 则分解唯一

A A A 是一个 n n n 阶可逆阵, 则存在置换阵 P P P 使得 P A = L U PA=LU PA=LU

对称矩阵的 L D L T LDL^T LDLT 分解

7 向量空间

向量子空间

V V V R n \mathbb R^n Rn 的非空子集, 且 V V V 关于向量加法和数乘运算封闭 ( ∀ α , β ∈ V , ∀ c 1 , c 2 ∈ R ⟹ c 1 α + c 2 β ∈ V \forall \alpha ,\beta\in V,\forall c_1,c_2\in \mathbb R \Longrightarrow c_1\alpha+c_2\beta\in V α,βV,c1,c2Rc1α+c2βV), 则称 V V V R n \mathbb R^n Rn 的一个向量子空间

推广的向量空间的定义

在由称为“向量”的元素构成的非空集合 V V V 中, 若定义了加法和数乘运算, 且对任意向量 a , b , c \boldsymbol{a}, \boldsymbol{b}, \boldsymbol{c} a,b,c 及数域 F \mathbb{F} F, k , l ∈ F k,l\in \mathbb{F} k,lF 满足以下八条性质:

  1. a + b = b + a \boldsymbol a + \boldsymbol b=\boldsymbol b + \boldsymbol a a+b=b+a
  2. a + ( b + c ) = ( a + b ) + c \boldsymbol a + (\boldsymbol b+\boldsymbol c)=(\boldsymbol a + \boldsymbol b)+\boldsymbol c a+(b+c)=(a+b)+c
  3. 存在零向量 0 ,   a + 0 = a \boldsymbol 0,\ \boldsymbol a+\boldsymbol 0=\boldsymbol a 0, a+0=a
  4. 对任意向量 a \boldsymbol a a, 存在唯一相反向量 − a -\boldsymbol a a, 使得 a + ( − a ) = 0 \boldsymbol a+(-\boldsymbol a)=\boldsymbol 0 a+(a)=0
  5. 1 ⋅ a = a 1\cdot \boldsymbol a=\boldsymbol a 1a=a
  6. ( k l ) a = k ( l a ) (kl)\boldsymbol a=k(l\boldsymbol a) (kl)a=k(la)
  7. k ( a + b ) = k a + k b k(\boldsymbol a+\boldsymbol b)=k\boldsymbol a+k\boldsymbol b k(a+b)=ka+kb
  8. ( k + l ) a = k a + l a (k+l)\boldsymbol a=k\boldsymbol a+l\boldsymbol a (k+l)a=ka+la

则称 V V V 为定义在数域 F \mathbb{F} F 上的向量空间

列空间

A A A 的列向量所有线性组合构成的空间称为 A A A 的列空间, 记作 C ( A ) C(A) C(A)
C ( A ) = { c 1 α 1 + c 2 α 2 + ⋯ + c n α n ∣ c i ∈ R } = { y ∈ R m ∣ y = A x , x ∈ R n } C(A)=\{c_1 \boldsymbol \alpha_1+ c_2 \boldsymbol \alpha_2+\cdots+ c_n \boldsymbol \alpha_n | c_i\in \mathbb R\}=\{\boldsymbol y\in\mathbb R^m | \boldsymbol y=A \boldsymbol x,\boldsymbol x\in \mathbb R^n\} C(A)={c1α1+c2α2++cnαnciR}={yRmy=Ax,xRn}

A x = b A \boldsymbol x=\boldsymbol b Ax=b 有解    ⟺    b ∈ C ( A ) \iff \boldsymbol b\in C(A) bC(A)

求列空间: 将矩阵化为阶梯形, 阶梯形中主元所在的的列 / 原矩阵中主元所在的列的线性组合就是列空间

零空间

N ( A ) = { x ∣ A x = 0 } ⊂ R n N(A)=\{\boldsymbol x | A \boldsymbol x= \boldsymbol 0\}\subset \mathbb R^n N(A)={xAx=0}Rn

求零空间: 将矩阵化为阶梯形 / 简化行阶梯形 (RREF), 将主元所在的列对应解 x \boldsymbol x x 位置的数字标记为 1, 通过 A x = 0 A \boldsymbol x=\boldsymbol 0 Ax=0 确定 x \boldsymbol x x 其他位置的数字得到基础解系, 进行组合得到零空间

阶梯形

  1. A ⟶ 行 变 换 U A\overset{行变换}{\longrightarrow}U AU, 则 N ( A ) = N ( U ) N(A)=N(U) N(A)=N(U)
  2. B x = 0 ⟹ A B x = 0 B \boldsymbol x= \boldsymbol 0\Longrightarrow AB \boldsymbol x= \boldsymbol 0 Bx=0ABx=0, 这说明 N ( B ) ⊂ N ( A B ) N(B)\subset N(AB) N(B)N(AB)
  3. C ( A B ) ⊂ C ( A ) C(AB)\subset C(A) C(AB)C(A), 即 ( A B ) (AB) (AB) 的每一列是 A A A 的列向量的线性组合
  4. A x = b A \boldsymbol x=\boldsymbol b Ax=b 有一个解 x ∗ \boldsymbol x^* x, 则 A x = b A \boldsymbol x=\boldsymbol b Ax=b 的解集为 x ∗ + N ( A ) \boldsymbol x^*+N(A) x+N(A)

8 求解齐次线性方程组

A x = 0 A \boldsymbol x=\boldsymbol 0 Ax=0 的基础解系

  1. 主元个数 = 未知量个数 ( A A A 的列数)- 自由变量个数
  2. 自由变量个数 = 基础解系中向量的个数 = 解集中线性无关解向量可达到的最大个数
  3. 主元个数 = A A A 的列向量中线性无关列向量的个数

9 求解非齐次线性方程组

极大线性无关组

向量组的极大线性无关组: 从原向量组中选出一部分向量构成的线性无关向量组, 并且再填入原向量组中的任一向量就线性相关

向量组的秩: 向量组的极大线性无关组中向量的个数.
定理: 两组向量若能互相线性表出, 则它们的秩相等
A A A 的行秩 = A A A 的列秩 = A A A 的秩

求特解 x ∗ \boldsymbol x^* x

将矩阵化为 RREF 后令自由变量为 0, 解出主元对应位置的数字即可

10 无关性、基与维数

基与维数

v 1 , v 2 , ⋯   , v n ∈ V \boldsymbol v_1, \boldsymbol v_2, \cdots , \boldsymbol v_n\in V v1,v2,,vnV v 1 , v 2 , ⋯   , v n \boldsymbol v_1, \boldsymbol v_2, \cdots , \boldsymbol v_n v1,v2,,vn 线性无关, 且 ∀ α ∈ V , α \forall \alpha\in V,\alpha αV,α v 1 , v 2 , ⋯   , v n \boldsymbol v_1, \boldsymbol v_2, \cdots , \boldsymbol v_n v1,v2,,vn 的线性组合, 则称 { v 1 , v 2 , ⋯   , v n } \{\boldsymbol v_1, \boldsymbol v_2, \cdots , \boldsymbol v_n\} {v1,v2,,vn} V V V 的一组基

可逆矩阵与一组基相乘得到的还是一组基

关于秩的不等式

r ( A B ) ≤ min ⁡ { r ( A ) , r ( B ) } r(AB)\le \min \{r(A),r(B)\} r(AB)min{r(A),r(B)}
r ( A ) = r ( A T ) r(A)=r(A^T) r(A)=r(AT)
r ( A + B ) ≤ r ( A ) + r ( B ) r(A+B)\le r(A)+r(B) r(A+B)r(A)+r(B)

11 四个基本子空间的基与维数

四个基本子空间

列空间 C ( A ) = { y ∈ R m ∣ y = A x , x ∈ R n } C(A)=\{\boldsymbol y\in\mathbb R^m | \boldsymbol y=A \boldsymbol x,\boldsymbol x\in \mathbb R^n\} C(A)={yRmy=Ax,xRn}
行空间 C ( A T ) = { y ∈ R n ∣ y = A T x , x ∈ R m } C(A^T)=\{\boldsymbol y\in\mathbb R^n | \boldsymbol y=A^T \boldsymbol x,\boldsymbol x\in \mathbb R^m\} C(AT)={yRny=ATx,xRm}
零空间 N ( A ) = { x ∈ R n ∣ A x = 0 } N(A)=\{\boldsymbol x \in \mathbb R^n| A \boldsymbol x= \boldsymbol 0\} N(A)={xRnAx=0}
左零空间 N ( A T ) = { x ∈ R m ∣ A T x = 0 } N(A^T)=\{\boldsymbol x \in \mathbb R^m| A^T \boldsymbol x= \boldsymbol 0\} N(AT)={xRmATx=0}

C ( A ) C(A) C(A) N ( A T ) N(A^T) N(AT) R m \mathbb R^m Rm 的子空间
C ( A T ) C(A^T) C(AT) N ( A ) N(A) N(A) R m \mathbb R^m Rm 的子空间

子空间的基和维数

R R E F RREF RREF 中主元所在的列 / 对应原矩阵中的列是 C ( A ) C(A) C(A) 的一组基
用 “上面行的倍数加到下面行” 化 A A A 为阶梯形 (忽略中间的全零行), 阶梯形非零行标号对应 A A A 的行即为 C ( A T ) C(A^T) C(AT) 的一组基
A A A 的基础解系构成 N ( A ) N(A) N(A) 的一组基
A T A^T AT 的基础解系构成 N ( A T ) N(A^T) N(AT) 的一组基

d i m ( C ( A ) ) = d i m ( C ( A T ) ) = r dim(C(A))=dim(C(A^T))=r dim(C(A))=dim(C(AT))=r
d i m ( N ( A ) ) = n − r dim(N(A))=n-r dim(N(A))=nr
d i m ( N ( A T ) ) = m − r dim(N(A^T))=m-r dim(N(AT))=mr

维数公式

d i m W 1 + d i m W 2 = d i m ( W 1 ∩ W 2 ) + d i m ( W 1 + W 2 ) dim W_1+dim W_2=dim(W_1 \cap W_2)+dim(W_1+W_2) dimW1+dimW2=dim(W1W2)+dim(W1+W2)

12 四个基本子空间的正交性

C ( A T ) ⊥ N ( A ) , C ( A T ) + N ( A ) = R n C(A^T)\perp N(A), C(A^T)+ N(A)=\mathbb R^n C(AT)N(A),C(AT)+N(A)=Rn
C ( A ) ⊥ N ( A T ) , C ( A ) + N ( A T ) = R m C(A)\perp N(A^T), C(A)+ N(A^T)=\mathbb R^m C(A)N(AT),C(A)+N(AT)=Rm

A x = b A \boldsymbol x=\boldsymbol b Ax=b C ( A T ) C(A^T) C(AT) 中解的唯一性

定理: 若 A x = b A \boldsymbol x=\boldsymbol b Ax=b 有解, 则 A x = b A \boldsymbol x=\boldsymbol b Ax=b C ( A T ) C(A^T) C(AT) 中有唯一解

13 投影

引言

A x = b A \boldsymbol x=\boldsymbol b Ax=b 无解, 能够找到 x ^ ∈ R n \hat{\boldsymbol x}\in \mathbb R^n x^Rn, 使得 ∥ A x ^ − b ∥ \left \| A \hat{\boldsymbol x}-\boldsymbol b \right \| Ax^b 最小
直观上, A x = b A \boldsymbol x=\boldsymbol b Ax=b 无解    ⟺    b ∉ C ( A ) \iff \boldsymbol b\notin C(A) b/C(A). 上述问题意味着求 C ( A ) C(A) C(A) 上距离 b \boldsymbol b b 最近的点 A x ^ A\hat{\boldsymbol x} Ax^, 它是 b \boldsymbol b b C ( A ) C(A) C(A) 上的投影点

投影矩阵

v v v 在平面 π = C ( A ) \pi=C(A) π=C(A) 上的投影 p p p:
投影 p = A x ^ ∈ C ( A ) ⟹ v − p = e ⊥ C ( A ) ⟹ A T ( v − A x ^ ) = 0 \boldsymbol p=A\hat{\boldsymbol x}\in C(A)\Longrightarrow \boldsymbol v- \boldsymbol p=\boldsymbol e\perp C(A) \Longrightarrow A^T(\boldsymbol v-A\hat{\boldsymbol x})=\boldsymbol 0 p=Ax^C(A)vp=eC(A)AT(vAx^)=0
⟹ x ^ \Longrightarrow \hat{\boldsymbol x} x^ A T A x = A T v A^TA \boldsymbol x=A^T \boldsymbol v ATAx=ATv 的解
A A A 列满秩, A T A A^TA ATA 是可逆阵 ⟹ x ^ = ( A T A ) − 1 A T v , p = A ( A T A ) − 1 A T v \Longrightarrow \hat{\boldsymbol x}=(A^TA)^{-1}A^T \boldsymbol v, \boldsymbol p=A(A^TA)^{-1}A^T \boldsymbol v x^=(ATA)1ATv,p=A(ATA)1ATv
将 $ P=A(ATA){-1}A^T $ 称为投影矩阵

A T A A^TA ATA 可逆, 投影阵 $ P=A(ATA){-1}A^T $ 满足 P 2 = P , P T = P P^2=P,P^T=P P2=P,PT=P
一般的, 一个矩阵 P P P 满足 P 2 = P , P T = P P^2=P, P^T=P P2=P,PT=P, 则称 P P P 为投影矩阵

14 最小二乘法

A x = b A \boldsymbol x=\boldsymbol b Ax=b 无解, 将 A T A x ^ = A T b A^TA\hat{\boldsymbol x}=A^T \boldsymbol b ATAx^=ATb 称为正规方程组. 解出 x ^ \hat{\boldsymbol x} x^, 得到 b \boldsymbol b b 在 C(A) 上的投影 p = A x ^ \boldsymbol p=A\hat{\boldsymbol x} p=Ax^

15 Gram-Schmidt 正交化

目标:
给定 V ∈ R n V\in \mathbb R^n VRn 为一个子空间, v 1 , v 2 , ⋯   , v k \boldsymbol v_1,\boldsymbol v_2,\cdots ,\boldsymbol v_k v1,v2,,vk V V V 的一组基, 把它们化成一组正交的向量 w 1 , w 2 , ⋯   , w k \boldsymbol w_1,\boldsymbol w_2,\cdots ,\boldsymbol w_k w1,w2,,wk, 满足:

  1. w i T w j = 0 , i ≠ j {\boldsymbol w_i}^T\boldsymbol w_j=0,i\neq j wiTwj=0,i=j
  2. L ( v 1 , v 2 , ⋯   , v t ) = L ( w 1 , w 2 , ⋯   , w t ) , 1 ≤ t ≤ k L(\boldsymbol v_1,\boldsymbol v_2,\cdots ,\boldsymbol v_t)=L(\boldsymbol w_1,\boldsymbol w_2,\cdots ,\boldsymbol w_t),1\le t\le k L(v1,v2,,vt)=L(w1,w2,,wt),1tk, L ( v 1 , v 2 , ⋯   , v t ) L(\boldsymbol v_1,\boldsymbol v_2,\cdots ,\boldsymbol v_t) L(v1,v2,,vt) 表示 v 1 , v 2 , ⋯   , v t \boldsymbol v_1,\boldsymbol v_2,\cdots ,\boldsymbol v_t v1,v2,,vt 生成的 V V V 的子空间

正交化过程

w 1 = v 1 w 2 = v 2 − w 1 T v 2 w 1 T w 1 w 1 w 3 = v 3 − w 1 T v 3 w 1 T w 1 w 1 − w 2 T v 3 w 2 T w 2 w 2 \boldsymbol w_1=\boldsymbol v_1 \\ \boldsymbol w_2=\boldsymbol v_2-\frac{{\boldsymbol w_1}^T \boldsymbol v_2}{{\boldsymbol w_1}^T \boldsymbol w_1}\boldsymbol w_1 \\ \boldsymbol w_3=\boldsymbol v_3-\frac{{\boldsymbol w_1}^T \boldsymbol v_3}{{\boldsymbol w_1}^T \boldsymbol w_1}\boldsymbol w_1-\frac{{\boldsymbol w_2}^T \boldsymbol v_3}{{\boldsymbol w_2}^T \boldsymbol w_2}\boldsymbol w_2 w1=v1w2=v2w1Tw1w1Tv2w1w3=v3w1Tw1w1Tv3w1w2Tw2w2Tv3w2
再进行单位化 q i = w i ∥ w i ∥ \boldsymbol q_i=\frac{\boldsymbol w_i}{\left \| \boldsymbol w_i \right \|} qi=wiwi

QR 分解

举例:
A = ( v 1 , v 2 , v 3 ) = ( 1 1 0 1 0 1 0 1 1 ) A=(\boldsymbol v_1,\boldsymbol v_2, \boldsymbol v_3)=\begin{pmatrix}1&1&0 \\ 1&0&1 \\ 0&1&1 \end{pmatrix} A=(v1,v2,v3)=110101011
A = Q R = ( 1 2 1 6 − 1 3 1 2 − 1 6 1 3 0 2 6 1 3 ) ( 2 2 1 2 1 2 0 3 6 1 6 0 0 2 3 ) A=QR=\begin{pmatrix} \frac{1}{\sqrt 2}&\frac{1}{\sqrt 6}&-\frac{1}{\sqrt 3} \\ \frac{1}{\sqrt 2}&-\frac{1}{\sqrt 6}&\frac{1}{\sqrt 3}\\0&\frac{2}{\sqrt 6}&\frac{1}{\sqrt 3} \end{pmatrix}\begin{pmatrix} \frac{2}{\sqrt 2}&\frac{1}{\sqrt 2}&\frac{1}{\sqrt 2} \\ 0&\frac{3}{\sqrt 6}&\frac{1}{\sqrt 6}\\0&0&\frac{2}{\sqrt 3} \end{pmatrix} A=QR=2 12 106 16 16 23 13 13 12 2002 16 302 16 13 2
R R R 是对角元为正数的上三角矩阵

16 行列式的基本性质

行列式的几何意义

二阶行列式的几何意义: 平面四边形的“有向”面积
三阶行列式的几何意义: 平行六面体的“有向”体积

行列式性质

  1. 单位阵行列式为 1 1 1
  2. 给一行乘 c c c, 行列式值乘 c c c
  3. 一行元素可以拆为两数之和进而分为两个矩阵
  4. 交换任意两行行列式值取反
  5. 行列互换行列式值不变

推论:

  1. 两行成比例, 行列式值为 0 0 0
  2. 将一行的倍数加到另一行, 行列式值不变

行列式与初等变换

  1. 行列式不为零等价于矩阵可逆
  2. n n n 阶方阵乘积的行列式 = 各自行列式的乘积

17 行列式的计算

M i j M_{ij} Mij A A A 划去第 i i i 行第 j j j 列得到的 n − 1 n-1 n1 阶矩阵
余子式: det ⁡ M i j \det M_{ij} detMij
代数余子式: C i j = ( − 1 ) i + j det ⁡ M i j C_{ij}=(-1)^{i+j}\det M_{ij} Cij=(1)i+jdetMij

行列式展开定理

det ⁡ A = ∣ a i j ∣ n × n = a i 1 C i 1 + a i 2 C i 2 + ⋯ + a i n C i n , ∀ i , j = 1 , ⋯   , n \det A=|{a_{ij}}|_{n\times n}=a_{i1}C_{i1}+a_{i2}C_{i2}+\cdots+a_{in}C_{in},\forall i,j=1,\cdots,n detA=aijn×n=ai1Ci1+ai2Ci2++ainCin,i,j=1,,n

典型计算方法

化为上三角或下三角, 计算对角元乘积即为行列式值
通过行列式展开定理展开进行不断降阶后计算行列式值

n 阶范德蒙德行列式

D n = ∣ 1 1 1 ⋯ 1 x 1 x 2 x 3 ⋯ x n x 1 2 x 2 2 x 3 2 ⋯ x n 2 ⋮ ⋮ ⋮ ⋱ ⋮ x 1 n − 1 x 2 n − 1 x 3 n − 1 ⋯ x n n − 1 ∣ = ∏ 1 ≤ i < j ≤ n ( x j − x i ) D_{n}=\left|\begin{array}{ccccc} 1 & 1 & 1 & \cdots & 1 \\ x_{1} & x_{2} & x_{3} & \cdots & x_{n} \\ x_{1}^{2} & x_{2}^{2} & x_{3}^{2} & \cdots & x_{n}^{2} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ x_{1}^{n-1} & x_{2}^{n-1} & x_{3}^{n-1} & \cdots & x_{n}^{n-1} \end{array}\right|=\prod_{1 \leq iDn=1x1x12x1n11x2x22x2n11x3x32x3n11xnxn2xnn1=1i<jn(xjxi)

18 Cramer 法则及行列式的几何意义

代数余子式的重要性质

∑ k = 1 n a i k C j k = { D , i = j 0 , i ≠ j \sum_{k=1}^{n}a_{ik}C_{jk}=\left\{\begin{array}{c} D,i=j \\ 0,i\neq j \end{array} \right. k=1naikCjk={D,i=j0,i=j

伴随矩阵

下面的矩阵称为 A A A 的伴随矩阵
A ∗ = a d j ( A ) = ( C 11 C 21 ⋯ C n 1 C 12 C 22 ⋯ C n 2 ⋮ ⋮ ⋮ C 1 n C 2 n ⋯ C n n ) A^*=adj(A)=\left(\begin{array}{cccc} C_{11} & C_{21} & \cdots & C_{n 1} \\ C_{12} & C_{22} & \cdots & C_{n 2} \\ \vdots & \vdots & & \vdots \\ C_{1 n} & C_{2 n} & \cdots & C_{n n} \end{array}\right) A=adj(A)=C11C12C1nC21C22C2nCn1Cn2Cnn
( A ∗ ) T (A^*)^T (A)T: A A A 的代数余子式矩阵

求逆矩阵公式

A − 1 = a d j ( A ) ∣ A ∣ A^{-1}=\frac{adj(A)}{|A|} A1=Aadj(A)

线性方程组的公式解

一般地, 若不使用行列式, A A A 可逆时, A x = b A \boldsymbol x=\boldsymbol b Ax=b 解的表达式将非常复杂.
定理 (Cramer’s Rule): 设 A A A n n n 阶可逆阵, b ∈ R n \boldsymbol b \in \mathbb{R}^{n} bRn, 令 B k B_{k} Bk 是将 A A A 的 第 k k k 列换成向量 b \boldsymbol b b 后所得的矩阵. 则 A x = b A \boldsymbol {x}=\boldsymbol {b} Ax=b 的唯一解为
x = ( x 1 , ⋯   , x n ) T , x 1 = det ⁡ ( B 1 ) det ⁡ A , ⋯   , x n = det ⁡ ( B n ) det ⁡ A \boldsymbol {x}=\left(x_{1}, \cdots, x_{n}\right)^{T}, \quad x_{1}=\frac{\operatorname{det}\left(B_{1}\right)}{\operatorname{det} A}, \cdots, x_{n}=\frac{\operatorname{det}\left(B_{n}\right)}{\operatorname{det} A} x=(x1,,xn)T,x1=detAdet(B1),,xn=detAdet(Bn)

向量的叉积 / 外积

u = ( u 1 u 2 u 3 ) , v = ( v 1 v 2 v 3 ) \boldsymbol u=\begin{pmatrix}u_1\\u_2\\u_3\end{pmatrix},\boldsymbol v=\begin{pmatrix}v_1\\v_2\\v_3\end{pmatrix} u=u1u2u3,v=v1v2v3, u × v \boldsymbol u\times \boldsymbol v u×v 是与 u \boldsymbol u u v \boldsymbol v v 都垂直且成右手关系的向量

u × v = − v × u \boldsymbol u\times \boldsymbol v=-\boldsymbol v\times \boldsymbol u u×v=v×u
( u 1 + u 2 ) × v = u 1 × v + u 2 × v (\boldsymbol u_1+\boldsymbol u_2)\times \boldsymbol v=\boldsymbol u_1\times \boldsymbol v+\boldsymbol u_2\times \boldsymbol v (u1+u2)×v=u1×v+u2×v

混合积

混合积 u × v ⋅ w \boldsymbol u\times \boldsymbol v\cdot \boldsymbol w u×vw , 几何上表示三向量组成的平行六面体的有向体积.

性质: u × v ⋅ w = v × w ⋅ u = w × u ⋅ v \boldsymbol u\times \boldsymbol v\cdot \boldsymbol w=\boldsymbol v\times \boldsymbol w\cdot \boldsymbol u=\boldsymbol w\times \boldsymbol u\cdot \boldsymbol v u×vw=v×wu=w×uv

定理: u × v ⋅ w = det ⁡ ( u , v , w ) \boldsymbol u\times \boldsymbol v\cdot \boldsymbol w=\det (\boldsymbol u,\boldsymbol v,\boldsymbol w) u×vw=det(u,v,w)

19 特征值和特征向量

特征值

A A A, 若存在数 λ \lambda λ 和非零向量 x \boldsymbol x x, 满足 A x = λ x A \boldsymbol x=\lambda \boldsymbol x Ax=λx, 则称 λ \lambda λ A A A 的特征值, x \boldsymbol x x A A A 的属于特征值 λ \lambda λ 的特征向量

λ \lambda λ 为方阵 A A A 的特征值    ⟺    det ⁡ ( A − λ I ) = 0 \iff \det (A-\lambda I)=0 det(AλI)=0

det ⁡ ( A − λ I ) = 0 \det (A-\lambda I)=0 det(AλI)=0 是关于 λ \lambda λ 的多项式, 求解多项式得到 λ \lambda λ, 之后将解出的 λ \lambda λ 分别带回 ( A − λ I ) x = 0 (A-\lambda I)\boldsymbol x=\boldsymbol 0 (AλI)x=0 即可解出特征值对应的特征向量

举例: 投影矩阵的特征值是 0 0 0 1 1 1

特征值的性质

∑ i = 1 n λ i = t r ( A ) = ∑ i = 1 n a i i \sum_{i=1}^{n}\lambda_i=tr(A)=\sum_{i=1}^{n}a_{ii} i=1nλi=tr(A)=i=1naii
∏ i = 1 n = det ⁡ A \prod_{i=1}^n=\det A i=1n=detA

20 矩阵的对角化

n × n n\times n n×n 矩阵 A A A n n n 个线性无关的特征向量 x 1 , x 2 , ⋯   , x n , A x i = λ i x i \boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_n, A \boldsymbol x_i=\lambda_i \boldsymbol x_i x1,x2,,xn,Axi=λixi, 令 S = ( x 1 , x 2 , ⋯   , x n ) S=(\boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_n) S=(x1,x2,,xn), 则 S − 1 A S S^{-1}AS S1AS 是一个对角矩阵 Λ \Lambda Λ, 其对角元素是 A A A 的特征值
S − 1 A S = Λ = ( λ 1 ⋱ λ n ) S^{-1}AS=\Lambda=\begin{pmatrix}\lambda_1& & \\ & \ddots& \\ & &\lambda_n\end{pmatrix} S1AS=Λ=λ1λn

若存在可逆矩阵 S S S, 使得 S − 1 A S S^{-1}AS S1AS 为对角矩阵, 则称矩阵 A A A 是可对角化的

n × n n\times n n×n 矩阵 A A A 可对角化的充要条件是 A A A n n n 个线性无关的特征向量 x 1 , x 2 , ⋯   , x n , A x i = λ i x i \boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_n, A \boldsymbol x_i=\lambda_i \boldsymbol x_i x1,x2,,xn,Axi=λixi

定理:
λ 1 , λ 2 , ⋯   , λ k \boldsymbol \lambda_1 ,\boldsymbol \lambda_2,\cdots, \boldsymbol \lambda_k λ1,λ2,,λk A A A 的互异特征值, x 1 , x 2 , ⋯   , x k \boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_k x1,x2,,xk 是相应特征向量, 则 x 1 , x 2 , ⋯   , x k \boldsymbol x_1 ,\boldsymbol x_2,\cdots, \boldsymbol x_k x1,x2,,xk 线性无关

推论:
具有 n n n 个两两互异特征值的 n × n n\times n n×n 矩阵可以对角化

特征值的代数重数和几何重数

定义: 设 det ⁡ ( A − λ I ) = ( λ 1 − λ ) n 1 ⋯ ( λ k − λ ) n k \operatorname{det}(A-\lambda I)=\left(\lambda_{1}-\lambda\right)^{n_{1}} \cdots\left(\lambda_{k}-\lambda\right)^{n_{k}} det(AλI)=(λ1λ)n1(λkλ)nk , 其中 λ i ≠ λ j ( i ≠ j ) \lambda_{i} \neq \lambda_{j}(i \neq j) λi=λj(i=j). 称 n i n_{i} ni 为特征值 λ i \lambda_{i} λi 的代数重数, 记作 A M ( λ i ) = n i AM\left(\lambda_{i}\right)=n_{i} AM(λi)=ni. 称 dim ⁡ N ( A − λ i I ) \operatorname{dim} N\left(A-\lambda_{i} I\right) dimN(AλiI) 为特征值 λ i \lambda_{i} λi 的几何重数, 记作 G M ( λ i ) = dim ⁡ N ( A − λ i I ) G M\left(\lambda_{i}\right)=\operatorname{dim} N\left(A-\lambda_{i} I\right) GM(λi)=dimN(AλiI)

G M ( λ i ) ≤ A M ( λ i ) G M\left(\lambda_{i}\right)\le AM\left(\lambda_{i}\right) GM(λi)AM(λi)

定理: 复方阵 A A A 可对角化    ⟺    \iff 对任意特征值 λ i \lambda_i λi , G M ( λ i ) = A M ( λ i ) G M\left(\lambda_{i}\right)= AM\left(\lambda_{i}\right) GM(λi)=AM(λi)

对角化的应用

快速计算 A k A^k Ak

22 实对阵矩阵

定理: 实对称矩阵的特征值都是实数
定理: 任何实对称矩阵都正交相似于对角阵, 即对实对称阵 A A A, 存在正交阵 Q Q Q, 使 Q T A Q Q^TAQ QTAQ 为对角阵

1 正定矩阵

特征值全是正数的实对称矩阵称为正定矩阵

实对称矩阵 A 正定的充要条件

  1. A A A 的所有特征值均为正
  2. x T A x > 0 {\boldsymbol x}^TA \boldsymbol x>0 xTAx>0 对所有非零实向量 x \boldsymbol x x 成立
  3. A A A 的所有顺序主子式都是正的
  4. (只做上面行的倍数加到下面行) n n n 阶阵 A A A n n n 个主元都是正的
  5. 存在列满秩矩阵 R R R, 使得 A = R T R A=R^TR A=RTR
  6. A A A 的所有主子式都是正的

n n n 阶行列式中任选 k k k 行: 第 i 1 , i 2 , ⋯   , i k i_1,i_2,\cdots,i_k i1,i2,,ik 行, 再取相应的第 i 1 , i 2 , ⋯   , i k i_1,i_2,\cdots,i_k i1,i2,,ik 列. 由上述选取的 k k k k k k 列交汇处元素组成的新矩阵称
k k k 阶主子阵; 主子阵的行列式, 称为 n n n 阶行列式的一个 k k k 阶主子式.
n n n 阶行列式中由第 1 , ⋯   , k 1,\cdots,k 1,,k 行和第 1 , ⋯   , k 1,\cdots,k 1,,k 列所确定的主子式称为 k k k 阶顺序主子式.

半正定矩阵

若实对称矩阵 A A A 的特征值均非负,那么称 A A A 为半正定矩阵

半正定矩阵的判别条件

  1. A A A 的所有特征值 λ i \lambda_i λi 均非负
  2. x T A x ≥ 0 {\boldsymbol x}^TA \boldsymbol x≥0 xTAx0 对所有实向量 x \boldsymbol x x 成立.
  3. 存在矩阵 R R R, 使得 A = R T R A=R^TR A=RTR( R R R 可能是不可逆阵)
  4. A 的所有主子式均非负

二次型

n n n 维实向量 x ∈ R n \boldsymbol x \in \mathbb R ^{n} xRn 及 n 阶实矩阵 A, 称数值函数
f ( x ) = x T A x = x T ( a i j ) n × n x = ∑ i = 1 n ∑ j = 1 n a i j x i x j f(\mathbf{x})=\mathbf{x}^{T} A \mathbf{x}=\mathbf{x}^{T}\left(a_{i j}\right)_{n \times n} \mathbf{x}=\sum_{i=1}^{n} \sum_{j=1}^{n} a_{i j} x_{i} x_{j} f(x)=xTAx=xT(aij)n×nx=i=1nj=1naijxixj
为一个 (实) 二次型, 它是关于 x 1 , ⋯   , x n x_1,\cdots,x_n x1,,xn 的二次齐次多项式

主轴定理

A A A 是一个 n n n 阶实对称矩阵, 则存在正交变量代换 x = Q y \mathbf x = Q\mathbf y x=Qy, 使得二次型
x T A x = y T Λ y = ∑ i = 1 n λ i y i 2 \mathbf{x}^{T} A \mathbf{x}=\mathbf{y}^{T} \Lambda \mathbf{y}=\sum_{i=1}^{n} \lambda_{i} y_{i}^{2} xTAx=yTΛy=i=1nλiyi2
变为对角形的二次型, 其中 Q T A Q = Λ = diag ⁡ ( λ 1 , ⋯   , λ n ) Q^{T} A Q=\Lambda=\operatorname{diag}\left(\lambda_{1}, \cdots, \lambda_{n}\right) QTAQ=Λ=diag(λ1,,λn), λ 1 , ⋯   , λ n \lambda_{1}, \cdots, \lambda_{n} λ1,,λn A A A 的所有特征值.

二次型的分类

一个二次型 f ( x ) = x T A x f(\mathbf{x})=\mathbf{x}^{T} A \mathbf{x} f(x)=xTAx 是:

  • 正定的, 若对所有 x ≠ 0 \mathbf{x} \neq \mathbf{0} x=0, 有 f ( x ) > 0 f(\mathbf{x})>0 f(x)>0    ⟺    A \iff A A 的所有特征值都是正数
  • 负定的, 若对所有 x ≠ 0 \mathbf{x} \neq \mathbf{0} x=0, 有 f ( x ) < 0 f(\mathbf{x})<0 f(x)<0    ⟺    A \iff A A 的所有特征值都是负数
  • 不定的, 若 f ( x ) f(\mathbf{x}) f(x) 既有正值, 又有负值    ⟺    A \iff A A 既有正特征值, 又有负特征值
  • 半正定的, 若对所有 x \mathbf x x, 有 f ( x ) ≥ 0 f(\mathbf{x}) \geq 0 f(x)0
  • 半负定的, 若对所有 x \mathbf x x, 有 f ( x ) ≤ 0 f(\mathbf{x}) \leq 0 f(x)0

矩阵的合同

两个 n n n 阶矩阵 A A A, B B B, 若存在 n n n 阶可逆矩阵 C C C, 使得 C T A C = B C^{T} A C=B CTAC=B, 则称矩阵 A A A B B B 合同, 记为 A ≅ B A\cong B AB

主轴定理可表述为: 任何实对称矩阵都正交合同于对角阵

3 奇异值分解

引言: 如何“对角化” m × n m\times n m×n 矩阵

奇异值分解

A A A 是一个 m × n m\times n m×n 矩阵, 则存在 m m m 阶正交矩阵 U U U n n n 阶正交矩阵 V V V, 满足:
A = U ( σ 1 ⋱ σ 2 0 ) V T = U Σ V T A=U\begin{pmatrix}\sigma_1&&&\\&\ddots&&\\&&\sigma_2&\\&&&\boldsymbol 0\end{pmatrix}V^T=U\Sigma V^T A=Uσ1σ20VT=UΣVT
其中 r = r a n k ( A ) r=rank(A) r=rank(A). 习惯上, 取 σ 1 ≥ σ 2 ≥ ⋯ ≥ σ r ≥ 0 \sigma_1≥\sigma_2≥\cdots≥\sigma_r≥0 σ1σ2σr0, 称 σ 1 , σ 2 , ⋯   , σ r \sigma_1, \sigma_2 ,\cdots,\sigma_r σ1,σ2,,σr 为奇异值, 称 U U U V V V 的前 r r r 列向量为奇异向量. 这个分解称为奇异值分解, 简称 S V D SVD SVD.

A v i = σ i u i A \boldsymbol v_i=\sigma_i \boldsymbol u_i Avi=σiui, A T u i = σ i v i A^T \boldsymbol u_i=\sigma_i \boldsymbol v_i ATui=σivi

A T A v i = σ i 2 v i A^T A \boldsymbol v_i={\sigma_i}^2 \boldsymbol v_i ATAvi=σi2vi
u i = A v i σ i \boldsymbol u_i=\frac{A \boldsymbol v_i}{\sigma_i} ui=σiAvi

{ u 1 , ⋯   , u r } \{\boldsymbol u_1, \cdots, \boldsymbol u_r\} {u1,,ur} C ( A ) C(A) C(A) 的一组单位正交基
{ v 1 , ⋯   , v r } \{\boldsymbol v_1, \cdots, \boldsymbol v_r\} {v1,,vr} C ( A T ) C(A^T) C(AT) 的一组单位正交基

奇异值分解的应用

A = U Σ V T A=U\Sigma V^T A=UΣVT m × n m\times n m×n 实矩阵 A A A 的奇异值分解, r = r ( A ) r=r(A) r=r(A), 则

  • 正交矩阵 U U U 的前 r r r 列是 C ( A ) C(A) C(A) 的一组标准正交基;
  • 正交矩阵 U U U 的后 ( m − r ) (m-r) (mr) 列是 N ( A T ) N(A^T) N(AT) 的一组标准正交基;
  • 正交矩阵 V V V 的前 r r r 列是 C ( A T ) C(A^T) C(AT) 的一组标准正交基;
  • 正交矩阵 V V V 的后 ( n − r ) (n-r) (nr) 列是 N ( A ) N(A) N(A) 的一组标准正交基.

4 线性变换 I

V , W V,W V,W 是数域 F \mathbb F F 上的向量空间, V V V W W W 的映射 T : V → W T:V\to W T:VW 若保持加法和数乘计算, 即
T ( x + y ) = T ( x ) + T ( y ) ,   T ( k x ) = k T ( x ) ,   ∀ x , y ∈ V ,   ∀ k ∈ F T(\boldsymbol x+ \boldsymbol y)=T(\boldsymbol x)+T(\boldsymbol y),\ T(k \boldsymbol x)=kT(\boldsymbol x), \ \forall \boldsymbol x,\boldsymbol y\in V,\ \forall k\in \mathbb F T(x+y)=T(x)+T(y), T(kx)=kT(x), x,yV, kF, 则称 T : V → W T:V\to W T:VW 是一个线性变换

向量空间 V V V W W W 的全体线性变换构成一个向量空间, 记为 L ( V , W ) \mathcal L (V,W) L(V,W)

线性变换的乘积

定义: 设 τ ∈ L ( U , V ) , σ ∈ L ( V , W ) . \tau \in \mathcal{L}(U, V), \sigma \in \mathcal{L}(V, W) . τL(U,V),σL(V,W). 定义线性变换的乘积 σ τ : U → W \sigma \tau: U \rightarrow W στ:UW 为:
( σ τ ) ( u ) = σ ( τ ( u ) ) , ∀ u ∈ U (\sigma \tau)(\mathbf{u})=\sigma(\tau(\mathbf{u})), \quad \forall \mathbf{u} \in U (στ)(u)=σ(τ(u)),uU
直接验证得 σ τ ∈ L ( U , W ) \sigma \tau \in \mathcal{L}(U, W) στL(U,W)

线性变换的逆

τ ∈ L ( V , V ) \tau \in \mathcal{L}(V, V) τL(V,V), 若存在 τ ∈ L ( V , V ) \tau \in \mathcal{L}(V, V) τL(V,V) 使得 σ τ = τ σ = I \sigma \tau=\tau \sigma=I στ=τσ=I, 则称 σ \sigma σ 是可逆线性变换, τ \tau τ σ \sigma σ 的逆变换

线性变换的矩阵表示

T ( v 1 , … , v n ) = ( T ( v 1 ) , … , T ( v n ) ) = ( w 1 , … , w m ) ( a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a m 1 a m 2 ⋯ a m n ) T\left(\mathbf{v}_{1}, \ldots, \mathbf{v}_{n}\right)=\left(T\left(\mathbf{v}_{1}\right), \ldots, T\left(\mathbf{v}_{n}\right)\right)=\left(\mathbf{w}_{1}, \ldots, \mathbf{w}_{m}\right)\left(\begin{array}{cccc}a_{11} & a_{12} & \cdots & a_{1 n} \\ a_{21} & a_{22} & \cdots & a_{2 n} \\ \vdots & \vdots & & \vdots \\ a_{m 1} & a_{m 2} & \cdots & a_{m n}\end{array}\right) T(v1,,vn)=(T(v1),,T(vn))=(w1,,wm)a11a21am1a12a22am2a1na2namn

m × n m\times n m×n 矩阵 A A A 为线性变换 T T T V V V 中给定基 v 1 , ⋯   , v n \boldsymbol v_1,\cdots ,\boldsymbol v_n v1,,vn 和 W 中给定基 w 1 , ⋯   , w m \boldsymbol w_1,\cdots ,\boldsymbol w_m w1,,wm 下的矩阵表示
注: A A A 中第 j j j 列恰是 T ( v j ) T(\boldsymbol v_j) T(vj) 在基 w 1 , ⋯   , w m \boldsymbol w_1,\cdots ,\boldsymbol w_m w1,,wm 下的坐标 ’

定理: 设 v 1 , ⋯   , v n \boldsymbol v_1,\cdots ,\boldsymbol v_n v1,,vn n n n 维空间 V V V 的一组基, w 1 , ⋯   , w m \boldsymbol w_1,\cdots ,\boldsymbol w_m w1,,wm m m m 维向量空间 W W W 的一组基, A A A 是任一 m × n m\times n m×n 矩阵, 则有唯一的线性变换 σ \sigma σ 满足: σ ( v 1 , ⋯   , v n ) = ( w 1 , ⋯   , w m ) A \sigma (\boldsymbol v_1,\cdots ,\boldsymbol v_n)=(\boldsymbol w_1,\cdots ,\boldsymbol w_m)A σ(v1,,vn)=(w1,,wm)A

5 线性变换 II

恒同变换: 对应矩阵 I n I_n In

有线性变换 σ : V → W \sigma:V\to W σ:VW
线性变换的核: ker ⁡ σ = { v ∈ V ∣ σ ( v ) = 0 } \ker \sigma=\{\boldsymbol v\in V | \sigma (\boldsymbol v)=\boldsymbol 0\} kerσ={vVσ(v)=0}
线性变换的像 (值域): Im ⁡ σ = { σ ( v ) ∣ v ∈ V } \operatorname{Im} \sigma = \{\sigma ( \boldsymbol v)|\boldsymbol v\in V\} Imσ={σ(v)vV}

dim ⁡ ( ker ⁡ σ ) \dim (\ker \sigma) dim(kerσ) 称为线性变换 σ \sigma σ 的零度
dim ⁡ ( Im ⁡ σ ) \dim (\operatorname{Im} \sigma) dim(Imσ) 称为线性变换 σ \sigma σ 的秩

你可能感兴趣的:(线性代数,矩阵)