机器学习/深度学习/AI基础数学知识之线性代数概览

线性代数概览

  • 线性代数
    • 行列式
      • 逆序数
      • 行列式的性质与计算
        • 行列式的性质
        • 行列式计算
    • 矩阵
      • 矩阵的基本运算
      • 伴随矩阵,逆矩阵
      • 初等变换,求逆和秩
    • 向量
    • 解方程组
    • 特征值与特征向量
    • 二次型

本篇内容都是线性代数,高等数学和概率论的基本内容,不涉及到公式的推导以及内容的深究,主要是做一个备忘录,以便查阅。本篇只涉及到线性代数,高等数学和概率论见后文博客。

线性代数

这里是对基本的线性代数的知识的记录

行列式

行列式n * n的表示变换,n*m的无实际意义。

逆序数

总结下来是:一切向前看。
定义为:对排列中的每一个数,当前数的和小于前面的数字的个数,将这些个数加在一起就是排列的逆序数。
如排列426315 的逆序数为: τ ( 426315 ) = 0 + 1 + 0 + 2 + 4 + 1 = 8 \tau(426315)=0+1+0+2+4+1=8 τ(426315)=0+1+0+2+4+1=8

对于行列式中某些元素的乘积满足:
a 1 , n a 2 , m = − 1 τ ( n m ) a 1 , n a 2 , m a_{1,n}a_{2,m}=-1^{\tau(nm)}a_{1,n}a_{2,m} a1,na2,m=1τ(nm)a1,na2,m
即符号可以通过列排列的逆序数得到。

行列式的性质与计算

行列式的性质

(1)转置不变
(2)对换变号,两行互换要加负号
(3)提公因子,可以把某一行的公因子提出来放到行列式前面,而不是整个行列式。
(4)拆加性质,某一列是可以分解为两个和,行列式可以分解为两个行列式,分解是拆,合并是加。
(5)倍加不变,如第二行加上第一行的k倍,行列式的值不发生改变。
零值性质:某行为0,行列式为0,两行成比例,行列式为0。

行列式计算

(1)对角线法则
用主对角线的乘积减去副对角的乘积,适用于二阶和三阶的。三阶的方法计算如下:
机器学习/深度学习/AI基础数学知识之线性代数概览_第1张图片

(2)三角化法
①主对角三角行列式,元素在左下(下三角)或是右上的(上三角),结果是主对角线上的元素乘积。
②副对角三角行列式,元素在右下或是左上的,结果为 − 1 n ( n − 1 ) 2 a 1 , n . . . a n , 1 -1^{\frac{n(n-1)}{2}}a_{1,n}...a_{n,1} 12n(n1)a1,n...an,1。即副对角线的乘积,还需要-1的那么多次方,-1的系数可以由列排列的逆序数得到。

行/列和相等的行列式:

  1. 行(列)和相等,列(行)相加
  2. 提公因子
  3. 三角化

(3)行列式展开

  1. 余子式与代数余子式
    余子式 M i j M_{ij} Mij:划掉 a i j a_{ij} aij所在的行和列.
    代数余子式 A i j A_{ij} Aij A i j = ( − 1 ) i + j M i j A_{ij}=(-1)^{i+j}M{ij} Aij=(1)i+jMij.

    余子式和代数余子式是一定比原行列式要低一阶的。

  2. 展开定理(降阶法)
    一次操作是将n阶行列式降为n-1阶
    展开定理:
    D = ∣ A ∣ = a i 1 A i 1 + a i 2 A i 2 + . . . + a i n A i n D = |A| = a_{i1}A_{i1} + a_{i2}A_{i2} +...+a_{in}A_{in} D=A=ai1Ai1+ai2Ai2+...+ainAin
    对n阶行列式A, 上面是用第一行展开的结果,用其他行展开也可以,可以看到已经变成了n-1阶行列式的加和。也就实现了降阶。
    关键在于先化简,使得行列式的某行或者某列出现较多的0。这样前面的系数 a i j a_{ij} aij为0,减少对代数余子式的计算。
    推论:
    a i 1 A j 1 + a i 2 A j 2 + . . . + a i n A j n = { D , i = j 0 , i ≠ j a_{i1}A_{j1} + a_{i2}A_{j2} +...+a_{in}A_{jn} = \left\{ \begin{array}{lr} D,&i=j \\ 0,&i\neq j \end{array} \right. ai1Aj1+ai2Aj2+...+ainAjn={D,0,i=ji=j
    可以通过展开定理一直对高阶行列式进行展开,直到可以直接进行计算。

若直接给出某行列式的代数余子式的展开形式,可以直接组成新的行列式进行计算,即展开定理的逆运用。

(4)其他
分块行列式,拉普拉斯公式
主对角的分块:
∣ A m   O O   B n ∣ = ∣ A m   C O   B n ∣ = ∣ A m   C O   B n ∣ = ∣ A m ∣ ∣ B n ∣ \left| \begin{array}{lr}A_m \ O \\ O \ B_n \end{array} \right| =\left| \begin{array}{lr}A_m \ C \\ O \ B_n \end{array} \right| = \left| \begin{array}{lr}A_m \ C \\ O \ B_n \end{array} \right| = |A_m||B_n| Am OO Bn=Am CO Bn=Am CO Bn=AmBn
副对角的分块:
∣ O   A m B n   O ∣ = ∣ C   A m B n   O ∣ = ∣ O   A m B n   C ∣ = ( − 1 ) m n ∣ A m ∣ ∣ B n ∣ \left| \begin{array}{lr}O \ A_m \\ B_n \ O \end{array} \right| =\left| \begin{array}{lr}C \ A_m \\ B_n \ O \end{array} \right| = \left| \begin{array}{lr}O \ A_m \\ B_n \ C\end{array} \right| =(-1)^{mn} |A_m||B_n| O AmBn O=C AmBn O=O AmBn C=(1)mnAmBn

其中m代表行列式A的阶数,n代表行列式B的阶数,C为常行列式,O为全0的行列式。

矩阵

矩阵和行列式的不同表现在:

  • 行数不等于列数
  • 共有m*n个元素
  • 本质是一个数表

矩阵的基本运算

  1. 矩阵加法
    A+B,要求是同型矩阵,对应元素相加减

  2. 矩阵数乘
    kA,每个元素均要乘k。

  3. 矩阵乘法:
    矩阵A乘矩阵B要求相邻的维度相同,则有 A m × n B n × s = C m × s A_{m\times n}B_{n \times s} = C_{m\times s} Am×nBn×s=Cm×s. 实际的运算定义为:
    c i j = ∑ l = 1 n a i l b l j , i = 1 , . . . , m ,   j = 1 , . . . , k . c_{ij} = \sum_{l=1}^na_{il}b_{lj},\quad i=1,...,m,\ j=1,...,k. cij=l=1nailblj,i=1,...,m, j=1,...,k.
    交换律,完全平方公式,平方差公式均失效

  4. 矩阵的转置
    A ⊤ A^\top A,就是行变列,列变行。

伴随矩阵,逆矩阵

(1)伴随矩阵 A ∗ A^* A
对于下面这样一个矩阵A,它的伴随矩阵定义为:
A = ∣ a 11   a 12   a 13 a 21   a 22   a 23 a 31   a 32   a 33 ∣ , A ∗ = ∣ A 11   A 21   A 31 A 12   A 22   A 32 A 13   A 23   A 33 ∣ A=\left| \begin{array}{lr} a_{11} \ a_{12} \ a_{13} \\ a_{21} \ a_{22} \ a_{23} \\ a_{31} \ a_{32} \ a_{33} \end{array} \right|, A^*=\left| \begin{array}{lr} A_{11} \ A_{21} \ A_{31} \\ A_{12} \ A_{22} \ A_{32} \\ A_{13} \ A_{23} \ A_{33} \end{array} \right| A=a11 a12 a13a21 a22 a23a31 a32 a33A=A11 A21 A31A12 A22 A32A13 A23 A33
需要注意的有2点,1是元素为代数余子式,2是排列方式和A的排列相比是转置的。

核心公式
A ∗ A = A A ∗ = ∣ A ∣ I A^*A = AA^* = |A|I AA=AA=AI
其中I为单位矩阵。

(2)逆矩阵 A − 1 A^{-1} A1
如果有 A B = B A = I AB = BA = I AB=BA=I,则B为A的逆矩阵,记 B = A − 1 B = A^{-1} B=A1.
重要公式:
Ⅰ. 求逆公式: A − 1 = A ∗ ∣ A ∣ A^{-1} = \frac{A^*}{|A|} A1=AA
Ⅱ. 可逆的充要条件: ∣ A ∣ ≠ 0 |A| \neq 0 A=0

(3) A ∗ , A − 1 , ∣ A ∣ 的 性 质 A^*,A^{-1},|A|的性质 A,A1,A

  1. 伴随矩阵 A ∗ A* A性质:
    ∣ A ∗ ∣ = ∣ A ∣ n − 1 |A^*| = |A|^{n-1} A=An1
    ( A B ) ∗ = B ∗ A ∗ (AB)^* = B^*A^* (AB)=BA
    A ∗ = ∣ A ∣ A − 1 A^* = |A|A^{-1} A=AA1
    ( k A ) ∗ = k n − 1 A ∗ (kA)^* = k^{n-1}A^* (kA)=kn1A
  2. 逆矩阵 A − 1 A^{-1} A1性质:
    ( A − 1 ) − 1 = A (A^{-1})^{-1} = A (A1)1=A
    ( A B ) − 1 = B − 1 A − 1 (AB)^{-1} = B^{-1}A^{-1} (AB)1=B1A1
    ( A ⊤ ) − 1 = ( A − 1 ) ⊤ (A^\top)^{-1} = (A^{-1})^\top (A)1=(A1)
    ( k A ) − 1 = 1 k A − 1 (kA)^{-1} = \frac{1}{k}A^{-1} (kA)1=k1A1
  3. 方阵的行列式 ∣ A ∣ |A| A性质:
    ∣ A ⊤ ∣ = ∣ A ∣ |A^\top| = |A| A=A
    ∣ k A ∣ = k n ∣ A ∣ |kA| = k^n|A| kA=knA
    ∣ A B ∣ = ∣ A ∣ ∣ B ∣ |AB| = |A||B| AB=AB

初等变换,求逆和秩

  1. 初等变换
    初等变换主要包括以下三种操作:
    (1) 两行互换
    (2) 常数乘某一行
    (3) 某两行加减操作

初等变换的目的是变成行阶梯形矩阵

  1. 求逆矩阵
    对于2阶可以通过记忆直接给出:口诀为主对调,副变号,式倒数。
    公式为:
    A = ( a   b c   d ) , A − 1 = 1 a d − b c ( d   − b − c   a ) A=\left( \begin{array}{lr} a \ b \\ c \ d \end{array} \right), A^{-1}=\frac{1}{ad-bc}\left( \begin{array}{lr} d \ -b \\ -c \ a \end{array} \right) A=(a bc d)A1=adbc1(d bc a)
    对于3阶即以上,通过公式求解:
    A − 1 = 1 ∣ A ∣ A ∗ A^{-1} = \frac{1}{|A|}A^* A1=A1A

另外可以通过初等变换,对矩阵 A A A,求 A − 1 A^{-1} A1,则只需让 ( A ∣ I ) (A|I) (AI)通过初等变换,把左边变为I,右边就是逆矩阵了,即变为 ( I ∣ A − 1 ) (I|A^{-1}) (IA1)。实际上是两边同乘了一个 A − 1 A^{-1} A1

  1. 矩阵的秩
    (1)秩是什么
    秩就是矩阵A化简到行最简矩阵时,不全为0的行的个数。
    (2)秩的性质:
    A m × n , R ( A ) ≤ min ⁡ { m , n } A_{m\times n}, R(A) \leq \min\{m,n\} Am×n,R(A)min{m,n}。秩小于维数中小的那个。
    A A A为方阵,$R(A) = n $ 等价于 ∣ A ∣ ≠ 0 |A|\neq 0 A=0 R ( A ) < n R(A)R(A)<n等价于 ∣ A ∣ = 0 |A|= 0 A=0。方阵的秩小于阶数则行列式为0。
    R ( A ⊤ ) = R ( A ) = R ( k A ) , k ≠ 0 R(A^\top)=R(A)=R(kA), k\neq 0 R(A)=R(A)=R(kA),k=0。常数不改变秩。
    R ( A B ) ≤ R ( A ) , R ( A B ) ≤ R ( B ) R(AB)\leq R(A), R(AB)\leq R(B) R(AB)R(A),R(AB)R(B) // 矩阵的秩越乘越小。

向量

  1. 线性表示
    定义:给定n维向量组A: α 1 , α 2 , . . . , α m , \alpha_1,\alpha_2,...,\alpha_m, α1,α2,...,αm,和向量 β \beta β,如果存在一组数 k 1 , k 2 , . . . , k m k_1,k_2,...,k_m k1,k2,...,km,使得 β = k 1 α 1 + k 2 α 2 + . . . + k m α m \beta = k_1\alpha_1+k_2\alpha_2+...+k_m\alpha_m β=k1α1+k2α2+...+kmαm,则称向量 β \beta β可由向量组A线性表示。

其实就是B能用A表示出来。

  1. 线性相关
    ①给定n维向量组A: α 1 , α 2 , . . . , α m , \alpha_1,\alpha_2,...,\alpha_m, α1,α2,...,αm,,存在一组不全为0的数 k 1 , k 2 , . . . , k m k_1,k_2,...,k_m k1,k2,...,km,使得 k 1 α 1 + k 2 α 2 + . . . + k m α m = 0 k_1\alpha_1+k_2\alpha_2+...+k_m\alpha_m =0 k1α1+k2α2+...+kmαm=0,则称向量组A线性相关,否则线性无关。
    ②若 R ( α 1 , α 2 , . . . , α m ) < m R(\alpha_1,\alpha_2,...,\alpha_m)R(α1,α2,...,αm)<m则向量线性相关,若相等则线性无关,秩的角度判断。
    α 1 , α 2 , . . . , α n \alpha_1,\alpha_2,...,\alpha_n α1,α2,...,αn为n维列向量,则:
    ∣ α 1 , α 2 , . . . , α n ∣ = 0 |\alpha_1,\alpha_2,...,\alpha_n| = 0 α1,α2,...,αn=0等价于 α 1 , α 2 , . . . , α n \alpha_1,\alpha_2,...,\alpha_n α1,α2,...,αn线性相关。
    ∣ α 1 , α 2 , . . . , α n ∣ ≠ 0 |\alpha_1,\alpha_2,...,\alpha_n|\neq0 α1,α2,...,αn=0等价于 α 1 , α 2 , . . . , α n \alpha_1,\alpha_2,...,\alpha_n α1,α2,...,αn线性无关。

  2. 极大线性无关组
    向量组 α 1 , α 2 , . . . , α s , \alpha_1,\alpha_2,...,\alpha_s, α1,α2,...,αs,的部分向量 α i 1 , α i 2 , . . . , α i r , \alpha_{i1},\alpha_{i2},...,\alpha_{ir}, αi1,αi2,...,αir,满足条件:
    (1) α i 1 , α i 2 , . . . , α i r \alpha_{i1},\alpha_{i2},...,\alpha_{ir} αi1,αi2,...,αir线性无关。
    (2) α 1 , α 2 , . . . , α s , \alpha_1,\alpha_2,...,\alpha_s, α1,α2,...,αs,中的任一向量均可由它们线性表示,则称向量组 α i 1 , α i 2 , . . . , α i r \alpha_{i1},\alpha_{i2},...,\alpha_{ir} αi1,αi2,...,αir为向量组 α 1 , α 2 , . . . , α s , \alpha_1,\alpha_2,...,\alpha_s, α1,α2,...,αs,的一个极大线性无关组。

解方程组

  1. 齐次线性方程组 A m × n x = 0 A_{m\times n}x = 0 Am×nx=0
    解的判定:
    (1) R ( A ) = n R(A)=n R(A)=n可以推出 A m × n x = 0 A_{m\times n}x = 0 Am×nx=0只有零解。
    (2) R ( A ) < n R(A)R(A)<n可以推出 A m × n x = 0 A_{m\times n}x = 0 Am×nx=0有非零解,且有n-R(A)个无关向量。

  2. 非齐次线性方程组 A m × n x = b A_{m\times n}x = b Am×nx=b
    解的判定:
    (1) R ( A ) = R ( A ∣ b ) = n R(A)=R(A|b) = n R(A)=R(Ab)=n,方程组有唯一解。
    (2) R ( A ) = R ( A ∣ b ) < n R(A) = R(A|b)R(A)=R(Ab)<n,方程组有无穷解。
    (3) R ( A ) ≠ R ( A ∣ b ) R(A) \neq R(A|b) R(A)=R(Ab),方程组无解。

特征值与特征向量

  1. 求特征值、特征向量:
    (1)特征值: ∣ A − λ I ∣ = 0 |A-\lambda I|=0 AλI=0,解出lambda即为特征值,特征值实际上是通过矩阵A进行线性变换的特征向量缩放值。
    (2) ∣ A − λ I ∣ = 0 |A-\lambda I|=0 AλI=0化简到行阶梯型矩阵,求它的通解就是特征向量。

  2. 特征值的性质
    ①特征值的和等于主对角元素的和,即矩阵A的迹。
    ②特征值的积等于矩阵A对应的行列式。
    ③若A的特征值为 λ \lambda λ,则有下面的表格:

矩阵 k A kA kA A 2 A^2 A2 a A + b I aA+bI aA+bI A m A^m Am A − 1 A^{-1} A1 A ∗ A^* A
特征值 k λ k\lambda kλ λ 2 \lambda^2 λ2 a λ + b a\lambda + b aλ+b λ m \lambda^m λm 1 λ \frac{1}{\lambda} λ1 ∣ A ∣ λ \frac{|A|}{\lambda} λA
  1. 相似对角化
    方阵对角化:
    ①求特征值: λ 1 , λ 2 , . . . , λ n \lambda_1, \lambda_2, ... ,\lambda_n λ1,λ2,...,λn.
    ②求特征向量: α 1 , α 2 , . . . , α n \alpha_1,\alpha_2,...,\alpha_n α1,α2,...,αn.
    ③令 P = ( α 1 , α 2 , . . . , α n ) P =(\alpha_1,\alpha_2,...,\alpha_n) P=(α1,α2,...,αn)
    那么方阵对角化 P − 1 A P P^{-1}AP P1AP就是主对角线全为特征值,其他为0的方阵。

方阵对角化判定,满足这两个条件:
①A有n个线性无关的特征向量
②无关特征向量个数=重特征值重数

  1. 正交相似对角化
    标准化公式: α 1 , α 2 \alpha_1, \alpha_2 α1,α2
    ①施密特正交化:
    β 1 = α 1 β 2 = α 2 − ⟨ α 2 , β 1 ⟩ ⟨ β 1 , β 1 ⟩ β 1 \beta_1 = \alpha_1 \\ \beta_2 = \alpha_2 - \frac{\left \langle \alpha_2,\beta_1 \rangle \right.}{\left \langle \beta_1,\beta_1 \rangle \right.}\beta_1 β1=α1β2=α2β1,β1α2,β1β1
    ②单位化:
    e 1 = β 1 ∥ β 1 ∥ , e 2 = β 2 ∥ β 2 ∥ , e_1 = \frac{\beta_1}{\Vert \beta_1\Vert}, e_2 = \frac{\beta_2}{\Vert \beta_2\Vert}, e1=β1β1,e2=β2β2,
    其中 ⟨ α 2 , β 1 ⟩ \left \langle \alpha_2,\beta_1 \rangle \right. α2,β1表示求其中两个变量的内积, ∥ β 2 ∥ \Vert \beta_2\Vert β2表示向量的模。

二次型

  1. 二次型基本概念
    二次齐次,所有项都是二次,包括 x 1 2 x_1^2 x12 x 1 x 2 x_1x_2 x1x2这种形式,用矩阵表示时,平方的前面系数放在矩阵的主对角线,其他的如 x 1 x 2 x_1x_2 x1x2前面的系数放在(1,2)和(2,1)两个位置,并除以2。没有的位置时0。

  2. 化二次型为标准型
    即把二次型的矩阵,进行正交相似对角化。得到正交矩阵Q,进行正交变换: x = Q y x=Qy x=Qy。标准型为: x = λ 1 y 1 2 + λ 2 y 2 2 + . . . + λ n y n 2 x=\lambda_1y_1^2+\lambda_2y_2^2+...+\lambda_ny_n^2 x=λ1y12+λ2y22+...+λnyn2,其中 λ n \lambda_n λn为特征值。

  3. 正定性
    判断二次型矩阵是否正定:
    方法1:顺序主子式
    三个顺序主子式全大于0,就正定,顺序主子式即对矩阵分别求1,2,…,n阶行列式。
    方法2:特征值
    首先求出特征值,特征值全是正,就正定。

你可能感兴趣的:(AI数学就这?,人工智能,深度学习,线性代数,矩阵)