机器学习基础 2:矩阵乘法以及求导

向量、矩阵、张量

向量:一维数组
矩阵:二维数组
张量:N 维数组 什么是张量(tensor)?
机器学习基础 2:矩阵乘法以及求导_第1张图片

特殊矩阵

对角矩阵 [ a 11 0 0 0 a 22 0 0 0 a 33 ] \begin{bmatrix} a_{11} & 0 & 0 \\ 0 & a_{22} & 0 \\ 0 & 0 & a_{33} \\ \end{bmatrix} a11000a22000a33
单位矩阵 [ 1 0 0 0 1 0 0 0 1 ] \begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \\ \end{bmatrix} 100010001

行列式(determinant)

  根据 某考研视频,行列式定义如下:

∣ a 11 a 12 a 21 a 22 ∣ = a 11 a 22 − a 12 a 21 \begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{vmatrix} = a_{11}a_{22} -a_{12}a_{21} a11a21a12a22=a11a22a12a21
∣ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ∣ = a 11 a 22 a 33 + a 12 a 23 a 31 + a 21 a 32 a 13 − a 13 a 22 a 31 + a 12 a 21 a 33 + a 23 a 32 a 11 \begin{vmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \\ \end{vmatrix} = a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{21}a_{32}a_{13}-a_{13}a_{22}a_{31}+a_{12}a_{21}a_{33}+a_{23}a_{32}a_{11} a11a21a31a12a22a32a13a23a33=a11a22a33+a12a23a31+a21a32a13a13a22a31+a12a21a33+a23a32a11
二阶行列式由2个二维向量( ( a 11 , a 12 ) (a_{11}, a_{12}) (a11,a12) ( a 21 , a 22 ) (a_{21}, a_{22}) (a21,a22))组成,其结果为两个向量为邻边的平行四边形的面积

三阶行列式由3个三维向量组成,其结果为三个向量为邻边的平行六面体的体积

  对上述情形进行扩展:

∣ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋮ a n 1 a n 2 ⋯ a n n ∣ \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & & \vdots\\ a_{n1} & a_{n2} & \cdots & a_{nn} \\ \end{vmatrix} a11a21an1a12a22an2a1na2nann n n n 阶行列式由 n n n n n n 维向量组成,其结果是以这 n n n 个向量的 n n n 维图形的 n n n 维体积
为方便起见,定义 D n × n = ∣ A n × n ∣ D_{n\times n} = \begin{vmatrix} A_{n\times n}\end{vmatrix} Dn×n=An×n

  行列式有以下性质

  • 某行元素全为零 ⇒ \Rightarrow D = 0 D=0 D=0
  • 两行元素对应成比例 ⇒ \Rightarrow D = 0 D=0 D=0
  • 交换两行元素 ⇒ \Rightarrow D D D 变号  (互换)
  • 某行元素乘以 k k k ⇒ \Rightarrow D D D 乘以 k k k(倍乘)
  • 某行元素乘以 k k k 后加到另一行 ⇒ \Rightarrow D D D 不变 (倍加)
  • 单行可拆 ⇒ \Rightarrow 只有一行元素不同的行列式可以相加  (可加性)
  • 以上行的性质均适用于列

  行列式有以下重要结论

  • D ≠ 0 D \neq 0 D̸=0 时,向量之间相互独立 (线性无关)
  • D = 0 D = 0 D=0 时,向量中至少一个多余 (线性相关)

###矩阵(matrix)
  根据 某考研视频,矩阵的本质为:

表面上,是一个表达系统信息的数表
本质上,用秩来研究矩阵

  秩的定义

给出 A m × n A_{m\times n} Am×n 若有
{ ∃   k   阶 子 式 不 为 0   ⇒   ∃   k   个 独 立 向 量 ∀   k + 1   阶 子 式 全 为 0   ⇒   ∀   k + 1   个 向 量 中 至 少 有 一 个 多 余 \left\{ \begin{aligned} \exists\ k\ 阶子式不为 0 &\ \Rightarrow\ \exists\ k\ 个独立向量\\ \forall\ k+1\ 阶子式全为 0 &\ \Rightarrow\ \forall\ k+1\ 个向量中至少有一个多余 \\ \end{aligned} \right. {  k 0 k+1 0   k    k+1  有且仅有 k k k 个独立向量独立,故秩是组成 A A A 的独立向量的个数, A A A 的秩 表示为 r ( A ) = k r(A)=k r(A)=k

  考察一种特殊形式的矩阵——阶梯矩阵

A = [ a 11 a 12 a 13 0 a 22 a 13 0 0 a 33 ] B = [ 1 0 a 13 0 1 0 0 0 1 ] A = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ 0 & a_{22} & a_{13} \\ 0 & 0 & a_{33} \end{bmatrix} \\ B = \begin{bmatrix} 1 & 0 & a_{13} \\ 0 & 1 & 0 \\ 0 & 0 & 1 \\ \end{bmatrix} A=a1100a12a220a13a13a33B=100010a1301
行阶梯矩阵 A A A 满足以下条件:

  • 若有全0行,全在下方
  • 从左向右,出现连续 0 的个数自上而下严格单调递增

最简行阶梯矩阵 B B B 满足以下条件:

  • 台角位置元素均为 1
  • 台角正上方元素全为 0

  最简行阶梯矩阵的一个最重要的特例就是单位矩阵 E E E

对角线上的元素为 1,其他元素均为0
[ 1 0 ⋯ 0 0 1 ⋯ 0 ⋮ ⋮ ⋮ 0 0 ⋯ 1 ] \begin{bmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\ \vdots & \vdots & & \vdots\\ 0 & 0 & \cdots & 1 \\ \end{bmatrix} 100010001

  可以看出,行阶梯矩阵的秩为台阶数目,将普通矩阵转换为阶梯矩阵的方法——初等行变换:

  • 互换 [ a 11 a 12 a 13 a 21 a 22 a 23 ] → [ a 21 a 22 a 13 a 11 a 12 a 23 ] \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \end{bmatrix} \to \begin{bmatrix} a_{21} & a_{22} & a_{13} \\ a_{11} & a_{12} & a_{23} \end{bmatrix} [a11a21a12a22a13a23][a21a11a22a12a13a23]
  • 倍乘 [ a 11 a 12 a 23 ] → [ k ⋅ a 11 k ⋅ a 12 k ⋅ a 23 ] \begin{bmatrix} a_{11} & a_{12} & a_{23} \\ \end{bmatrix} \to \begin{bmatrix} k\cdot a_{11} & k\cdot a_{12} & k\cdot a_{23} \end{bmatrix} [a11a12a23][ka11ka12ka23]
  • 倍加 [ a 11 a 12 a 13 a 21 a 22 a 13 ] → [ a 11 a 12 a 13 k ⋅ a 11 + a 21 k ⋅ a 12 + a 22 k ⋅ a 13 + a 23 ] \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{13} \end{bmatrix} \to \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ k\cdot a_{11} + a_{21}& k\cdot a_{12} +a_{22} & k\cdot a_{13} + a_{23} \end{bmatrix} [a11a21a12a22a13a13][a11ka11+a21a12ka12+a22a13ka13+a23]

  下面引入一个重要定理:

任何可逆矩阵( D ≠ 0 D \neq 0 D̸=0),一定可以通过初等行变换,化成同阶单位矩阵

   将初等变换应用到单位矩阵 E 上,可以得到初等矩阵。
   每个初等变换,可以使用一个初等矩阵来等价表示。
   因此多个初等变换可以合并成一个方程。

矩阵运算

   同型矩阵之间矩阵与标量之间可以进行普通的 $+,-,\times, \div $ 四则运算

[ a 11 a 12 a 21 a 22 ] ± [ b 11 b 12 b 21 b 22 ] → [ a 11 ± b 11 a 12 ± b 12 a 21 ± b 21 b 22 ± a 22 ] [ a 11 a 12 a 21 a 22 ] ± k → [ a 11 ± k a 12 ± k a 21 ± k a 22 ± k ] \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{bmatrix} \pm \begin{bmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \\ \end{bmatrix} \to \begin{bmatrix} a_{11}\pm b_{11} & a_{12}\pm b_{12} \\ a_{21}\pm b_{21} & b_{22}\pm a_{22} \\ \end{bmatrix} \\ \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{bmatrix} \pm k \to \begin{bmatrix} a_{11}\pm k & a_{12}\pm k \\ a_{21}\pm k & a_{22}\pm k \\ \end{bmatrix} [a11a21a12a22]±[b11b21b12b22][a11±b11a21±b21a12±b12b22±a22][a11a21a12a22]±k[a11±ka21±ka12±ka22±k]

   列数与行数向对应的矩阵之间可以进行矩阵乘法

[ a 11 a 12 a 13 a 21 a 22 a 23 ] × [ b 11 b 12 b 21 b 22 b 31 b 32 ] → [ a 11 b 11 + a 12 b 21 + a 13 b 31 a 11 b 12 + a 12 b 22 + a 13 b 32 a 21 b 11 + a 22 b 21 + a 23 b 31 a 21 b 12 + a 22 b 22 + a 23 b 32 ] \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ \end{bmatrix} \times \begin{bmatrix} b_{11} & b_{12} \\ b_{21} & b_{22} \\ b_{31} & b_{32} \\ \end{bmatrix} \to \begin{bmatrix} a_{11}b_{11}+a_{12}b_{21}+a_{13}b_{31} & a_{11}b_{12}+a_{12}b_{22}+a_{13}b_{32} \\ a_{21}b_{11}+a_{22}b_{21}+a_{23}b_{31} & a_{21}b_{12}+a_{22}b_{22}+a_{23}b_{32} \end{bmatrix} [a11a21a12a22a13a23]×b11b21b31b12b22b32[a11b11+a12b21+a13b31a21b11+a22b21+a23b31a11b12+a12b22+a13b32a21b12+a22b22+a23b32]
向量的点积是矩阵乘法的特殊情况,此外,对于任意方阵 X ∈ R n × n X \in R^{n\times n} XRn×n 都满足 X × E → X X\times E \to X X×EX
[ a 11 a 12 a 21 a 22 ] × [ 1 0 0 1 ] → [ a 11 a 12 a 21 a 22 ] \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{bmatrix} \times \begin{bmatrix} 1 & 0 \\ 0 & 1 \\ \end{bmatrix} \to \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{bmatrix} [a11a21a12a22]×[1001][a11a21a12a22]

   矩阵转置 A T A^T AT

[ a 11 a 12 a 13 a 21 a 22 a 23 ] → [ a 11 a 21 a 12 a 22 a 13 a 23 ] \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ \end{bmatrix} \to \begin{bmatrix} a_{11} & a_{21} \\ a_{12} & a_{22} \\ a_{13} & a_{23} \\ \end{bmatrix} [a11a21a12a22a13a23]a11a12a13a21a22a23
一些常用性质 ( A ± B ) T = A T ± B T ( A × B ) T = B T × A T ( A T ) T = A ( k ∗ A ) T = k ∗ A T ∣ A T ∣ = ∣ A ∣ (A\pm B)^T = A^T \pm B^T \\ (A\times B)^T = B^T \times A^T \\ (A^T)^T = A \\ (k*A)^T = k*A^T \\ \begin{vmatrix}A^T\end{vmatrix} = \begin{vmatrix}A\end{vmatrix} (A±B)T=AT±BT(A×B)T=BT×AT(AT)T=A(kA)T=kATAT=A

   矩阵求逆 A − 1 A^{-1} A1

找到一个 A − 1 A^{-1} A1

向量与方程组

方程组 { a 11 x 1 + a 12 x 2 + ⋯ + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + ⋯ + a 2 n x n = b 2 ⋯ ⋯ a m 1 x 1 + a m 2 x 2 + ⋯ + a m n x n = b m \left\{ \begin{aligned} a_{11}x_1 &+ a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 &+ a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \\ \cdots & \cdots \\ a_{m1}x_1 &+ a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \\ \end{aligned} \right. a11x1a21x1am1x1+a12x2++a1nxn=b1+a22x2++a2nxn=b2+am2x2++amnxn=bm
对应的向量组 x 1 [ a 11 a 21 ⋮ a m 1 ] + x 2 [ a 12 a 22 ⋮ a m 2 ] + ⋯ + x n [ a 1 n a 2 n ⋮ a m n ] = [ b 1 n b 2 n ⋮ b m n ] x_1\begin{bmatrix} a_{11} \\ a_{21} \\ \vdots \\ a_{m1} \end{bmatrix} + x_2\begin{bmatrix} a_{12} \\ a_{22} \\ \vdots \\ a_{m2} \end{bmatrix} + \cdots + x_n\begin{bmatrix} a_{1n} \\ a_{2n} \\ \vdots \\ a_{mn} \end{bmatrix} = \begin{bmatrix} b_{1n} \\ b_{2n} \\ \vdots \\ b_{mn} \end{bmatrix} x1a11a21am1+x2a12a22am2++xna1na2namn=b1nb2nbmn
向量组简化 x 1 α 1 + x 2 α 2 + ⋯ + x n α n = β x_1\alpha_1 + x_2\alpha_2 + \cdots +x_n\alpha_n = \beta x1α1+x2α2++xnαn=β
可见:方程组的解 x x x,就是描述一个向量 β \beta β 与一组向量 α \alpha α 的表示系数
可以继续简化为由向量 α 1 , ⋯   , α n \alpha_1,\cdots,\alpha_n α1,,αn组成的系数矩阵、数 x 1 , ⋯   , x n x_1,\cdots,x_n x1,,xn组成未知数矩阵、自由项矩阵 β \beta β 组成的形式
A × x = β A\times x = \beta A×x=β

定性研究

  • 相关性问题(有无多余向量)
    { ∃   一 个 元 素 不 全 为 0 的 向 量 x 使 得 A × x = 0 ( 有 非 零 解 , 且 必 有 无 穷 多 个 ) → α 1 , ⋯   , α n 线 性 相 关 若 A × x = 0 成 立 , 必 须 满 足 x 元 素 全 为 0 ( 无 非 零 解 ) → α 1 , ⋯   , α n 线 性 无 关 \left\{ \begin{aligned} \exists\ 一个元素不全为 0 的向量 x 使得 A\times x = 0 &(有非零解,且必有无穷多个)\to \alpha_1,\cdots,\alpha_n 线性相关 \\ 若 A\times x = 0 成立,必须满足 x 元素全为 0&(无非零解)\to \alpha_1,\cdots,\alpha_n 线性无关 \end{aligned} \right. {  0x使A×x=0A×x=0x0α1,,αn线α1,,αn线其中 x i ≠ 0 x_i\neq 0 xi̸=0 对应的系数向量 α i \alpha_i αi 就是多余向量
  • 表示性问题(表达出多余向量)
    { ∃   一 个 x 使 得 A × x = β ( 有 解 )   → β 可 以 由 α 1 , ⋯   , α n 线 性 表 出 ̸ ∃ 任 何 一 个 x 使 得 A × x = β ( 无 解 )   → β 不 能 由 α 1 , ⋯   , α n 线 性 表 出 \left\{ \begin{aligned} \exists\ 一个 x 使得 A\times x = \beta (有解)&\ \to \beta 可以由 \alpha_1,\cdots,\alpha_n 线性表出 \\ \not\exists 任何一个 x 使得 A\times x = \beta (无解)&\ \to \beta 不能由 \alpha_1,\cdots,\alpha_n 线性表出 \end{aligned} \right. {  x使A×x=β̸x使A×x=β βα1,,αn线 βα1,,αn线定义系数矩阵与自由项矩阵的组合为增广矩阵 ( A ∣ β ) (A|\beta) (Aβ),当 r ( A ) = r ( A ∣ β ) r(A)=r(A|\beta) r(A)=r(Aβ) β \beta β 是多余的;当 r ( A ) + 1 = r ( A ∣ β ) r(A)+1=r(A|\beta) r(A)+1=r(Aβ) β \beta β 不是多余的
  • 代表性问题(极大无关组)
    定义一组向量 α i 1 , ⋯   , α i r \alpha_{i1},\cdots, \alpha_{ir} αi1,,αir,满足:
    - 这组向量之间线性无关
    - 取自某个向量组 A = [ α 1 , ⋯   , α s ] A=[\alpha_1,\cdots,\alpha_s] A=[α1,,αs]
    - A A A 中任一向量都可以由这组向量线性表出

则称这组向量是 A A A 的一个极大线性无关组,这线性无关组

  • 等价性问题(等价向量组)
    给定两个同维向量组 A = [ α 1 , ⋯   , α s ] A=[\alpha_1,\cdots,\alpha_s] A=[α1,,αs] B = [ β 1 , ⋯   , β r ] B=[\beta_1,\cdots,\beta_r] B=[β1,,βr]
    - 若 A A A 中所有向量可以由 B B B 中的向量线性表出,则则称 A A A 可由 B B B 线性表出
    - 若 B B B 中所有向量可以由 A A A 中的向量线性表出,则则称 B B B 可由 A A A 线性表出
    - 上面两点同时成立,则称 A A A 等价于 B B B

特征值与二次型

  矩阵 A A A的特征值与特征向量:

对于 A n × n A_{n\times n} An×n 若存在数 λ \lambda λ 与非零向量 ξ \xi ξ 使得 A ξ = λ ξ A\xi=\lambda\xi Aξ=λξ,则称 λ \lambda λ A A A 的特征值, ξ \xi ξ A A A 属于 λ \lambda λ 的特征向量

  下面给出求解特征值的方法:

根据上述定义,可以整理一个齐次方程组:
λ ξ − A ξ = ( λ E − A ) ξ = 0 \lambda\xi-A\xi=(\lambda E-A)\xi = 0 λξAξ=(λEA)ξ=0由于 ξ \xi ξ 是非零向量,因此该方程有非零解,故系数矩阵中存在线性相关的系数向量,因此可以得到下面的特征方程组:
r a n k ( λ E − A ) < n ⇒ ∣ λ E − A ∣ = 0 rank(\lambda E-A)<n \Rightarrow |\lambda E-A| = 0 rank(λEA)<nλEA=0
解该方程的就可以得到(一个或多个)特征值 λ \lambda λ,代回原方程即可解出对应的 ξ \xi ξ

  相似对角化:

若存在可逆矩阵 D D D 使得 D − 1 A D = Λ D^{-1}AD=\Lambda D1AD=Λ Λ \Lambda Λ 是对角阵),则称 A ∼ Λ A \sim \Lambda AΛ A A A相似于 Λ \Lambda Λ

  下面分析求相似对角化的方法:

根据上述定义,可以整理得到:
D − 1 A D = Λ   ⇒   A D = D Λ   ⇒ A ( ξ 1 , ⋯   , ξ n ) = ( ξ 1 , ⋯   , ξ n ) [ λ 1 0 ⋯ 0 0 λ 2 ⋯ 0 ⋮ ⋮ ⋯ ⋮ 0 0 ⋯ λ n ] ⇒ ∀   A ξ i = λ i ξ i ( i = 1 , ⋯   , n ) D^{-1}AD=\Lambda\ \Rightarrow\ AD=D\Lambda\ \Rightarrow\\ A(\xi_1,\cdots,\xi_n) = (\xi_1,\cdots,\xi_n)\begin{bmatrix} \lambda_{1} & 0 & \cdots & 0 \\ 0 & \lambda_{2} & \cdots & 0 \\ \vdots & \vdots & \cdots & \vdots \\ 0 & 0 & \cdots & \lambda_{n}\\ \end{bmatrix} \Rightarrow \\ \forall\ A\xi_i = \lambda_i\xi_i \quad ( i = 1,\cdots,n) D1AD=Λ  AD=DΛ A(ξ1,,ξn)=(ξ1,,ξn)λ1000λ2000λn Aξi=λiξi(i=1,,n) 不难看出,要得到满足这一条件的 λ \lambda λ ξ \xi ξ 对,只要求解特征方程即可

  正交矩阵定义:

若矩阵 P P P 满足 P P T = E PP^T=E PPT=E,则称 P P P 为正交矩阵

  正交矩阵性质:

[ a 11 a 12 a 21 a 22 ] × [ a 11 a 21 a 12 a 22 ] = [ 1 0 0 1 ] ⇒ [ α 1 α 2 ] × [ α 1 α 2 ] = [ ∥ α 1 ∥ 2 α 1 ⋅ α 2 α 2 ⋅ α 1 ∥ α 2 ∥ 2 ] \begin{bmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \\ \end{bmatrix} \times \begin{bmatrix} a_{11} & a_{21} \\ a_{12} & a_{22} \\ \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 0 & 1 \\ \end{bmatrix} \Rightarrow \\ \begin{bmatrix} \alpha_1 \\ \alpha_2 \end{bmatrix} \times \begin{bmatrix} \alpha_1 & \alpha_2 \end{bmatrix} = \begin{bmatrix} \| \alpha_1 \|^2 & \alpha_1\cdot\alpha_2 \\ \alpha_2\cdot\alpha_1 & \| \alpha_2 \|^2 \\ \end{bmatrix} [a11a21a12a22]×[a11a12a21a22]=[1001][α1α2]×[α1α2]=[α12α2α1α1α2α22] 从上面可看出,若矩阵 P n × n P_{n\times n} Pn×n 是正交阵,则组成该矩阵的的向量 α \alpha α 有如下性质:
{ ∥ α i ∥ 2 = 0 ( 单 位 向 量 ) i = 1 , ⋯   , n α i ⊥ α j ( 相 互 正 交 ) j = 1 , ⋯   , n   且   j ≠ i \left\{ \begin{aligned} \| \alpha_i \|^2 = 0 (单位向量)&\qquad i=1,\cdots,n\\ \alpha_i \perp \alpha_j (相互正交)&\qquad j=1,\cdots,n\ 且\ j\neq i \end{aligned} \right. { αi2=0αiαji=1,,nj=1,,n  j̸=i因此,这一组向量 α \alpha α 构成一组标准正交基
此外,正交矩阵天然具有以下性质: P − 1 = P T P^{-1}=P^T P1=PT

  函数的二次型:

f ( x 1 , x 2 , x 3 ) = [ a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ] [ x 1 x 2 x 3 ] f(x_1,x_2,x_3) = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \\ \end{bmatrix}\begin{bmatrix} x_{1} \\ x_{2} \\ x_{3} \\ \end{bmatrix} f(x1,x2,x3)=a11a21a31a12a22a32a13a23a33x1x2x3

  函数的相似对角化:

f ( x 1 , x 2 , x 3 ) = [ λ 1 0 0 0 λ 2 0 0 0 λ 3 ] [ x 1 x 2 x 3 ] f(x_1,x_2,x_3) = \begin{bmatrix} \lambda_{1} & 0 & 0 \\ 0 & \lambda_{2} & 0 \\ 0 & 0 & \lambda_{3} \\ \end{bmatrix}\begin{bmatrix} x_{1} \\ x_{2} \\ x_{3} \\ \end{bmatrix} f(x1,x2,x3)=λ1000λ2000λ3x1x2x3

可逆矩阵

  可逆矩阵的定义

对于 A n × n A_{n\times n} An×n B n × n B_{n\times n} Bn×n,若 A B = E AB=E AB=E A 、 B A、B AB可逆,且有 B A = E 、 A − 1 = B 、 B − 1 = A 、 A B = B A BA=E、A^{-1}=B、B^{-1}=A、AB=BA BA=EA1=BB1=AAB=BA

  一些性质

( A − 1 ) − 1 = A ( k A − 1 ) = 1 k A − 1 ( A B ) − 1 = B − 1 A − 1 ( A T ) − 1 = ( A − 1 ) T ∣ A − 1 ∣ = 1 ∣ A ∣ (A^{-1})^{-1} = A \\ (kA^{-1}) = \frac{1}{k}A^{-1} \\ (AB)^{-1} = B^{-1}A^{-1} \\ (A^T)^{-1} = (A^{-1})^T \\ |A^{-1}| = \frac{1}{|A|} (A1)1=A(kA1)=k1A1(AB)1=B1A1(AT)1=(A1)TA1=A1

初等矩阵

  初等矩阵的定义

单位矩阵 E E E 仅经过一次初等变换得到的矩阵,分为三种:
互换阵 E i j E_{ij} Eij、倍乘阵 E i ( k ) E_{i}(k) Ei(k)、倍加阵 E i j ( k ) E_{ij}(k) Eij(k)

  一些性质

E i j − 1 = E i j E i ( k ) − 1 = E i ( 1 k ) E i j ( k ) − 1 = E i j ( − k ) E_{ij}^{-1} = E_{ij} \\ E_{i}(k)^{-1} = E_{i}(\frac{1}{k}) \\ E_{ij}(k)^{-1} = E_{ij}(-k) \\ Eij1=EijEi(k)1=Ei(k1)Eij(k)1=Eij(k)

进行行初等变换,相当于左乘以一和初等矩阵
进行列初等变换,相当于右乘以一个初等矩阵

你可能感兴趣的:(机器学习)