数据挖掘day9-CS229-Linear Algebra Review and Reference

因为计划先看的凸优化,但是发现其中很多符号不认识(不同的机构使用的不一定一样)。过两天才看到这个线性代数综述,我觉得应该是我的顺序搞反了,所以,将这一篇的日期顺序排的靠前点。其实我更推荐看原文章或翻译:中文翻译,不过这里我会把公式都打出来,主要是联系一下Latax。
(未完待填坑)

1、基本概念和符号

方程组:
4 x 1 − 5 x 2 = − 13 4x_1-5x_2=-13 4x15x2=13
− 2 x 1 + 3 x 2 = 9 -2x_1+3x_2=9 2x1+3x2=9

可以写成线性代数的形式:

A x = b Ax=b Ax=b 其中: A = [ 4 − 5 − 1 3 ] A=\left[\begin{matrix} 4&-5\\ -1&3 \end{matrix} \right] A=[4153], b = [ − 13 9 ] b=\left[\begin{matrix}-13\\ 9\end{matrix} \right] b=[139]

1.1、基本符号

采用以下符号:
· A ∈ R m × n A \in \mathbb{R}^{m×n} ARm×n ,表示一个m行n列的矩阵,并且矩阵A中的所有元素都是实数。
· x ∈ R n x \in \mathbb{R}^{n} xRn ,表示一个含有n个元素的向量,通常,我们把n维向量看成是一个n行1列矩阵,即列向量。如果我们想表示一个行向量(1行n列矩阵),我们通常写作 x T x^T xT,即x的转置。
· 向量的第i个元素写作 x i x_i xi

x = [ x 1 x 2 ⋮ x n ] x=\left[\begin{matrix} x_1\\x_2\\ \vdots \\x_n \end{matrix} \right] x=x1x2xn

·采用 a i j ( o r A i j , A i , j , e t c ) a_{ij }(or A_{ij} , A_{i,j} , etc) aij(orAij,Ai,j,etc)表示A的 i i i j j j列元素

A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ] A=\left[\begin{matrix} a_{11}&a_{12}& \cdots &a_{1n}\\a_{21}&a_{22}& \cdots &a_{2n}\\ \vdots& \vdots&\ddots&\vdots\\a_{m1}&a_{m2}& \cdots &a_{mn} \end{matrix} \right] A=a11a21am1a12a22am2a1na2namn

·采用 a j ( o r A : , j ) a_{j }(or A_{:,j} ) aj(orA:,j)表示A的 j j j列元素

A = [ ∣ ∣ ∣ a 1 a 2 ⋯ a n ∣ ∣ ∣ ] A=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right] A=a1a2an

·采用 a i T ( o r A i , : ) a_{i}^T(or A_{i,:} ) aiT(orAi,:)表示A的 i i i行元素

A = [ — a 1 T — — a 2 T — ⋮ — a m T — ] A=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] A=a1Ta2TamT

2、矩阵乘法

百度百科-矩阵乘法
矩阵 A ∈ R m × n A \in \mathbb{R}^{m×n} ARm×n B ∈ R n × P B \in \mathbb{R}^{n×P} BRn×P的乘积:
C = A B ∈ R m × p C=AB\in \mathbb{R}^{m×p} C=ABRm×p
其元素为 C i j = ∑ k = 1 n A i k B k j C_{ij}= \displaystyle \sum_{k=1}^nA_{ik}B_{kj} Cij=k=1nAikBkj

2.1、向量乘积

内积:
x , y ∈ R n x,y \in \mathbb{R}^n x,yRn,的点积/内积为 x T y x^Ty xTy,是一个实数
x T y ∈ R = [ x 1 x 2 ⋯ x n ] [ y 1 y 2 ⋮ y n ] = ∑ i = 1 n x i y i x^Ty \in \mathbb{R}=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} y_1\\y_2\\ \vdots\\y_n \end{matrix} \right]= \displaystyle \sum_{i=1}^nx_{i}y_{i} xTyR=[x1x2xn]y1y2yn=i=1nxiyi

内积是矩阵乘法的特例,通常 x T y = y T x x^Ty=y^Tx xTy=yTx

外积:
x ∈ R m , y ∈ R n x \in \mathbb{R}^m,y \in \mathbb{R}^n xRm,yRn x y T ∈ R m × n xy^T \in \mathbb{R}^{m×n} xyTRm×n为向量的外积

x y T ∈ R m × n = [ x 1 x 2 ⋮ x n ] [ y 1 y 2 ⋯ y n ] = [ x 1 y 1 x 1 y 2 ⋯ x 1 y n x 2 y 1 x 2 y 2 ⋯ x 2 y n ⋮ ⋮ ⋱ ⋮ x m y 1 x m y 2 ⋯ x m y n ] xy^T \in \mathbb{R}^{m×n}=\left[\begin{matrix} x_1\\x_2\\ \vdots\\x_n \end{matrix} \right] \left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]= \left[\begin{matrix} x_1y_1&x_1y_2& \cdots &x_1y_n\\x_2y_1&x_2y_2& \cdots &x_2y_n\\ \vdots& \vdots&\ddots&\vdots\\x_my_1&x_my_2& \cdots &x_my_n \end{matrix} \right] xyTRm×n=x1x2xn[y1y2yn]=x1y1x2y1xmy1x1y2x2y2xmy2x1ynx2ynxmyn

外积写法的例子, 1 ∈ R n 1 \in \mathbb {R}^n 1Rn是元素都为1的n维向量, A ∈ R m × n A \in \mathbb{R}^{m×n} ARm×n是m行n列矩阵,每一列都是 x ∈ R m x \in \mathbb{R}^m xRm,A可以简洁的写作

A = [ ∣ ∣ ∣ x x ⋯ x ∣ ∣ ∣ ] = [ x 1 x 1 ⋯ x 1 x 2 x 2 ⋯ x 2 ⋮ ⋮ ⋱ ⋮ x m x m ⋯ x m ] = [ x 1 x 1 ⋮ x 1 ] [ y 1 y 2 ⋯ y n ] = x 1 T A=\left[\begin{matrix} |&|& &|\\x&x& \cdots &x\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x_1&x_1& \cdots &x_1\\x_2&x_2& \cdots &x_2\\ \vdots& \vdots&\ddots&\vdots\\x_m&x_m& \cdots &x_m\end{matrix} \right]=\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]\left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]=x1^T A=xxx=x1x2xmx1x2xmx1x2xm=x1x1x1[y1y2yn]=x1T

2.2、矩阵-向量乘法

右乘列向量的写法:
矩阵 A ∈ R m × n A \in \mathbb{R}^{m×n} ARm×n与向量 x ∈ R n x \in \mathbb{R}^n xRn的乘积为向量 y = A x ∈ R m y=Ax \in \mathbb{R}^m y=AxRm
行的形式:
来写 A , A x A,Ax AAx y i = a i T x y_i=a_i^Tx yi=aiTx

y = A x = [ — a 1 T — — a 2 T — ⋮ — a m T — ] x = [ — a 1 T x — — a 2 T x — ⋮ — a m T x — ] y=Ax=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]x=\left[\begin{matrix} — &a_1^Tx& — \\ — &a_2^Tx& — \\ &\vdots& \\ — &a_m^Tx& — \\ \end{matrix} \right] y=Ax=a1Ta2TamTx=a1Txa2TxamTx

列的形式:
来写 A , A x A,Ax AAx

y = A x = [ ∣ ∣ ∣ a 1 a 2 ⋯ a n ∣ ∣ ∣ ] [ x 1 x 1 ⋮ x 1 ] = [ a 1 ] x 1 + [ a 2 ] x 2 + ⋯ + [ a n ] x n y=Ax=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]=[a_1]x_1+[a_2]x_2+\cdots+[a_n]x_n y=Ax=a1a2anx1x1x1=[a1]x1+[a2]x2++[an]xn

左乘行向量的写法:

A ∈ R m × n A \in \mathbb{R}^{m×n} ARm×n, x ∈ R m x \in \mathbb{R}^m xRm, y ∈ R n y \in \mathbb{R}^n yRn,则 y T = x T A y^T=x^TA yT=xTA

行的形式:

y T = x T A = x T [ ∣ ∣ ∣ a 1 a 2 ⋯ a n ∣ ∣ ∣ ] = [ x T a 1 x T a 2 ⋯ x T a n ] y^T=x^TA=x^T\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x^Ta_1&x^Ta_2&\cdots&x^Ta_n\end{matrix} \right] yT=xTA=xTa1a2an=[xTa1xTa2xTan]

列的形式:

y T = x T A = [ x 1 x 2 ⋯ x n ] [ — a 1 T — — a 2 T — ⋮ — a m T — ] y^T=x^TA=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] yT=xTA=[x1x2xn]a1Ta2TamT

= x 1 [ — a 1 T — ] + x 2 [ — a 2 T — ] + ⋯ + x n [ — a n T — ] =x_1\left[\begin{matrix} — &a_1^T& — \end{matrix} \right]+x_2\left[\begin{matrix} — &a_2^T& — \end{matrix} \right]+\cdots+x_n\left[\begin{matrix} — &a_n^T& — \end{matrix} \right] =x1[a1T]+x2[a2T]++xn[anT]

2.3、矩阵乘法

基于以上的知识,矩阵乘法 C = A B C=AB C=AB有4种表示方式

A的行,B的列: 最常用的方式

C = A B = [ — a 1 T — — a 2 T — ⋮ — a m T — ] [ ∣ ∣ ∣ b 1 b 2 ⋯ a p ∣ ∣ ∣ ] = [ a 1 T b 1 a 1 T b 1 ⋯ a 1 T b 1 a 1 T b 1 a 1 T b 1 ⋯ a 1 T b 1 ⋮ ⋮ ⋱ ⋮ a 1 T b 1 a 1 T b 1 ⋯ a 1 T b 1 ] C=AB=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] \left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\ \vdots& \vdots&\ddots&\vdots\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\end{matrix} \right] C=AB=a1Ta2TamTb1b2ap=a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1a1Tb1

A的列,B的行:

C = A B = [ ∣ ∣ ∣ a 1 a 2 ⋯ a p ∣ ∣ ∣ ] [ — b 1 T — — b 2 T — ⋮ — b n T — ] = ∑ i = 1 n a i b i T C=AB= \left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right] \left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]= \displaystyle \sum_{i=1}^na_{i}b_{i}^T C=AB=a1a2apb1Tb2TbnT=i=1naibiT

或者,可以看作是一系列的向量-矩阵乘积:
B以列向量表示:

C i = A b i C_i=Ab_i Ci=Abi

C = A B = A [ ∣ ∣ ∣ b 1 b 2 ⋯ b p ∣ ∣ ∣ ] = [ ∣ ∣ ∣ A b 1 A b 2 ⋯ A b p ∣ ∣ ∣ ] C=AB= A\left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &b_{p}\\|&|& &|\end{matrix} \right] =\left[\begin{matrix} |&|& &|\\Ab_{1}&Ab_{2}& \cdots &Ab_{p}\\|&|& &|\end{matrix} \right] C=AB=Ab1b2bp=Ab1Ab2Abp

A以行向量表示:

C i T = a i T B C_i^T=a_i^TB CiT=aiTB

C = A B = [ — b 1 T — — b 2 T — ⋮ — b n T — ] B = [ — a 1 T B — — a 2 T B — ⋮ — a m T B — ] C=AB=\left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]B=\left[\begin{matrix} — &a_1^TB& — \\ — &a_2^TB& — \\ &\vdots& \\ — &a_m^TB& — \\ \end{matrix} \right] C=AB=b1Tb2TbnTB=a1TBa2TBamTB

矩阵乘法的性质: (前面线性代数的本质更加形象)
·结合律 ( A B ) C = A ( B C ) (AB)C=A(BC) (AB)C=A(BC)
·分配率 A ( B + C ) = A B + A C A(B+C)=AB+AC A(B+C)=AB+AC
·没有交换律!!

3、运算和性质

3.1、单位矩阵与对角矩阵

单位矩阵只有对角线位置是1,其余都是0的矩阵

I i j = { 1 i = j 0 i ≠ j I_{ij}=\left\{ \begin{matrix}1&i=j\\0& i \ne j \end{matrix} \right. Iij={10i=ji=j (不等于号打出来有问题)

A I = A = I A AI=A=IA AI=A=IA

对角矩阵只有对角不为零

D i j = { d i i = j 0 i ≠ j D_{ij}=\left\{ \begin{matrix}d_i&i=j\\0& i \ne j \end{matrix} \right. Dij={di0i=ji=j

3.2、转置

行列反转, A ∈ R m × n A \in \mathbb{R}^{m×n} ARm×n转置为 A T ∈ R n × m A^T \in \mathbb{R}^{n×m} ATRn×m

其元素为 ( A T ) i j = A j i (A^T)_{ij}=A_{ji} (AT)ij=Aji

性质: ( A T ) T = A (A^T)^T=A (AT)T=A ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT

3.3、对称矩阵

A ∈ R n × n A \in \mathbb{R}^{n×n} ARn×n,如果 A = A T A=A^T A=AT,那就是对称的,如果 A = ( − A T ) A=(-A^T) A=(AT)那就是反对称的
任何矩阵A, A + A T A+A^T A+AT是对称的, A − A T A-A^T AAT是反对称的,因此

A = 1 2 ( A + A T ) + 1 2 ( A − A T ) A=\frac{1}{2}(A+A^T)+\frac{1}{2}(A-A^T) A=21(A+AT)+21(AAT)

通常将大小为n的对称矩阵几何表示为 S n \mathbb {S}^n Sn,因此 A ∈ S n A\in\mathbb {S}^n ASn表示A是 n × n n×n n×n对称矩阵

3.4、迹

方阵 A ∈ R n A\in\mathbb {R}^n ARn的迹,记做 t r ( A ) tr(A) tr(A),可以省略括号 t r A trA trA,是矩阵的对角线元素之和:

t r A = ∑ i = 1 n A i i trA=\displaystyle \sum_{i=1}^nA_{ii} trA=i=1nAii

性质如下:

A ∈ R n × n A \in \mathbb{R}^{n×n} ARn×n t r A = t r A T trA=trA^T trA=trAT
A , B ∈ R n × n A ,B\in \mathbb{R}^{n×n} A,BRn×n t r ( A + B ) = t r A + t r B tr(A+B)=trA+trB tr(A+B)=trA+trB
A ∈ R n × n , t ∈ R A \in \mathbb{R}^{n×n} ,t \in \mathbb{R} ARn×n,tR t r ( t A ) = t t r A tr(tA)=t trA tr(tA)=ttrA
A,B,C都是方阵, t r A B = t r B A trAB=trBA trAB=trBA, t r A B C = t r B C A = t r C B A trABC=trBCA=trCBA trABC=trBCA=trCBA,方阵更多类推

3.5、范数

中间部分内容较多,后面再补上,

3.11、二次型和半正定矩阵

参见二次型的几何意义-知乎

你可能感兴趣的:(数据挖掘)