因为计划先看的凸优化,但是发现其中很多符号不认识(不同的机构使用的不一定一样)。过两天才看到这个线性代数综述,我觉得应该是我的顺序搞反了,所以,将这一篇的日期顺序排的靠前点。其实我更推荐看原文章或翻译:中文翻译,不过这里我会把公式都打出来,主要是联系一下Latax。
(未完待填坑)
方程组:
4 x 1 − 5 x 2 = − 13 4x_1-5x_2=-13 4x1−5x2=−13
− 2 x 1 + 3 x 2 = 9 -2x_1+3x_2=9 −2x1+3x2=9
可以写成线性代数的形式:
A x = b Ax=b Ax=b 其中: A = [ 4 − 5 − 1 3 ] A=\left[\begin{matrix} 4&-5\\ -1&3 \end{matrix} \right] A=[4−1−53], b = [ − 13 9 ] b=\left[\begin{matrix}-13\\ 9\end{matrix} \right] b=[−139]
采用以下符号:
· A ∈ R m × n A \in \mathbb{R}^{m×n} A∈Rm×n ,表示一个m行n列的矩阵,并且矩阵A中的所有元素都是实数。
· x ∈ R n x \in \mathbb{R}^{n} x∈Rn ,表示一个含有n个元素的向量,通常,我们把n维向量看成是一个n行1列矩阵,即列向量。如果我们想表示一个行向量(1行n列矩阵),我们通常写作 x T x^T xT,即x的转置。
· 向量的第i个元素写作 x i x_i xi:
x = [ x 1 x 2 ⋮ x n ] x=\left[\begin{matrix} x_1\\x_2\\ \vdots \\x_n \end{matrix} \right] x=⎣⎢⎢⎢⎡x1x2⋮xn⎦⎥⎥⎥⎤
·采用 a i j ( o r A i j , A i , j , e t c ) a_{ij }(or A_{ij} , A_{i,j} , etc) aij(orAij,Ai,j,etc)表示A的 i i i行 j j j列元素
A = [ a 11 a 12 ⋯ a 1 n a 21 a 22 ⋯ a 2 n ⋮ ⋮ ⋱ ⋮ a m 1 a m 2 ⋯ a m n ] A=\left[\begin{matrix} a_{11}&a_{12}& \cdots &a_{1n}\\a_{21}&a_{22}& \cdots &a_{2n}\\ \vdots& \vdots&\ddots&\vdots\\a_{m1}&a_{m2}& \cdots &a_{mn} \end{matrix} \right] A=⎣⎢⎢⎢⎡a11a21⋮am1a12a22⋮am2⋯⋯⋱⋯a1na2n⋮amn⎦⎥⎥⎥⎤
·采用 a j ( o r A : , j ) a_{j }(or A_{:,j} ) aj(orA:,j)表示A的 j j j列元素
A = [ ∣ ∣ ∣ a 1 a 2 ⋯ a n ∣ ∣ ∣ ] A=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right] A=⎣⎡∣a1∣∣a2∣⋯∣an∣⎦⎤
·采用 a i T ( o r A i , : ) a_{i}^T(or A_{i,:} ) aiT(orAi,:)表示A的 i i i行元素
A = [ — a 1 T — — a 2 T — ⋮ — a m T — ] A=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] A=⎣⎢⎢⎢⎡———a1Ta2T⋮amT———⎦⎥⎥⎥⎤
百度百科-矩阵乘法
矩阵 A ∈ R m × n A \in \mathbb{R}^{m×n} A∈Rm×n和 B ∈ R n × P B \in \mathbb{R}^{n×P} B∈Rn×P的乘积:
C = A B ∈ R m × p C=AB\in \mathbb{R}^{m×p} C=AB∈Rm×p
其元素为 C i j = ∑ k = 1 n A i k B k j C_{ij}= \displaystyle \sum_{k=1}^nA_{ik}B_{kj} Cij=k=1∑nAikBkj
内积:
x , y ∈ R n x,y \in \mathbb{R}^n x,y∈Rn,的点积/内积为 x T y x^Ty xTy,是一个实数
x T y ∈ R = [ x 1 x 2 ⋯ x n ] [ y 1 y 2 ⋮ y n ] = ∑ i = 1 n x i y i x^Ty \in \mathbb{R}=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} y_1\\y_2\\ \vdots\\y_n \end{matrix} \right]= \displaystyle \sum_{i=1}^nx_{i}y_{i} xTy∈R=[x1x2⋯xn]⎣⎢⎢⎢⎡y1y2⋮yn⎦⎥⎥⎥⎤=i=1∑nxiyi
内积是矩阵乘法的特例,通常 x T y = y T x x^Ty=y^Tx xTy=yTx
外积:
x ∈ R m , y ∈ R n x \in \mathbb{R}^m,y \in \mathbb{R}^n x∈Rm,y∈Rn, x y T ∈ R m × n xy^T \in \mathbb{R}^{m×n} xyT∈Rm×n为向量的外积
x y T ∈ R m × n = [ x 1 x 2 ⋮ x n ] [ y 1 y 2 ⋯ y n ] = [ x 1 y 1 x 1 y 2 ⋯ x 1 y n x 2 y 1 x 2 y 2 ⋯ x 2 y n ⋮ ⋮ ⋱ ⋮ x m y 1 x m y 2 ⋯ x m y n ] xy^T \in \mathbb{R}^{m×n}=\left[\begin{matrix} x_1\\x_2\\ \vdots\\x_n \end{matrix} \right] \left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]= \left[\begin{matrix} x_1y_1&x_1y_2& \cdots &x_1y_n\\x_2y_1&x_2y_2& \cdots &x_2y_n\\ \vdots& \vdots&\ddots&\vdots\\x_my_1&x_my_2& \cdots &x_my_n \end{matrix} \right] xyT∈Rm×n=⎣⎢⎢⎢⎡x1x2⋮xn⎦⎥⎥⎥⎤[y1y2⋯yn]=⎣⎢⎢⎢⎡x1y1x2y1⋮xmy1x1y2x2y2⋮xmy2⋯⋯⋱⋯x1ynx2yn⋮xmyn⎦⎥⎥⎥⎤
外积写法的例子, 1 ∈ R n 1 \in \mathbb {R}^n 1∈Rn是元素都为1的n维向量, A ∈ R m × n A \in \mathbb{R}^{m×n} A∈Rm×n是m行n列矩阵,每一列都是 x ∈ R m x \in \mathbb{R}^m x∈Rm,A可以简洁的写作
A = [ ∣ ∣ ∣ x x ⋯ x ∣ ∣ ∣ ] = [ x 1 x 1 ⋯ x 1 x 2 x 2 ⋯ x 2 ⋮ ⋮ ⋱ ⋮ x m x m ⋯ x m ] = [ x 1 x 1 ⋮ x 1 ] [ y 1 y 2 ⋯ y n ] = x 1 T A=\left[\begin{matrix} |&|& &|\\x&x& \cdots &x\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x_1&x_1& \cdots &x_1\\x_2&x_2& \cdots &x_2\\ \vdots& \vdots&\ddots&\vdots\\x_m&x_m& \cdots &x_m\end{matrix} \right]=\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]\left[\begin{matrix} y_1&y_2& \cdots&y_n \end{matrix} \right]=x1^T A=⎣⎡∣x∣∣x∣⋯∣x∣⎦⎤=⎣⎢⎢⎢⎡x1x2⋮xmx1x2⋮xm⋯⋯⋱⋯x1x2⋮xm⎦⎥⎥⎥⎤=⎣⎢⎢⎢⎡x1x1⋮x1⎦⎥⎥⎥⎤[y1y2⋯yn]=x1T
右乘列向量的写法:
矩阵 A ∈ R m × n A \in \mathbb{R}^{m×n} A∈Rm×n与向量 x ∈ R n x \in \mathbb{R}^n x∈Rn的乘积为向量 y = A x ∈ R m y=Ax \in \mathbb{R}^m y=Ax∈Rm
行的形式:
来写 A , A x A,Ax A,Ax, y i = a i T x y_i=a_i^Tx yi=aiTx:
y = A x = [ — a 1 T — — a 2 T — ⋮ — a m T — ] x = [ — a 1 T x — — a 2 T x — ⋮ — a m T x — ] y=Ax=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right]x=\left[\begin{matrix} — &a_1^Tx& — \\ — &a_2^Tx& — \\ &\vdots& \\ — &a_m^Tx& — \\ \end{matrix} \right] y=Ax=⎣⎢⎢⎢⎡———a1Ta2T⋮amT———⎦⎥⎥⎥⎤x=⎣⎢⎢⎢⎡———a1Txa2Tx⋮amTx———⎦⎥⎥⎥⎤
列的形式:
来写 A , A x A,Ax A,Ax:
y = A x = [ ∣ ∣ ∣ a 1 a 2 ⋯ a n ∣ ∣ ∣ ] [ x 1 x 1 ⋮ x 1 ] = [ a 1 ] x 1 + [ a 2 ] x 2 + ⋯ + [ a n ] x n y=Ax=\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]\left[\begin{matrix} x_1\\x_1\\ \vdots \\x_1 \end{matrix} \right]=[a_1]x_1+[a_2]x_2+\cdots+[a_n]x_n y=Ax=⎣⎡∣a1∣∣a2∣⋯∣an∣⎦⎤⎣⎢⎢⎢⎡x1x1⋮x1⎦⎥⎥⎥⎤=[a1]x1+[a2]x2+⋯+[an]xn
左乘行向量的写法:
A ∈ R m × n A \in \mathbb{R}^{m×n} A∈Rm×n, x ∈ R m x \in \mathbb{R}^m x∈Rm, y ∈ R n y \in \mathbb{R}^n y∈Rn,则 y T = x T A y^T=x^TA yT=xTA
行的形式:
y T = x T A = x T [ ∣ ∣ ∣ a 1 a 2 ⋯ a n ∣ ∣ ∣ ] = [ x T a 1 x T a 2 ⋯ x T a n ] y^T=x^TA=x^T\left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{n}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} x^Ta_1&x^Ta_2&\cdots&x^Ta_n\end{matrix} \right] yT=xTA=xT⎣⎡∣a1∣∣a2∣⋯∣an∣⎦⎤=[xTa1xTa2⋯xTan]
列的形式:
y T = x T A = [ x 1 x 2 ⋯ x n ] [ — a 1 T — — a 2 T — ⋮ — a m T — ] y^T=x^TA=\left[\begin{matrix} x_1&x_2&\cdots&x_n \end{matrix} \right] \left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] yT=xTA=[x1x2⋯xn]⎣⎢⎢⎢⎡———a1Ta2T⋮amT———⎦⎥⎥⎥⎤
= x 1 [ — a 1 T — ] + x 2 [ — a 2 T — ] + ⋯ + x n [ — a n T — ] =x_1\left[\begin{matrix} — &a_1^T& — \end{matrix} \right]+x_2\left[\begin{matrix} — &a_2^T& — \end{matrix} \right]+\cdots+x_n\left[\begin{matrix} — &a_n^T& — \end{matrix} \right] =x1[—a1T—]+x2[—a2T—]+⋯+xn[—anT—]
基于以上的知识,矩阵乘法 C = A B C=AB C=AB有4种表示方式
A的行,B的列: 最常用的方式
C = A B = [ — a 1 T — — a 2 T — ⋮ — a m T — ] [ ∣ ∣ ∣ b 1 b 2 ⋯ a p ∣ ∣ ∣ ] = [ a 1 T b 1 a 1 T b 1 ⋯ a 1 T b 1 a 1 T b 1 a 1 T b 1 ⋯ a 1 T b 1 ⋮ ⋮ ⋱ ⋮ a 1 T b 1 a 1 T b 1 ⋯ a 1 T b 1 ] C=AB=\left[\begin{matrix} — &a_1^T& — \\ — &a_2^T& — \\ &\vdots& \\ — &a_m^T& — \\ \end{matrix} \right] \left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right]=\left[\begin{matrix} a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\\ \vdots& \vdots&\ddots&\vdots\\a_1^Tb1&a_1^Tb1& \cdots &a_1^Tb1\end{matrix} \right] C=AB=⎣⎢⎢⎢⎡———a1Ta2T⋮amT———⎦⎥⎥⎥⎤⎣⎡∣b1∣∣b2∣⋯∣ap∣⎦⎤=⎣⎢⎢⎢⎡a1Tb1a1Tb1⋮a1Tb1a1Tb1a1Tb1⋮a1Tb1⋯⋯⋱⋯a1Tb1a1Tb1⋮a1Tb1⎦⎥⎥⎥⎤
A的列,B的行:
C = A B = [ ∣ ∣ ∣ a 1 a 2 ⋯ a p ∣ ∣ ∣ ] [ — b 1 T — — b 2 T — ⋮ — b n T — ] = ∑ i = 1 n a i b i T C=AB= \left[\begin{matrix} |&|& &|\\a_{1}&a_{2}& \cdots &a_{p}\\|&|& &|\end{matrix} \right] \left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]= \displaystyle \sum_{i=1}^na_{i}b_{i}^T C=AB=⎣⎡∣a1∣∣a2∣⋯∣ap∣⎦⎤⎣⎢⎢⎢⎡———b1Tb2T⋮bnT———⎦⎥⎥⎥⎤=i=1∑naibiT
或者,可以看作是一系列的向量-矩阵乘积:
B以列向量表示:
C i = A b i C_i=Ab_i Ci=Abi
C = A B = A [ ∣ ∣ ∣ b 1 b 2 ⋯ b p ∣ ∣ ∣ ] = [ ∣ ∣ ∣ A b 1 A b 2 ⋯ A b p ∣ ∣ ∣ ] C=AB= A\left[\begin{matrix} |&|& &|\\b_{1}&b_{2}& \cdots &b_{p}\\|&|& &|\end{matrix} \right] =\left[\begin{matrix} |&|& &|\\Ab_{1}&Ab_{2}& \cdots &Ab_{p}\\|&|& &|\end{matrix} \right] C=AB=A⎣⎡∣b1∣∣b2∣⋯∣bp∣⎦⎤=⎣⎡∣Ab1∣∣Ab2∣⋯∣Abp∣⎦⎤
A以行向量表示:
C i T = a i T B C_i^T=a_i^TB CiT=aiTB
C = A B = [ — b 1 T — — b 2 T — ⋮ — b n T — ] B = [ — a 1 T B — — a 2 T B — ⋮ — a m T B — ] C=AB=\left[\begin{matrix} — &b_1^T& — \\ — &b_2^T& — \\ &\vdots& \\ — &b_n^T& — \\ \end{matrix} \right]B=\left[\begin{matrix} — &a_1^TB& — \\ — &a_2^TB& — \\ &\vdots& \\ — &a_m^TB& — \\ \end{matrix} \right] C=AB=⎣⎢⎢⎢⎡———b1Tb2T⋮bnT———⎦⎥⎥⎥⎤B=⎣⎢⎢⎢⎡———a1TBa2TB⋮amTB———⎦⎥⎥⎥⎤
矩阵乘法的性质: (前面线性代数的本质更加形象)
·结合律 ( A B ) C = A ( B C ) (AB)C=A(BC) (AB)C=A(BC)
·分配率 A ( B + C ) = A B + A C A(B+C)=AB+AC A(B+C)=AB+AC
·没有交换律!!
单位矩阵
只有对角线位置是1,其余都是0的矩阵
I i j = { 1 i = j 0 i ≠ j I_{ij}=\left\{ \begin{matrix}1&i=j\\0& i \ne j \end{matrix} \right. Iij={10i=ji=j (不等于号打出来有问题)
A I = A = I A AI=A=IA AI=A=IA
对角矩阵
只有对角不为零
D i j = { d i i = j 0 i ≠ j D_{ij}=\left\{ \begin{matrix}d_i&i=j\\0& i \ne j \end{matrix} \right. Dij={di0i=ji=j
行列反转, A ∈ R m × n A \in \mathbb{R}^{m×n} A∈Rm×n转置为 A T ∈ R n × m A^T \in \mathbb{R}^{n×m} AT∈Rn×m
其元素为 ( A T ) i j = A j i (A^T)_{ij}=A_{ji} (AT)ij=Aji
性质: ( A T ) T = A (A^T)^T=A (AT)T=A, ( A B ) T = B T A T (AB)^T=B^TA^T (AB)T=BTAT , ( A + B ) T = A T + B T (A+B)^T=A^T+B^T (A+B)T=AT+BT
A ∈ R n × n A \in \mathbb{R}^{n×n} A∈Rn×n,如果 A = A T A=A^T A=AT,那就是对称的,如果 A = ( − A T ) A=(-A^T) A=(−AT)那就是反对称的
任何矩阵A, A + A T A+A^T A+AT是对称的, A − A T A-A^T A−AT是反对称的,因此
A = 1 2 ( A + A T ) + 1 2 ( A − A T ) A=\frac{1}{2}(A+A^T)+\frac{1}{2}(A-A^T) A=21(A+AT)+21(A−AT)
通常将大小为n的对称矩阵几何表示为 S n \mathbb {S}^n Sn,因此 A ∈ S n A\in\mathbb {S}^n A∈Sn表示A是 n × n n×n n×n对称矩阵
方阵 A ∈ R n A\in\mathbb {R}^n A∈Rn的迹,记做 t r ( A ) tr(A) tr(A),可以省略括号 t r A trA trA,是矩阵的对角线元素之和:
t r A = ∑ i = 1 n A i i trA=\displaystyle \sum_{i=1}^nA_{ii} trA=i=1∑nAii
性质如下:
A ∈ R n × n A \in \mathbb{R}^{n×n} A∈Rn×n, t r A = t r A T trA=trA^T trA=trAT
A , B ∈ R n × n A ,B\in \mathbb{R}^{n×n} A,B∈Rn×n, t r ( A + B ) = t r A + t r B tr(A+B)=trA+trB tr(A+B)=trA+trB
A ∈ R n × n , t ∈ R A \in \mathbb{R}^{n×n} ,t \in \mathbb{R} A∈Rn×n,t∈R, t r ( t A ) = t t r A tr(tA)=t trA tr(tA)=ttrA
A,B,C都是方阵, t r A B = t r B A trAB=trBA trAB=trBA, t r A B C = t r B C A = t r C B A trABC=trBCA=trCBA trABC=trBCA=trCBA,方阵更多类推
中间部分内容较多,后面再补上,
参见二次型的几何意义-知乎