矩阵是数学中的一个重要的基本概念,是代数学的一个主要研究对象,也是数学研究和应用的一个重要工具。“矩阵”这个词是由西尔维斯特首先使用的,他是为了将数字的矩形阵列区别于行列式而发明了这个述语。而实际上,矩阵这个课题在诞生之前就已经发展的很好了。从行列式的大量工作中明显的表现出来,为了很多目的,不管行列式的值是否与问题有关,方阵本身都可以研究和使用,矩阵的许多基本性质也是在行列式的发展中建立起来的。
1855 年,埃米特(C.Hermite,1822~1901)证明了别的数学家发现的一些矩阵类的特征根的特殊性质,如现在称为埃米特矩阵的特征根性质等。后来,克莱伯施(A.Clebsch,1831~1872)、布克海姆(A.Buchheim)等证明了对称矩阵的特征根性质。泰伯(H.Taber)引入矩阵的迹的概念并给出了一些有关的结论。 在矩阵论的发展史上,弗罗伯纽斯(G.Frobenius,1849-1917)的贡献是不可磨灭的。他讨论了最小多项式问题,引进了矩阵的秩、不变因子和初等因子、正交矩阵、矩阵的相似变换、合同矩阵等概念,以合乎逻辑的形式整理了不变因子和初等因子的理论,并讨论了正交矩阵与合同矩阵的一些重要性质。 1854 年,约当研究了矩阵化为标准型的问题。1892年,梅茨勒(H.Metzler)引进了矩阵的超越函数概念并将其写成矩阵的幂级数的形式。傅立叶、西尔和庞加莱的著作中还讨论了无限阶矩阵问题,这主要是适用方程发展的需要而开始的。
向量的类型根据元素的实际意义不同可以分为,
物理向量
泛指既有幅值,又有方向的物理量,如速度、加速度、位移等。
几何向量
为了将物理向量可视化,常用带方向的线段表示。这种有向线段出称为几何向量。
代数向量
几何向量可以用代数形式表示。例如,若平面上的几何向量 v = a b ⃗ v=\vec{ab} v=ab中点a的坐标为 ( a 1 , a 2 ) (a_1,a_2) (a1,a2),点b的坐标为 ( b 1 , b 2 ) (b_1,b_2) (b1,b2),则该几何向量可以表示为代数形式 [ b 1 − a 1 b 2 − a 2 ] \begin{bmatrix} b_1-a_1\\ b_2-a_2\\ \end{bmatrix} [b1−a1b2−a2]
其中,根据元素的类型不同,代数向量又可以分为以下三种,
常数向量
向量中的元素为实数或复数
函数向量
向量中的元素包含函数值,如 x = [ 1 , x , x 2 , . . . , x n ] T \mathbf{x}=[1,x,x^2,...,x^n]^T x=[1,x,x2,...,xn]T
随机向量
向量中的元素为随机变量或随机过程,如 x = [ x 1 ( n ) , x 2 ( n ) , . . . , x m ( n ) ] T \mathbf{x}=[x_1(n),x_2(n),...,x_m(n)]^T x=[x1(n),x2(n),...,xm(n)]T,其中 x 1 ( n ) , x 2 ( n ) , . . . , x m ( n ) x_1(n),x_2(n),...,x_m(n) x1(n),x2(n),...,xm(n)是 m m m个随机过程或随机信号
矩阵的基本运算包括矩阵的转置、共轭、共轭转置、加法、乘法和求逆
A = [ a 11 a 12 ⋯ a 1 m a 21 a 22 ⋯ a 2 m ⋯ ⋯ ⋯ ⋯ a m 1 a m 2 ⋯ a m m ] A=\begin{bmatrix}{a_{11}} & {a_{12}} & {\cdots} & {a_{1 m}} \\ {a_{21}} & {a_{22}} & {\cdots} & {a_{2 m}} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{m 1}} & {a_{m 2}} & {\cdots} & {a_{m m}}\end{bmatrix} A=⎣⎢⎢⎡a11a21⋯am1a12a22⋯am2⋯⋯⋯⋯a1ma2m⋯amm⎦⎥⎥⎤
A T = [ a 11 a 21 ⋯ a m 1 a 12 a 22 ⋯ a m 2 ⋯ ⋯ ⋯ ⋯ a 1 m a 2 m ⋯ a m m ] A^T=\begin{bmatrix}{a_{11}} & {a_{21}} & {\cdots} & {a_{m1}} \\ {a_{12}} & {a_{22}} & {\cdots} & {a_{m2}} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{1m}} & {a_{2m}} & {\cdots} & {a_{m m}}\end{bmatrix} AT=⎣⎢⎢⎡a11a12⋯a1ma21a22⋯a2m⋯⋯⋯⋯am1am2⋯amm⎦⎥⎥⎤
A ∗ = [ a 11 ∗ a 12 ∗ ⋯ a 1 m ∗ a 21 ∗ a 22 ∗ ⋯ a 2 m ∗ ⋯ ⋯ ⋯ ⋯ a m 1 ∗ a m 2 ∗ ⋯ a m m ∗ ] A^*=\begin{bmatrix}{a_{11}^*} & {a_{12}^*} & {\cdots} & {a_{1 m}^*} \\ {a_{21}^*} & {a_{22}^*} & {\cdots} & {a_{2 m}^*} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{m 1}^*} & {a_{m 2}^*} & {\cdots} & {a_{m m}^*}\end{bmatrix} A∗=⎣⎢⎢⎡a11∗a21∗⋯am1∗a12∗a22∗⋯am2∗⋯⋯⋯⋯a1m∗a2m∗⋯amm∗⎦⎥⎥⎤
A T = [ a 11 ∗ a 21 ∗ ⋯ a m 1 ∗ a 12 ∗ a 22 ∗ ⋯ a m 2 ∗ ⋯ ⋯ ⋯ ⋯ a 1 m ∗ a 2 m ∗ ⋯ a m m ∗ ] A^T=\begin{bmatrix}{a_{11}^*} & {a_{21}^*} & {\cdots} & {a_{m1}^*} \\ {a_{12}^*} & {a_{22}^*} & {\cdots} & {a_{m2}^*} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{1m}^*} & {a_{2m}^*} & {\cdots} & {a_{m m}^*}\end{bmatrix} AT=⎣⎢⎢⎡a11∗a12∗⋯a1m∗a21∗a22∗⋯a2m∗⋯⋯⋯⋯am1∗am2∗⋯amm∗⎦⎥⎥⎤
共轭转置又被称为Hermitian伴随、Hermitian转置或Hermitian共轭, A = A T A=A^T A=AT的实方阵称为对称矩阵, A = A H A=A^H A=AH的复方阵称为Hermitian矩阵
方阵 A A A的逆矩阵记为 A − 1 A^{-1} A−1, A − 1 A^{-1} A−1被定义为满足以下关系 A A − 1 = A A − 1 = I AA^{-1}=AA^{-1}=\mathbf{I} AA−1=AA−1=I
加法与乘法
两个 m × n m\times n m×n矩阵 A 、 B A、B A、B的加法, [ A + B ] i j = a i j + b i j [A+B]_{ij}=a_{ij}+b_{ij} [A+B]ij=aij+bij
m × n m\times n m×n大小的矩阵 A A A与 1 × n 1\times n 1×n大小的向量 x = [ x 1 , . . . , x n ] x=[x_1,...,x_n] x=[x1,...,xn]相乘, [ A x ] i = ∑ j = 1 n a i j x j , i = 1 , . . . , m [Ax]_i=\sum_{j=1}^na_{ij}x_j,\quad i=1,...,m [Ax]i=∑j=1naijxj,i=1,...,m
m × n m\times n m×n大小的矩阵 A A A与 n × r n\times r n×r大小的矩阵 B B B相乘, [ A B ] i j = ∑ k = 1 n a i k b k j , i = 1 , . . . , m ; j = 1 , . . . , r [AB]_{ij}=\sum_{k=1}^na_{ik}b_{kj},\quad i=1,...,m;j=1,...,r [AB]ij=∑k=1naikbkj,i=1,...,m;j=1,...,r
需要注意的是,一般来说,矩阵乘积是不满足交换律的
关于矩阵中转置、共轭、共轭转置、求逆的性质
分配律
( A + B ) ∗ = A ∗ + B ∗ , ( A + B ) T = A T + B T , ( A + B ) H = A H + B H (A+B)^*=A^*+B^*,\quad (A+B)^T=A^T+B^T,\quad (A+B)^H=A^H+B^H (A+B)∗=A∗+B∗,(A+B)T=AT+BT,(A+B)H=AH+BH
矩阵乘积中转置、共轭转置、求逆的性质
( A B ) T = B T A T , ( A B ) H = B H A H , ( A B ) − 1 = B − 1 A − 1 (AB)^T=B^TA^T,\quad (AB)^H=B^HA^H,\quad (AB)^{-1}=B^{-1}A^{-1} (AB)T=BTAT,(AB)H=BHAH,(AB)−1=B−1A−1
转置、共轭、共轭转置与求逆交换
( A ∗ ) − 1 = ( A − 1 ) ∗ , ( A T ) − 1 = ( A − 1 ) T , ( A H ) − 1 = ( A − 1 ) H (A^*)^{-1}=(A^{-1})^*,\quad (A^T)^{-1}=(A^{-1})^T,\quad (A^H)^{-1}=(A^{-1})^H (A∗)−1=(A−1)∗,(AT)−1=(A−1)T,(AH)−1=(A−1)H
除了上述矩阵的基本运算之外,还有矩阵函数
三角函数
sin ( A ) = ∑ n = 0 ∞ ( − 1 ) n A 2 n + 1 ( 2 n + 1 ) ! = A − 1 3 ! A 3 + 1 5 ! A 5 − ⋯ cos ( A ) = ∑ n = 0 ∞ ( − 1 ) n A 2 n ( 2 n ) ! = I − 1 2 ! A 2 + 1 4 ! A 4 − ⋯ \begin{aligned} \sin (\boldsymbol{A}) &=\sum_{n=0}^{\infty} \frac{(-1)^{n} \boldsymbol{A}^{2 n+1}}{(2 n+1) !}=\boldsymbol{A}-\frac{1}{3 !} \boldsymbol{A}^{3}+\frac{1}{5 !} \boldsymbol{A}^{5}-\cdots \\ \cos (\boldsymbol{A}) &=\sum_{n=0}^{\infty} \frac{(-1)^{n} \boldsymbol{A}^{2 n}}{(2 n) !}=\boldsymbol{I}-\frac{1}{2 !} \boldsymbol{A}^{2}+\frac{1}{4 !} \boldsymbol{A}^{4}-\cdots \end{aligned} sin(A)cos(A)=n=0∑∞(2n+1)!(−1)nA2n+1=A−3!1A3+5!1A5−⋯=n=0∑∞(2n)!(−1)nA2n=I−2!1A2+4!1A4−⋯
指数函数
e A = ∑ n = 0 ∞ 1 n ! A n = I + A + 1 2 A 2 + 1 3 ! A 3 + ⋯ e − A = ∑ n = 0 ∞ 1 n ! ( − 1 ) n A n = I − A + 1 2 A 2 − 1 3 ! A 3 + ⋯ e A t = I + A t + 1 2 A 2 t 2 + 1 3 ! A 3 t 3 + ⋯ \begin{aligned} \mathrm{e}^{A} &=\sum_{n=0}^{\infty} \frac{1}{n !} \boldsymbol{A}^{n}=\boldsymbol{I}+\boldsymbol{A}+\frac{1}{2} \boldsymbol{A}^{2}+\frac{1}{3 !} \boldsymbol{A}^{3}+\cdots \\ \mathrm{e}^{-\boldsymbol{A}} &=\sum_{n=0}^{\infty} \frac{1}{n !}(-1)^{n} \boldsymbol{A}^{n}=\boldsymbol{I}-\boldsymbol{A}+\frac{1}{2} \boldsymbol{A}^{2}-\frac{1}{3 !} \boldsymbol{A}^{3}+\cdots \\ \mathrm{e}^{\boldsymbol{A} t} &=\boldsymbol{I}+\boldsymbol{A} t+\frac{1}{2} \boldsymbol{A}^{2} t^{2}+\frac{1}{3 !} \boldsymbol{A}^{3} t^{3}+\cdots \end{aligned} eAe−AeAt=n=0∑∞n!1An=I+A+21A2+3!1A3+⋯=n=0∑∞n!1(−1)nAn=I−A+21A2−3!1A3+⋯=I+At+21A2t2+3!1A3t3+⋯
对数函数
ln ( I + A ) = ∑ n = 1 ∞ ( − 1 ) n − 1 n A n = A − 1 2 A 2 + 1 3 A 3 − ⋯ \ln (I+A)=\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n} A^{n}=A-\frac{1}{2} A^{2}+\frac{1}{3} A^{3}-\cdots ln(I+A)=n=1∑∞n(−1)n−1An=A−21A2+31A3−⋯
矩阵导数
d A d t = A ˙ = [ d a 11 d t d a 12 d t ⋯ d a 1 n d t d a 21 d t d a 22 d t ⋯ d a 2 n d t ⋮ ⋮ ⋱ ⋮ d a m 1 d t d a m 2 d t ⋯ d a m n d t ] \frac{\mathrm{d} \boldsymbol{A}}{\mathrm{d} t}=\dot{\boldsymbol{A}}=\left[ \begin{array}{cccc}{\frac{\mathrm{d} a_{11}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{12}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{1 n}}{\mathrm{d} t}} \\ {\frac{\mathrm{d} a_{21}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{22}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{2 n}}{\mathrm{d} t}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {\frac{\mathrm{d} a_{m 1}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{m 2}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{m n}}{\mathrm{d} t}}\end{array}\right] dtdA=A˙=⎣⎢⎢⎢⎡dtda11dtda21⋮dtdam1dtda12dtda22⋮dtdam2⋯⋯⋱⋯dtda1ndtda2n⋮dtdamn⎦⎥⎥⎥⎤
矩阵积分
∫ A d t = [ ∫ a 11 d t ∫ a 12 d t ⋯ ∫ a 1 n d t a 21 d t ∫ a 22 d t ⋯ ∫ a 2 n d t ⋮ ⋮ ⋱ ⋮ ∫ a m 1 d t ∫ a m 2 d t ⋯ ∫ a m n d t ] \int \boldsymbol{A} \mathrm{d} t=\left[ \begin{array}{cccc}{\int a_{11} \mathrm{d} t} & {\int a_{12} \mathrm{d} t} & {\cdots} & {\int a_{1 n} \mathrm{d} t} \\ {a_{21} \mathrm{d} t} & {\int a_{22} \mathrm{d} t} & {\cdots} & {\int a_{2 n} \mathrm{d} t} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {\int a_{m 1} \mathrm{d} t} & {\int a_{m 2} \mathrm{d} t} & {\cdots} & {\int a_{m n} \mathrm{d} t}\end{array}\right] ∫Adt=⎣⎢⎢⎢⎡∫a11dta21dt⋮∫am1dt∫a12dt∫a22dt⋮∫am2dt⋯⋯⋱⋯∫a1ndt∫a2ndt⋮∫amndt⎦⎥⎥⎥⎤
对角矩阵、零矩阵、单位矩阵
幂等矩阵 A A A具有以下性质:
又被称为对合矩阵,若 A 2 = A A = I A^2=AA=\mathbf{I} A2=AA=I,若 A A A为幂单矩阵,则函数 f ( ⋅ ) f(\cdot) f(⋅)具有以下性质:
f ( s I + t A ) = 1 2 [ ( I + A ) f ( s + t ) + ( I − A ) f ( s − t ) ] f(s \boldsymbol{I}+t \boldsymbol{A})=\frac{1}{2}[(\boldsymbol{I}+\boldsymbol{A}) f(s+t)+(\boldsymbol{I}-\boldsymbol{A}) f(s-t)] f(sI+tA)=21[(I+A)f(s+t)+(I−A)f(s−t)]
其中,幂等矩阵和幂单矩阵也有关系,矩阵 A A A是幂单矩阵,当且仅当 1 2 ( A + I ) \frac{1}{2}\boldsymbol({A}+\boldsymbol{I}) 21(A+I)
方阵 A A A被称为幂零矩阵,若 A 2 = A A = O A^2=AA=\boldsymbol{O} A2=AA=O,若 A A A为幂单矩阵,则函数 f ( ⋅ ) f(\cdot) f(⋅)具有以下性质:
f ( s I + t A ) = I f ( s ) + t A f ′ ( s ) f(s \boldsymbol{I}+t \boldsymbol{A})=\boldsymbol{I}f(s)+t\boldsymbol{A}f^{\prime}(s) f(sI+tA)=If(s)+tAf′(s)
Source from: 《矩阵分析与应用》,张贤达