假子集合(当然子集合):本身和空集合
真子集合(非当然子集合):其他子集合
相等:元素完全相同, S 1 = S 2 S_1=S_2 S1=S2
交:属于集合 S 1 S_1 S1也属于集合 S 2 S_2 S2的元素组成的集合, S 1 ∩ S 2 = { x ∣ x ∈ S 1 且 x ∈ S 2 } S_1\cap S_2=\{x|x\in S_1且 x\in S_2\} S1∩S2={x∣x∈S1且x∈S2}
并:属于集合 S 1 S_1 S1或属于集合 S 2 S_2 S2的元素组成的集合, S 1 ∪ S 2 = { x ∣ x ∈ S 1 或 x ∈ S 2 } S_1\cup S_2=\{x|x\in S_1或 x\in S_2\} S1∪S2={x∣x∈S1或x∈S2}
和: S 1 + S 2 = { x + y ∣ x ∈ S 1 , y ∈ S 2 } S_1+S_2=\{x+y|x\in S_1,y\in S_2\} S1+S2={x+y∣x∈S1,y∈S2}
映射 σ : S → S ′ \sigma:S\rightarrow S' σ:S→S′, S S S中的每个元素(原象|象源)都能在 S ′ S' S′中找到对应的元素(象)。 S S S到自身的映射通常也叫做 S S S到自身的变换。
相等:两个映射都是 S → S ′ S\rightarrow S' S→S′,且 ∀ a ∈ S , σ 1 ( a ) = σ 2 ( a ) \forall a\in S,\sigma_1(a)=\sigma_2(a) ∀a∈S,σ1(a)=σ2(a),则称 σ 1 = σ 2 \sigma_1=\sigma_2 σ1=σ2。
乘积: ( τ σ ) ( a ) = τ ( σ ( a ) ) (\tau\sigma)(a)=\tau(\sigma(a)) (τσ)(a)=τ(σ(a)),满足结合律但是不满足交换律。
数域 K K K,非空集合 V V V,在 V V V中定义加法运算和数乘运算(统称 V V V的线性运算),且满足以下条件,则称 V V V是 K K K上的线性空间(向量空间)。 K K K是实数域的话, V V V叫做实线性空间,复数同理。
加法运算满足:封闭且唯一、交换律、结合律、存在零元素(唯一,反证)、存在负元素(唯一,反证)。
数乘运算满足:封闭且唯一、数因子分配律、分配律、结合律、1乘( 1 x = x 1x=x 1x=x)
注意基统一用列向量来表示。坐标也是列向量。
过渡矩阵 C C C: ( y 1 , y 2 , ⋯ , y n ) = ( x 1 , x 2 , ⋯ , x n ) C \begin{pmatrix}y_1,y_2,\cdots,y_n\end{pmatrix}=\begin{pmatrix}x_1,x_2,\cdots,x_n\end{pmatrix}C (y1,y2,⋯,yn)=(x1,x2,⋯,xn)C
生成子空间: L ( x 1 , x 2 , ⋯ , x n ) L(x_1,x_2,\cdots,x_n) L(x1,x2,⋯,xn)
空间维数公式: dim V 1 + dim V 2 = dim ( V 1 + V 2 ) + dim ( V 1 ∩ V 2 ) \dim V_1+\dim V_2=\dim(V_1+V_2)+\dim(V_1\cap V_2) dimV1+dimV2=dim(V1+V2)+dim(V1∩V2)
对线性运算封闭: T ( k x + l y ) = k T x + l T y T(kx+ly)=kTx+lTy T(kx+ly)=kTx+lTy
线性变换的值域:所有向量的象形成的集合 R ( T ) = { T x ∣ x ∈ V } R(T)=\{Tx|x\in V\} R(T)={Tx∣x∈V}
线性变换的核:所有被 T T T变为零向量的原象构成的集合 N ( T ) = { x ∣ T x = 0 , x ∈ V } N(T)=\{x|Tx=0,x\in V\} N(T)={x∣Tx=0,x∈V}
注意线性变换不可交换: T 1 T 2 ≠ T 2 T 1 T_1T_2\neq T_2T_1 T1T2=T2T1
矩阵表示: ( T x 1 , T x 2 , ⋯ , T x n ) = ( x 1 , x 2 , ⋯ , x n ) A (Tx_1,Tx_2,\cdots,Tx_n)=(x_1,x_2,\cdots,x_n)A (Tx1,Tx2,⋯,Txn)=(x1,x2,⋯,xn)A。注意线性变换的矩阵表示和选择哪一组基有关,不同基下的矩阵是相似的,也就是 B = C − 1 A C B=C^{-1}AC B=C−1AC。
T x = λ x Tx=\lambda x Tx=λx
在一组基下就是: A ξ = λ ξ → ( λ I − A ) ξ ⃗ = 0 ⃗ → det ( λ I − A ) = 0 A\xi=\lambda \xi\rightarrow (\lambda I-A)\vec{\xi}=\vec{0}\rightarrow \det(\lambda I-A)=0 Aξ=λξ→(λI−A)ξ=0→det(λI−A)=0
矩阵 A A A的所有特征值的和等于 A A A的迹,而 A A A的全体特征值的乘积等于 det A \det A detA: t r ( A ) = ∑ i = 1 n a i i = ∑ i = 1 n λ i , det A = ∏ i = 1 n λ i tr(A)=\sum_{i=1}^n a_{ii}=\sum_{i=1}^n \lambda_i,\det A=\prod_{i=1}^n \lambda_i tr(A)=∑i=1naii=∑i=1nλi,detA=∏i=1nλi
迹的特殊性质: t r ( A B ) = t r ( B A ) tr(AB)=tr(BA) tr(AB)=tr(BA)
n n n阶矩阵一定相似于三角矩阵: P − 1 A P P^{-1}AP P−1AP, P P P由特征向量组成。
Hamilton-Cayley: n n n阶矩阵 A A A是其特征多项式的矩阵根。
不同特征值的特征向量线性无关。
可以化为对角矩阵的充要条件:有 n n n个线性无关的特征向量。
基于复矩阵: P − 1 A P = J P^{-1}AP=J P−1AP=J
因式 ( λ − λ i ) m i (\lambda-\lambda_i)^{m_i} (λ−λi)mi对应的Jordan块:
( λ i 1 λ i 1 λ i ⋱ ⋱ 1 λ i ) \begin{pmatrix}\lambda_i&1&&&\\&\lambda_i &1&&\\&&\lambda_i&\ddots&\\&&&\ddots&1\\&&&&\lambda_i\end{pmatrix} ⎝⎜⎜⎜⎜⎛λi1λi1λi⋱⋱1λi⎠⎟⎟⎟⎟⎞
注意 λ i \lambda_i λi的重数不一定是 m i m_i mi
特征矩阵: λ I − A \lambda I-A λI−A
不变因子:通过初等变换把特征矩阵变成对角的(只用列变换即可),对角元素叫做不变因子。
初等因子:把次数大于0的不变因子分解为不可约因式的乘积,连带它们的幂次一起叫做初等因子。
求解Jordan标准型:
把每个初等因子对应的Jordan块拼一起就是矩阵的Jordan标准型。要求解 P P P的话需要解非齐次线性方程组,在一般情况下,如果 λ 1 \lambda_1 λ1是 A A A的 k k k重特征值,则 x 1 , x 2 , ⋯ , x k x_1,x_2,\cdots,x_k x1,x2,⋯,xk可由解下面各方程组获得:
( λ 1 I − A ) x 1 = 0 ( λ 1 I − A ) x i = − x i − 1 (\lambda_1 I-A)x_1=0\\ (\lambda_1 I-A)x_i=-x_{i-1} (λ1I−A)x1=0(λ1I−A)xi=−xi−1
也就是: A ( x 1 , x 2 , ⋯ , x k ) = ( x 1 , x 2 , ⋯ , x k ) J A(x_1,x_2,\cdots,x_k)=(x_1,x_2,\cdots,x_k)J A(x1,x2,⋯,xk)=(x1,x2,⋯,xk)J
化矩阵为Jordan标准形,实际上就是适当选择线性空间的基或坐标系,使得在新坐标系之下,问题的数学形式最为简单,从而便于研究。
A = ( a i j ) n × n = ( ( x 1 , x 1 ) ⋯ ( x 1 , x n ) ( x 2 , x 1 ) ⋯ ( x 2 , x n ) ⋮ ⋮ ( x n , x 1 ) ⋯ ( x n , x n ) ) A=(a_{ij})_{n\times n}=\begin{pmatrix} (x_1,x_1)&\cdots&(x_1,x_n)\\ (x_2,x_1)&\cdots&(x_2,x_n)\\ \vdots&&\vdots\\ (x_n,x_1)&\cdots&(x_n,x_n)\\ \end{pmatrix} A=(aij)n×n=⎝⎜⎜⎜⎛(x1,x1)(x2,x1)⋮(xn,x1)⋯⋯⋯(x1,xn)(x2,xn)⋮(xn,xn)⎠⎟⎟⎟⎞
称为这个空间对于基 x 1 , x 2 , ⋯ , x n x_1,x_2,\cdots,x_n x1,x2,⋯,xn的度量矩阵(Gram矩阵),注意度量矩阵是对称且正定的。
可以通过 ( x , y ) = x T A y (x,y)=x^TAy (x,y)=xTAy来计算任意两向量的内积。
不同基的度量矩阵是合同的。假设两组基的过渡矩阵是 C C C,即 ( y 1 , y 2 , ⋯ , y n ) = ( x 1 , x 2 , ⋯ , x n ) C (y_1,y_2,\cdots,y_n)=(x_1,x_2,\cdots,x_n)C (y1,y2,⋯,yn)=(x1,x2,⋯,xn)C,那么度量矩阵存在 B = C T A C B=C^TAC B=CTAC的关系,也就是矩阵合同。
注意线性变换在不同基下的矩阵是相似的。
定义:欧氏空间, ( x , y ) = 0 (x,y)=0 (x,y)=0,称为正交或垂直。
正交补空间: V n = V 1 ⊕ V 1 ⊥ V^n=V_1\oplus V_1^\perp Vn=V1⊕V1⊥,直和是指交为零子空间。求齐次线性方程组的解( A x = 0 Ax=0 Ax=0)就是求行向量生成子空间( R ( A T ) R(A^T) R(AT))的正交补空间( N ( A ) N(A) N(A))。
A m × n A_{m\times n} Am×n
∥ A x ∥ V ≤ ∥ A ∥ M ∥ x ∥ V \|Ax\|_V\leq \|A\|_M\|x\|_V ∥Ax∥V≤∥A∥M∥x∥V
一种矩阵范数可以和多个向量范数相容(至少一个),反之亦可。
如果对于某种矩阵范数 ∥ ∥ \|\| ∥∥,有 ∥ A ∥ < 1 \|A\|<1 ∥A∥<1,那么矩阵 I − A I-A I−A可逆,且有:
∥ ( I − A ) − 1 ∥ ≤ ∥ I ∥ 1 − ∥ A ∥ \|(I-A)^{-1}\|\leq \frac{\|I\|}{1-\|A\|} ∥(I−A)−1∥≤1−∥A∥∥I∥
∥ I − ( I − A ) − 1 ∥ ≤ ∥ A ∥ 1 − ∥ A ∥ \|I-(I-A)^{-1}\|\leq \frac{\|A\|}{1-\|A\|} ∥I−(I−A)−1∥≤1−∥A∥∥A∥
c o n d ( A ) = ∥ A ∥ ∥ A − 1 ∥ cond(A)=\|A\|\|A^{-1}\| cond(A)=∥A∥∥A−1∥,是求矩阵逆的摄动的一个重要量,一般来说,条件数越大, ( A + δ A ) − 1 (A+\delta A)^{-1} (A+δA)−1和 A − 1 A^{-1} A−1的相对误差就越大。
方阵A模最大特征值的模: ρ ( A ) = max ∣ λ ∣ \rho(A)=\max|\lambda| ρ(A)=max∣λ∣
谱半径小于等于所有A的范数值
一般来说,谱半径 ρ ( A ) \rho(A) ρ(A)和谱范数 ∥ A ∥ 2 \|A\|_2 ∥A∥2可能相差很大
矩阵级数是指无穷多个有序同阶矩阵之和。
以矩阵为自变量且取值为矩阵。
f ( A ) = P ⋅ d i a g ( f ( J 1 ) , f ( J 2 ) , ⋯ , f ( J s ) ) P − 1 f(A)=P\cdot diag(f(J_1),f(J_2),\cdots,f(J_s))P^{-1} f(A)=P⋅diag(f(J1),f(J2),⋯,f(Js))P−1
若 A B = B A AB=BA AB=BA,则 e A e B = e B e A = e A + B e^Ae^B=e^Be^A=e^{A+B} eAeB=eBeA=eA+B
det ( e A ) = e t r A \det(e^A)=e^{trA} det(eA)=etrA
矩阵对一个变量的导数就是每个元素对变量的导数,积分也是。
函数对矩阵的导数是函数对矩阵每个元素的导数。
将方阵分解为下三角矩阵和上三角矩阵的乘积。可进行三角分解的充要条件是:顺序主子式均不等于0。
将方阵分解为正交矩阵和上三角矩阵的乘积。
T i , j = ( cos ( θ ) sin ( θ ) 0 − sin ( θ ) cos ( θ ) 0 0 0 I ) T_{i,j}=\begin{pmatrix} \cos(\theta)&\sin(\theta)&0\\ -\sin(\theta)&\cos(\theta)&0\\ 0&0&I \end{pmatrix} Ti,j=⎝⎛cos(θ)−sin(θ)0sin(θ)cos(θ)000I⎠⎞
d x = x − H x → u = d x / ∣ d x ∣ → H = I − 2 u u T dx=x-Hx\rightarrow u=dx/|dx|\rightarrow H=I-2uu^T dx=x−Hx→u=dx/∣dx∣→H=I−2uuT
矩阵分解为列满秩矩阵和行满秩矩阵的乘积, A = F G A=FG A=FG。
A ∈ C m × n A\in C^{m\times n} A∈Cm×n
奇异值是指Hermite矩阵 A H A A^HA AHA的特征值的算术平方根。
A = U D V H A=UDV^H A=UDVH,其中U、V是酉矩阵( U H U = U U H = I U^HU=UU^H=I UHU=UUH=I)。
正交相抵:存在酉矩阵使得 A = U B V H A=UBV^H A=UBVH
步骤:
常义Rayleigh商: R ( x ) = x H A x x H x R(x)=\frac{x^HAx}{x^Hx} R(x)=xHxxHAx
广义Rayleigh商: R ( x ) = x H A x x H B x R(x)=\frac{x^HAx}{x^HBx} R(x)=xHBxxHAx,其中B是正定矩阵
性质:
若A为实对称矩阵,则 min x ≠ 0 R ( x ) = min λ , max x ≠ 0 R ( x ) = max λ \min_{x\neq 0} R(x)=\min \lambda,\max_{x\neq 0} R(x)=\max \lambda minx=0R(x)=minλ,maxx=0R(x)=maxλ
行\列盖尔圆半径是那一行\列的元素绝对值之和。
隔离矩阵特征值:
A x = λ B x Ax=\lambda Bx Ax=λBx,A、B都是自共轭矩阵(Hermite矩阵),其中B正定。
极小范数解:若 A x = b Ax=b Ax=b有解, ∥ x 0 ∥ 2 = min A x = b ∥ x ∥ 2 \|x_0\|_2=\min_{Ax=b}\|x\|_2 ∥x0∥2=minAx=b∥x∥2
极小范数二乘解:若 A x = b Ax=b Ax=b无解, ∥ x 0 ∥ 2 = min min ∥ A x − b ∥ 2 ∥ x ∥ 2 \|x_0\|_2=\min_{\min\|Ax-b\|_2}\|x\|_2 ∥x0∥2=minmin∥Ax−b∥2∥x∥2
A + = A H ( A H A A H ) ( 1 ) A H A^+=A^H(A^HAA^H)^{(1)}A^H A+=AH(AHAAH)(1)AH,虽然 ( A H A A H ) ( 1 ) (A^HAA^H)^{(1)} (AHAAH)(1)不唯一,但Morre-Penrose逆是唯一的。