矩阵论 - Part II

矩阵论 - Part II

文章目录

  • 矩阵论 - Part II
    • 概念索引
    • 4 矩阵空间

概念索引

4 向量空间, 最大线性无关组, 线性(子)空间, 线性空间的维数, 基和坐标, 同构映射, 同构空间, 基变换, 过度矩阵, 坐标变换, 线性变换, 线性变换的矩阵表示, 相似矩阵, 欧式空间, 內积, 范数, Schwartz不等式, 夹角, 规范正交基, Schmidt正交化过程, 正交矩阵

4 矩阵空间

向量空间

向量空间: n n n维向量的集合 V V V, 如果对加法和数乘运算封闭, 则集合 V V V称为向量空间

生成向量空间

子空间

空间维数

0空间

最大线性无关组: 向量组 A A A中有 r r r个向量(设为向量组 A 0 A_0 A0)线性无关, 任意 r + 1 r+1 r+1个向量线性相关, 则称 A 0 A_0 A0是一个最大线性无关组, r r r称为向量组的, 只含有0向量的向量组没有最大无关组, 规定其秩为 0 0 0

矩阵的秩等于其列向量组的秩, 也等于其行向量组的秩

向量组 B B B可以由向量组 A A A线性表示, 则向量组 B B B的秩不大于向量组 A A A的秩

  • 等价的向量组秩相等
  • C = A B C = AB C=AB, 则 { R ( C ) ≤ R ( A ) R ( C ) ≤ R ( B ) \left \{ \begin{aligned} R(C) \leq R(A) \\ R(C) \leq R(B) \end{aligned} \right. {R(C)R(A)R(C)R(B)
  • 最大线性无关组的等价定义: 设 B B B A A A的部分组, 若 B B B是线性无关组, 且 A A A可以由 B B B线性表示, 则 B B B A A A的最大无关组

线性空间

非空集合 V V V, 实数域 R R R(可以为其他数域), 定义加法数乘运算两种运算, 满足如下性质( λ , μ ∈ R \lambda, \mu \in R λ,μR, α , β , γ ∈ V \alpha, \beta, \gamma \in V α,β,γV):

  • 性质1: 加法交换律, α + β = β + α \alpha + \beta = \beta + \alpha α+β=β+α
  • 性质2: 加法结合律 ( α + β ) + γ = α + ( β + γ ) (\alpha + \beta) + \gamma = \alpha + (\beta + \gamma) (α+β)+γ=α+(β+γ)
  • 性质3: V V V中有 O O O元素 α + O = α \alpha + O = \alpha α+O=α
  • 性质4: V V V中任何元素有负元素 ∀ α ∈ V , ∃ β ∈ V \forall \alpha \in V, \exist\beta\in V αV,βV, s.t. α = − β \alpha = -\beta α=β
  • 性质5: V V V中有单位元 I I I I ⋅ α = α I \cdot \alpha=\alpha Iα=α
  • 性质6: λ ( μ α ) = ( λ μ ) α \lambda(\mu\alpha)=(\lambda\mu)\alpha λ(μα)=(λμ)α
  • 性质7: ( λ + μ ) α = λ α + μ α (\lambda + \mu)\alpha = \lambda\alpha + \mu\alpha (λ+μ)α=λα+μα
  • 性质8: λ ( α + β ) = λ α + λ β \lambda(\alpha + \beta) = \lambda\alpha + \lambda\beta λ(α+β)=λα+λβ
    满足上述性质的加法和数乘运算称为线性运算, 定义线性运算的集合 V V V称为线性空间

线性空间的性质

零元素唯一

任一元素的负元素唯一

0 α = O , ( − 1 ) α = − α , λ O = O 0\alpha=O, (-1)\alpha = -\alpha, \lambda O = O 0α=O,(1)α=α,λO=O

λ α = 0 \lambda\alpha=0 λα=0, 则必有 α = O \alpha=O α=O, 或 λ = 0 \lambda=0 λ=0

线性子空间

线性空间的非空子集, 对于原线性空间加法和数乘运算也构成一个线性空间, 则称该子集为原线性空间的线性子空间

线性空间 V V V上的一个非空子集 L L L构成线性子空间的充要条件是: L L L V V V中的线性运算封闭.

线性空间的维数, 基和坐标

a 1 , a 2 , ⋯   , a n a_1, a_2, \cdots, a_n a1,a2,,an, 维数 n n n

V V V中的元素用基元素 α \alpha α线性表示为: α = x 1 α 1 + x 2 α 2 + ⋯ + x n α n \alpha = x_1\alpha_1 + x_2\alpha_2 + \cdots + x_n\alpha_n α=x1α1+x2α2++xnαn, ( x 1 , x 2 , ⋯   , x n ) (x_1, x_2, \cdots, x_n) (x1,x2,,xn)称为元素 a l p h a alpha alpha在这组基下的坐标.

同构

U U U, V V V是数域 F F F上的两个线性空间, f f f U U U V V V的一个映射, 如果满足:
(1) f f f是双射
(2) ∀ α , β ∈ U \forall \alpha, \beta \in U α,βU,有 f ( α + β ) = f ( α ) + f ( β ) f(\alpha + \beta) = f(\alpha) + f(\beta) f(α+β)=f(α)+f(β)
(3) ∀ α ∈ U \forall \alpha \in U αU, λ ∈ F \lambda \in F λF, 有 f ( λ α ) = λ f ( α ) f(\lambda \alpha) = \lambda f(\alpha) f(λα)=λf(α)
则称 f f f U U U V V V同构映射, 如果 U U U V V V的同构映射存在, 则称 U U U V V V同构, 记为 U ≅ V U \cong V UV.

数域 F F F上的任意 n n n维线性空间都与 F n F^n Fn同构

同构映射的基本性质

f f f是线性空间 U U U V V V的同构映射, 则:
(1) f ( 0 ) = 0 f(0) = 0 f(0)=0
(2) ∀ α ∈ U \forall \alpha \in U αU, 有 f ( − α ) = − f ( α ) f(-\alpha) = - f(\alpha) f(α)=f(α)
(3) ∀ α i ∈ U , λ i ∈ F \forall \alpha_i \in U, \lambda_i \in F αiU,λiF, 有 f ( λ 1 α 1 + ⋯ + λ n α n ) = λ 1 f ( α 1 ) + ⋯ + λ n f ( α n ) f(\lambda_1\alpha_1 + \cdots + \lambda_n\alpha_n) = \lambda_1f(\alpha_1) + \cdots + \lambda_nf(\alpha_n) f(λ1α1++λnαn)=λ1f(α1)++λnf(αn)
(4) U U U中的向量 α 1 , α 2 , ⋯   , α n \alpha_1, \alpha_2, \cdots, \alpha_n α1,α2,,αn线性相关的充要条件是 f ( α 1 ) , f ( α 2 ) , ⋯   , f ( α n ) f(\alpha_1), f(\alpha_2), \cdots, f(\alpha_n) f(α1),f(α2),,f(αn)线性相关
(5) α 1 , α 2 , ⋯   , α n \alpha_1, \alpha_2, \cdots, \alpha_n α1,α2,,αn U U U的一个基的充要条件是 f ( α 1 ) , f ( α 2 ) , ⋯   , f ( α n ) f(\alpha_1), f(\alpha_2), \cdots, f(\alpha_n) f(α1),f(α2),,f(αn) V V V的一个基
(6) U U U的子空间在 f f f下的象集是 V V V的子空间
(7) V V V的子空间在 f f f下的原集是 U U U的子空间
(8) f f f的逆映射是 V V V U U U的同构映射
(9) 若 g g g是线性空间 V V V W W W的t同构映射, 则 g f gf gf U U U W W W的同构映射

同构关系的性质

反身性: V ≅ V V \cong V VV
对称性: 若 U ≅ V U \cong V UV, 则 V ≅ U V \cong U VU
传递性: 若 U ≅ V U \cong V UV, V ≅ W V \cong W VW, 则 U ≅ W U \cong W UW

线性空间同构的一个充要条件

数域 F F F上两个有限维线性空间同构的充要条件是它们有相同的维数.

同构的线性空间是不加区别的(代数角度), 维数是有限维线性空间的唯一本质特征.

一般无限维空间可以用有限维逼近, 因此有限维空间应用广泛, 如FFT

基变换

α 1 , ⋯   , α n \alpha_1, \cdots, \alpha_n α1,,αn β 1 , ⋯   , β n \beta_1, \cdots, \beta_n β1,,βn n n n维线性空间 V n V_n Vn的两组基. 则存在变换使得 [ β 1 , ⋯   , β n ] = [ α 1 , ⋯   , α n ] P [\beta_1, \cdots, \beta_n]=[\alpha_1, \cdots, \alpha_n]P [β1,,βn]=[α1,,αn]P P P P过度矩阵, 上式称基变换表示式.

坐标变换

设线性空间 V V V中的元素 α \alpha α在两组基 α 1 , ⋯   , α n \alpha_1, \cdots, \alpha_n α1,,αn β 1 , ⋯   , β n \beta_1, \cdots, \beta_n β1,,βn下的坐标分别是 [ x 1 , ⋯   , x n ] T [x_1, \cdots, x_n]^T [x1,,xn]T [ x 1 ′ , ⋯   , x n ′ ] T [x_1^\prime, \cdots, x_n^\prime]^T [x1,,xn]T, P P P为过度矩阵(同上定义), 则两组基下的坐标表示满足如下坐标变换 [ x 1 , ⋯   , x n ] T = P [ x 1 ′ , ⋯   , x n ′ ] T [x_1, \cdots, x_n]^T = P[x_1^\prime, \cdots, x_n^\prime]^T [x1,,xn]T=P[x1,,xn]T [ x 1 ′ , ⋯   , x n ′ ] T = P − 1 [ x 1 , ⋯   , x n ] T [x_1^\prime, \cdots, x_n^\prime]^T = P^{-1}[x_1, \cdots, x_n]^T [x1,,xn]T=P1[x1,,xn]T

线性变换

V n , U m V_n, U_m Vn,Um分别是 n n n维和 m m m维线性空间, 如果变换 T : V n → U m T: V_n\rightarrow U_m T:VnUm满足:
(1) 可加性: T ( α 1 + α 2 ) = T ( α 1 ) + T ( α 2 ) T(\alpha_1 + \alpha_2) = T(\alpha_1) + T(\alpha_2) T(α1+α2)=T(α1)+T(α2)
(2) 可数乘性: T ( k α ) = k T ( α ) T(k\alpha) = kT(\alpha) T(kα)=kT(α)
则称该变换为线性变换

若果 U m = V n U_m = V_n Um=Vn, 即 T T T V n V_n Vn到自身的线性变换, 称线性空间 V n V_n Vn中的线性变换

线性变换的性质

T ( 0 ) = 0 , T ( − α ) = − T ( α ) T(0) = 0, \quad T(-\alpha) = - T(\alpha) T(0)=0,T(α)=T(α)

β = λ 1 α 1 + ⋯ + λ n α n \beta=\lambda_1\alpha_1 + \cdots + \lambda_n\alpha_n β=λ1α1++λnαn T ( β ) = T ( λ 1 α 1 + ⋯ + λ n α n ) = λ 1 T ( α 1 ) + ⋯ + λ n T ( α n ) T(\beta) =T(\lambda_1\alpha_1 + \cdots + \lambda_n\alpha_n) = \lambda_1T(\alpha_1) + \cdots + \lambda_nT(\alpha_n) T(β)=T(λ1α1++λnαn)=λ1T(α1)++λnT(αn)

α 1 , α 2 , ⋯   , α n \alpha_1, \alpha_2, \cdots, \alpha_n α1,α2,,αn线性相关, 则 T ( α 1 ) , T ( α 2 ) , ⋯   , T ( α n ) T(\alpha_1), T(\alpha_2), \cdots, T(\alpha_n) T(α1),T(α2),,T(αn)线性相关

线性变换 T T T的象 T ( V n ) T(V_n) T(Vn)是一个线性空间( U m U_m Um的子空间), 称为线性空间 T T T的象空间

集合 S T = { α ∣ α ∈ V n , T ( α ) = 0 } S_T=\{\alpha |_{\alpha\in V_n},T(\alpha)=0\} ST={ααVn,T(α)=0}的是 V n V_n Vn的子空间, 集合 S T S_T ST称为线性变换 T T T的核

用矩阵表示线性变换

y = T ( x ) = A x y=T(x) = Ax y=T(x)=Ax

R n \mathbb{R^n} Rn中任何线性变换 T T T都可以用矩阵表示 T ( x ) = A x , x ∈ R n T(x) = Ax, \quad x\in \mathbb{R^n} T(x)=Ax,xRn A = [ T ( e 1 ) , T ( e 2 ) , ⋯   , T ( e n ) ] A=[T(e_1), T(e_2), \cdots, T(e_n)] A=[T(e1),T(e2),,T(en)]其中 e 1 , … , e n e_1, \ldots, e_n e1,,en是一组基, 称 A A A是线性变换 T T T在这组基下的线性表示

上述情况可以推广到一般的线性空间 V n V_n Vn中, 设 α 1 , … , α n \alpha_1, \ldots, \alpha_n α1,,αn是一组基, 此时对于 V n V_n Vn中的任意元 α = ∑ i = 1 n x i α i \alpha=\sum_{i=1}^n x_i \alpha_i α=i=1nxiαi, 其线性变换 T ( α ) = T ( ∑ i = 1 n x i α i ) = [ T ( α 1 ) , … , T ( α n ] [ x 1 , … , x n ] T = [ α 1 , … , α n ] A [ x 1 , … , x n ] T T(\alpha)=T(\sum_{i=1}^n x_i \alpha_i)=[T(\alpha_1), \ldots, T(\alpha_n][x_1, \ldots, x_n]^T=[\alpha_1, \ldots, \alpha_n]A[x_1, \ldots, x_n]^T T(α)=T(i=1nxiαi)=[T(α1),,T(αn][x1,,xn]T=[α1,,αn]A[x1,,xn]T
自行思考此时 A A A的形式

不同基的变换矩阵

V n V_n Vn线性空间中, 取定两组基: α 1 , … , α n \alpha_1, \ldots, \alpha_n α1,,αn β 1 , … , β n \beta_1, \ldots, \beta_n β1,,βn, 由基 a l p h a 1 , … , α n alpha_1, \ldots, \alpha_n alpha1,,αn到基 β 1 , … , β n \beta_1, \ldots, \beta_n β1,,βn的过度矩阵为 P P P, V n V_n Vn的线性变换 T T T在这两组基条件下的矩阵分别为 A A A B B B, 则有 B = P − 1 A P B = P^{-1}AP B=P1AP

相似矩阵

n n n阶方阵 A A A B B B称为相似矩阵, 如果存在可逆矩阵 P P P, 使得 B = P − 1 A P B = P^{-1}AP B=P1AP成立, P P P称为相似变换矩阵

欧式空间

欧式空间在一般线性空间的基础上, 引入长度(范数)的定义, 如三维空间中向量 ( x , y , z ) (x, y, z) (x,y,z)的长度平方为 r 2 = x 2 + y 2 + z 2 r^2 = x^2 + y^2 + z^2 r2=x2+y2+z2后来在长度定义的基础上进一步定义了內积, 形成內积空间. 內积空间不仅仅有长度, 还有夹角, 正交等.

欧式空间定义

有內积定义的实线性空间称为欧式空间

向量內积

[ x , y ] = [ y , x ] [x, y] = [y, x] [x,y]=[y,x]
[ k x , y ] = k [ x , y ] [kx, y] = k[x, y] [kx,y]=k[x,y]
[ x + y , z ] = [ x , z ] + [ y , z ] [x + y, z] = [x, z] + [y, z] [x+y,z]=[x,z]+[y,z]
满足上述3条性质的运算为內积运算

无限维空间及內积定义

函数线性空间
[ f , g ] = [ g , f ] = ∫ a b g f d x [f, g] = [g, f] = \int_a^bgfdx [f,g]=[g,f]=abgfdx
[ k f , g ] = k [ f , g ] = k ∫ a b f g d x [kf, g] = k[f, g]=k\int_a^bfgdx [kf,g]=k[f,g]=kabfgdx
[ f 1 + f 2 , g ] = ∫ a b ( f 1 + f 2 ) g d x = ∫ a b f 1 g d x + ∫ a b f 2 g d x = [ f 1 , g ] + [ f 2 , g ] [f_1 + f_2, g] = \int_a^b (f_1 + f_2)gdx = \int_a^bf_1gdx + \int_a^bf_2gdx=[f_1, g] + [f_2, g] [f1+f2,g]=ab(f1+f2)gdx=abf1gdx+abf2gdx=[f1,g]+[f2,g]
上述函数空间也是內积空间

向量范数

非负性
齐次性 ∥ k x ∥ = ∣ k ∣ ∥ x ∥ \|kx\| = |k|\|x\| kx=kx
三角不等式 ∥ x + y ∥ ≤ ∥ x ∥ + ∥ y ∥ \|x+y\| \leq \|x\| + \|y\| x+yx+y

Schwartz不等式

[ x , y ] 2 ≤ [ x , x ] [ y , y ] [x, y]^2 \leq [x, x][y, y] [x,y]2[x,x][y,y] ∣ [ x , y ] ∣ ≤ ∥ x ∥ ∥ y ∥ |[x, y]| \leq \|x\|\|y\| [x,y]xy当且仅当 x , y x, y x,y线性相关时等号成立

向量的夹角

∥ x ∥ , ∥ y ∥ ≠ 0 \|x\|,\|y\|\neq 0 x,y=0, 则 x , y x, y x,y之间的夹角定义为 θ = arccos ⁡ [ x , y ] ∥ x ∥ ∥ y ∥ \theta =\arccos \frac{[x, y]}{\|x\| \|y\|} θ=arccosxy[x,y]

正交

[ x , y ] = 0 [x, y] = 0 [x,y]=0, 则 x , y x, y x,y正交, 0 0 0向量和所有向量正交

函数空间中也有夹角和正交的概念 θ = arccos ⁡ [ f , g ] ∣ ∣ f ∣ ∣ ∣ ∣ g ∣ ∣ \theta =\arccos \frac{[f, g] }{||f||||g||} θ=arccosfg[f,g] ∫ a b f g = 0 \int_a^bfg=0 abfg=0

两两正交向量组线性无关

如果向量组 α 1 , … , α n \alpha _1, \ldots, \alpha_n α1,,αn是两两正交的非零向量, 则 α 1 , … , α n \alpha _1, \ldots, \alpha_n α1,,αn线性无关,

正交基

n n n维空间中 n n n个两两正交的基, 构成该空间的一组正交基

规范正交基

都是单位向量的正交基称规范正交基

规范正交基下的坐标表示

e 1 , … , e n e_1, \ldots, e_n e1,,en是规范正交基, 元素 α \alpha α在这组基下的坐标满足 x i = [ α , e i ] , i = 1 , 2 , … , n x_i = [\alpha, e_i], \quad i=1, 2, \ldots, n xi=[α,ei],i=1,2,,n

Schmidt正交化过程

{ b 1 = a 1 b 2 = a 2 − [ b 1 , a 2 ] [ b 1 , b 1 ] b 1 b 3 = a 3 − [ b 1 , a 3 ] [ b 1 , b 1 ] b 1 − [ b 2 , a 3 ] [ b 2 , b 2 ] b 2 ⋮ b r = a r − [ b 1 , a r ] [ b 1 , b 1 ] b 1 − [ b 2 , a r ] [ b 2 , b 2 ] b 2 − ⋯ − [ b r − 1 , a r ] [ b r − 1 , b r − 1 ] b r − 1 \left \{ \begin{aligned} &b_1 = a_1 \\ &b_2 = a_2 - \frac{[b_1, a_2]}{[b_1, b_1]}b_1 \\&b_3 = a_3 - \frac{[b_1, a_3]}{[b_1, b_1]}b_1 - \frac{[b_2, a_3]}{[b_2, b_2]}b_2 \\ & \qquad \vdots \\&b_r = a_r - \frac{[b_1, a_r]}{[b_1, b_1]}b_1 - \frac{[b_2, a_r]}{[b_2, b_2]}b_2 - \cdots - \frac{[b_{r-1} , a_r]}{[b_{r-1} , b_{r-1} ]}b_{r-1} \end{aligned} \right. b1=a1b2=a2[b1,b1][b1,a2]b1b3=a3[b1,b1][b1,a3]b1[b2,b2][b2,a3]b2br=ar[b1,b1][b1,ar]b1[b2,b2][b2,ar]b2[br1,br1][br1,ar]br1
归一化过程 e 1 = b 1 ∣ ∣ b 1 ∣ ∣ , e 2 = b 2 ∣ ∣ b 2 ∣ ∣ , ⋯   , e n = b n ∣ ∣ b 1 ∣ ∣ e _1 = \frac{b_1}{||b_1||}, \quad e _2 = \frac{b_2}{||b_2||}, \quad \cdots, \quad e _n = \frac{b_n}{||b_1||} e1=b1b1,e2=b2b2,,en=b1bn

正交矩阵

n × n n\times n n×n的方阵, 满足 A T A = E A^TA=E ATA=E A T = A − 1 A^T = A^{-1} AT=A1

正交矩阵是内积不变的线性变换, 所以也称正交变换矩阵

坐标旋转矩阵是正交矩阵, 但正交矩阵不一定是坐标旋转矩阵

方阵 A A A是正交矩阵的充要条件 A A A的行向量(列向量)是 R n \mathbb{R^n} Rn中的规范正交基

你可能感兴趣的:(理学)