定义7.1.1
设 V V V是实数域 R \bold{R} R上的线性空间,如果 V V V中的任意两个向量 a , b \bold{a,b} a,b均按照某一法则对应一个实数,记作 ( a , b ) (\bold{a,b}) (a,b),且满足:
- 对称性:对任意两个向量 a , b ∈ V \bold{a,b} \in V a,b∈V,有:
( a , b ) = ( b , a ) (\bold{a,b}) = (\bold{b,a}) (a,b)=(b,a)- 线性性:对任意实数 λ \lambda λ和任意三个向量 a , b , c ∈ V \bold{a,b,c} \in V a,b,c∈V,有:
( λ a , b ) = λ ( a , b ) (\lambda \bold{a,b}) = \lambda (\bold{a,b}) (λa,b)=λ(a,b)
( a + b , c ) = ( a , c ) + ( b , c ) (\bold{a+b, c}) = (\bold{a,c}) + (\bold{b,c}) (a+b,c)=(a,c)+(b,c)- 正定性:对任意一个向量 a ∈ V \bold{a} \in V a∈V,有 ( a , a ) ≥ 0 (\bold{a,a}) \geq 0 (a,a)≥0,等号成立当且仅当 a = 0 \bold{a} = \bold{0} a=0。
则称 ( a , b ) (\bold{a,b}) (a,b)为向量 a , b \bold{a,b} a,b的内积,定义了内记的实数域 R \bold{R} R上的线性空间 V V V称为欧几里得(Euclid)空间,简称欧氏空间。
对于欧氏空间,有Cauchy-Schwarz不等式:
定理7.1.1(Cauchy-Schwarz不等式)
设 V V V是欧式空间, ( ⋅ , ⋅ ) (\cdot,\cdot) (⋅,⋅)是 V V V的内积,则对 V V V当中的任意两个向量 a , b \bold{a,b} a,b,有:
∣ ( a , b ) ∣ ≤ ( a , a ) ( b , b ) |(\bold{a,b})| \leq \sqrt{(\bold{a,a})(\bold{b,b})} ∣(a,b)∣≤(a,a)(b,b)
定义 7.1.2
设 V V V是欧式空间, ( ⋅ , ⋅ ) (\cdot, \cdot) (⋅,⋅)是 V V V的内积,对于任意的 a ∈ V \bold{a} \in V a∈V,称
∣ a ∣ = ( a , a ) |\bold{a}| = \sqrt{(\bold{a,a})} ∣a∣=(a,a)
为 a \bold{a} a的长度或者模。
模长具有如下性质:
定义7.2.1
在 n n n为欧氏空间 V V V当中,一组两两正交的非零向量称为正交向量组。由正交向量组构成的基称为正交基。由单位向量组构成的正交基成为标准正交基。
定理7.2.1(Schmidt正交化)
从 n n n为欧氏空间 V V V的任意一组基出发,可以构造一组标准正交基。
定义7.3.1
实数域上两个欧氏空间 V V V和 V ′ V' V′称为同构的,如果存在一个从 V V V到 V ′ V' V′的一一映射 σ : V → V ′ \sigma: V \rightarrow V' σ:V→V′,满足:
- σ ( λ α + μ β ) = λ σ ( α ) + μ σ ( β ) \sigma(\lambda \bold{\alpha} + \mu \bold{\beta}) = \lambda \sigma(\bold{\alpha}) + \mu \sigma(\bold{\beta}) σ(λα+μβ)=λσ(α)+μσ(β)
- ( σ ( α ) , σ ( β ) ) = ( α , β ) (\sigma(\bold{\alpha}), \sigma(\bold{\beta})) = (\bold{\alpha}, \bold{\beta}) (σ(α),σ(β))=(α,β)
其中, α , β \bold{\alpha, \beta} α,β为 V V V中的两个任意向量, λ , μ \lambda, \mu λ,μ是两个任意实数。
定理7.3.1
两个有限维欧氏空间同构的充要条件是他们的维度相同。
定义7.4.1
设 V V V是一个 n n n维的欧氏空间, A \mathcal{A} A是 V V V上的一个线性变换,如果 A \mathcal{A} A保持 V V V的内积不变,即对于任意两个向量 a , b ∈ V \bold{a,b} \in V a,b∈V,都有:
( A ( a ) , ( b ) ) = ( ( a , b ) ) (\mathcal{A}(\bold{a}), \mathcal(\bold{b})) = (\bold(a,b)) (A(a),(b))=((a,b))
则称 A \mathcal{A} A是 V V V上的正交变换。
定理7.4.1
设 V V V是一个 n n n维的欧式空间, A \mathcal{A} A是 V V V上的一个线性变换,则 A \mathcal{A} A为正交变换当且仅当下列两个条件之一成立:
- A \mathcal{A} A保持任意向量的模不变;
- A \mathcal{A} A将标准正交基变换为标准正交基。
定义7.4.2
如果实方阵 A \bold{A} A满足 A T A = I \bold{A^{T}A} = \bold{I} ATA=I或者 A − 1 = A \bold{A}^{-1} = \bold{A} A−1=A,则称方阵 A \bold{A} A为正交矩阵。
定理7.4.2
欧式空间中的线性变换 A \mathcal{A} A是正交变换的充要条件是 A \mathcal{A} A在标准正交基下的矩阵 A \bold{A} A是正交矩阵。
定理7.4.3
设 V V V是 n n n维欧氏空间,则:
- 单位变换是正交变换;
- 两个正交变换的复合仍然是正交变换;
- 正交变换一定可逆,其逆变换也是正交变换。
由正交矩阵的定义可知,正交矩阵的行列式 d e t A = ± 1 det\bold{A} = \pm 1 detA=±1。如果 A \mathcal{A} A在一组基下的矩阵行列式为 1 1 1,则称 A \mathcal{A} A为第一类变换。如果正交变换 A \mathcal{A} A在一组基下的矩阵行列式为 − 1 -1 −1,则称 A \mathcal{A} A为第二类变换。
定理7.4.3
设 A \mathcal{A} A是欧氏空间 V V V上的正交变换,则 A \mathcal{A} A的特征值的模都为 1 1 1。
特别的, A \mathcal{A} A的实特征值(如果存在的话)只能是 1 1 1或者 − 1 -1 −1。
如果 V V V的维数是奇数且 A \mathcal{A} A是第一类正交变换,则 A \mathcal{A} A一定存在职位 1 1 1的特征值。
定义7.4.3
设 V V V是 n n n维欧氏空间上的线性变换, A \mathcal{A} A是 V V V上的线性变换。
如果 A \mathcal{A} A满足 ( a , A ( b ) ) = ( A ( a ) , b ) (\bold{a}, \mathcal{A}(\bold{b})) = (\mathcal{A}(\bold{a}), \bold{b}) (a,A(b))=(A(a),b)对 V V V中的任意两个向量 a , b \bold{a,b} a,b成立,则称 A \mathcal{A} A是 V V V上的对称变换。
定理7.4.5
设 A \mathcal{A} A是欧氏空间上的线性变换,则 A \mathcal{A} A是对称变换的充要条件是 A \mathcal{A} A在任何一组标准正交基下的矩阵 A \bold{A} A是实对称矩阵。
定理7.4.6
设 A \mathcal{A} A是欧式空间 V V V上的对称变换,则 A \mathcal{A} A的不同特征值对应的特征向量相互正交。
定理7.4.7
实对称矩阵的特征值都是实数。
定理7.4.8
实对阵矩阵 A \bold{A} A的属于不同特征值的特征向量必正交。
定理7.4.9
对于任意 n n n阶实对称矩阵 A \bold{A} A,存在一个 n n n阶正交矩阵 T \bold{T} T,使得 T − 1 A T \bold{T^{-1}AT} T−1AT为对角矩阵。
定义7.5.1
设 V 1 , V 2 V_1, V_2 V1,V2是欧式空间 V V V的两个子空间,如果对于任意的 a 1 ∈ V 1 , a 2 ∈ V 2 \bold{a}_1 \in V_1, \bold{a}_2 \in V_2 a1∈V1,a2∈V2,恒有 ( a 1 , a 2 ) = 0 (\bold{a}_1, \bold{a}_2) = 0 (a1,a2)=0,则称子空间 V 1 , V 2 V_1, V_2 V1,V2相互正交,记为 V 1 ⊥ V 2 V_1 \perp V_2 V1⊥V2。
如果一个向量 a \bold{a} a与子空间 V 1 V_1 V1中的任意一个向量均正交,则称向量 a \bold{a} a与子空间 V 1 V_1 V1正交,记为 a ⊥ V 1 \bold{a} \perp V_1 a⊥V1。
定理7.5.1
如果子空间 V 1 , V 2 V_1, V_2 V1,V2相互正交,那么他们的和 V 1 + V 2 V_1 + V_2 V1+V2是直和。推而广之,如果 V 1 , V 2 , . . . , V r V_1, V_2, ..., V_r V1,V2,...,Vr两两相互正交,则它们的和 V 1 + V 2 + . . . + V r V_1 + V_2 + ... + V_r V1+V2+...+Vr是直和。
定义7.5.2
如果 V 1 ⊥ V 2 V_1 \perp V_2 V1⊥V2且 V = V 1 + V 2 V=V_1 + V_2 V=V1+V2,那么子空间 V 2 V_2 V2称为子空间 V 1 V_1 V1的正交补空间或简称为正交补。
显然,如果 V 2 V_2 V2是 V 1 V_1 V1的正交补,那么 V 1 V_1 V1也是 V 2 V_2 V2的正交补。
定理7.5.2
欧式空间 V V V中任意一个子空间 V 1 V_1 V1都有唯一的正交补空间。
定义7.6.1
设 V V V是复数域上的线性空间,如果对于 V V V内的任意两个向量 a , b \bold{a,b} a,b都按某一法则对应于某一个复数,记作 ( a , b ) (\bold{a,b}) (a,b),且满足:
- 共轭对称性:对任意两个向量 a , b ∈ V \bold{a, b}\in V a,b∈V,有 ( a , b ) = ( b , a ) ‾ (\bold{a,b}) = \overline{(\bold{b,a})} (a,b)=(b,a)
- 线性性:对任意一个复数 λ \lambda λ和三个向量 a , b , c ∈ V \bold{a,b,c} \in V a,b,c∈V,有 ( a , λ b ) = λ ( a , b ) , ( a , b + c ) = ( a , b ) + ( a , c ) (\bold{a}, \lambda \bold{b}) = \lambda (\bold{a,b}), (\bold{a}, \bold{b+c}) = (\bold{a,b}) + (\bold{a,c}) (a,λb)=λ(a,b),(a,b+c)=(a,b)+(a,c)
- 正定性:对于任意一个向量 a ∈ V \bold{a} \in V a∈V,有 ( a , a ) ≥ 0 (\bold{a, a}) \geq 0 (a,a)≥0,等号成立当且仅当 a = 0 \bold{a} = \bold{0} a=0。
则称 ( a , b ) (\bold{a, b}) (a,b)为 a \bold{a} a和 b \bold{b} b的内积。
定义了内积的复数域 C \bold{C} C上的线性空间 V V V称为酉空间。
定义7.6.2
有空间中的两个向量 a , b \bold{a,b} a,b满足 ( a , b ) = 0 (\bold{a,b})=0 (a,b)=0,则称 a \bold{a} a和 b \bold{b} b相互正交或垂直,记为 a ⊥ b \bold{a} \perp \bold{b} a⊥b。
定理7.6.1
设 V V V是 n n n维酉空间,则:
- V V V中两两正交的一组非零向量一定是线性无关的;
- V V V中也存在标准正交基,即存在一组基 e 1 , . . , e n \bold{e}_1, .., \bold{e}_n e1,..,en,满足 ( e i , e j ) = δ i , j (\bold{e}_i, \bold{e}_j) = \delta_{i,j} (ei,ej)=δi,j, i , j = 1 , 2 , . . . , n i,j=1,2,...,n i,j=1,2,...,n;
- 欧式空间的Schmidt正交化过程在酉空间一样有效,即从酉空间中任意一组基出发,可以通过完全一样的Schmidt正交化过程,得到一组标准正交基。
我们摘录书中给出的欧氏空间与酉空间的对比如下:
欧氏空间 | 酉空间 |
---|---|
内积 ( a , b ) (\bold{a,b}) (a,b)为实数,满足: 1. ( a , b ) = ( b , a ) (\bold{a,b}) = (\bold{b,a}) (a,b)=(b,a) 2. ( λ a , b ) = ( a , λ b ) = λ ( a , b ) (\lambda \bold{a}, \bold{b}) = (\bold{a}, \lambda\bold{b}) = \lambda(\bold{a,b}) (λa,b)=(a,λb)=λ(a,b) |
内积 ( a , b ) (\bold{a,b}) (a,b)为复数,满足: 1. ( a , b ) = ( b , a ) ‾ (\bold{a,b}) = \overline{(\bold{b,a})} (a,b)=(b,a) 2. ( λ a , b ) = ( a , λ b ) = λ ( a , b ) (\lambda \bold{a}, \bold{b}) = (\bold{a}, \lambda\bold{b}) = \lambda(\bold{a,b}) (λa,b)=(a,λb)=λ(a,b) |
模 ∣ a ∣ = ( a , a ) ≥ 0 | \bold{a} | = \sqrt{(\bold{a,a})} \geq 0 ∣a∣=(a,a)≥0 向量 a \bold{a} a的单位向量化 a ∣ a ∣ \frac{\bold{a}}{| \bold{a} |} ∣a∣a |
模 ∣ a ∣ = ( a , a ) ≥ 0 | \bold{a} | = \sqrt{(\bold{a,a})} \geq 0 ∣a∣=(a,a)≥0 向量 a \bold{a} a的单位向量化 a ∣ a ∣ \frac{\bold{a}}{| \bold{a} |} ∣a∣a |
Cauchy-Schwarz不等式 ( a , b ) 2 ≤ ( a , a ) ( b , b ) (\bold{a,b})^2 \leq (\bold{a,a})(\bold{b,b}) (a,b)2≤(a,a)(b,b) 即 ∣ ( a , b ) ∣ ≤ ∣ a ∣ ∣ b ∣ | (\bold{a,b}) | \leq | \bold{a} | | \bold{b} | ∣(a,b)∣≤∣a∣∣b∣ 当且仅当 a , b \bold{a,b} a,b线性相关时等号成立 |
Cauchy-Schwarz不等式 ( a , b ) ( a , b ) ‾ ≤ ( a , a ) ( b , b ) (\bold{a,b}) \overline{(\bold{a,b})} \leq (\bold{a,a})(\bold{b,b}) (a,b)(a,b)≤(a,a)(b,b) 即 ∣ ( a , b ) ∣ ≤ ∣ a ∣ ∣ b ∣ | (\bold{a,b}) | \leq | \bold{a} | | \bold{b} | ∣(a,b)∣≤∣a∣∣b∣ 当且仅当 a , b \bold{a,b} a,b线性相关时等号成立 |
非零向量 a , b \bold{a,b} a,b的夹角 φ = a r c c o s ( a , b ) ∣ a ∣ ∣ b ∣ \varphi = arccos \frac{(\bold{a,b})}{| \bold{a} | | \bold{b} |} φ=arccos∣a∣∣b∣(a,b) | 无定义 |
向量 a , b \bold{a,b} a,b正交,即 ( a , b ) = 0 (\bold{a,b}) = 0 (a,b)=0 | 向量 a , b \bold{a,b} a,b正交,即 ( a , b ) = 0 (\bold{a,b}) = 0 (a,b)=0 |
三角不等式成立 ∣ a + b ∣ ≤ ∣ a ∣ + ∣ b ∣ | \bold{a} + \bold{b} | \leq | \bold{a} | + | \bold{b} | ∣a+b∣≤∣a∣+∣b∣ |
三角不等式成立 ∣ a + b ∣ ≤ ∣ a ∣ + ∣ b ∣ | \bold{a} + \bold{b} | \leq | \bold{a} | + | \bold{b} | ∣a+b∣≤∣a∣+∣b∣ |
度量矩阵 G \bold{G} G为是对称矩阵 设 e 1 , . . . , e n \bold{e}_1, ..., \bold{e}_n e1,...,en为基, σ i j = ( e i , e j ) = σ j i \sigma_{ij} = (\bold{e}_i, \bold{e}_j) = \sigma_{ji} σij=(ei,ej)=σji 度量矩阵 G = ( σ i j ) = G T \bold{G} = (\sigma_{ij}) = \bold{G}^T G=(σij)=GT |
度量矩阵 G \bold{G} G为是对称矩阵 设 e 1 , . . . , e n \bold{e}_1, ..., \bold{e}_n e1,...,en为基, σ i j = ( e i , e j ) = ( e j , e i ) ‾ = σ j i ‾ \sigma_{ij} = (\bold{e}_i, \bold{e}_j) = \overline{(\bold{e}_j, \bold{e}_i)} = \overline{\sigma_{ji}} σij=(ei,ej)=(ej,ei)=σji 度量矩阵 G = ( σ i j ) = ( G ‾ ) T \bold{G} = (\sigma_{ij}) = (\overline{\bold{G}})^T G=(σij)=(G)T |
用Schmidt方法可以将任意一组基改造为标准正交基 e 1 , . . . , e n \bold{e}_1, ..., \bold{e}_n e1,...,en ( e i , e j ) = δ i j , i , j = 1 , 2 , . . . , n (\bold{e}_i, \bold{e}_j) = \delta_{ij}, i,j = 1,2,...,n (ei,ej)=δij,i,j=1,2,...,n |
用Schmidt方法可以将任意一组基改造为标准正交基 e 1 , . . . , e n \bold{e}_1, ..., \bold{e}_n e1,...,en ( e i , e j ) = δ i j , i , j = 1 , 2 , . . . , n (\bold{e}_i, \bold{e}_j) = \delta_{ij}, i,j = 1,2,...,n (ei,ej)=δij,i,j=1,2,...,n |
在标准正交基下, a , b = ∑ i = 1 n a i b i \bold{a,b} = \sum_{i=1}^{n}a_i b_i a,b=∑i=1naibi | 在标准正交基下, a , b = ∑ i = 1 n a ‾ i b i \bold{a,b} = \sum_{i=1}^{n}\overline{a}_i b_i a,b=∑i=1naibi |
定义7.6.3
设 U \mathcal{U} U是酉空间 V V V上的线性变换,如果 U \mathcal{U} U保持内积不变,即对一切向量 a , b ∈ V \bold{a,b} \in V a,b∈V有
( U a , U b ) = ( a , b ) (\mathcal{U}\bold{a}, \mathcal{U}\bold{b}) = (\bold{a,b}) (Ua,Ub)=(a,b)
则称 U \mathcal{U} U是酉空间 V V V上的一个酉变换。
定义7.6.4
设 U \bold{U} U是一个 n n n阶复矩阵,如果它满足 U H U = I \bold{U^HU} = \bold{I} UHU=I或者 U − 1 = U H \bold{U}^{-1} = \bold{U^H} U−1=UH,则称 U \bold{U} U为酉矩阵。
定理7.6.2
设 U \mathcal{U} U是酉空间 V V V上的一个线性变换,则下列各命题互相等价:
- U \mathcal{U} U是一个酉变换
- U \mathcal{U} U保持向量的模不变,即对任意的 a ∈ V \bold{a} \in V a∈V,有 ∣ U a ∣ = ∣ a ∣ |\mathcal{U}\bold{a}| = |\bold{a}| ∣Ua∣=∣a∣
- U \mathcal{U} U把酉空间的标准正交基变为标准正交基;
- U \mathcal{U} U在标准正交基下的矩阵是酉矩阵。
定理7.6.3
设 U ( V ) U(V) U(V)是 n n n为酉空间 V V V中所有酉变换的全体所形成的集合,则:
- 单位变换 E ∈ U ( V ) \mathcal{E} \in U(V) E∈U(V)
- 如果 U 1 , U 2 ∈ U ( V ) \mathcal{U}_1, \mathcal{U}_2 \in U(V) U1,U2∈U(V),则 U 1 ∘ U 2 ∈ U ( V ) \mathcal{U}_1 \circ \mathcal{U}_2 \in U(V) U1∘U2∈U(V);
- 如果 U ∈ U ( V ) \mathcal{U} \in U(V) U∈U(V),则 U − 1 ∈ U ( V ) \mathcal{U}^{-1} \in U(V) U−1∈U(V)
定义7.6.5
设 A \mathcal{A} A是 n n n维酉空间 V V V上的线性变换,如果对 V V V中任意两个向量 a , b \bold{a,b} a,b有 ( a , A b ) = ( A a , b ) (\bold{a}, \mathcal{A}\bold{b}) = (\mathcal{A}\bold{a}, \bold{b}) (a,Ab)=(Aa,b),则称 A \mathcal{A} A是酉空间 V V V上的Hermite变换。
定义7.6.6
称满足 A = A H \bold{A} = \bold{A^H} A=AH的复矩阵为Hermite矩阵。
定义7.6.7
设 A \mathcal{A} A是 n n n维酉空间 V V V上的一个线性变换,如果存在 V V V上的线性变换 A ∗ \mathcal{A}^{*} A∗,使得对于任意两个向量 a , b \bold{a,b} a,b,有 ( A a , b ) = ( a , A ∗ b ) (\mathcal{A}\bold{a}, \bold{b}) = (\bold{a}, \mathcal{A}^{*} \bold{b}) (Aa,b)=(a,A∗b),则称 A ∗ \mathcal{A}^{*} A∗为 A \mathcal{A} A的共轭变换。
线性变换的共轭关系满足如下性质:
定义7.6.8
设 A \mathcal{A} A是 n n n维酉空间上的一个线性变换,如果 A \mathcal{A} A和它的共轭变换 A ∗ \mathcal{A}^{*} A∗可交换,即 A A ∗ = A ∗ A \mathcal{AA^{*}} = \mathcal{A^{*}A} AA∗=A∗A,则称变换 A \mathcal{A} A是一个规范变换。
规范变换在标准正交基下的矩阵满足 A A H = A H A \bold{AA^H} = \bold{A^HA} AAH=AHA,我们称满足上式的矩阵为规范矩阵。
定理7.6.4
设 A \mathcal{A} A是 n n n维酉空间 V V V中的一个线性变换,如果 W W W是 A \mathcal{A} A的不变子空间(即 W W W是 V V V的子空间,且对任意的 a ∈ W \bold{a} \in W a∈W,有 A a ∈ W \mathcal{A}\bold{a} \in W Aa∈W),则 W W W在 V V V中的正交补空间 W ⊥ W^{\perp} W⊥是 A \mathcal{A} A的共轭变换 A ∗ \mathcal{A}^{*} A∗的不变子空间。
定理7.6.5
设 λ \lambda λ是 n n n维酉空间上的规范变换 A \mathcal{A} A的特征值, x \bold{x} x是对应的特征向量,则 λ ‾ \overline{\lambda} λ是 A \mathcal{A} A的共轭变换 A ∗ \mathcal{A}^{*} A∗的特征值, x \bold{x} x是对应的特征向量。
定理7.6.6
设 A \mathcal{A} A是 n n n维酉空间 V V V上的规范变换,则 A \mathcal{A} A的属于不同特征值的特征向量相互正交。
定理7.6.7
设 A \mathcal{A} A是 n n n维酉空间 V V V中任意规范变换,则存在 V V V的一组标准正交基,使得 A \mathcal{A} A在这组基下的矩阵 A \bold{A} A为对角矩阵。
定义7.6.9
对于复数域上的 n n n阶方阵 A , B \bold{A, B} A,B,如果存在 n n n阶酉矩阵 U \bold{U} U,使得 A = U − 1 B U \bold{A} = \bold{U^{-1}BU} A=U−1BU, U − 1 = U H \bold{U}^{-1} = \bold{U}^{H} U−1=UH,则称 A \bold{A} A酉相似于 B \bold{B} B。
定理7.6.8
任一规范矩阵 A \bold{A} A都可有相似于对角矩阵。
反之,复数域上任意酉相似于对角矩阵的矩阵一定是规范矩阵。
定理7.6.9
设 A \mathcal{A} A是酉空间 V V V中任一酉变换,则:
- A \mathcal{A} A的特征值的模为1;
- 存在一组标准正交基,使得 A \mathcal{A} A在这组基下对应的矩阵为对角矩阵。
定理7.6.10
设 A \mathcal{A} A是酉空间 V V V中的任意一个Hermite变换,则:
- A \mathcal{A} A的特征值一定是实数;
- 存在一组标准正交基,使得 A \mathcal{A} A在这组基下对应的矩阵为实对角矩阵。