此博客停止更新迁移至SnailDove’s Blog,查看本文点击此处
笔记源自:清华大学公开课:线性代数2——第12讲:复数与复矩阵
之前接触的大部分线性代数知识都只考虑实数情形,但复数情形不可避免会遇到。例如 (cosθsinθ−sinθcosθ) ( c o s θ − s i n θ s i n θ c o s θ ) 没有实特征值(除了极特殊情形),目的:比较实数和复数情形的异同,注意学习复数和实数的区别联系。
复数复习:
例题:证明 cosπ2n+1cos2π2n+1⋯cosnπ2n+1=12n c o s π 2 n + 1 c o s 2 π 2 n + 1 ⋯ c o s n π 2 n + 1 = 1 2 n
要证明这个需要以下3点:
(1) −1−ei2θ=−1−cos2θ−isin2θ=−2cosθ(cosθ+isinθ)⇒|−1−cos2θ−isin2θ|=2|cosθ| − 1 − e i 2 θ = − 1 − c o s 2 θ − i s i n 2 θ = − 2 c o s θ ( c o s θ + i s i n θ ) ⇒ | − 1 − c o s 2 θ − i s i n 2 θ | = 2 | c o s θ |
(2)设 ω=cos2π2n+1+isin2π2n+1=ei2π2n+1(⇒|−1−ω|=2|cos(π2n+1)| ω = c o s 2 π 2 n + 1 + i s i n 2 π 2 n + 1 = e i 2 π 2 n + 1 ( ⇒ | − 1 − ω | = 2 | c o s ( π 2 n + 1 ) | ,那么 x2n+x2n−1+⋯+1=(x−ω)(x−ω2)⋯(x−ω2n)(∗) x 2 n + x 2 n − 1 + ⋯ + 1 = ( x − ω ) ( x − ω 2 ) ⋯ ( x − ω 2 n ) ( ∗ ) 推导如下: x2n+1−1=(x−1)(x−ω)(x−ω2)⋯(x−ω2n)⇒x2n+1−1x−1=(x−ω)(x−ω2)⋯(x−ω2n)⇒1(1−x2n+1)1−x=(x−ω)(x−ω2)⋯(x−ω2n) x 2 n + 1 − 1 = ( x − 1 ) ( x − ω ) ( x − ω 2 ) ⋯ ( x − ω 2 n ) ⇒ x 2 n + 1 − 1 x − 1 = ( x − ω ) ( x − ω 2 ) ⋯ ( x − ω 2 n ) ⇒ 1 ( 1 − x 2 n + 1 ) 1 − x = ( x − ω ) ( x − ω 2 ) ⋯ ( x − ω 2 n )
(3) cos(2n+1−k)π2n+1=coskπ2n+1 c o s ( 2 n + 1 − k ) π 2 n + 1 = c o s k π 2 n + 1
令 (∗) ( ∗ ) 等式中 x=−1 x = − 1 ,且取两边长度 1=|(−1−ω)(−1−ω2)⋯(−1−ω2n) 1 = | ( − 1 − ω ) ( − 1 − ω 2 ) ⋯ ( − 1 − ω 2 n ) 中右边每一项利用(1)式子得到 |−1−ω|=2|cosπ2n+1|,|−1−ω2|=2|cos2π2n+1|,…|−1−ωn|=2|cosnπ2n+1| | − 1 − ω | = 2 | c o s π 2 n + 1 | , | − 1 − ω 2 | = 2 | c o s 2 π 2 n + 1 | , … | − 1 − ω n | = 2 | c o s n π 2 n + 1 |
从n+1项起根据(3)得:
|−1−ω2n|=2|cos2nπ2n+1|=2|cos(2n+1−1)π2n+1|=2|cos(π−π2n+1)|=2|cos(π2n+1)|=|−1−ω| | − 1 − ω 2 n | = 2 | c o s 2 n π 2 n + 1 | = 2 | c o s ( 2 n + 1 − 1 ) π 2 n + 1 | = 2 | c o s ( π − π 2 n + 1 ) | = 2 | c o s ( π 2 n + 1 ) | = | − 1 − ω |
复数矩阵 A=(aij)m×n,aij∈C A = ( a i j ) m × n , a i j ∈ C , 那么称 AT¯¯¯¯¯¯¯(=A¯T) A T ¯ ( = A ¯ T ) 为 Hermitian 矩阵,记为 AH A H 。例如: Z=(1+ii)→ZH=(1−i−i) Z = ( 1 + i i ) → Z H = ( 1 − i − i ) ,而且发现 ZZH=||Z||2 Z Z H = | | Z | | 2 ,这个可以类比实数中的 xTx=||x||2 x T x = | | x | | 2 。性质: (AH)H=A,(AB)H=BHAH ( A H ) H = A , ( A B ) H = B H A H (按照共轭转置即可求得),正如在 Rn R n 的定义内积,在 C C 上也可以定义内积: u,v∈Cn,uHv=(u¯1⋯u¯n)⎛⎝⎜⎜⎜⎜⎜⎜v1...vn⎞⎠⎟⎟⎟⎟⎟⎟=u¯1v1+⋯+u¯nvn u , v ∈ C n , u H v = ( u ¯ 1 ⋯ u ¯ n ) ( v 1 . . . v n ) = u ¯ 1 v 1 + ⋯ + u ¯ n v n ,内积的性质: uHv=vHu¯¯¯¯¯¯¯¯¯ u H v = v H u ¯ 。
在实数矩阵中有对称矩阵的概念和作用,复数矩阵有类似的——厄米特矩阵(Hermite matrix),定义为: A=AH A = A H ,即一个矩阵的共轭转置等于它本身,那么称这种矩阵为Hermite阵。例: (21−i1+i3) ( 2 1 + i 1 − i 3 ) 。
性质1:Hermite阵对角线元素为实数。
性质2: z∈C,A=AH⇒zHAz z ∈ C , A = A H ⇒ z H A z 是一个实数。证明如下: zHAz¯¯¯¯¯¯¯¯¯¯¯¯T=(zHAz)H=zHAHz=zHAz z H A z ¯ T = ( z H A z ) H = z H A H z = z H A z
性质3:设 A,B A , B 是Hermite阵,则 A+B A + B 也是,证明: (A+B)H=AH+BH=A+B ( A + B ) H = A H + B H = A + B 。进一步,若 AB=BA A B = B A (即乘法可交换的时候),则 AB A B 是Hermite阵。 ⇒An ⇒ A n 是Hermite阵。
性质4:设 A A 是一个 n n 阶复矩阵, AAH,A+AH A A H , A + A H 是Hermite阵,联系对比实对称矩阵的 AAT,ATA,A+AT A A T , A T A , A + A T 。
性质5:一个Hermite矩阵A的特征值是实数。证明:设 Az=λ0z A z = λ 0 z ,则 zHAz=λ0zHz z H A z = λ 0 z H z 。 zHAz z H A z 和 zHz z H z 均为实数 ⇒λ0(z0≠0) ⇒ λ 0 ( z 0 ≠ 0 ) 是实数。
性质6:一个Hermite阵的不同特征值的特征向量相互正交。证明:设 (1)Az1=λ1z1,(2)Az2=λ2z2,λ1≠λ2 ( 1 ) A z 1 = λ 1 z 1 , ( 2 ) A z 2 = λ 2 z 2 , λ 1 ≠ λ 2 , 在(1)两边同乘以 zH2 z 2 H 得: (3)zH2Az1=zH2λ1z1⇒(4)zH2AHz1=(Az2)Hz1=λ2¯¯¯¯¯zH2z1=λ2zH2z1 ( 3 ) z 2 H A z 1 = z 2 H λ 1 z 1 ⇒ ( 4 ) z 2 H A H z 1 = ( A z 2 ) H z 1 = λ 2 ¯ z 2 H z 1 = λ 2 z 2 H z 1 ,由 (3)(4)⇒λ1zH2z1=λ2zH2z1⇒(λ1−λ2)zH2z1=0 ( 3 ) ( 4 ) ⇒ λ 1 z 2 H z 1 = λ 2 z 2 H z 1 ⇒ ( λ 1 − λ 2 ) z 2 H z 1 = 0 ,因为 λ1≠λ2 λ 1 ≠ λ 2 得: zH2z1=0 z 2 H z 1 = 0 。
酉矩阵是正交阵的复数类比。 Un×n U n × n 是酉矩阵 ⇔ ⇔ ∀z∈Cn,||Uz||=||z|| ∀ z ∈ C n , | | U z | | = | | z | | ,证明: UHU=In⇒|Uz|2=zHUHUz=zHz=|z|2⇒|Uz|=|z|⇒|λ|=1 U H U = I n ⇒ | U z | 2 = z H U H U z = z H z = | z | 2 ⇒ | U z | = | z | ⇒ | λ | = 1 。得出与实数矩阵类似的性质1:酉矩阵乘以任何向量不改变它的模长。性质2: U U 是酉矩阵,则 U U 的特征值模长为1。 例: u=⎛⎝⎜⎜⎜⎜⎜12√12√0−16√16√1+i3√6√1−i3√23√−1+i3√23√13√⎞⎠⎟⎟⎟⎟⎟ u = ( 1 2 − 1 6 1 − i 3 2 3 1 2 1 6 − 1 + i 3 2 3 0 1 + i 3 6 1 3 ) , |detU|=∏|λi|=1 | d e t U | = ∏ | λ i | = 1 (行列式的长度等于特征值长度的乘积)。
而实数的正交阵,也有类似的性质。下面证明正交阵不同特征值对应的特征向量相互正交:
因为 Q Q 正交阵, QTQ=E,|Q|=1=λ1λ2…λn Q T Q = E , | Q | = 1 = λ 1 λ 2 … λ n ,设 λ1,λ2 λ 1 , λ 2 为 Q Q 的两个不同的特征值, ξ1,ξ2 ξ 1 , ξ 2 为对应的特征向量 (1)Qξ1=λ1ξ1,(2)Qξ2=λ2ξ2,(3)(ξ2)TQT=λ2(ξ2)T⇒(3)(1)⇒ξT2QTQξ1=λ1λ2ξT2ξ1⇒(λ1λ2−1)ξT2ξ1=0 ( 1 ) Q ξ 1 = λ 1 ξ 1 , ( 2 ) Q ξ 2 = λ 2 ξ 2 , ( 3 ) ( ξ 2 ) T Q T = λ 2 ( ξ 2 ) T ⇒ ( 3 ) ( 1 ) ⇒ ξ 2 T Q T Q ξ 1 = λ 1 λ 2 ξ 2 T ξ 1 ⇒ ( λ 1 λ 2 − 1 ) ξ 2 T ξ 1 = 0
而 |λ1|=|λ2|=1,λ1≠λ2 | λ 1 | = | λ 2 | = 1 , λ 1 ≠ λ 2 ,得 ξ2Tξ1=0,因此ξ2,ξ1 ξ 2 T ξ 1 = 0 , 因 此 ξ 2 , ξ 1 正交。
酉阵和Hermite矩阵均为复正规矩阵,即: AHA=AAH A H A = A A H 。 酉相似:设 A,B A , B 是;两 n n 阶复矩阵,若存在酉矩阵 U U ,使得 A=UHBU A = U H B U ,则 A A 和 B B 是酉相似(联系实数矩阵的正交相似)。定理:设 A A 复正规阵,则
定理(Schur):任意一个复矩阵 A A 酉相似于一个上三角阵。即: ∃ U∈unitary matrix,∀ A∈complex matrix,UH=U−1,UHAU=⎛⎝⎜⎜λ100∗⋱0∗∗λn⎞⎠⎟⎟⇒ ∃ U ∈ u n i t a r y m a t r i x , ∀ A ∈ c o m p l e x m a t r i x , U H = U − 1 , U H A U = ( λ 1 ∗ ∗ 0 ⋱ ∗ 0 0 λ n ) ⇒ 任意一个复正规阵酉相似于对角阵,特别地,酉相似于 ⎛⎝⎜⎜⎜⎜⎜11⋱1⎞⎠⎟⎟⎟⎟⎟ ( 1 1 ⋱ 1 ) , UHAU=diag(λ1,…,λn)⇒AU=λU U H A U = d i a g ( λ 1 , … , λ n ) ⇒ A U = λ U 。
一个实矩阵 A A 是正规的 ⇔ATA=AAT ⇔ A T A = A A T 。例如, A A 是正交阵或者 A A 是对称(反对称)矩阵。
如果 A A 是正规的,那么存在正交阵 Ω Ω 使得:
ΩTAΩ=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜(a1−b1b1a1)⋱(as−bsbsas)λ2s+1⋱λn⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ Ω T A Ω = ( ( a 1 b 1 − b 1 a 1 ) ⋱ ( a s b s − b s a s ) λ 2 s + 1 ⋱ λ n ) ,即实正规阵正交相似于分块对角阵。
对于复正规阵酉相似对角阵 UHAU=diag(λ1,…,λn)⇒AU=λU U H A U = d i a g ( λ 1 , … , λ n ) ⇒ A U = λ U ,这里如果把 U U 的列向量写成 uk=β+iγ, k∈[1,n], β,γ∈Rn u k = β + i γ , k ∈ [ 1 , n ] , β , γ ∈ R n ,例如: (1+i1−i)=(11)+i(1−1) ( 1 + i 1 − i ) = ( 1 1 ) + i ( 1 − 1 ) 。
Auk=λkuk⇒A(β+iγ)=λk(β+iγ) A u k = λ k u k ⇒ A ( β + i γ ) = λ k ( β + i γ ) ,令 λk=a+ib λ k = a + i b ,得: Aβ=aβ−bγ,Aγ=bβ+aγ⇒ A β = a β − b γ , A γ = b β + a γ ⇒
A(β,γ)=(β,γ)(a−bba) A ( β , γ ) = ( β , γ ) ( a b − b a ) ,所以 Ω Ω 的实际上是由 U U 的特征向量的实部和虚部组成的这样一个形式。 Ω Ω 是一个正交阵,那 β β 和 γ γ 是不是正交的?它们的长度相等嘛?不然无法保证 Ω Ω 是一个正交阵。 结论:设 A A 是 n n 解实正交阵。若 λ=a+ib(b≠0) λ = a + i b ( b ≠ 0 ) 是 A A 的特征值, x=x1+ix2, x1,x2∈Rn x = x 1 + i x 2 , x 1 , x 2 ∈ R n 是对应的特征向量,则 ||x1||=||x2|| | | x 1 | | = | | x 2 | | ,且 x1,x2 x 1 , x 2 是相互正交的。
证明:如果 λ=a+ib λ = a + i b 是 A A 的特征值,那么 λ=a−ib λ = a − i b 也是 A A 的特征值。因为 A A 实正交阵,所以对 Ax=λx A x = λ x 取两边共轭得: Ax¯¯¯¯¯¯¯=Ax¯=λ¯