一、可对角化、特征值和特征向量的定义
Defs: 1) A linear operator T: V→V,on a finite-dimensional vector space V is called diagonalizable if ∃ an ordered basis β s.t.[T]β is a diagonal matrix.
2) Let A ∈ Mn×n(F), then A is said to be diagonalizable if LA is diagonalizable. Here LA: Fn→Fn, LA(x)=Ax, x∈F。
Defs: 1) Let T be a linear operator on a vector space V. If ∃ a 非零元素 v ∈ V and a scalar λ∈F s.t. T(v)=λv,
then λ is an eigenvalue(特征值) of T and v is its corresponding eigenvector(特征向量).
2) Let A ∈ Mn×n(F), if ∃ a 非零元素 v ∈ Fn and a scalar λ∈F s.t. A(v)=λv, then λ is an eigenvalue of A and v is its associated eigenvectors.
因为T是线性的,所以一个特征值所对应的特征向量有无穷多个,当我们找到一个特征向量,将其乘以一个非零的scalar,所得之结果仍为特征向量。
二、可对角化的充分必要条件
Thm5.1:
三、特征值和特征向量的计算
Thm5.2 Let A ∈ Mn×n(F), Then λ is an eigenvalue of A⇔det(A-λI)=0.
Def:
Thm5.4 v∈V is an eigenvector of T corresponding to λ ⇔ 非零元素 v 位于T -λI的零空间中,即 v∈N(T -λI) .
四、可对角化的充分条件
在Section2中,我们已经给出了可对角化的一个充要条件:一个线性算子(或一个矩阵)的特征值相对应的特征向量如果能构成向量空间的一个基底,那么这个线性算子(或矩阵)就是可对角化的。但是这个条件显然用起来并不那么方便,你要先算特征值,再计算对应的特征向量,然后还要检查特征向量是否线性独立。我们希望有一个更加简洁的条件来检验是否可对角化。为了得出这个更好用的条件,需要从下面这个Thm 5.5开始讨论。
Thm 5.5 Let 是 λi T的特征值,vi是对应的特征向量。如果λi 各不相同,其中i = 1,2,...,k,那么{v1, v2, ... , vk}是线性独立的。(Hint:证明的方法主要是数学归纳法,这里不做详述)
Remark:Thm 5.5的逆命题不成立。Thm 5.5说明一组各不相同的特征值所对应的特征向量彼此线性独立。但是如果有一组彼此线性独立的特征向量,其对应回去的特征值是否各不相同是无法保证的。
一个简单的反例就是单位矩阵,例如 I = {1 0; 0 1},当λ=1时,任何不为0的向量都是对应的特征向量,但这些彼此独立的特征向量对应的特征值都是1。
推论:Let dim(V) = n, and T: V→V是线性的,或者A ∈ Mn×n(F),如果T(或A)有n个不同的特征值,⇒ T(或A)是可对角线化的。
这个推论是很显然的,因为T(或A)有n个不同的特征值,根据Thm5.5,它就有n个线性独立的特征向量。而dim(V) = n,所以这n个线性独立的特征向量就构成了一组基底。再由Thm5.1就可以得出T(或A)可对角线化的结论。
当然,这个推论的逆命题仍然是不成立的,也就是说它不是可对角线化的充要条件。为了要得到一个更强的结论,我们还要讨论,如果特征多项式有重根,那么矩阵(或算子)还可以对角线化吗?
五、几个重要的定义
后面我们需要用到如下几个重要的定义。
Def 1: A polynomial f(t) in P(F) splits over F, if f(t) can be factored as a product of the first degree polynomials in P(F)。
F对于这个定义非常重要,必须要先指定。例如,F=R,那么(t2 + 1)(t - 2) does not split over R. However, it does split over C。
Thm 5.6:T: F→F,或A ∈ Mn×n(F),是可对角化的 ⇒ T(或A)的特征多项式splits over F。
Def 2: Let f(t) and λ 分别是T的特征多项式和特征值。那么λ 的代数重数(algebraic multiplicity)是最大的正整数k for which (1-λ)k is the factor of f(t)。
Def 3: 我们把Eλ = {v∈V: T(v) = λv} = {v∈V: (T - λI)(v) = 0} 定义为的eigenspace。
也就是说Eλ 是个集合,这个集合收集了T的所有特征向量,以及零向量(把零向量也一同收进来的原因就在于使其形成一个子空间,这样才可以进一步去讨论维度的问题)。Remark: Eλ 是V的一个子空间。
既然Eλ 是V的一个子空间,那么就可以定义它的维度。于是又有了如下定义。
Def 4: 定义dim(Eλ) 是λ的几何重数(geometric multiplicity),记为gm(λ)。
例如:对于单位矩阵 I = {1 0; 0 1}∈ M2×2(R),它的特征多项式 f(t) = det(I-tI)=(1-t)2 ,所以λ = 1的am=2。
另外,很容易发现任何二维向量都是2×2单位矩阵的特征向量(因为Ix=1x,x对于任意二维向量都成立),所以可以知道Eλ=1 = R2 ,即dim(Eλ=1)=2,所以λ = 1的gm=2。
关于am和gm有如下一些结论(它在证明Section 6中的定理时会被用到):
1)(Thm 5.7) 1 ≤ gm(λ) ≤ am(λ)
2)(Thm 5.8) Let λi be distinct eigenvalues of T, where i = 1, 2, ..., k. Let Si be a finite 线性独立 subset of eigenspace Eλi. Then S = S1∪S2∪...∪S3 是线性独立的。
该定理的图形化解释如下图所示:
六、可对角化的条件
我们希望有一个更加简洁的条件来检验是否可对角化。而且是充分必要的条件。下面这个定理表明在某些条件下,只要检查特征值的一些情况就可以判断对角化的情况。
注意k可以是小于等于n的,所以其实这定理是允许有重根的情况。这个定理的详细证明可以参考文献【1】。下面来看几个例子。首先,请问下面这个矩阵A可以对角化吗?
为此要先来求它的特征多项式,即
可以看到它有两个不同的特征值,当λ = 4时 am =1 ,而且根据Thm 5.7可知其gm =1。当 λ = 3时 am =2 ,根据dimenstion theroy还可以算得此时gm = 1。由于定理的要求是所有的几何重数都等于代数重数,显然这里无法满足,所以矩阵A是不能对角化的。
再来看一个算子的例子。T : P2(R)→P2(R), T(f(x))=f(1)+f'(0)x+(f'(0)+f''(0))x2.
P2(R)→P2(R)表示线性算子T的作用是把一个二次多项式转换到一个二次多项式,符号P2(R)表示定义在R上的2次多项式。现在问T可否对角化?(应该说明对于一个算子T而言,要利用定理5.9就必须要先求出它的矩阵表示。如果选择的基底不同,那么对应的矩阵表示其实也会不同,但是最终的特征多项式并不会有影响,所以其实对于算子而言,如果要检查其可否对角化,那么大可以随便选择一个基底来求其矩阵表示)
对于二次多项式来说,可以选择标准基底 β = {1, x, x2},然后求算子T的矩阵表达,则有
T(1) = 1, T(x) = 1+ x + x2, T(x2) = 1 + 2x2
然后把系数依次摆成矩阵就得到了T的一个矩阵表示法,即
在求出它的特征多项式为f(t) = (1-t)2(2-t), 于是可知当t=2时,am=gm=1,当t=1时,am=gm=2。所以根据Thm 5.9可知T是可对角线化的。
既然算子T是可以对角线化的。根据定义其实就表明可以找到一个基底r,使得T的矩阵表示[T]r是一个对角线矩阵。上面我们使用的标准基底β所对应的矩阵表示不是一个对角矩阵。那么下面我们想问,如何找出那样一个基底r ?
基本的找法可以总结为:由[T]β找Q,再找r。因为对于一个矩阵[T]β而言,说其实可以对角化的就意味着存在一个Q,使得Q-1[T]βQ=D,而D是一个对角线矩阵。根据定理5.1(3)可知首先要找的就是特征向量,然后由特征向量来把Q组出来。现在[T]β有两个特征值,当t=1时,其am=2,所以可以找出2个线性独立的特征向量,当t=2时,am=1,所以可以找出一个特征向量,用这三个向量就可以组成Q。
当t=1时,就要先求[T]β-tI的零空间,即解下面这个方程组
解得x2 + x3 = 0, 所以只有写出满足这个条件的两个线性独立的向量即可,例如(1, 0, 0)T和(0, -1, 1)T。
当t=2时,就要先求[T]β-tI的零空间,即解下面这个方程组
解得-x1 + x2 + x3 = 0, x2 = 0, 所以可以写出向量为(1, 0, 1)T。把这三个向量合起来就得到了Q,即
这也就得到了r = {1, -x + x2, 1+ x2},用这个基底再来写T的矩阵表示,就会得到一个对角线矩阵。
本文主要根据台湾交通大学开放课程线性代数(莊重 特聘教授主讲)之授课内容整理,并参考以下书籍:
【1】S.H. Friedberg, A.J. Insel, L.E Spence, 4th edition, Linear Algebra, Prentice-Hall, 2003
【2】David C. Lay. 刘深泉,等译. 线性代数及其应用(原书第3版),机械工业出版社,2005