线性代数笔记(5):矩阵的对角化

一、可对角化、特征值和特征向量的定义


Defs: 1) A linear operator T: V→Von a finite-dimensional vector space V is called diagonalizable if ∃ an ordered basis β s.t.[T]β is a diagonal matrix.

2) Let A  Mn×n(F), then A is said to be diagonalizable if Lis diagonalizable. Here LA: Fn→Fn, LA(x)=Ax, xF


Defs: 1) Let T be a linear operator on a vector space V. If a 非零元素 v V and a scalar λF s.t. T(v)=λv,
then λ is an eigenvalue(特征值) of T and v is its corresponding eigenvector(特征向量).

2) Let  Mn×n(F), if a 非零元素 v Fn and a scalar λF s.t. A(v)=λv, then λ is an eigenvalue of A and v is its associated eigenvectors. 


因为T是线性的,所以一个特征值所对应的特征向量有无穷多个,当我们找到一个特征向量,将其乘以一个非零的scalar,所得之结果仍为特征向量。


二、可对角化的充分必要条件


Thm5.1:

  1. A linear operator T on a finite-dimensional vector space V is diagonalizable an ordered basis β={v1, v2, ... , vn} for V, consisting of eigenvectors of T. In such case, let D=[T]β , then Djj is the eigenvalue corresponding to the
    eigenvector vj .
  2. Let  Mn×n(F), then A is diagonalizable an ordered basis β={v1, v2, ... , vn} for Fn with vj being eigenvalues.
  3. Assume T is diagonalizable. Let β' be be another ordered basis for V. Then . In particular, if T = LA and β' is the standard basis for Fn, then [T]β=Q-1AQ, where Q = (v1, v2, ... , vn).


三、特征值和特征向量的计算


Thm5.2 Let  Mn×n(F), Then λ is an eigenvalue of Adet(A-λI)=0.


Def:

  1. Let  Mn×n(F), Then f(λ) = det(A-λI) is called the characteristic polynomial (特征多项式) of A (eigenvalues 即是 A的特征多项式之零根).
  2. Let T be a linear operator on an n-dimensional vector space V with ordered basis β. We define the characteristic polynomial f(λ) of T to be the characteristic polynomial of A= [T]β. That is, f(λ) = det(A-λI).


Thm5.4 vV is an eigenvector of T corresponding to λ 非零元素 v 位于T -λI的零空间中,即 vN(T -λI) .


四、可对角化的充分条件


在Section2中,我们已经给出了可对角化的一个充要条件:一个线性算子(或一个矩阵)的特征值相对应的特征向量如果能构成向量空间的一个基底,那么这个线性算子(或矩阵)就是可对角化的。但是这个条件显然用起来并不那么方便,你要先算特征值,再计算对应的特征向量,然后还要检查特征向量是否线性独立。我们希望有一个更加简洁的条件来检验是否可对角化。为了得出这个更好用的条件,需要从下面这个Thm 5.5开始讨论。


Thm 5.5 Let 是 λT的特征值,vi是对应的特征向量。如果λi 各不相同,其中i = 1,2,...,k,那么{v1v2, ... , vk}是线性独立的。(Hint:证明的方法主要是数学归纳法,这里不做详述)


Remark:Thm 5.5的逆命题不成立。Thm 5.5说明一组各不相同的特征值所对应的特征向量彼此线性独立。但是如果有一组彼此线性独立的特征向量,其对应回去的特征值是否各不相同是无法保证的。

一个简单的反例就是单位矩阵,例如 I = {1 0; 0 1},当λ=1时,任何不为0的向量都是对应的特征向量,但这些彼此独立的特征向量对应的特征值都是1。


推论:Let dim(V) = n, and T: V→V是线性的,或者 Mn×n(F),如果T(或A)有n个不同的特征值, T(或A)是可对角线化的。

这个推论是很显然的,因为T(或A)有n个不同的特征值,根据Thm5.5,它就有n个线性独立的特征向量。而dim(V) = n,所以这n个线性独立的特征向量就构成了一组基底。再由Thm5.1就可以得出T(或A)可对角线化的结论。

当然,这个推论的逆命题仍然是不成立的,也就是说它不是可对角线化的充要条件。为了要得到一个更强的结论,我们还要讨论,如果特征多项式有重根,那么矩阵(或算子)还可以对角线化吗?


五、几个重要的定义


后面我们需要用到如下几个重要的定义。


Def 1: A polynomial f(t) in P(F) splits over F, if f(t) can be factored as a product of the first degree polynomials in P(F)。

F对于这个定义非常重要,必须要先指定。例如,F=R,那么(t2 + 1)(- 2) does not split over R. However, it does split over C。


Thm 5.6:T: FF,或 Mn×n(F),是可对角化的 ⇒ T(或A)的特征多项式splits over F。


Def 2: Let f(t) and λ 分别是T的特征多项式和特征值。那么λ 代数重数(algebraic multiplicity)是最大的正整数k for which (1-λ)k is the factor of f(t)。


Def 3: 我们把Eλ = {v∈V: T(v) = λv} = {v∈V: (T - λI)(v) = 0} 定义为的eigenspace。

也就是说Eλ 是个集合,这个集合收集了T的所有特征向量,以及零向量(把零向量也一同收进来的原因就在于使其形成一个子空间,这样才可以进一步去讨论维度的问题)。Remark: Eλ 是V的一个子空间。


既然Eλ 是V的一个子空间,那么就可以定义它的维度。于是又有了如下定义。

Def 4: 定义dim(Eλ) 是λ几何重数(geometric multiplicity),记为gm(λ)


例如:对于单位矩阵 I = {1 0; 0 1} M2×2(R),它的特征多项式 f(t) = det(I-tI)=(1-t)2 ,所以λ = 1的am=2。

另外,很容易发现任何二维向量都是2×2单位矩阵的特征向量(因为Ix=1x,x对于任意二维向量都成立),所以可以知道Eλ=1 = R2 ,即dim(Eλ=1)=2,所以λ = 1的gm=2。


关于am和gm有如下一些结论(它在证明Section 6中的定理时会被用到):

1)(Thm 5.7) 1 ≤ gm(λ≤ am(λ)

2)(Thm 5.8) Let λbe distinct eigenvalues of T, where i = 1, 2, ..., k. Let Sbe a finite 线性独立 subset of eigenspace Eλi. Then S = S1S2∪...S3 是线性独立的。

该定理的图形化解释如下图所示:

线性代数笔记(5):矩阵的对角化_第1张图片

六、可对角化的条件


我们希望有一个更加简洁的条件来检验是否可对角化。而且是充分必要的条件。下面这个定理表明在某些条件下,只要检查特征值的一些情况就可以判断对角化的情况。


线性代数笔记(5):矩阵的对角化_第2张图片

注意k可以是小于等于n的,所以其实这定理是允许有重根的情况。这个定理的详细证明可以参考文献【1】。下面来看几个例子。首先,请问下面这个矩阵A可以对角化吗?


为此要先来求它的特征多项式,即


可以看到它有两个不同的特征值,当λ = 4 am =1 ,而且根据Thm 5.7可知其gm =1。当 λ = 3 am =2 ,根据dimenstion theroy还可以算得此时gm = 1。由于定理的要求是所有的几何重数都等于代数重数,显然这里无法满足,所以矩阵A是不能对角化的。


再来看一个算子的例子。T : P2(R)P2(R), T(f(x))=f(1)+f'(0)x+(f'(0)+f''(0))x2.

P2(R)P2(R)表示线性算子T的作用是把一个二次多项式转换到一个二次多项式,符号P2(R)表示定义在R上的2次多项式。现在问T可否对角化?(应该说明对于一个算子T而言,要利用定理5.9就必须要先求出它的矩阵表示。如果选择的基底不同,那么对应的矩阵表示其实也会不同,但是最终的特征多项式并不会有影响,所以其实对于算子而言,如果要检查其可否对角化,那么大可以随便选择一个基底来求其矩阵表示)

对于二次多项式来说,可以选择标准基底 β = {1, x, x2},然后求算子T的矩阵表达,则有

T(1) = 1, T(x) = 1+ x + x2, T(x2) = 1 + 2x2

然后把系数依次摆成矩阵就得到了T的一个矩阵表示法,即

线性代数笔记(5):矩阵的对角化_第3张图片

在求出它的特征多项式为f(t) = (1-t)2(2-t), 于是可知当t=2时,am=gm=1,当t=1时,am=gm=2。所以根据Thm 5.9可知T是可对角线化的。


既然算子T是可以对角线化的。根据定义其实就表明可以找到一个基底r,使得T的矩阵表示[T]r是一个对角线矩阵。上面我们使用的标准基底β所对应的矩阵表示不是一个对角矩阵。那么下面我们想问,如何找出那样一个基底r


基本的找法可以总结为:由[T]β找Q,再找r。因为对于一个矩阵[T]β而言,说其实可以对角化的就意味着存在一个Q,使得Q-1[T]βQ=D,而D是一个对角线矩阵。根据定理5.1(3)可知首先要找的就是特征向量,然后由特征向量来把Q组出来。现在[T]β有两个特征值,当t=1时,其am=2,所以可以找出2个线性独立的特征向量,当t=2时,am=1,所以可以找出一个特征向量,用这三个向量就可以组成Q。


当t=1时,就要先求[T]β-tI的零空间,即解下面这个方程组

线性代数笔记(5):矩阵的对角化_第4张图片

解得x2 + x3 = 0, 所以只有写出满足这个条件的两个线性独立的向量即可,例如(1, 0, 0)T和(0, -1, 1)T

当t=2时,就要先求[T]β-tI的零空间,即解下面这个方程组

线性代数笔记(5):矩阵的对角化_第5张图片

解得-x1 + x2 + x3 = 0, x2 = 0, 所以可以写出向量为(1, 0, 1)T。把这三个向量合起来就得到了Q,即

线性代数笔记(5):矩阵的对角化_第6张图片

这也就得到了r = {1,  -x + x2, 1+ x2},用这个基底再来写T的矩阵表示,就会得到一个对角线矩阵。


本文主要根据台湾交通大学开放课程线性代数(莊重 特聘教授主讲)之授课内容整理,并参考以下书籍:

【1】S.H. Friedberg, A.J. Insel, L.E Spence, 4th edition, Linear Algebra, Prentice-Hall, 2003

【2】David C. Lay. 刘深泉,等译. 线性代数及其应用(原书第3版),机械工业出版社,2005

你可能感兴趣的:(线性代数与概率统计)