特征基和相似对角化

一、特征基

这里谈谈对特征基的简单描述,详细定义请参考正规教材。

特征基和特征向量密不可分,  假设我们有一个矩阵,记做A矩阵,A矩阵可以理解为一种线性变换,A矩阵的每一列可以看做是变换后的基向量的坐标(详见https://blog.csdn.net/xiaoyink/article/details/90705106),特征基顾名思义,用特征向量作为基向量,构建坐标系;特征基矩阵可以理解为 用矩阵A的特征向量作为基向量,构建新的坐标系,在新的坐标系中表示A矩阵(变换),所得到的新矩阵,即特征基 矩阵 和 A矩阵 表示的是同一个变换,只不过他们是在不同坐标系中对同一个变换的不同描述而已,  并且特征基 矩阵 一定是对角阵。

        这里简单说明一下原因,下面会有详细说明,无论是什么矩阵所表示的变换 对 矩阵的特征向量 都只有伸缩作用,不能改变方向,特征基 矩阵也不例外,恰好特征基矩阵的 特征向量正好也是基向量,那么可以这么说,特征基矩阵对其坐标系的每个维度的基向量只有缩放作用,所以其肯定是对角阵,或者我们用 I 表示特征基矩阵,那么I E 表示 I 矩阵对每个维度的基向量进行变换,有上述知I E为对角阵, 又由于E为单位阵 ,即I 为对角阵,即特征基矩阵一定为对角阵

下面我们用具体的矩阵来进行举例说明:

        设A为,其两个线性无关的特征向量为    作为基向量,构建新的坐标系,在新的坐标系中A矩阵对应的变换如何表示,我们构建新的矩阵P,矩阵P,矩阵P以及其逆矩阵 可以在两个坐标系之间切换,A变换在以为基向量的新坐标系中如何表示? 我们可以用表示,如下:

                                                 

为什么呢? 假设我们只知道向量α在坐标系中的坐标,向量α在经过A变换后为何向量?

由于为坐标系中的坐标,而A矩阵为A变换在中的表述,所以坐标系不同,不能直接用A乘以α得到结果,正确的步骤如下:

Pα  得到α向量在中的坐标

APα 得到α向量经过A变换后在中的坐标

 得到α向量经过A变换后在中的坐标

A变换在中的表述为 ,根据上述条件是特征基矩阵(这段涉及基变换的内容可以参考视频https://www.bilibili.com/video/av6731067/?p=13),所以我们可以根据普通矩阵,通过求其特征向量来构造P矩阵,通过来求其,特征基矩阵,从而将其相似对角化。

提供另一种思考方式,我们不用引入α向量,  证明A变换在构成的坐标系中的表述为

β表示基向量,用β2表示基向量,则P矩阵可以写成

下面我们来思考  A变换 在  某一坐标系中的 矩阵表述 的实际意义是什么,我直接说结论:

     经过A变换之后,坐标系的所有基向量的新坐标,构成一个矩阵,此矩阵就是A变换在  此坐标系中的表述。

那么A变换,在以P矩阵列向量作为基向量的坐标系中的表述,可以分布理解,AP 的意义就是,P矩阵列向量经过A变换后的坐标,即基向量经过A变换后的坐标 构成的矩阵, 但是这个坐标是在坐标系中的,再将这个矩阵转换成在P矩阵列向量作为基向量所形成的坐标系中的坐标,即,即A变换在中的表述为 。

二、相似对角化

 

在上述步骤中,我们求得了A矩阵的特征基矩阵,  那么我们只需要证明特征基矩阵一定是对角阵即可,即可说明通过求矩阵的特征向量将其相似对角化这一方式可行。

矩阵和A矩阵为同一变换在不同坐标系中的两种表述,其实质是一样的,即变换的效果是一样的,其实上述过程中我们已经文字说明为什么特征基矩阵一定是对角阵,下面我们通过公式计算的方式来证明:

其中P矩阵可以拆成A矩阵的特征向量(列向量),所以

 

其中A矩阵的特征值,乘以P矩阵的每一个列向量得到的坐标系每个维度的单位向量,即

所以,特征基矩阵一定是对角阵。

注:特征基矩阵是我自己的业余叫法,我的本意是  以 矩阵的特征向量为 新的基向量 构建新的坐标系, 原来矩阵所对应的的线性变换,在新的坐标系中 的表述 为一个新的矩阵,这个新的矩阵我称之为特征基矩阵。

其他的结论:

n维矩阵能够相似对角化,则其肯定有n个线性无关的特征向量(充分必要条件)

n维矩阵有n个不同的特征值,则 其肯定可以相似对角化(充分不必要条件)

应用:

通过相似对角化,可以简化矩阵的n次幂的计算,另外相似对角化 在 二次型中也有应用。

 

你可能感兴趣的:(数学)