线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系

本文主要围绕以下定理,并对相关知识点做回顾和扩充。

定理:\lambda _{1},...,\lambda _{n}(实数或者复数,可以重复)是n阶方阵A=[a_{ij}]n个特征值,即\left | A-\lambda E \right |=(\lambda -\lambda _{1})(\lambda -\lambda _{2})...(\lambda -\lambda _{n})=0,则

\sum^{n}_{i=1}\lambda _{i}=tr(A)=\sum^{n}_{i=1}a_{ii}\prod ^{n}_{i=1}\lambda _{i}=det(A)=\left | A \right |

通俗描述即为:矩阵的特征值之和等于矩阵的迹,矩阵的特征值之积等于矩阵的行列式。

以下分为五个部分介绍:

  • 韦达定理
  • 矩阵行列式
  • 矩阵的迹
  • 矩阵的特征值及特征向量
  • 解释矩阵的特征值之和等于矩阵的迹,之积等于矩阵的行列式

一、韦达定理

韦达定理说明了一元二次方程中根和系数之间的关系。

1、一元二次方程

对于一元二次方程ax^{2}+bx+c=0a\neq 0\Delta =b^{2}-4ac\geq 0),设两个根为x_{1}x_{2}

则:x_{1},x_{2}=\frac{-b\pm \sqrt{b^{2}-4ac}}{2a}

且易得到:x_{1}+x_{2}=-\frac{b}{a}x_{1}\cdot x_{2}=\frac{c}{a}

以上定理交代了两根之和(积)与方程系数的关系。

2、一元三次方程

对于一元三次方程ax^{3}+bx^{2}+cx+d=0,设三个根为x_{1}x_{2}x_{3}

易得到:x_{1}+x_{2}+x_{3}=-\frac{b}{a}x_{1}\cdot x_{2}\cdot x_{3}=-\frac{d}{a}

3、一元多次方程

推广定理:韦达定理不仅可以说明一元二次方程根与系数的关系,还可以推广说明一元n次方程根与系数的关系。

设复系数一元n次方程b_{n}x^{n}+b_{n-1}x^{n-1}+...+b_{1}x+b_{0}=\sum^{n}_{i=1}b_{i}x^{i}+b_{0}=0,其中b_{i}代表第i次项的系数,b_{0}代表常数项。

x_{1}+x_{1}+...+x_{n}=\sum^{n}_{i=1}x_{i}=-\frac{b_{n-1}}{b_{n}}x_{1}x_{2}...x{n}=\prod ^{n}_{i=1}x_{i}=(-1)^{n}\frac{b_{0}}{b_{n}}

即:所有根之和为(n-1)次项系数与n次项系数之比的相反数,所有根之积为常数项与n次项系数之比再乘以(-1)^{n}

注:该推广形式的证明一般无法根据求根公式进行,因为5次以上的一元方程没有求根公式。证明步骤较繁琐,是通过将左边的多项式因式分解成a_{n}(x-x_{1})(x-x{2})...(x-x_{n})之后,再去括号,比较相同次数的项的系数从而得出结论。这个方法具有普遍性,即使是有求根公式的方程,亦可以通过该方法证明韦达定理,而无需借助求根公式。

二、矩阵行列式

1、矩阵行列式的基本介绍

一个n\times n的方阵A的行列式记为det(A)或者|A|,一个2×2矩阵的行列式可表示如下:

det\begin{pmatrix} a &b \\ c &d \end{pmatrix}=ad-bc

把一个n阶行列式中的元素a_{ij}所在的第i行和第j列划去后,留下来的n-1阶行列式叫做元素a_{ij}余子式,记作M_{ij}。记A_{ij}=(-1)^{i+j}M_{ij},叫做元素a_{ij}代数余子式。例如:

A=\begin{vmatrix} a_{11} & a_{12} & a_{13} & a_{14} \\ a_{21} & a_{22} & a_{23} &a_{24} \\ a_{31} & a_{32} &a_{33} &a_{34} \\ a_{41} & a_{42} &a_{43} &a_{44} \end{vmatrix}M_{23}=\begin{vmatrix} a_{11} & a_{12} & a_{14} \\ a_{31} & a_{32} &a_{34} \\ a_{41} & a_{42} &a_{44} \end{vmatrix}A_{23}=(-1)^{2+3}M_{23}=-M_{23}

注意:余子式和代数余子式是行列式中才有的概念。如上所示,此时的A代表行列式,M_{23}代表元素a_{23}的余子式,A_{23}代表元素a_{23}的D代数余子式。

命题:n阶行列式det(A)等于它的任一行(列)的所有元素与其对应的代数余子式的乘积之和:

det(A)=\left | A \right |=a_{i1}A_{i1}+a_{i2}A_{i2}+...+a_{in}A_{in}=\sum ^{n}_{j=1}a_{ij}(-1)^{i+j}M_{ij}(其中,i可以取任意的行号1,2,3,...,n)

det(A)=\left | A \right |=a_{1j}A_{1j}+a_{2j}A_{2j}+...+a_{nj}A_{nj}=\sum ^{n}_{i=1}a_{ij}(-1)^{i+j}M_{ij}(其中,j可以取任意的列号1,2,3,...,n)

2、矩阵行列式的几何理解

一句话概括之,行列式的本质就是线性变换的放大率(伸缩因子)。

几何理解:A表示n维空间到n维空间的线性变换,假想原来空间中有一个n维的“立方体”(任意形状),其中“立方体”内的每一个点都经过这个线性变换,变成n维空间中的一个新立方体,设原立方体的体积为V_{1},新立方体的体积为V_{2},行列式det(A)=\frac{V_{2}}{V_{1}}

1)线性变换

理解行列式之前,需要先理解线性变换。

线性代数中的线性变换:转换矩阵A=\begin{pmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{pmatrix}乘以向量\overrightarrow{v}=\begin{pmatrix} v_{1}\\ v_{2} \end{pmatrix}就是对其进行了线性变换,从而得到转换之后的向量\overrightarrow{{v}'}=A\overrightarrow{v}=\begin{pmatrix} a_{11}v_{1}+a_{12}v_{2}\\ a_{21}v_{1}+a_{22}v_{2} \end{pmatrix}

线性变化中的“”线性”二字,也就是原来的一条直线,在变换了之后还应该是直线。

任何一个空间都可以由一组基构成,也就是说,这个空间上的任何一个点(向量)都可以由这组基以线性组合的形式得到。

如下图,\overrightarrow{v}=\begin{pmatrix} v_{1}\\ v_{2} \end{pmatrix}也可以写作v_{1}\overrightarrow{i}+v_{2}\overrightarrow{j}\overrightarrow{i}\overrightarrow{j}为基向量,\overrightarrow{i}=\begin{pmatrix} 1\\ 0 \end{pmatrix}\overrightarrow{j}=\begin{pmatrix} 0\\ 1 \end{pmatrix}

线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系_第1张图片

假设我们有原向量\overrightarrow{v}=\begin{pmatrix} 2\\ 3 \end{pmatrix},变换(旋转)矩阵A=\begin{pmatrix} cos(90^{\circ}) &-sin(90^{\circ}) \\ sin(90^{\circ}) & cos(90^{\circ}) \end{pmatrix}=\begin{pmatrix} 0 &-1\\ 1 & 0 \end{pmatrix},从而得到转换之后的向量\overrightarrow{{v}'}=A\overrightarrow{v}=\begin{pmatrix} 0 &-1\\ 1 & 0 \end{pmatrix}\begin{pmatrix} 2\\ 3 \end{pmatrix}=\begin{pmatrix} 0\times 2-1\times 3\\ 1\times 2+0\times3 \end{pmatrix}=\begin{pmatrix} -3\\ 2 \end{pmatrix}

从基向量的角度解释:矩阵A对向量\overrightarrow{v}的变换,其实是施加在其基底上的变换,而新的向量\overrightarrow{{v}'}关于新的基底(\overrightarrow{{i}'},\overrightarrow{{j}'})的线性组合,与原来的向量\overrightarrow{v}是关于基底(\overrightarrow{i},\overrightarrow{j})的线性组合是一样的。\overrightarrow{i}=\begin{pmatrix} 1\\ 0 \end{pmatrix}\overrightarrow{j}=\begin{pmatrix} 0\\ 1 \end{pmatrix}\overrightarrow{v}=\begin{pmatrix} 2\\ 3 \end{pmatrix}=2\overrightarrow{i}+3\overrightarrow{j}=2\begin{pmatrix} 1\\ 0\end{pmatrix}+3\begin{pmatrix} 0\\ 1\end{pmatrix},线性组合系数为(2,3),\overrightarrow{i}=\begin{pmatrix} 1\\ 0 \end{pmatrix}\overrightarrow{j}=\begin{pmatrix} 0\\ 1 \end{pmatrix}经过矩阵A的线性变换之后变成新的基底\overrightarrow{{i}'}=A\overrightarrow{i}=\begin{pmatrix} 0 &-1\\ 1 & 0 \end{pmatrix}\begin{pmatrix} 1\\ 0 \end{pmatrix}=\begin{pmatrix} 0\\1 \end{pmatrix}\overrightarrow{{j}'}=A\overrightarrow{j}=\begin{pmatrix} 0 &-1\\ 1 & 0 \end{pmatrix}\begin{pmatrix} 0\\ 1 \end{pmatrix}=\begin{pmatrix} -1\\0\end{pmatrix},新向量\overrightarrow{{v}'}=2\overrightarrow{{i}'}+3\overrightarrow{{j}'}=2\begin{pmatrix} 0\\ 1\end{pmatrix}+3\begin{pmatrix} -1\\ 0\end{pmatrix}=\begin{pmatrix} -3\\ 2\end{pmatrix}线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系_第2张图片

注意:关于旋转矩阵的由来及推导可见《线性代数——线性变换——旋转矩阵(泰勒公式、虚数、欧拉公式)》 

所以我们说,一个向量,在经过一个矩阵A的变换之后,改变的是组成向量的基,而这个向量关于基的线性组合方式是没有变化的。

换句话说,对于一个线性变换,我们只需要跟踪其基在变换前后的变化,便可以掌握整个空间的变化。而矩阵A的列其实与变换后新的基底之间有着某些联系,也就是说,新的基底其实就是矩阵A的列向量的线性组合\overrightarrow{{i}'}=A\overrightarrow{i}=\begin{pmatrix} 0 &-1\\ 1 & 0 \end{pmatrix}\begin{pmatrix} 1\\ 0 \end{pmatrix}=1A_{1}+0A_{2}=1\begin{pmatrix} 0\\ 1 \end{pmatrix}+0\begin{pmatrix} -1\\ 0 \end{pmatrix},其中A_{1},A_{2}A的列。

以上的图形展现的是“旋转”的线性变化,其本质是改变组成向量的基。接下来我们“推移”是怎么改变基的,如下图。

线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系_第3张图片

推移矩阵把\overrightarrow{v}推移到\overrightarrow{{v}'}实际上也是改变了\overrightarrow{v}的基底(\overrightarrow{i},\overrightarrow{j})

有原向量\overrightarrow{v}=\begin{pmatrix} 2\\ 3 \end{pmatrix},变换(推移)矩阵A=\begin{pmatrix} 1 & -\frac{4}{3}\\ 0 & 1 \end{pmatrix},从而得到转换之后的向量\overrightarrow{{v}'}=A\overrightarrow{v}=\begin{pmatrix} 1 &-\frac{4}{3}\\ 0 & 1 \end{pmatrix}\begin{pmatrix} 2\\ 3 \end{pmatrix}=\begin{pmatrix} 1\times 2-\frac{4}{3}\times 3\\ 0\times 2+1\times3 \end{pmatrix}=\begin{pmatrix} -2\\ 3\end{pmatrix}

从基向量的角度解释:设\overrightarrow{i}=\begin{pmatrix} 1\\ 0 \end{pmatrix}\overrightarrow{j}=\begin{pmatrix} 0\\ 1 \end{pmatrix}\overrightarrow{v}=\begin{pmatrix} 2\\ 3 \end{pmatrix}=2\overrightarrow{i}+3\overrightarrow{j}=2\begin{pmatrix} 1\\ 0\end{pmatrix}+3\begin{pmatrix} 0\\ 1\end{pmatrix},线性组合系数为(2,3);\overrightarrow{i}=\begin{pmatrix} 1\\ 0 \end{pmatrix}\overrightarrow{j}=\begin{pmatrix} 0\\ 1 \end{pmatrix}经过矩阵A的线性变换之后变成新的基底\overrightarrow{{i}'}=A\overrightarrow{i}=\begin{pmatrix} 1 & -\frac{4}{3}\\ 0 & 1 \end{pmatrix}\begin{pmatrix} 1\\ 0 \end{pmatrix}=\begin{pmatrix}1\\0\end{pmatrix}\overrightarrow{{j}'}=A\overrightarrow{j}=\begin{pmatrix} 1 & -\frac{4}{3}\\ 0 & 1 \end{pmatrix}\begin{pmatrix} 0\\ 1 \end{pmatrix}=\begin{pmatrix} -\frac{4}{3}\\1\end{pmatrix},新向量\overrightarrow{{v}'}=2\overrightarrow{{i}'}+3\overrightarrow{{j}'}=2\begin{pmatrix} 1\\ 0\end{pmatrix}+3\begin{pmatrix} -\frac{4}{3}\\ 1\end{pmatrix}=\begin{pmatrix} -2\\ 3\end{pmatrix}

2)行列式的几何理解

以上面的旋转矩阵A=\begin{pmatrix} cos\theta &-sin\theta \\ sin\theta& cos\theta \end{pmatrix}为例,我们对其求行列式\left | A \right |=\begin{vmatrix} cos\theta &-sin\theta \\ sin\theta& cos\theta \end{vmatrix}=cos^{2}\theta +sin^{2}\theta=1,意味旋转矩阵的行列式恒等于1,且不改变面积(或体积),如下图二维平面的旋转展示。

线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系_第4张图片

 即和上面的结论相符:行列式是线性变换的伸缩因子。

且我们容易得到:

  • det(A)> 1,对图形起到放大作用;

  • det(A)= 1,图形大小没有变化;

  • 0< det(A)< 1,对图形起到缩小作用;

  • det(A)=0,矩阵不可逆。

  • det(A)< 0,改变了基的“左右手法则”。线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系_第5张图片

3)行列式的性质

由上面我们已经知道,行列式是线性变换的伸缩因子,所以很容易得到:

det(AB)=det(A)\times det(B)=det(BA)

从“体积”的角度理解为:两次对“体积”的缩放效果是累积的,且和两次操作次序无关。

4)“矩阵A可逆” 完全等价于 “det(A)\neq 0

公式推导

由上面我们已知:det(AB)=det(A)\times det(B)=det(BA)

且有逆矩阵的性质:AA^{-1}=EE为单位矩阵)

结合可得:det(AA^{-1})=det(A)\times det(A^{-1})=det(E)=1

如果det(A)=0,则det(A^{-1})=\frac{1}{0},无意义,即det(A^{-1})不存在,即矩阵A不可逆。

几何理解

det(A)=0可以理解为线性变换矩阵An维立方体给拍扁了(原来n维变成了n-1维或n-2维,....),例如把3维立方体拍成2维的纸片,纸片体积多少呢?当然是 0 啦!

注意:这里说的体积都是针对n维空间而言的,det(A)=0就表示新的立方体在n维空间体积为0,但是可能在n-1维还是有体积的,只是在n维空间的标准下为0而已。好比一张纸片,“2维体积”也就是面积可以不为0,但是“3维体积”是0。

所以凡是det(A)=0的矩阵A都是不可逆的,因为这样的变换以后就再也找不到一个矩阵将其变换回去,这样的矩阵必然是没有逆矩阵A^{-1}的。

详细可参考:

https://www.matongxue.com/madocs/247.html

https://www.zhihu.com/collection/200330229

三、矩阵的迹

1、矩阵的迹的基本介绍

在线性代数中,一个n\times n矩阵A的主对角线(从左上方至右下方的对角线)上各个元素的总和被称为矩阵A的迹(或迹数),一般记作tr(A)tr(A)=\sum^{n}_{i=1}a_{ii}

四、矩阵的特征值及特征向量

1、矩阵的特征值、特征向量的基本介绍

以下知识点来自吴传生主编的《线性代数》

1)特征值、特征向量

An阶方阵,如果标量\lambdan维非零列向量x使关系式Ax=\lambda x成立,则称\lambda是方阵A的特征值,非零列向量x称为A的对应于特征值\lambda的特征向量。Ax=\lambda x可改写为(A-\lambda E)x=0

这是n个未知数n个方程的齐次线性方程组,它有非零解的充要条件是\left | A-\lambda E \right |=0,即

\begin{vmatrix} a_{11}-\lambda & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ .& .& .&. \\ .& .& .&. \\ .& .& .&. \\ a_{n1}& a_{n2} & ... & a_{nn}-\lambda \end{vmatrix}=0

2)特征值、特征向量的求解

求n阶方阵的特征值和特征向量的步骤如下:

  • 求出n阶方阵A的特征多项式\left | A-\lambda E \right |

  • 求出特征方程\left | A-\lambda E \right |=0的全部根,\lambda _{1}\lambda _{2},......,\lambda _{n},即为A的特征值。

  • 把每个特征值\lambda _{i}代入线性方程组( A-\lambda E)x=0,求出基础解系,就是A对应于\lambda _{i}的特征向量,基础解析的线性组合(零向量外)就是A对应于\lambda _{i}的全部特征向量。

3)特征值、特征向量的几何解释

上面我们提到,线性变换其实是施加在其基底上的变换,在以\overrightarrow{i},\overrightarrow{j}为基底的二维空间中,向量\overrightarrow{v}经过矩阵A变换,变成A\overrightarrow{v},可以观察到,调整后\overrightarrow{v}A\overrightarrow{v}在同一条直线上,但是A\overrightarrow{v}相对于\overrightarrow{v}延长了。

此时,我们就称\overrightarrow{v}A的特征向量,而A\overrightarrow{v}的长度是\overrightarrow{v}的长度的\lambda倍,\lambda就是特征值。

所以A\overrightarrow{v}=\lambda \overrightarrow{v}可以理解为,\overrightarrow{v}A的作用下,保持方向不变进行比例为\lambda的伸缩。

如果把矩阵看作是运动,则特征值就是运动的速度,特征向量就是运动的方向。

线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系_第6张图片

五、解释矩阵的特征值之和等于矩阵的迹,之积等于矩阵的行列式

1、矩阵的特征值之和等于矩阵的迹

已知求n阶方阵的特征值,即求n阶方阵A的特征多项式\left | A-\lambda E \right |=0的全部根,即求

\begin{vmatrix} a_{11}-\lambda & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ .& .& .&. \\ .& .& .&. \\ .& .& .&. \\ a_{n1}& a_{n2} & ... & a_{nn}-\lambda \end{vmatrix}=0的所有\lambda

由韦达定理可知:设\begin{vmatrix} a_{11}-\lambda & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ .& .& .&. \\ .& .& .&. \\ .& .& .&. \\ a_{n1}& a_{n2} & ... & a_{nn}-\lambda \end{vmatrix}=b_{n}\lambda ^{n}+b_{n-1}\lambda ^{n-1}+...+b_{1}\lambda +b_{0}=0,其中b_{i}代表第i次项的系数,b_{0}代表常数项。则\lambda _{1}+\lambda _{1}+...+\lambda _{n}=\sum^{n}_{i=1}\lambda _{i}=-\frac{b_{n-1}}{b_{n}},其中,b^{n}\lambda^{n}的系数等于(-1)^{n}(当n为奇数时等于-1,偶数时为1);b^{n-1}\lambda^{n-1}的系数,除了主对角元的乘积(a_{11}-\lambda )(a_{22}-\lambda )...(a_{nn}-\lambda )的展开项之外,其他展开项的次数都小于n-1,因此n-1次项的系数b^{n-1}就是 (a_{11}-\lambda )(a_{22}-\lambda )...(a_{nn}-\lambda )\lambda ^{n-1}的系数,等于(-1)^{n}(a_{11}+a_{22}+...a_{nn})(当n为奇数时为负,偶数时为正),则\lambda _{1}+\lambda _{1}+...+\lambda _{n}=\sum^{n}_{i=1}\lambda _{i}=-\frac{b_{n-1}}{b_{n}}=\frac{(-1)^{n}(a_{11}+a_{22}+...a_{nn})}{(-1)^{n}}=tr(A),即矩阵的特征值之和等于矩阵的迹。

2、矩阵的特征值之积等于矩阵的行列式

1)代数理解

同样根据韦达定理可知,\lambda _{1}\lambda _{2}...\lambda {n}=\prod ^{n}_{i=1}\lambda _{i}=(-1)^{n}\frac{b_{0}}{b_{n}},其中,b^{n}\lambda^{n}的系数等于(-1)^{n}(当n为奇数时等于-1,偶数时为1),则可化简为\lambda _{1}\lambda _{2}...\lambda {n}=\prod ^{n}_{i=1}\lambda _{i}=\frac{(-1)^{n}b_{0}}{(-1)^{n}}=b_{0},已知特征多项式\begin{vmatrix} a_{11}-\lambda & a_{12} & ... & a_{1n} \\ a_{21} & a_{22}-\lambda & ... & a_{2n} \\ .& .& .&. \\ .& .& .&. \\ .& .& .&. \\ a_{n1}& a_{n2} & ... & a_{nn}-\lambda \end{vmatrix}=b_{n}\lambda ^{n}+b_{n-1}\lambda ^{n-1}+...+b_{1}\lambda +b_{0},我们令\lambda=0,求得线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系_第7张图片b_{0}代表n阶方阵A的行列式,即\lambda _{1}\lambda _{2}...\lambda {n}=\prod ^{n}_{i=1}\lambda _{i}=\frac{(-1)^{n}b_{0}}{(-1)^{n}}=b_{0}=det(A)矩阵的特征值之积等于矩阵的行列式。

2)几何理解

特征值,理解为通过变换改变了观察者视角,由特征向量产生新的正交基,每个特征值对应着特征向量所在方向上的缩放系数,

行列式,理解为有向体积的缩放系数。

特征值在每个维度上缩放系数之乘积就是总的有向体积缩放系数。

如下图所示,原来的长方体体积V=a\cdot b\cdot c,缩放之后的长方体体积等于。{V}'=\lambda_{1} a\cdot \lambda_{2} b\cdot \lambda_{3} c=(\lambda_{1} \cdot \lambda_{2} \cdot \lambda_{3})\cdot (a\cdot b\cdot c)=(\lambda_{1} \cdot \lambda_{2} \cdot \lambda_{3})V

线性代数——韦达定理、矩阵行列式、矩阵的迹、矩阵特征值及关系_第8张图片

 

 

 

 

 

 

 

 

你可能感兴趣的:(线性代数,多元统计分析)