数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解

举一个多元线性回归的例子:

假设x_1,x_2,...,x_N都为n维的行向量,N表示样本个数,y为实数。

则得到到,其中,x_{1n}为向量x_1中的n个值;a_1,a_2,a_3,...,a_n就是要估计的参数。

数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第1张图片

 将上式写成矩阵的形式就是

数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第2张图片

我们的目的就是要解出参数a的列向量,则通过下式即可解出a向量。

数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第3张图片

但是通常情况下样本量N并不等于每个样本的维度n,N\neq n

则求Xa-Y的最小值 

对a求偏导,导数等于0处去最小值

【置于为什么求偏导后的式子是这样的,我放到了最后说明,该结论记住即可】

移项得

那么X^TX是否可逆呢?如果可逆,就可以通过a=(X^TX)^{-1}(X^TY)求得a向量。

下面判断X^TX是否可逆,当N\neq n时,有两种情况,N>n 和 N

①N>n

其中,X_{5\times 3}X^T_{3\times 5},则X^TX_{3\times 3}

 数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第4张图片

 这个就是伪逆矩阵,当X可逆时,它就是逆矩阵。

伪逆矩阵对应的解法叫做最小二乘解。 

②N

 其中,X_{3\times 5}X^T_{5\times 3},则X^TX_{5\times 5}

 数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第5张图片

 注意:

 此时X^TX不可逆该怎么办呢?

我们就需要在后面加入一个正则项

为什么要加入正则项呢?针对N最小范数解)

对a求偏导得到

移项:数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第6张图片

为什么(X^TX+\lambda I)必为可逆呢?\lambda I 肯定是可逆的,故加上X^TX(半正定矩阵,上一章证明过)也是可逆的。

证明一下:

数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第7张图片

 其中a^T,a是试探向量,故a^Ta> 0,所以2式为是正定的,非半正定。

 这个公式叫做岭回归,在对角线上加入了 λ,就像山岭一样。

 对矩阵求偏导:数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第8张图片

 数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第9张图片 数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第10张图片

数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第11张图片

 数学基础(二)逆矩阵、伪逆矩阵、最小二乘解、最小范数解_第12张图片

更多请参考:矩阵求导、几种重要的矩阵及常用的矩阵求导公式_~青萍之末~的博客-CSDN博客_矩阵求导公式大全

你可能感兴趣的:(机器学习,矩阵,线性代数,numpy)