线性回归以及最小二乘法的应用

目录

1. 最小二乘法

1.1 定义

1.2 解法

2. 一元线性回归

3. 多元线性回归


1. 最小二乘法

1.1 定义

最小二乘法(又称最小平方法)是一种数学化技。它通最小化差的平方和找数据的最佳函数匹配。利用最小二乘法可以便地求得未知的数据,并使得些求得的数据与实际数据之间误差的平方和最小。

有效的最小二乘法是勒德在 1805 表的,基本思想就是认为测量中有差,所以所有方程的累积误

                                                                  

 

用函数表示

                                                                  

观察值与实际真实值的差量平方和达到最小以寻求估计值的方法,就叫做最小二乘法,用最小二乘法得到的估计,叫做最小二乘估计。当然,取平方和作为目标函数只是众多可取的方法之一。

1.2 解法

为了求出这个二次函数的最小值,对其进行求导,导数为0的时候取得最小值

                                                         

 

由此推导

                                                    

 

勒让德在文中最小二乘法的良性做了几点明:

  • 最小二乘使得差平方和最小,并在各个方程的差之建立了一种平衡,从而防止某一个极端差取得支配地位。

  • 计算中只要求偏导后求解线性方程组,计算过程明确便捷。

  • 最小二乘可以出算平均计值(如上述证明)。

由于算平均是一个历经的方法,而以上的推理明,算平均是最小二乘的一个特例,所以从另一个角度明了最小二乘方法的良性,使我们对最小二乘法更加有信心。

 

2. 一元线性回归

分析中,如果只包括一个自量和一个因量,且二者的关系可用一条直线近似表示,种回分析称一元线性回分析。

对于一元线性回归模型, 体中取了n组观察值 , 对于平面中的这n个点,在简单线回归问题中,模型就是我们的直线方程:y = ax + b。

选择最佳拟合曲线的标准可以确定为:使总的拟合误差(即总残差)达到最小。有以下三个标准可以选择:        

  • 残差和最小确定直线位置是一个途径。但很快发现计算残差和存在相互抵消的问题

  • 残差绝对值和最小确定直线位置也是一个途径。但绝对值算比

  • 最小二乘法的原是以残差平方和最小确定直线位置。用最小二乘法除了算比方便外,得到的估具有良特性。种方法异常非常敏感。 

最常用的是普通最小二乘法(Ordinary  Least SquareOLS):所选择的回模型应该使所有的残差平方和达到最小,即采用平方失函数。 

                                                                                    

通过ϵ 对a,b求偏导 对a,b求偏导:

                                                 

 

3. 多元线性回归

 如果回分析中包括两个或两个以上的自量,且因量和自量之线性关系,多元线性回分析。

对于二维空间线性是一条直线;对于三维空间线性是一个平面,对于多维空间线性是一个超平面。方程模型为 y = Xb ∙θ

求解思路也与简单线性回归非常一致,目标同样是:已知训练数据样本x,y,找到 θ=θ0θ1 ,…, θn , 尽可能小。

推导出可以得到多元线性回归的正规方程解:

                                                                           

下一节将介绍用梯度下降法来解该方程。

你可能感兴趣的:(AI,最小二乘法)