线性回归2-正交回归(使用点到直线的距离公式)

文章目录

  • 另一种推导方法-点到直线的距离公式
    • 目标函数
    • 推导过程
      • 目标函数$\bm{J}_2$对$b$求导:
      • 目标函数$\bm{J}_2$对$a$求导:

另一种推导方法-点到直线的距离公式

从几何意义上理解正交回归,就是找一条直线,使得点到直线的距离平方之和最小。所以如果用点到直线的距离公式当做目标函数,最后拟合的结果应该与正交回归得出的结果相同。下面继续推导,做一下验证。

目标函数

同样假设直线方程为 y = a x + b y=ax+b y=ax+b,则点 ( x i , y i ) (x_i,y_i) (xi,yi)到直线的距离为:
d i = ∣ a x i − y + b ∣ a 2 + 1 d_i=\dfrac{|ax_i-y+b|}{\sqrt{a^2+1}} di=a2+1 axiy+b
这时,目标函数可以写成:
J 2 = ∑ d i 2 = ∑ ( a x i − y + b ) 2 a 2 + 1 \bm{J}_2=\sum d_i^2=\sum\dfrac{(ax_i-y+b)^2}{a^2+1} J2=di2=a2+1(axiy+b)2

推导过程

目标函数 J 2 \bm{J}_2 J2 b b b求导:

∂ J 2 ∂ b = 1 a 2 + 1 ∑ ( 2 b + 2 a x i − 2 y i ) \dfrac{\partial \bm{J}_2}{\partial b}=\dfrac{1}{a^2+1}\sum(2b+2ax_i-2y_i) bJ2=a2+11(2b+2axi2yi)
∂ J 2 ∂ b = 0 \dfrac{\partial \bm{J}_2}{\partial b}=0 bJ2=0,解得:
b = y ˉ − a x ˉ b=\bar{y}-a\bar{x} b=yˉaxˉ

目标函数 J 2 \bm{J}_2 J2 a a a求导:

∂ J 2 ∂ a = ∑ − 2 a ( a 2 + 1 ) 2 ( a x i − y i + b ) 2 + ∑ 2 x i a 2 + 1 ( a x i − y i + b ) \dfrac{\partial \bm{J}_2}{\partial a}=\sum\dfrac{-2a}{(a^2+1)^2}(ax_i-y_i+b)^2+\sum\dfrac{2x_i}{a^2+1}(ax_i-y_i+b) aJ2=(a2+1)22a(axiyi+b)2+a2+12xi(axiyi+b)
∂ J 2 ∂ a = 0 \dfrac{\partial \bm{J}_2}{\partial a}=0 aJ2=0,并化简得:
∑ − a ( a x i − y i + b ) 2 + ∑ x i ( a x i − y i + b ) ( a 2 + 1 ) = 0 \sum -a(ax_i-y_i+b)^2+\sum x_i(ax_i-y_i+b)(a^2+1)=0 a(axiyi+b)2+xi(axiyi+b)(a2+1)=0
b = y ˉ − a x ˉ b=\bar{y}-a\bar{x} b=yˉaxˉ带入,并化简得:
0 = a 3 ∑ ( − x ˉ 2 + x i x ˉ ) + a 2 ∑ ( 2 x i y i − 2 x i y ˉ + 2 x ˉ y ˉ − 2 y i x ˉ − x i y i + x i y ˉ ) + a ∑ ( − y i 2 − y ˉ 2 + 2 y i y ˉ − x i x ˉ + x i 2 ) + ∑ ( x i y ˉ − x i y i ) \begin{aligned} 0=\quad &a^3\sum(-\bar{x}^2+x_i\bar{x})\\ +&a^2\sum(2x_iy_i-2x_i\bar{y}+2\bar{x}\bar{y}-2y_i\bar{x}-x_iy_i+x_i\bar{y})\\ +&a\sum(-y_i^2-\bar{y}^2+2y_i\bar{y}-x_i\bar{x}+x_i^2)\\ +&\sum(x_i\bar{y}-x_iy_i) \end{aligned} 0=+++a3(xˉ2+xixˉ)a2(2xiyi2xiyˉ+2xˉyˉ2yixˉxiyi+xiyˉ)a(yi2yˉ2+2yiyˉxixˉ+xi2)(xiyˉxiyi)
最后化简得:
a 2 ( s x y ) + a ( − s y y + s x x ) − s x y = 0 a^2(\bm{s}_{xy})+a(-\bm{s}_{yy}+\bm{s}_{xx})-\bm{s}_{xy}=0 a2(sxy)+a(syy+sxx)sxy=0
这与上一节得出的结果一致。

你可能感兴趣的:(理论类,线性回归,点到直线的距离,正交回归)