统计学习——最小二乘法

最小二乘法

最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

法国数学家,阿德里安-马里·勒让德(1752-1833)提出让总的误差的平方最小的y就是真值,这是基于,如果误差是随机的,应该围绕真值上下波动。
统计学习——最小二乘法_第1张图片
现在有多组观测值((x1,y1),(x2,y2),(x3,y3),…,(xn,yn)),可以带入上式,通过计算误差平方的最小值,求得这组观测值拟合的函数,这个函数既可以是一次函数y=ax+b,也可以是二元函数y=ax^2+bx+c,也可以是更高次数的函数。下面用一次函数y=ax+b举例:

统计学习——最小二乘法_第2张图片

以上公式就是最小二乘法,所谓“二乘”就是平方的意思,台湾直接翻译为最小平方法。
对误差的平方函数求偏导,当偏导为0的时候,即为函数最小值点

推广

温度与冰淇淋的销量:
统计学习——最小二乘法_第3张图片
看上去像是某种线性关系:
统计学习——最小二乘法_第4张图片
可以假设这种线性关系为:
在这里插入图片描述
通过最小二乘法的思想:
统计学习——最小二乘法_第5张图片
上图的i,x,y分别为:
统计学习——最小二乘法_第6张图片
总误差的平方为:
在这里插入图片描述
不同的a,b会导致不同的\epsilon,根据多元微积分的知识,当:
统计学习——最小二乘法_第7张图片
这个时候\epsilon取最小值。
对于a,b而言,上述方程组为线性方程组,用之前的数据解出来:
统计学习——最小二乘法_第8张图片
也就是这根直线:
统计学习——最小二乘法_第9张图片
其实,还可以假设:在这里插入图片描述
在这个假设下,可以根据最小二乘法,算出a,b,c,得到下面这根红色的二次曲线:
统计学习——最小二乘法_第10张图片
不同的数据,更可以选择不同的f(x),通过最小二乘法可以得到不一样的拟合曲线:
统计学习——最小二乘法_第11张图片
统计学习——最小二乘法_第12张图片
统计学习——最小二乘法_第13张图片
统计学习——最小二乘法_第14张图片
统计学习——最小二乘法_第15张图片
统计学习——最小二乘法_第16张图片
统计学习——最小二乘法_第17张图片
统计学习——最小二乘法_第18张图片

统计学习——最小二乘法_第19张图片
统计学习——最小二乘法_第20张图片
统计学习——最小二乘法_第21张图片
统计学习——最小二乘法_第22张图片
统计学习——最小二乘法_第23张图片
统计学习——最小二乘法_第24张图片
统计学习——最小二乘法_第25张图片
统计学习——最小二乘法_第26张图片
统计学习——最小二乘法_第27张图片
统计学习——最小二乘法_第28张图片
统计学习——最小二乘法_第29张图片
统计学习——最小二乘法_第30张图片
统计学习——最小二乘法_第31张图片
统计学习——最小二乘法_第32张图片
统计学习——最小二乘法_第33张图片
统计学习——最小二乘法_第34张图片
统计学习——最小二乘法_第35张图片
统计学习——最小二乘法_第36张图片
统计学习——最小二乘法_第37张图片
统计学习——最小二乘法_第38张图片
统计学习——最小二乘法_第39张图片
统计学习——最小二乘法_第40张图片
统计学习——最小二乘法_第41张图片
统计学习——最小二乘法_第42张图片
统计学习——最小二乘法_第43张图片
统计学习——最小二乘法_第44张图片
统计学习——最小二乘法_第45张图片
统计学习——最小二乘法_第46张图片
统计学习——最小二乘法_第47张图片
统计学习——最小二乘法_第48张图片
统计学习——最小二乘法_第49张图片
在这里插入图片描述
统计学习——最小二乘法_第50张图片
统计学习——最小二乘法_第51张图片
统计学习——最小二乘法_第52张图片
统计学习——最小二乘法_第53张图片
统计学习——最小二乘法_第54张图片
统计学习——最小二乘法_第55张图片
统计学习——最小二乘法_第56张图片
统计学习——最小二乘法_第57张图片
统计学习——最小二乘法_第58张图片
统计学习——最小二乘法_第59张图片
统计学习——最小二乘法_第60张图片
统计学习——最小二乘法_第61张图片
统计学习——最小二乘法_第62张图片
统计学习——最小二乘法_第63张图片
统计学习——最小二乘法_第64张图片
统计学习——最小二乘法_第65张图片
统计学习——最小二乘法_第66张图片
统计学习——最小二乘法_第67张图片

天津大学喻梅教授 数据挖掘课程ppt

你可能感兴趣的:(机器学习)