【数学建模算法】(27)插值和拟合:最小二乘法

1.线性最小二乘法

曲线拟合问题的提法是,已知一组(二维)数据,即平面上的个点,,互不相同,寻求一个函数(曲线)使在某种准则下与所有数据点最为接近,即曲线拟合得最好。

线性最小二乘法是解决曲线拟合最常用的方法,基本思路是,令:

其中是事先选定的一组线性无关的函数,是待定系数。拟合准则是使,与的距离 的平方和最小,称为最小二乘准则。

1.1.系数的确定

记:

为求使达到最小,只需利用极值的必要条件,得到关于的线性方程组:

即:

记:
R=\left[\begin{array}{ccc}{r_{1}\left(x_{1}\right)} & {\cdots} & {r_{m}\left(x_{1}\right)} \\ {\vdots} & {\vdots} & {\vdots} \\ {r_{1}\left(x_{n}\right)} & {\cdots} & {r_{m}\left(x_{n}\right)}\end{array}\right]_{n \times m}

方程组(2)可表为:

当线性无关时,列满秩,可逆,于是方程组(3)有唯一解:

1.2.函数的选取

面对一组数据,用线性最小二乘法作曲线拟合时,首要的、也是关键的一步是恰当地选取容易确定。若无法知道与之间的关系,通常可以将数据作图,直观地判断应该用什么样的曲线去作拟合。人们常用的曲线有:

(1)直线:
(2)多项式:(一般,不宜太高)
(3)双曲线(一支):
(4)指数函数:

对于指数曲线,拟合前需作变量代换,化为对的线性函数。
已知一组数据,用什么样的曲线拟合最好,可以在直观判断的基础上,选几种曲线分别拟合,然后比较,看哪条曲线的最小二乘指标最小。

2.最小二乘法的Matlab实现

2.1.解方程组方法

在上面的记号下,

Matlab中的线性最小二乘的标准型为:

命令为:

例1 用最小二乘法求一个形如的经验公式,使它与下表所示的数据拟合。

19 25 31 38 44
19.0 32.3 49.0 73.3 97.8

解:编写程序如下

x=[19 25 31 38 44]';
y=[19.0 32.3 49.0 73.3 97.8]';
r=[ones(5,1),x.^2];
ab=r\y%求出最小二乘的系数
x0=19:0.1:44;
y0=ab(1)+ab(2)*x0.^2;
plot(x,y,'o',x0,y0,'r')

这里没有用任何函数,笔者也是第一次知道反斜杠可以直接算出最小二乘算法的系数。

2.2.多项式拟合方法

如果取,即用次多项式拟合给定数据,Matlab中有现成的函数:

a=polyfit(x0,y0,m)
其中输入参数为要拟合的数据,为拟合多项式的次数,输出参数为拟合多项式的系数

例2 某乡镇企业 1990-1996 年的生产利润如下表

年份 1990 1991 1992 1993 1994 1995 1996
利润(万元) 70 122 144 152 174 196 202

试预测1997年和1998年的利润:

解:做已知数据的散点图:

x0=[1990 1991 1992 1993 1994 1995 1996];
y0=[70 122 144 152 174 196 202];
plot(x0,y0,'*')

发现该乡镇企业的年生产利润几乎直线上升。因此,我们可以用作为拟合函数来预测该乡镇企业未来的年利润。编写程序如下:

x0=[1990 1991 1992 1993 1994 1995 1996];
y0=[70 122 144 152 174 196 202];
a=polyfit(x0,y0,1)
y97=polyval(a,1997)
y98=polyval(a,1998)

求得,预测1997年的利润为233.4286万元,1998年的生产利润是253.9286元。

你可能感兴趣的:(【数学建模算法】(27)插值和拟合:最小二乘法)