数模比赛中,常常需要根据已知的函数点进行数据、模型的处理和分析,而有时候现有的数据是极少的,不足以支撑分析的进行,这时就需要使用一些数学的方法,“模拟产生”一些新的但又比较靠谱的值来满足需求,这就是插值的作用。
建模实例: MathorCup第六届A题 淡水养殖池塘水华发生及池水净化处理
参考资料:刘春凤: 中国大学MOOC数值计算方法
插值法的概念:
设函数y = f(x)在区间[a,b]上有定义,且已知在点a<=x0 若存在一简单函数P(x),使 P(xi) = yi (i = 0,1,2,...,n) 则称P(x)为f(x)的插值函数,点x0,x1,...,xn称为插值节点,包含插值节点的区间[a,b]称为插值区间,求插值函数P(x)的方法称为插值法 插值多项式:P(x)是次数不超过n的代数多项式 P(x) = a0+a1x+...+an*xn 分段插值:P(x)为分段多项式(最常见) 三角插值:P(x)为三角多项式。一般要用到傅里叶变换等复杂的数学工具 只要n+1个节点互异,满足上述插值条件的多项式是唯一存在的 如果不限制多项式的次数,插值多项式并不唯一 拉格朗日插值法和牛顿插值法插值法都存在龙格现象的问题,并且仅仅要求插值多项式在插值节点处与被插函数有相等的函数值,不能全面反映被插值函数的性态,因此数学建模中一般不使用这两种方法。 直接使用Hermite插值得到的多项式次数较高,也存在着龙格现象,因此在实际应用中,往往使用分段三次 Hermite 插值多项式 (PCHIP) 例: 高次插值会产生龙格现象,即在两端处波动极大,产生明显的震荡。在不熟悉曲线运动趋势的前提下,不要轻易使用高次插值 插值多项式次数高精度未必提高 插值多项式次数越高摄入误差可能显著增大 与拉格朗日插值法相比,牛顿插值法的计算过程具有继承性。(牛顿插值法每次插值只和前n项的值有关,这样每次只要在原来的函数上添加新的项,就能够产生新的函数,而拉格朗日插值每增加一个数据都需要重新计算) 但是牛顿插值也存在龙格现象的问题。 不但要求在节点上的函数值相等,而且还要求对应的导数值也相等,甚至要求高阶导数也相等,满足这种要求的插值多项式就是埃尔米特插值多项式。 精确度较低 1.pchip()函数 Matlab有内置的函数: x是已知的样本点的横坐标;y是已知的样本点的纵坐标;new_x是要插入处对应的横坐标 2.plot函数用法: plot(x,y,'o')表示把x,y这组数据点用小圆在图上绘制出来 plot(new_x, p, 'r-')表示把(new_x, p)这组数据点用红色实线在图中绘制出来 plot(x, y, 'o', new_x, p, 'r‐')表示把上面两个图像绘制在一张图上 数据的光滑性和连续性更好 1.spline()函数 Matlab有内置的函数: x是已知的样本点的横坐标;y是已知的样本点的纵坐标;new_x是要插入处对应的横坐标 2.legend(string1,string2,string3, …) 分别将字符串1、字符串2、字符串3……标注到图中,每个字符串对应的图标为画图时 可以看出,三次样条生成的曲线更加光滑。在实际建模中,由于我们不知道数据的生成过程,因此这两种插值都可以使用。 interpn()函数 x1,x2,...,xn是已知的样本点的横坐标 y是已知的样本点的纵坐标坐标 new_x1,new_x2,...,new_xn是要插入点的横坐标 method是要插值的方法 举例:根据过去10年的中国人口数据,预测接下来三年的人口数据 注意:代码文件仅供参考,一定不要直接用于自己的数模论文中,国赛对于论文的查重要求非常严格,代码雷同也算作抄袭 补充知识点:subplot函数:可用于在同一个图形中同时显示多幅图像插值法原理
插值多项式
拉格朗日插值法
龙格现象
牛顿插值法
埃尔米特插值法
分段插值(可以提高精度)
分段线性插值
分段二次插值
实际使用:分段三次埃尔米特插值
代码知识点
p = pchip(x,y, new_x)
plot(x1,y1,x2,y2)
线方式: ‐ 实线 :点线 ‐. 虚点线 ‐ ‐ 波折线
点方式: . 圆点 +加号 * 星号 x x形 o 小圆
颜色: y黄; r红; g绿; b蓝; w白; k黑; m紫; c青x = ‐pi:pi; y = sin(x);
new_x = ‐pi:0.1:pi;
p = pchip(x,y,new_x);
plot(x, y, 'o', new_x, p, 'r‐')
MATLAB代码
% 分段三次埃尔米特插值
x = -pi:pi; y = sin(x);
new_x = -pi:0.1:pi;
p = pchip(x,y,new_x);
figure(1); % 在同一个脚本文件里面,要想画多个图,需要给每个图编号,否则只会显示最后一个图哦~
plot(x, y, 'o', new_x, p, 'r-')
实际使用:三次样条插值
代码知识点
p = spline (x,y, new_x)
的图标。代码实现
% 三次样条插值和分段三次埃尔米特插值的对比
x = -pi:pi;
y = sin(x);
new_x = -pi:0.1:pi;
p1 = pchip(x,y,new_x); %分段三次埃尔米特插值
p2 = spline(x,y,new_x); %三次样条插值
figure(2);
plot(x,y,'o',new_x,p1,'r-',new_x,p2,'b-')
legend('样本点','三次埃尔米特插值','三次样条插值','Location','SouthEast') %标注显示在东南方向
% ‘Location’用来指定标注显示的位置
n维数据的插值(了解)
代码知识点
p = interpn(x1,x2,...,xn, y, new_x1,new_x2,...,new_xn, method)
‘linear’:线性插值(默认算法);
‘cubic’:三次插值;
‘spline’:三次样条插值法;(最为精准)
‘nearest’:最邻近插值算法。MATLAB代码实现
% n维数据的插值
x = -pi:pi; y = sin(x);
new_x = -pi:0.1:pi;
p = interpn (x, y, new_x, 'spline');
% 等价于 p = spline(x, y, new_x);
figure(3);
plot(x, y, 'o', new_x, p, 'r-')
以上学习的算法可以用来预测
% 人口预测(注意:一般我们很少使用插值算法来预测数据,随着课程的深入,后面的章节会有更适合预测的算法供大家选择,例如灰色预测、拟合预测等)
population=[133126,133770,134413,135069,135738,136427,137122,137866,138639, 139538];
year = 2009:2018;
p1 = pchip(year, population, 2019:2021) %分段三次埃尔米特插值预测
p2 = spline(year, population, 2019:2021) %三次样条插值预测
figure(4);
plot(year, population,'o',2019:2021,p1,'r*-',2019:2021,p2,'bx-') %要预测的数据设为y
legend('样本点','三次埃尔米特插值预测','三次样条插值预测','Location','SouthEast')