本文大部分是对于数学建模清风老师的课程学习总结归纳而来,我的理解可能有错误,大家发现错误可以在评论区批评指正,课程地址:《数学建模清风》
数模比赛中,常常需要根据已知的函数点进行数据、模型的处理和分析,而有时候现有的数据是极少的,不足以支撑分析的进行,这时就需要使用一些数学的方法,模拟产生一些新的但又比较靠谱的值来满足需求,这就是插值的作用。另外也可以通过插值起到预测的作用。
设函数 y = f ( x ) y = f(x) y=f(x)在区间 [ a , b ] [a,b] [a,b]上有定义,且已知在点
a ≤ x 0 ≤ x 1 ≤ ⋯ ≤ x n ≤ b a \leq x_0 \leq x_1 \leq \cdots \leq x_n \leq b a≤x0≤x1≤⋯≤xn≤b
上的值分别为: y 0 , y 1 , ⋯ , y n y_0,y_1,\cdots,y_n y0,y1,⋯,yn
若存在一简单函数 P ( x ) P(x) P(x),使
P ( x i ) = y i ( i = 0 , 1 , 2 , ⋯ , n ) P(x_i) = y_i (i=0,1,2,\cdots,n) P(xi)=yi(i=0,1,2,⋯,n)
则称 P ( x ) P(x) P(x)为 f ( x ) f(x) f(x)的插值函数,点 x 0 , x 1 , ⋯ , x n x_0,x_1,\cdots,x_n x0,x1,⋯,xn成为插值节点,包含插值节点的区间 [ a , b ] [a,b] [a,b]称为插值区间,求插值函数 P ( x ) P(x) P(x)的方法称为插值法。
若 P ( x ) P(x) P(x)是次数不超过 n n n的代数多项式,即
P ( x ) = a 0 + a 1 x + ⋯ + a n x n P(x)=a_0+a_1x+\cdots+a_nx^n P(x)=a0+a1x+⋯+anxn
若 P ( x ) P(x) P(x)为分段多项式,就称为分段插值。
若 P ( x ) P(x) P(x)为三角多项式,就称为三角插值。
本文只讨论多项式插值和分段插值。
定理 设有n+1个互不相同的节点 ( x i , y i ) ( i = 0 , 1 , 2 , ⋯ , n ) (x_i,y_i)(i=0,1,2,\cdots,n) (xi,yi)(i=0,1,2,⋯,n),则存在唯一的多项式:
L n ( x ) = a 0 + a 1 x + a 2 x 2 + ⋯ + a n x n L_n(x)=a_0+a_1x+a_2x^2+\cdots+a_nx^n Ln(x)=a0+a1x+a2x2+⋯+anxn
使 得 L n ( x j ) = y j ( j = 0 , 1 , 2 , ⋯ , n ) 使得L_n(x_j)=y_j(j=0,1,2,\cdots,n) 使得Ln(xj)=yj(j=0,1,2,⋯,n)
证 构造方程组
{ a 0 + a 1 x 0 + a 2 x 0 2 + ⋯ + a n x 0 n = y 0 a 0 + a 1 x 1 + a 2 x 1 2 + ⋯ + a n x 1 n = y 1 ⋯ ⋯ a 0 + a 1 x n + a 2 x n 2 + ⋯ + a n x n n = y n \begin{cases} a_0+a_1x_0+a_2x_0^2+\cdots+a_nx_0^n=y_0\\ a_0+a_1x_1+a_2x_1^2+\cdots+a_nx_1^n=y_1\\ \cdots\cdots\\ a_0+a_1x_n+a_2x_n^2+\cdots+a_nx_n^n=y_n\\ \end{cases} ⎩⎪⎪⎪⎨⎪⎪⎪⎧a0+a1x0+a2x02+⋯+anx0n=y0a0+a1x1+a2x12+⋯+anx1n=y1⋯⋯a0+a1xn+a2xn2+⋯+anxnn=yn
令 : A = [ 1 x 0 ⋯ x 0 n 1 x 1 ⋯ x 1 n ⋮ ⋮ ⋯ ⋮ 1 x n ⋯ x n n ] , X = [ a 0 a 1 ⋮ a n ] , Y = [ y 0 y 1 ⋮ y n ] 令:A=\left[ \begin{matrix} 1&x_0&\cdots&x_0^n\\ 1&x_1&\cdots&x_1^n\\ \vdots&\vdots&\cdots&\vdots\\ 1&x_n&\cdots&x_n^n\\ \end{matrix} \right] ,X=\left[ \begin{matrix} a_0\\ a_1\\ \vdots\\ a_n \end{matrix} \right] ,Y=\left[ \begin{matrix} y_0\\ y_1\\ \vdots\\ y_n \end{matrix} \right] 令:A=⎣⎢⎢⎢⎡11⋮1x0x1⋮xn⋯⋯⋯⋯x0nx1n⋮xnn⎦⎥⎥⎥⎤,X=⎣⎢⎢⎢⎡a0a1⋮an⎦⎥⎥⎥⎤,Y=⎣⎢⎢⎢⎡y0y1⋮yn⎦⎥⎥⎥⎤
方 程 组 的 矩 阵 形 式 为 : A X = Y 方程组的矩阵形式为:AX=Y 方程组的矩阵形式为:AX=Y
由于 ∣ A ∣ = ∏ i = 1 n ∏ j = 0 i − 1 ( x i − x j ) ≠ 0 |A|=\prod^{n}_{i=1}\prod^{i-1}_{j=0}(x_i-x_j)\neq0 ∣A∣=∏i=1n∏j=0i−1(xi−xj)=0,所以方程组有唯一解。
从而 L n ( x ) = a 0 + a 1 x + a 2 x 2 + ⋯ + a n x n L_n(x)=a_0+a_1x+a_2x^2+\cdots+a_nx^n Ln(x)=a0+a1x+a2x2+⋯+anxn
【注1】只要n+1个节点互异,满足上述插值条件的多项式是唯一存在的。
【注2】如果不限制多项式的次数,插值多项式并不唯一。
在数值分析中,拉格朗日插值法是以法国十八世纪数学家约瑟夫∙路易斯∙拉格朗日命名的一种多项式插值方法。在若干个不同的地方得到相应的观测值,拉格朗日插值法可以找到一个多项式,其恰好在各个观测的点取到观测到的值。
两个点: ( x 0 , y 0 ) , ( x 1 , y 1 ) (x_0,y_0),(x_1,y_1) (x0,y0),(x1,y1)
f ( x ) = x − x 1 x 0 − x 1 y 0 + x − x 0 x 1 − x 0 y 1 f(x)=\frac{x-x_1}{x_0-x_1}y_0+\frac{x-x_0}{x_1-x_0}y_1 f(x)=x0−x1x−x1y0+x1−x0x−x0y1
三个点: ( x 0 , y 0 ) , ( x 1 , y 1 ) , ( x 2 , y 2 ) (x_0,y_0),(x_1,y_1),(x_2,y_2) (x0,y0),(x1,y1),(x2,y2)
f ( x ) = ( x − x 1 ) ( x − x 2 ) ( x 0 − x 1 ) ( x 0 − x 2 ) y 0 + ( x − x 0 ) ( x − x 2 ) ( x 1 − x 0 ) ( x 1 − x 2 ) y 1 + ( x − x 0 ) ( x − x 1 ) ( x 2 − x 0 ) ( x 2 − x 1 ) y 2 f(x)=\frac{(x-x_1)(x-x_2)}{(x_0-x_1)(x_0-x_2)}y_0+\frac{(x-x_0)(x-x_2)}{(x_1-x_0)(x_1-x_2)}y_1+\frac{(x-x_0)(x-x_1)}{(x_2-x_0)(x_2-x_1)}y_2 f(x)=(x0−x1)(x0−x2)(x−x1)(x−x2)y0+(x1−x0)(x1−x2)(x−x0)(x−x2)y1+(x2−x0)(x2−x1)(x−x0)(x−x1)y2
四个点: ( x 0 , y 0 ) , ( x 1 , y 1 ) , ( x 2 , y 2 ) , ( x 3 , y 3 ) (x_0,y_0),(x_1,y_1),(x_2,y_2),(x_3,y_3) (x0,y0),(x1,y1),(x2,y2),(x3,y3)
f ( x ) = ( x − x 1 ) ( x − x 2 ) ( x − x 3 ) ( x 0 − x 1 ) ( x 0 − x 2 ) ( x 0 − x 3 ) y 0 + ( x − x 0 ) ( x − x 2 ) ( x − x 3 ) ( x 1 − x 0 ) ( x 1 − x 2 ) ( x 1 − x 3 ) y 1 + ( x − x 0 ) ( x − x 1 ) ( x − x 3 ) ( x 2 − x 0 ) ( x 2 − x 1 ) ( x 2 − x 3 ) y 2 + ( x − x 0 ) ( x − x 1 ) ( x − x 2 ) ( x 3 − x 0 ) ( x 3 − x 1 ) ( x 3 − x 2 ) y 3 f(x)=\frac{(x-x_1)(x-x_2)(x-x_3)}{(x_0-x_1)(x_0-x_2)(x_0-x_3)}y_0+\frac{(x-x_0)(x-x_2)(x-x_3)}{(x_1-x_0)(x_1-x_2)(x_1-x_3)}y_1\\+\frac{(x-x_0)(x-x_1)(x-x_3)}{(x_2-x_0)(x_2-x_1)(x_2-x_3)}y_2+\frac{(x-x_0)(x-x_1)(x-x_2)}{(x_3-x_0)(x_3-x_1)(x_3-x_2)}y_3 f(x)=(x0−x1)(x0−x2)(x0−x3)(x−x1)(x−x2)(x−x3)y0+(x1−x0)(x1−x2)(x1−x3)(x−x0)(x−x2)(x−x3)y1+(x2−x0)(x2−x1)(x2−x3)(x−x0)(x−x1)(x−x3)y2+(x3−x0)(x3−x1)(x3−x2)(x−x0)(x−x1)(x−x2)y3
拉格朗日插值多项式如下:
L n ( x ) = ∑ k = 0 n y k ω n + 1 ( x ) ( x − x k ) ω n + 1 ′ ( x k ) = L_n(x)=\sum^n_{k=0}y_k\frac{\omega_{n+1}(x)}{(x-x_k)\omega^{'}_{n+1}(x_k)}= Ln(x)=k=0∑nyk(x−xk)ωn+1′(xk)ωn+1(x)=
PS:高次插值会产生龙格现象,即在两端处波动极大,产生明显的震荡。在不熟悉曲线运动趋势的前提下,不要轻易使用高次插值。
因此我们可以知道:插值多项式次数高精度未必显著提高,并且舍入误差可能显著增大。
对于这种情况,我们可以用分段低次插值的方法来解决。
分段二次插值
选取跟节点 x x x最近的三个节点 x i − 1 , x i , x i + 1 x_{i-1},x_i,x_{i+1} xi−1,xi,xi+1进行二次插值。即在每一个区间 [ x i − 1 , x i + 1 ] [x_i-1,x_i+1] [xi−1,xi+1]上,取:
f ( x ) ≈ L 2 ( x ) = ∑ k = i − 1 i + 1 [ y k ∏ j = i − 1 , j ≠ k i + 1 ( x − x j ) ( x k − x j ) f(x)\approx L_2(x)=\sum^{i+1}_{k=i-1}[y_k\prod^{i+1}_{j=i-1,j\neq k}\frac{(x-x_j)}{(x_k-x_j)} f(x)≈L2(x)=k=i−1∑i+1[ykj=i−1,j=k∏i+1(xk−xj)(x−xj)
这种分段的低次插值称为分段二次插值,在几何上就是用分段抛物线代替 y = f ( x ) y=f(x) y=f(x),故分段二次插值又称为分段抛物插值。
f ( x ) = f ( x 0 ) + f [ x 0 , x 1 ] ( x − x 0 ) + f [ x 0 , x 1 , x 2 ] ( x − x 0 ) ( x − x 1 ) + ⋯ + f [ x 0 , x 1 , ⋯ , x n − 2 , x n − 1 ] ( x − x 0 ) ( x − x 1 ) ⋯ ( x − x n − 3 ) ( x − x n − 2 ) + f [ x 0 , x 1 , ⋯ , x n − 1 , x n ] ( x − x 0 ) ( x − x 1 ) ⋯ ( x − x n − 2 ) ( x − x n − 1 ) f(x)=f(x_0)+f[x_0,x_1](x-x_0)+f[x_0,x_1,x_2](x-x_0)(x-x_1)+\cdots\\ +f[x_0,x_1,\cdots,x_{n-2},x_{n-1}](x-x_0)(x-x_1)\cdots(x-x_{n-3})(x-x_{n-2})\\ +f[x_0,x_1,\cdots,x_{n-1},x_n](x-x_0)(x-x_1)\cdots(x-x_{n-2})(x-x_{n-1}) f(x)=f(x0)+f[x0,x1](x−x0)+f[x0,x1,x2](x−x0)(x−x1)+⋯+f[x0,x1,⋯,xn−2,xn−1](x−x0)(x−x1)⋯(x−xn−3)(x−xn−2)+f[x0,x1,⋯,xn−1,xn](x−x0)(x−x1)⋯(x−xn−2)(x−xn−1)
商差定义 称 f [ x 0 , x k ] = f ( x k ) − f ( x 0 ) x k − x 0 f[x_0,x_k]=\frac{f(x_k)-f(x_0)}{x_k-x_0} f[x0,xk]=xk−x0f(xk)−f(x0)为函数 f ( x ) f(x) f(x)关于点 x 0 , x k x_0,x_k x0,xk的一阶商差(亦称均差)。
二 阶 商 差 : f ∣ x 0 , x 1 , x 2 ∣ = f ∣ x 1 , x 2 ∣ − f ∣ x 0 , x 1 ∣ x 2 − x 0 二阶商差:f|x_0,x_1,x_2|=\frac{f|x_1,x_2|-f|x_0,x_1|}{x_2-x_0} 二阶商差:f∣x0,x1,x2∣=x2−x0f∣x1,x2∣−f∣x0,x1∣
k 阶 商 差 : f ∣ x 0 , x 1 , ⋯ , x k ∣ = f ∣ x 1 , ⋯ , x k − 1 , x k ∣ − f ∣ x 0 , x 1 , ⋯ , x k − 1 ∣ x k − x 0 ( x k , x k − 1 可 以 不 相 邻 ) k阶商差:f|x_0,x_1,\cdots,x_k|=\frac{f|x_1,\cdots,x_{k-1},x_k|-f|x_0,x_1,\cdots,x_{k-1}|}{x_k-x_0}\\ (x_k,x_{k-1}可以不相邻) k阶商差:f∣x0,x1,⋯,xk∣=xk−x0f∣x1,⋯,xk−1,xk∣−f∣x0,x1,⋯,xk−1∣(xk,xk−1可以不相邻)
对比
与拉格朗日插值法相比,牛顿插值法的计算过程具有继承性。(牛顿插值法每次插值只和前n项的值有关,这样每次只要在原来的函数上添加新的项,就能够产生新的函数)
但是牛顿插值也存在龙格现象的问题。
评价
上面讲的两种插值仅仅要求插值多项式在插值节点处与被插函数有相等的函数值,而这种插值多项式却不能全面反映被插值函数的性态。
然而在许多实际问题中,不仅要求插值函数与被插值函数在所有节点处有相同的函数值,它也需要在一个或全部节点上插值多项式与被插函数有相同的低阶甚至高阶的导数值。
对于这些情况,拉格朗日插值和牛顿插值都不能满足。
设函数 f ( x ) f(x) f(x)在区间 [ a , b ] [a,b] [a,b]上有 n + 1 n+1 n+1个互异节点 a = x 0 < x 1 < x 2 < ⋯ < x n = b a=x_0
f ( x i ) = y i , f ′ ( x i ) = y i ′ ( i = 0 , 1 , 2 , ⋯ , n ) ( 2 n + 2 个 条 件 ) f(x_i)=y_i,f'(x_i)=y'_i(i=0,1,2,\cdots,n)(2n+2个条件) f(xi)=yi,f′(xi)=yi′(i=0,1,2,⋯,n)(2n+2个条件)
可唯一确定一个次数不超过 2 n + 1 2n+1 2n+1的多项式 H 2 n + 1 ( x ) = H ( x ) H_{2n+1}(x)=H(x) H2n+1(x)=H(x)满足:
H ( x j ) = y j , H ′ ( x j ) = m j ( j = 0 , 1 , ⋯ , n ) H(x_j)=y_j,H'(x_j)=m_j(j=0,1,\cdots,n) H(xj)=yj,H′(xj)=mj(j=0,1,⋯,n)
其余项为:
R ( x ) = f ( x ) − H ( x ) = f 2 n + 2 ( ξ ) ( 2 n + 2 ) ! ω 2 n + 2 ( x ) R(x)=f(x)-H(x)=\frac{f^{2n+2}(\xi)}{(2n+2)!}\omega_{2n+2}(x) R(x)=f(x)−H(x)=(2n+2)!f2n+2(ξ)ω2n+2(x)
直接使用埃尔米特插值得到的多项式次数较高,也存在着龙格现象。因此在实际应用中,往往使用分段 三次埃尔米特插值多项式(PCHIP)。
Matlab有内置的函数:
p = p c h i p ( x , y , n e w x ) p = pchip(x,y, new_x) p=pchip(x,y,newx)
设 y = f ( x ) y=f(x) y=f(x)在点 x 0 , x 1 , x 2 , ⋯ , x n x_0,x_1,x_2,\cdots,x_n x0,x1,x2,⋯,xn的值为 y 0 , y 1 , y 2 , ⋯ , y n y_0,y_1,y_2,\cdots,y_n y0,y1,y2,⋯,yn,若函数 S ( x ) S(x) S(x)满足下列条件:
则称 S ( x ) S(x) S(x)为函数 f ( x ) f(x) f(x)的三次样条插值函数
三次样条插值比三次埃米特插值更加光滑。
Matlab有内置的函数:
p = s p l i n e ( x , y , n e w x ) p=spline(x,y, new_x) p=spline(x,y,newx)
plot函数用法:
p l o t ( x 1 , y 1 , x 2 , y 2 ) plot(x1,y1,x2,y2) plot(x1,y1,x2,y2)
4. 线方式: ‐ 实线 :点线 ‐. 虚点线 ‐ ‐ 波折线
5. 点方式: . 圆点 +加号 * 星号 x x形 o小圆
6. 颜色: y黄 r红 g绿 b蓝 w白 k黑 m紫 c青
% 分段三次埃尔米特插值
x = -pi:pi; y = sin(x);
new_x = -pi:0.1:pi;
p = pchip(x,y,new_x);
plot(x, y, 'o', new_x, p, 'r-')
% 分段三次埃尔米特插值
x = -pi:pi; y = sin(x);
new_x = -pi:0.1:pi;
p = spline (x,y,new_x);
plot(x, y, 'o', new_x, p, 'r-')
% 三次样条插值和分段三次埃尔米特插值的对比
x = -pi:pi;
y = sin(x);
new_x = -pi:0.1:pi;
p1 = pchip(x,y,new_x); %分段三次埃尔米特插值
p2 = spline(x,y,new_x); %三次样条插值
plot(x,y,'o',new_x,p1,'r-',new_x,p2,'b-')
legend('样本点','三次埃尔米特插值','三次样条插值','Location','SouthEast')