龙格库塔算法原理详解

龙格库塔算法

前言: 本文从简单欧拉法讲起,详细探究了龙格库塔算法的原理。

文章目录

  • 龙格库塔算法
    • 0. 问题提出
    • 1. 欧拉法
      • 1.1 基本原理
      • 1.2 误差分析
    • 2. 龙格库塔算法
      • 2.1 基本原理
      • 2.2 精度问题

0. 问题提出

求解下面的一阶微分方程
{ y ′ ( x ) = d y d x = f ( x , y ) y ( x 0 ) = y 0 \left\{\begin{aligned} &y'(x)=\frac{dy}{dx} = f(x,y) \\ &y(x_0) = y_0 \end{aligned} \right. y(x)=dxdy=f(x,y)y(x0)=y0
即已知上述条件,则 y(x) 如何求出?

1. 欧拉法

1.1 基本原理

上述方程组给出了某点的坐标,以及该点的斜率值。可以使用欧拉法对 y(x) 进行迭代的近似求解。求解分析如下:

已知 x = x 0 x = x_0 x=x0 y = y 0 y=y_0 y=y0 ,且斜率为 y ′ ( x 0 ) = f ( x 0 , y 0 ) y'(x_0)=f(x_0,y_0) y(x0)=f(x0,y0) ,那么就可以用过该点且斜率为 y ′ ( x 0 ) y'(x_0) y(x0)的直线近似求解 x 0 x_0 x0附近一点 x 1 x_1 x1的函数值。

构建直线:
y ( x ) = y 0 + f ( x 0 , y 0 ) ( x − x 0 ) y(x) = y_0 + f(x_0,y_0)(x-x_0) y(x)=y0+f(x0,y0)(xx0)
那么,在 x = x 1 x=x_1 x=x1时,求得
y ( x 1 ) = y 0 + f ( x 0 , y 0 ) ( x 1 − x 0 ) y(x_1) = y_0+f(x_0,y_0)(x_1-x_0) y(x1)=y0+f(x0,y0)(x1x0)
即在 x = x 1 x=x_1 x=x1 时, y = y ( x 1 ) y=y(x_1) y=y(x1),且斜率为 y ′ ( x 1 ) = f ( x 1 , y 1 ) y'(x_1)=f(x_1,y_1) y(x1)=f(x1,y1)。重复以上步骤,可以求得 y ( x 2 ) , y ( x 3 ) , ⋯   , y ( x n ) y(x_2),y(x_3),\cdots,y(x_n) y(x2),y(x3),,y(xn)

如果等间隔取 x 值,即 x 1 − x 0 = x 2 − x 1 = x 3 − x 2 = ⋯ = x n − x n − 1 = h x_1-x_0 = x_2-x_1=x_3-x_2=\cdots=x_{n}-x_{n-1}=h x1x0=x2x1=x3x2==xnxn1=h,也即 x n = x 0 + n ⋅ h x_n=x_0+n\cdot h xn=x0+nh可以得到
y ( x 1 ) = y 0 + f ( x 0 , y 0 ) ⋅ h y ( x 2 ) = y 1 + f ( x 1 , y 1 ) ⋅ h ⋮ y ( x n ) = y n − 1 + f ( x n − 1 , y n − 1 ) ⋅ h y(x_1)=y_0+f(x_0,y_0)\cdot h \\ y(x_2)=y_1+f(x_1,y_1)\cdot h \\ \vdots\\ y(x_n)=y_{n-1}+f(x_{n-1},y_{n-1})\cdot h y(x1)=y0+f(x0,y0)hy(x2)=y1+f(x1,y1)hy(xn)=yn1+f(xn1,yn1)h
总结为:
{ y ( x n ) = y n − 1 + f ( x n − 1 , y n − 1 ) ⋅ h x n = x 0 + n ⋅ h \left\{\begin{aligned} &y(x_n)=y_{n-1}+f(x_{n-1},y_{n-1})\cdot h \\ &x_n = x_0 + n\cdot h \end{aligned} \right. {y(xn)=yn1+f(xn1,yn1)hxn=x0+nh
该公式就是欧拉公式。

1.2 误差分析

值得注意的是,如上求解 y ( x 1 ) y(x_1) y(x1) 是有误差的,而在求解 y ( x 2 ) y(x_2) y(x2) 的时候,虽然斜率是准确的,但函数值是基于 y ( x 1 ) y(x_1) y(x1) 的,即在第一次误差的基础上计算的,因此会累积误差。

可以使用泰勒展开分析每次迭代产生的误差。对 y ( x ) y(x) y(x) 进行泰勒展开
y ( x ) = y ( x k ) + y ′ ( x k ) ( x − x k ) + y ′ ′ ( x k ) 2 ! ( x − x k ) 2 + ⋯ + y n + 1 ( ϵ ) ( n + 1 ) ! ( x − x k ) n + 1 y(x) = y(x_k) +y'(x_k)(x-x_k)+\frac{y''(x_k)}{2!}(x-x_k)^2+\cdots+\frac{y^{n+1}(\epsilon)}{(n+1)!}(x-x_k)^{n+1} \\ y(x)=y(xk)+y(xk)(xxk)+2!y(xk)(xxk)2++(n+1)!yn+1(ϵ)(xxk)n+1
则对于 y ( x k + 1 ) y(x_{k+1}) y(xk+1)
y ( x k + 1 ) = y ( x k ) + y ′ ( x k ) ( x k + 1 − x k ) + O ( ( x k + 1 − x k ) 2 ) = y ( x k ) + y ′ ( x k ) ⋅ h + O ( h 2 ) \begin{aligned} y(x_{k+1}) &= y(x_k) + y'(x_k)(x_{k+1}-x_k)+O((x_{k+1}-x_k)^2) \\ &=y(x_k)+y'(x_k)\cdot h+O(h^2) \\ \end{aligned} y(xk+1)=y(xk)+y(xk)(xk+1xk)+O((xk+1xk)2)=y(xk)+y(xk)h+O(h2)
等式右侧 y ( x k ) + y ′ ( x k ) ⋅ h y(x_k)+y'(x_k)\cdot h y(xk)+y(xk)h 即为用欧拉法的 y k + 1 y_{k+1} yk+1的估计值,所以可以看出,每步误差即为 O ( h 2 ) O(h^2) O(h2) ,也即使用欧拉法具有一阶精度。该误差也被称为局部截断误差。当然,步长 h 越小,误差越小。

2. 龙格库塔算法

2.1 基本原理

该算法有些类似于欧拉法的思想,算是对其的改进,都是使用过 ( x k , y k ) (x_k,y_k) (xk,yk)的直线来近似下一点的函数值 y k + 1 y_{k+1} yk+1,区别在于斜率的选择。

在欧拉法中,直接使用该点的切线 y ′ ( x k ) y'(x_k) y(xk) 当做直线的斜率,这样会造成一个明显的结果,即对于 y ( x k + 1 ) y(x_{k+1}) y(xk+1) 的求解一定会有误差,除非y(x)为直线时,结果才是准确的。

基于上面的考虑,最终需要解决的便是,如何得到一条通过 ( x k , y k ) (x_k,y_k) (xk,yk)和下一点 ( x k + 1 , y k + 1 ) (x_{k+1},y_{k+1}) (xk+1,yk+1)的直线呢?或者说在知道 ( x k , y k ) (x_k,y_k) (xk,yk)的情况下,如何确定直线斜率,确保恰好经过待估测点 ( x k + 1 , y k + 1 ) (x_{k+1},y_{k+1}) (xk+1,yk+1) 呢?

答案是利用拉格朗日中值定理:

( x k , x k + 1 ) (x_k,x_{k+1}) (xk,xk+1) 区间内存在一点 ϵ ( x k < ϵ < x k + 1 ) \epsilon (x_{k}<\epsilonϵ(xk<ϵ<xk+1) ,使得等式 f ( x k + 1 ) − f ( x k ) = f ′ ( ϵ ) ( x k + 1 − x k ) f(x_{k+1})-f(x_k)=f'(\epsilon)(x_{k+1}-x_{k}) f(xk+1)f(xk)=f(ϵ)(xk+1xk) 成立。

所以准确的直线方程即为:
y ( x ) = y ( x k ) + y ′ ( ϵ ) ( x − x k ) = y ( x k ) + y ′ ( x k + θ h ) ( x − x k ) y(x) = y(x_k) + y'(\epsilon)(x-x_k) = y(x_k)+y'(x_k+\theta h)(x-x_k) y(x)=y(xk)+y(ϵ)(xxk)=y(xk)+y(xk+θh)(xxk)
如果等间距取值,即 x k + 1 − x k = h x_{k+1}-x_k=h xk+1xk=h ,则有
y ( x k + 1 ) = y ( x k ) + y ′ ( x k + θ h ) ⋅ h y(x_{k+1}) = y(x_k)+y'(x_k+\theta h)\cdot h y(xk+1)=y(xk)+y(xk+θh)h
θ ∈ ( 0 , 1 ) \theta\in(0,1) θ(0,1) ,这种方法可以确保估测的 y ( x k + 1 ) y(x_{k+1}) y(xk+1)是极其准确,而另 θ = 0 \theta=0 θ=0 的时候,其实就是欧拉法。

2.2 精度问题

原理已经明确了,下面就是如何确定 y ′ ( ϵ ) y'(\epsilon) y(ϵ) 的问题了,这就涉及到了龙格库塔算法的精度问题。

改进欧拉法

既然直接使用端点处 y ′ ( x k ) y'(x_k) y(xk) 的斜率不准确,那使用两个端点斜率取平均,是否准确度就提升了一点呢,即取
y ′ ( ϵ ) = y ′ ( x k ) + y ′ ( x k + 1 ) 2 y'(\epsilon) = \frac{y'(x_k)+y'(x_{k+1})}{2} y(ϵ)=2y(xk)+y(xk+1)
直观感受,应该会如此。为了方便书写,将 y ′ ( x k ) = κ 1 , y ′ ( x k + 1 ) = κ 2 y'(x_k)=\kappa_1,y'(x_{k+1})=\kappa_2 y(xk)=κ1y(xk+1=κ2 κ \kappa κ 即表示斜率。则上式
y ′ ( ϵ ) = 1 2 ( κ 1 + κ 2 ) y'(\epsilon)= \frac{1}{2}(\kappa_1+\kappa_2) y(ϵ)=21(κ1+κ2)
根据已知条件方程 y ′ ( x ) = f ( x , y ) y'(x)=f(x,y) y(x)=f(x,y),则
κ 1 = f ( x k , y k ) κ 2 = f ( x k + 1 , y k + 1 ) \kappa_1 = f(x_k,y_k) \\ \kappa_2 = f(x_{k+1},y_{k+1}) κ1=f(xk,yk)κ2=f(xk+1,yk+1)
f(x,y)是已知的,而值得注意的是, f ( x k + 1 , y k + 1 ) f(x_{k+1},y_{k+1}) f(xk+1,yk+1) y k + 1 y_{k+1} yk+1 是未知的,待求的,此处的 y k + 1 y_{k+1} yk+1可以用欧拉法来估计,即
y k + 1 = y k + y ′ ( x k ) ⋅ h = y k + κ 1 h y_{k+1}=y_k+y'(x_k)\cdot h=y_k+\kappa_1 h yk+1=yk+y(xk)h=yk+κ1h
当然这是不准确的,但精度影响肯定小于上述的欧拉法(如何减少影响,下述),此时
κ 1 = f ( x k , y k ) κ 2 = f ( x k + 1 , y k + κ 1 ⋅ h ) \kappa_1 = f(x_k,y_k) \\ \kappa_2 = f(x_{k+1},y_k+\kappa_1\cdot h) κ1=f(xk,yk)κ2=f(xk+1,yk+κ1h)
总结一下,在使用端点斜率的均值当做直线斜率思路下,递推求解方程如下
{ y k + 1 = y k + ( 1 2 κ 1 + 1 2 κ 2 ) ⋅ h κ 1 = f ( x k , y k ) κ 2 = f ( x k + 1 , y k + κ 1 ⋅ h ) \left\{\begin{aligned} &y_{k+1} = y_k+(\frac{1}{2}\kappa_1+\frac{1}{2}\kappa_2)\cdot h \\ &\kappa_1 = f(x_k,y_k) \\ &\kappa_2 = f(x_{k+1},y_k+\kappa_1\cdot h) \end{aligned} \right. yk+1=yk+(21κ1+21κ2)hκ1=f(xk,yk)κ2=f(xk+1,yk+κ1h)
该种方法称为改进欧拉法,精度可以达到 O ( h 3 ) O(h^3) O(h3)

事实上,对于两端点斜率取平均完全是出于习惯,更一般描述是对两斜率进行加权,取平均只是习惯性的把两者权重取相等而已,但实际应用中,不一定权重相等更精确,因此更一般描述为
{ y k + 1 = y k + ( λ 1 κ 1 + λ 2 κ 2 ) ⋅ h κ 1 = f ( x k , y k ) κ 2 = f ( x k + 1 , y k + κ 1 ⋅ h ) \left\{\begin{aligned} &y_{k+1} = y_k+(\lambda_1\kappa_1+\lambda_2\kappa_2)\cdot h \\ &\kappa_1 = f(x_k,y_k) \\ &\kappa_2 = f(x_{k+1},y_k+\kappa_1\cdot h) \end{aligned} \right. yk+1=yk+(λ1κ1+λ2κ2)hκ1=f(xk,yk)κ2=f(xk+1,yk+κ1h)
通用方法

依据上述思路,如何更精确一点呢?方法是用更多点加权来估算 f ′ ( ϵ ) f'(\epsilon) f(ϵ) 的值。

假设在 ( x k , x k + 1 ) (x_k,x_{k+1}) (xk,xk+1) 区间取n个点,对应为 x k + α 1 h ,   x k + α 2 h ,   ⋯   ,   x k + α n h x_k+\alpha_1 h,\ x_k+\alpha_2 h,\ \cdots,\ x_k+\alpha_n h xk+α1h, xk+α2h, , xk+αnh,且 α ∈ [ 0 , 1 ] \alpha\in[0,1] α[0,1],在每个点的斜率记为 κ 1 , κ 2 , ⋯   , κ n \kappa_1,\kappa_2,\cdots,\kappa_n κ1,κ2,,κn,对应加权为 λ 1 , λ 2 , ⋯   , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ1,λ2,,λn那么有
f ′ ( ϵ ) = λ 1 κ 1 + λ 2 κ 2 + ⋯ + λ n κ n f'(\epsilon) = \lambda_1\kappa_1+\lambda_2\kappa_2+\cdots+\lambda_n\kappa_n f(ϵ)=λ1κ1+λ2κ2++λnκn

y k + 1 = y k + ( λ 1 κ 1 + λ 2 κ 2 + ⋯ + λ n κ n ) ⋅ h y_{k+1} = y_k+(\lambda_1\kappa_1+\lambda_2\kappa_2+\cdots+\lambda_n\kappa_n)\cdot h yk+1=yk+(λ1κ1+λ2κ2++λnκn)h
λ \lambda λ 为自取值,对于 κ \kappa κ
κ 1 = f ′ ( x k + α 1 h ) = f ( x k + α 1 h , y ( x k + α 1 h ) ) κ 2 = f ′ ( x k + α 2 h ) = f ( x k + α 2 h , y ( x k + α 2 h ) ) ⋮ k n = f ′ ( x k + α n h ) = f ( x k + α n h , y ( x k + α n h ) ) \kappa_1 = f'(x_k+\alpha_1 h)=f(x_k+\alpha_1h,y(x_k+\alpha_1h)) \\ \kappa_2 = f'(x_k+\alpha_2h)=f(x_k+\alpha_2h,y(x_k+\alpha_2h)) \\ \vdots \\ k_n=f'(x_k+\alpha_nh) = f(x_k+\alpha_nh,y(x_k+\alpha_nh)) κ1=f(xk+α1h)=f(xk+α1h,y(xk+α1h))κ2=f(xk+α2h)=f(xk+α2h,y(xk+α2h))kn=f(xk+αnh)=f(xk+αnh,y(xk+αnh))
通常 α 1 \alpha_1 α1取0,即对应 x k x_k xk点;此时, κ 1 = f ( x k , y k ) \kappa_1=f(x_k,y_k) κ1=f(xk,yk)

同样,对于上面其余式子 f 自变量中的 y ( x k + α n h ) y(x_k+\alpha_nh) y(xk+αnh) 使用欧拉法来求,即
κ 1 = f ( x k , y k ) y ( x k + α 2 h ) = y ( x k ) + α 2 h ⋅ f ′ ( x k ) = y k + α 2 h ⋅ κ 1 y ( x k + α 3 h ) = y ( x k + α 2 h ) + ( α 3 − α 2 ) h ⋅ κ 2 = y k + α 2 h ⋅ κ 1 + ( α 3 − α 2 ) h ⋅ κ 2 ⋮ y ( x k + α n h ) = y k + α 2 h ⋅ h + ( α 3 − α 2 ) h ⋅ κ 2 + ⋯ + ( α n − α n − 1 ) h ⋅ κ n − 1 \kappa_1=f(x_k,y_k) \\ y(x_k+\alpha_2h) = y(x_k)+\alpha_2h\cdot f'(x_k)=y_k+\alpha_2h\cdot\kappa_1 \\ y(x_k+\alpha_3h) = y(x_k+\alpha_2h)+(\alpha_3-\alpha_2)h\cdot \kappa_2=y_k+\alpha_2h\cdot\kappa_1 + (\alpha_3-\alpha_2)h\cdot\kappa_2 \\ \vdots \\ y(x_k+\alpha_n h)=y_k+\alpha_2h\cdot h+(\alpha_3-\alpha_2)h\cdot \kappa_2+\cdots+(\alpha_n-\alpha_{n-1})h\cdot\kappa_{n-1} κ1=f(xk,yk)y(xk+α2h)=y(xk)+α2hf(xk)=yk+α2hκ1y(xk+α3h)=y(xk+α2h)+(α3α2)hκ2=yk+α2hκ1+(α3α2)hκ2y(xk+αnh)=yk+α2hh+(α3α2)hκ2++(αnαn1)hκn1
值得注意的是,对于欧拉法来说,两点间距越小,误差越小。对应于该处,取样点越多,间距越小,此处欧拉法误差越小。

总结以上,即
{ y k + 1 = y k + ( λ 1 κ 1 + λ 2 κ 2 + ⋯ + λ n κ n ) ⋅ h κ 1 = f ( x k , y k ) κ 2 = f ( x k + α 1 , y k + α 1 h κ 1 ) κ 3 = f ( x k + α 2 , y k + α 1 h κ 1 + ( α 2 − α 1 ) h κ 2 ) ⋮ κ n = f ( x k + α n , y k + α 1 h κ 1 + ( α 2 − α 1 ) h κ 2 + ⋯ + ( α n − α n − 1 ) h κ n − 1 ) \left\{\begin{aligned} &y_{k+1} = y_k+(\lambda_1\kappa_1+\lambda_2\kappa_2+\cdots+\lambda_n\kappa_n)\cdot h \\ &\kappa_1 = f(x_k,y_k) \\ &\kappa_2 = f(x_k+\alpha_1,y_k+\alpha_1 h\kappa_1) \\ &\kappa_3 = f(x_k+\alpha_2,y_k+\alpha_1h\kappa_1+(\alpha_2-\alpha_1)h\kappa_2)\\ \vdots \\ &\kappa_n = f(x_k+\alpha_n,y_k+\alpha_1h\kappa_1+(\alpha_2-\alpha_1)h\kappa_2+\cdots+(\alpha_n-\alpha_{n-1})h\kappa_{n-1}) \end{aligned} \right. yk+1=yk+(λ1κ1+λ2κ2++λnκn)hκ1=f(xk,yk)κ2=f(xk+α1,yk+α1hκ1)κ3=f(xk+α2,yk+α1hκ1+(α2α1)hκ2)κn=f(xk+αn,yk+α1hκ1+(α2α1)hκ2++(αnαn1)hκn1)
其中:

λ 1 , λ 2 , ⋯   , λ n \lambda_1,\lambda_2,\cdots,\lambda_n λ1,λ2,,λn 为对应采样点斜率权值,满足 λ 1 + λ 2 + ⋯ + λ n = 1 \lambda_1+\lambda_2+\cdots+\lambda_n=1 λ1+λ2++λn=1

α 1 , α 2 , ⋯   , α n \alpha_1,\alpha_2,\cdots,\alpha_n α1,α2,,αn 为采样点位置比率,满足 0 < α 1 < α 2 < ⋯ < α n 0<\alpha_1<\alpha_2<\cdots<\alpha_n 0<α1<α2<<αn

实际应用

采样两个点来估算斜率,其中一个为端点 ( x k , y k ) (x_k,y_k) xk,yk,另一个点取 α 1 \alpha_1 α1

可以得到二阶龙格库塔公式
{ y k + 1 = y k + ( λ 1 κ 1 + λ 2 κ 2 ) h κ 1 = f ( x k , y k ) κ 2 = f ( x k + α 1 h , y k + α 1 h κ 1 ) \left\{\begin{aligned} &y_{k+1} = y_k+(\lambda_1\kappa_1+\lambda_2\kappa_2)h \\ &\kappa_1 = f(x_k,y_k) \\ &\kappa_2 = f(x_k+\alpha_1h,y_k+\alpha_1h\kappa_1) \end{aligned} \right. yk+1=yk+(λ1κ1+λ2κ2)hκ1=f(xk,yk)κ2=f(xk+α1h,yk+α1hκ1)
依次类推,采样适当数量的点,设置适当的 α 和 λ \alpha和\lambda αλ 就可以得到三阶、四阶等更高精度的龙格库塔公式。具体推导不赘述。

仅需要说明的是,对于更高阶常用龙格库塔公式,对于采样点的选取以及采样点函数值的计算并非一定按照上述方式计算。如采样点选取可能会选取重复点,但采用不同函数值计算方案(以上都是基于前一点,有些就基于更前面的点),总之十分灵活,但原理和思想都是一样的

你可能感兴趣的:(数学相关,算法,数学建模,matlab)