一般迭代法(一)| 原理公式 + 迭代法的收敛性

一般迭代法

1. 基本原理和迭代公式

先看一个例子。设有两个函数 y = φ ( x ) y=\varphi(x) y=φ(x) y = x y=x y=x,欲求其交点 x ∗ x^* x。为此,可将函数 y = x y=x y=x改写成 x = y x=y x=y的形式,并给定一个初始值 x 0 x_0 x0,并进行如下计算:

(1)先计算函数 y = φ ( x ) y=\varphi(x) y=φ(x) x 0 x_0 x0处的函数值 y 0 y_0 y0,然后计算函数 x = y x=y x=y y 0 y_0 y0处的值 x 1 x_1 x1,即:
y 0 = φ ( x 0 ) , x 1 = y 0 y_0=\varphi(x_0), \quad x_1=y_0 y0=φ(x0),x1=y0
通过上述变换规则,由 x 0 x_0 x0得到 x 1 x_1 x1 x 1 x_1 x1一般不同于 x 0 x_0 x0,并且由 x 0 x_0 x0惟一确定。

(2)再计算函数 y = φ ( x ) y=\varphi(x) y=φ(x) x 1 x_1 x1处的函数值 y 1 y_1 y1,然后计算函数 x = y x=y x=y y 1 y_1 y1处的值 x 2 x_2 x2,即:
y 1 = φ ( x 1 ) , x 2 = y 1 y_1=\varphi(x_1),\quad x_2=y_1 y1=φ(x1),x2=y1
通过变换规则,由 x 1 x_1 x1得到 x 2 x_2 x2 x 2 x_2 x2不同于 x 1 x_1 x1并且由 x 1 x_1 x1惟一确定。

(3)这样一直计算下去,就有可能会得到这样的结果:计算函数 y = φ ( x ) y=\varphi(x) y=φ(x) x ∗ x^* x处的函数值 y ∗ y^* y,然后在计算函数 x = y x=y x=y y ∗ y^* y处的值时,得到的结果就是 x ∗ x^* x,即:
y ∗ = φ ( x ∗ ) , x ∗ = y ∗ y^*=\varphi(x^*),\quad x^*=y^* y=φ(x),x=y
即通过同样的变换规则,由 x ∗ x^* x得到的仍然是 x ∗ x^* x,并且该结果不再改变, x ∗ x^* x被称为不动点。上述按某种规则进行变换而得到某个数列 { x 0 , x 1 , x 2 , ⋯   , x ∗ , ⋯   } \{x_0,x_1,x_2,\cdots,x^*,\cdots\} {x0,x1,x2,,x,}的过程称为迭代过程。即:
x k + 1 = φ ( x k ) , ( k = 0 , 1 , 2 , ⋯   ) x_{k+1}=\varphi(x_k),\quad (k=0,1,2,\cdots) xk+1=φ(xk),(k=0,1,2,)
在上述迭代计算过程中,如果数列 { x 0 , x 1 , x 2 , ⋯   , x ∗ , ⋯   } \{x_0,x_1,x_2,\cdots,x^*,\cdots\} {x0,x1,x2,,x,}能趋向与某个极限值 x ∗ x^* x,则这个极限值必然是函数 y = φ ( x ) y=\varphi(x) y=φ(x) x = y x=y x=y的交点 x ∗ x^* x,或者是方程组 y = φ ( x ) y=\varphi(x) y=φ(x) x = y x=y x=y的解。于是,就得到了一种解方程的数值方法——迭代方法。下图从几何上描述了迭代的具体过程。

一般地,如果将方程组 y = φ ( x ) y=\varphi(x) y=φ(x) y = x y=x y=x消去y,则得到一个关于x的方程:
x = φ ( x ) x − φ ( x ) = 0 f ( x ) = 0 x=\varphi(x) \\x-\varphi(x)=0 \\f(x)=0 x=φ(x)xφ(x)=0f(x)=0
一般迭代法(一)| 原理公式 + 迭代法的收敛性_第1张图片

在方程 f ( x ) = 0 f(x)=0 f(x)=0中,两个函数的交点 x ∗ x^* x必定满足 f ( x ∗ ) = 0 f(x^*)=0 f(x)=0,即 f ( x ) = 0 f(x)=0 f(x)=0和方程组 y = φ ( x ) y=\varphi(x) y=φ(x) y = x y=x y=x同解。根据这一思路,上溯推导,就可得到方程 f ( x ) = 0 f(x)=0 f(x)=0迭代求根的一般方法。即对一个方程
f ( x ) = 0 f(x)=0 f(x)=0
进行等价变换,只要将其改写为隐式方程形式
x = φ ( x ) (1) x=\varphi(x) \tag{1} x=φ(x)(1)
就得到迭代的计算公式。并且,称 φ ( x ) \varphi(x) φ(x)为迭代函数(1)式一般迭代公式。由于 φ ( x ) \varphi(x) φ(x)中仍然含有未知数x,故方程(1)不能直接求解。如果给出一个迭代初值 x 0 x_0 x0,则隐式方程(1)可转化为显示方程:
x 1 = φ ( x 0 ) x_1=\varphi(x_0) x1=φ(x0)
这样,就可以导出一般迭代的格式:
x k + 1 = φ ( x k ) , k = 0 , 1 , 2 , ⋯ (2) x_{k+1}=\varphi(x_k),k=0,1,2,\cdots \quad \tag{2} xk+1=φ(xk),k=0,1,2,(2)
对于给定的迭代初值 x 0 x_0 x0,按迭代格式(2)反复计算,将得到一个序列 x 0 , x 1 , x 2 , ⋯   , x k x_0,x_1,x_2,\cdots,x_k x0,x1,x2,,xk。当 k → ∞ k\to \infty k,如果极限 l i m k → ∞ x k lim_{k\to \infty}x_k limkxk存在,则称该迭代格式 x k + 1 = φ ( x k ) x_{k+1}=\varphi(x_k) xk+1=φ(xk)是收敛的,并且,该极限就是方程 f ( x ) = 0 f(x)=0 f(x)=0的根,否则称该迭代格式 x k + 1 = φ ( x k ) x_{k+1}=\varphi(x_k) xk+1=φ(xk)是发散的。

例1:求方程 x 3 − x − 1 = 0 x^3-x-1=0 x3x1=0 x = 1.5 x=1.5 x=1.5附近的一个根

:可以将原方程改写为 x = x + 1 x=\sqrt{x+1} x=x+1 的形式。由此,可写出一般迭代格式为:
x k + 1 = x k + 1 3 , k = 0 , 1 , 2 , ⋯ x_{k+1}= \sqrt[3]{x_k+1},\quad k=0,1,2,\cdots xk+1=3xk+1 ,k=0,1,2,
取迭代初值 x 0 = 1.5 x_0=1.5 x0=1.5,按照上述迭代格式进行初次迭代,得到 x 1 = x 0 + 1 3 = 1.35721 x_1=\sqrt[3]{x_0+1}=1.35721 x1=3x0+1 =1.35721,继续迭代下去,直到第7次和第8次迭代结果分别是 x 7 = 1.32472 x_7=1.32472 x7=1.32472 x 8 = 1.32472 x_8=1.32472 x8=1.32472,两次迭代结果相同,便得到所求的根 x ∗ = 1.32472 x^*=1.32472 x=1.32472。下表列出了各次迭代的结果

一般迭代法(一)| 原理公式 + 迭代法的收敛性_第2张图片

在使用一般迭代法的过程中,迭代计算结果并不总是收敛的。如果将上述例题所给的方程改写为 x = x 3 − 1 x=x^3-1 x=x31,其迭代格式为 x k + 1 = x k 3 − 1 x_{k+1}=x_k^3-1 xk+1=xk31。若迭代初值仍取 x n = 1.5 x_n=1.5 xn=1.5,则 x 1 = 2.375 , x 2 = 12.3976 , ⋯   , x_1=2.375,x_2=12.3976,\cdots, x1=2.375,x2=12.3976,,这样继续迭代下去,显然得不到正确的结果,即当 k → ∞ k\to\infty k时不会趋于某个极限。这种迭代过程是发散的,而发生的迭代过程是毫无意义的。

下图给出了迭代发散过程的图解 ∣ φ ′ ( x ) ∣ > 1 |\varphi'(x)|>1 φ(x)>1时。因此,在使用一般迭代法时,必须首先检验迭代格式的收敛性

2. 迭代法的收敛性

定理1:设函数 φ ( x ) \varphi(x) φ(x) [ a , b ] [a,b] [a,b]上具有连续的一阶导数,且满足条件:

(1)对所有的 x ∈ [ a , b ] x\in[a,b] x[a,b],有 φ ( x ) ∈ [ a , b ] \varphi(x)\in[a,b] φ(x)[a,b]

(2)存在 0 < L < 1 00<L<1,对所有的 x ∈ [ a , b ] x\in[a,b] x[a,b],始终有 ∣ φ ′ ( x ) ∣ ≤ L |\varphi'(x)|\leq L φ(x)L,则方程 f ( x ) = 0 f(x)=0 f(x)=0 x = φ ( x ) x=\varphi(x) x=φ(x)有如下性质:

  • 在[a,b]上的解 x ∗ x^* x存在且惟一;
  • 对于任意的初始值 x 0 ∈ [ a , b ] x_0\in[a,b] x0[a,b],迭代过程 x k + 1 = φ ( x k ) x_{k+1}=\varphi(x_k) xk+1=φ(xk)均收敛于 x ∗ x^* x
  • 误差估计式为

∣ x ∗ − x k ∣ ≤ 1 1 − L ∣ x k + 1 − x k ∣ |x^*-x_k|\leq \frac{1}{1-L}|x_{k+1}-x_k| \\ xxk1L1xk+1xk


∣ x ∗ − x k ∣ ≤ L k 1 − L ∣ x 1 − x 0 ∣ ( k = 1 , 2 , ⋯   ) |x^*-x_k|\leq \frac{L^k}{1-L}|x_1-x_0|\quad (k=1,2,\cdots) xxk1LLkx1x0(k=1,2,)
定理1是一般迭代法的区间收敛定理。在该定理中,条件(1)保证 y = φ ( x ) y=\varphi(x) y=φ(x) y = x y=x y=x一定有交点,条件(2)保证方程若有根则必然惟一并且能用迭代法求解出来。这两个条件是充分条件而不是必要条件。下图给出了定理2的几何解释。其中:(a)表示同时满足两个条件的情形,(b)表示条件(2)不满足的情形,(c)表示条件(1)不满足的情形,(d)表示条件(1)和条件(2)同时都不满足的情形。因此,在用迭代法求方程的根时,构造的迭代函数 φ ( x ) \varphi(x) φ(x)必须同时满足两个条件。

一般迭代法(一)| 原理公式 + 迭代法的收敛性_第3张图片

定理1还给出来了迭代过程的终止条件,即:

一个收敛的迭代过程,虽然从理论上讲有 x ∗ = l i m k → ∞ x k x^*=lim_{k\to\infty}x_k x=limkxk,但在实际计算时,只能迭代有限次数,即只要迭代结果满足
∣ x k + 1 − x k ∣ ≤ ϵ |x_{k+1}-x_k|\leq \epsilon xk+1xkϵ
就能保证 x k x_k xk充分接近方程的根 x ∗ x^* x。该不等式称为迭代过程的终止条件。

例1中,由于同一方程一般可以构造出多个迭代函数,为了保证迭代过程收敛,根据定理1就能确定收敛的迭代函数 φ ( x ) \varphi(x) φ(x)以及选取迭代初始值 x 0 x_0 x0

一般说来,定理1中的两个条件在较大的有根区间上是很难保证的,因此要尽可能寻找足够小的方程根的分布区间。通常可在跟 x ∗ x^* x附近来考察其收敛性。于是,就有下面的一般迭代法的局部收敛定理。

一般迭代法(一)| 原理公式 + 迭代法的收敛性_第4张图片

定义1:对于迭代函数 φ ( x ) \varphi(x) φ(x),如果存在方程根 x ∗ x^* x的一个邻域 Δ : ∣ x − x ∗ ∣ ≤ δ \Delta:|x-x^*|\leq \delta Δ:xxδ,迭代过程对于任意初值 x 0 ∈ Δ x_0\in \Delta x0Δ均收敛,则称这种收敛性为局部收敛性

定理2:设 φ ( x ) \varphi(x) φ(x) x = φ ( x ) x=\varphi(x) x=φ(x) x ∗ x^* x的邻域内有连续的一阶导数,且
∣ φ ′ ( x ∗ ) ∣ < 1 |\varphi'(x^*)|<1 φ(x)<1
则迭代过程具有局部收敛性

注意:用迭代法求方程的根,选用不同的迭代函数,所得到的收敛性和收敛速度是不太一样的。因此,在实际计算中,应该选用收敛的迭代法以及收敛速度快的计算方法。

你可能感兴趣的:(数值计算)