非精确一维线搜索(Armijo-Goldstein Rule 和 Wolfe-Powell Rule)

非精确一维线搜索(Armijo-Goldstein Rule 和 Wolfe-Powell Rule)

  • Armijo-Goldstein Rule
    • 算法步骤
  • Wolfe-Powell Rule
    • 算法步骤

Armijo-Goldstein Rule

核心思想:

  1. 目标函数值有足够下降;
  2. 一维线搜索的步长不应该太小

算法步骤

  • S t e p 1 Step1 Step1:初始点 μ \mu μ ,令 μ m i n \mu_{min} μmin = 0, μ m a x \mu_{max} μmax = + ∞ \infty ρ ∈ ( 0 , 1 2 ) \rho\in(0,\frac{1}{2}) ρ(0,21),计算 f ( 0 ) f(0) f(0) f ′ ( 0 ) f'(0) f(0);

  • S t e p 2 Step2 Step2:如果 f ( μ ) > f ( 0 ) + ρ f ′ ( 0 ) μ f(\mu)>f(0)+\rho f'(0)\mu f(μ)>f(0)+ρf(0)μ, 令 μ m a x = μ \mu_{max}=\mu μmax=μ,转 S t e p 3 Step3 Step3 ,
    如果 f ( μ ) ≥ f ( 0 ) + ( 1 − ρ ) f ′ ( 0 ) μ f(\mu) \geq f(0) +(1-\rho)f'(0)\mu f(μ)f(0)+(1ρ)f(0)μ , 停止迭代,输出 μ \mu μ ,
    否则,令 μ m i n = μ \mu_{min}=\mu μmin=μ, 转 S t e p 3 Step3 Step3

  • S t e p 3 Step3 Step3:如果 μ m a x < + ∞ , 令 μ = μ m i n + μ m a x \mu_{max}<+\infty , 令\mu=\mu_{min}+\mu_{max} μmax<+,μ=μmin+μmax,转到 S t e p 2 Step2 Step2
    否则,令 μ = 2 μ \mu=2\mu μ=2μ, 转到 S t e p 2 Step2 Step2.

Wolfe-Powell Rule

核心思想:

  • 利用梯度避免将极小值排除在可接受区间外。

算法步骤

  • S t e p 1 Step1 Step1:初始点 μ , 令 μ m i n = 0 , μ m a x = + ∞ , 令 f m i n = f ( 0 ) , f m i n ′ = f ′ ( 0 ) \mu, 令\mu_{min}=0, \mu_{max}=+\infty, 令f_{min}=f(0), f'_{min}=f'(0) μ,μmin=0,μmax=+,fmin=f(0),fmin=f(0),
    ρ ( = 0.1 ) , σ ( = 0.4 ) \rho(=0.1),\sigma(=0.4) ρ(=0.1),σ(=0.4);

  • S t e p 2 Step2 Step2:如果 f ( μ ) > f ( 0 ) + ρ f ′ ( 0 ) μ , 令 μ m a x = μ , 转 到 S t e p 3 f(\mu)>f(0)+\rho f'(0)\mu,令\mu_{max}=\mu,转到Step3 f(μ)>f(0)+ρf(0)μ,μmax=μ,Step3,
    如果 f ′ ( μ ) ≥ σ f ′ ( 0 ) , 停 止 迭 代 , 输 出 μ f'(\mu)\geq\sigma f'(0),停止迭代,输出\mu f(μ)σf(0),μ,
    否则,令 μ m i n = μ , 转 到 S t e p 4 \mu_{min}=\mu,转到Step4 μmin=μStep4

  • S t e p 3 Step3 Step3 μ ^ = μ m i n + 1 2 μ − μ m i n 1 + f m i n − f ( μ ) ( μ − μ m i n ) f m i n ′ , μ = μ ^ , \hat \mu=\mu_{min}+\frac{1}{2}\frac{\mu-\mu_{min}}{1+\frac{f_{min}-f(\mu)}{(\mu-\mu_{min})f'_{min}}},\mu=\hat \mu, μ^=μmin+211+(μμmin)fminfminf(μ)μμmin,μ=μ^
    计算 f ( μ ) , f ′ ( μ ) , 转 到 S t e p 2 f(\mu),f'(\mu),转到Step2 f(μ),f(μ),Step2;

  • S t e p 4 Step4 Step4 μ ^ = μ + μ − μ m i n f m i n ′ − f ′ ( μ ) f ′ ( μ ) , \hat \mu=\mu+\frac{\mu-\mu_{min}}{f'_{min}-f'(\mu)}f'(\mu), μ^=μ+fminf(μ)μμminf(μ),
    计算 f m i n = f ( μ ) , f m i n ′ = f ′ ( μ ) , 令 μ = μ ^ f_{min}=f(\mu),f'_{min}=f'(\mu),令\mu=\hat \mu fmin=f(μ),fmin=f(μ),μ=μ^;
    计算 f ( μ ) , f ′ ( μ ) , 转 到 S t e p 2 f(\mu),f'(\mu),转到Step2 f(μ),f(μ),Step2;

代码实现后续补充

你可能感兴趣的:(数学小记,算法)