模拟退火(SA, Simulated Annealing)算法

转载自:数据魔术师公众号

 

旅行商问题(TSP)

TSP问题(Traveling Salesman Problem,旅行商问题)问题描述如下:

有若干个城市,任何两个城市之间的距离确定,现要求一旅行商从某城市出发必须经过每一个城市且只在一个城市逗留一次,最后回到出发的城市,问如何事先确定一条最短线路以保证其旅行的费用最少

模拟退火(SA, Simulated Annealing)算法_第1张图片

 

模拟退火算法

是一种通用概率演算法,用来在一个大的搜寻空间内找寻命题的最优解它是基于Monte-Carlo迭代求解策略的一种随机寻优算法模拟退火算法是解决TSP问题的有效方法之一。

原理

物理退火: 

  材料中的原子原来会停留在使内能有局部最小值的位置,加热使能量变大,原子会离开原来位置,而随机在其他位置中移动退火冷却时速度较慢,使得原子有较多可能可以找到内能比原先更低的位置。

模拟退火: 

  其原理也和固体退火的原理近似。模拟退火算法从某一较高初温出发,伴随温度参数的不断下降,结合概率突跳特性在解空间中随机寻找目标函数的全局最优解,即在局部最优解能概率性地跳出并最终趋于全局最优

爬山算法 (Hill Climbing Algorithm)

爬山算法是一种简单的贪心搜索算法,也可以被称为局部搜索算法(local search algorithm)该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解这种算法思想很单纯,但是也存在一个很大的缺陷。在搜索选择的过程中有可能会陷入局部最优解,而这个局部最优解不一定是全局最优解。比如下面这个问题:

模拟退火(SA, Simulated Annealing)算法_第2张图片

假设A是当前解,爬山算法往前继续搜索,当搜索到B这个局部最优解时就会停止搜索了。因为此时在B点无论是往哪边走都不会得到更优的解了。但是,聪明的同学已经发现了,全局最优解C点 

模拟退火算法

  爬山法是完完全全的贪心法(greedy algorithm),这种贪心只把眼光放在局部最优解上,因此只能搜索到局部的最优值。模拟退火其实也是一种贪心算法,只不过与爬山法不同的是,模拟退火算法在搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。

从上图来说,模拟退火算法在搜索到局部最优解B后,会以一定的概率接受向右移动也许经过几次这样的不是局部最优的移动后会到达BC之间的峰点D这样一来便跳出了局部最优解B,继续往右移动就有可能获得全局最优解C。如下图:

模拟退火(SA, Simulated Annealing)算法_第3张图片

概率计算

根据热力学的原理,在温度T时,出现能量差dE的降温的概率P(dE),表示为:

\LARGE P(dE)=e^{\frac{dE}{kT}}

其中k是一个常数,e表示自然指数,且 dE<0(温度总是降低的)。这条公式指明了:

1) 温度越高,出现一次能量差为dE的降温的概率越大(P是负指数函数,T越大,因变量越小,函数值离1越近)。

2) 温度越低,则出现降温的概率就越小。又由于dE总是小于0(不然怎么叫退火),因此dE/kT < 0 ,exp(dE/kT)取值是(0,1),那么P(dE)的函数取值范围是(0,1)

 

随着温度T的降低,P(dE)会逐渐降低。我们将一次向较差解的移动看做一次温度跳变过程,我们以概率P(dE)来接受这样的移动。也就是说,在用固体退火模拟组合优化问题,将内能E模拟为目标函数值 f,温度T演化成控制参数 t,即得到解组合优化问题的模拟退火演算法:

由初始解 i 和控制参数初值 t 开始,对当前解重复产生新解→计算目标函数差→接受或丢弃的迭代,并逐步衰减 t 值,算法终止时的当前解即为所得近似最优解。

因此归结起来就是以下几点:

1) 若f( Y(i+1) ) <= f( Y(i) ) (即移动后得到更优解),则总是接受该移动。

2) 若f( Y(i+1) ) > f( Y(i) ) (即移动后的解比当前解要差),则以一定概率接受移动,而且这个概率随着时间推移逐渐降低(逐渐降低才能趋向稳定)。

 

相当于上图中,从B移向BC之间的小波峰D时,每次右移(即接受一个更糟糕值)的概率在逐渐降低。如果这个坡特别长,那么很有可能最终我们并不会翻过这个坡。如果它不太长,这很有可能会翻过它,这取决于衰减 t 值的设定。

 

模拟退火算法伪代码

模拟退火(SA, Simulated Annealing)算法_第4张图片

 

使用模拟退火算法解决旅行商问题

TSP是经典的NP完全问题。精确的解决TSP的算法的时间复杂度O(2^N), 其中N是节点的个数 。而使用模拟退火算法则可以快速地获得一条近似最优路径。大体的思路如下:

1)    产生一条新的遍历路径P(i+1),计算路径P(i+1)的长度L( P(i+1) )。

2)    若L(P(i+1)) < L(P(i)),则接受P(i+1)为新的路径否则以模拟退火的那个概率接受P(i+1) ,然后降温。

3)    重复步骤1,2直到满足退出条件。

 

 

 

 

你可能感兴趣的:(运筹学笔记)