模拟退火算法

'''

2019.12

'''

总:

自己理解:可以求全局最优解,是梯度下降法的改进

官方解释:模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。根据Metropolis准则,粒子在温度T时趋于平衡的概率为e(-ΔE/(kT)),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t,即得到解组合优化问题的模拟退火算法:由初始解i和控制参数初值t开始,对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值t及其衰减因子Δt、每个t值时的迭代次数L和停止条件S。

算法介绍:(这部分可以直接看下面的例子

模拟退火算法的模型

1模拟退火算法可以分解为解空间、目标函数和初始解三部分。

2模拟退火的基本思想:

(1) 初始化:初始温度T(充分大),初始解状态S(是算法迭代的起点),每个T值的迭代次数L

(2) 对k=1, …, L做第(3)至第6步:

(3) 产生新解S′

(4) 计算增量ΔT=C(S′)-C(S),其中C(S)为评价函数

(5) 若ΔT<0则接受S′作为新的当前解,否则以概率exp(-ΔT/T)接受S′作为新的当前解.

(6) 如果满足终止条件则输出当前解作为最优解,结束程序。

终止条件通常取为连续若干个新解都没有被接受时终止算法。

(7) T逐渐减少,且T->0,然后转第2步。

模拟退火算法的步骤

模拟退火算法新解的产生和接受可分为如下四个步骤:

第一步是由一个产生函数从当前解产生一个位于解空间的新解;为便于后续的计算和接受,减少算法耗时,通常选择由当前新解经过简单地变换即可产生新解的方法,如对构成新解的全部或部分元素进行置换、互换等,注意到产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。

第二步是计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生,所以目标函数差的计算最好按增量计算。事实表明,对大多数应用而言,这是计算目标函数差的最快方法。

第三步是判断新解是否被接受,判断的依据是一个接受准则,最常用的接受准则是Metropolis准则: 若ΔT<0则接受S′作为新的当前解S,否则以概率exp(-ΔT/T)接受S′作为新的当前解S。

第四步是当新解被确定接受时,用新解代替当前解,这只需将当前解中对应于产生新解时的变换部分予以实现,同时修正目标函数值即可。此时,当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。

模拟退火算法与初始值无关,算法求得的解与初始解状态S(是算法迭代的起点)无关;模拟退火算法具有渐近收敛性,已在理论上被证明是一种以概率l 收敛于全局最优解的全局优化算法;模拟退火算法具有并行性。

                                                                                                                                                         ----百度百科

分:

参考(https://www.zhihu.com/question/24761931)

例子:算法思想

1,初始化:初始温度T,初始解状态S,是算法迭代的起点;

2,产生新解S'

3,计算增量\Delta T=C(S',S)其中C为评价函数,若\Delta T<0,则接受S'作为新的当前解,否则以概率exp(-\Delta T/KT)j接受S'作为新的当前解

4,如果满足终止条件则输出当前解作为最优解,结束程序,终止条件通常取为连续若干个新解都没有被接收时终止算法

Sa算法应用:

应用模拟退火法求以下函数的最小值:

y=np.sin(5*np.pi(x-0.05))+np.cos(np.pi*(x-0.04))      0

代码如下

'''
模拟退火法
'''
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.animation  as animation



#全局变量
save_list=[]

#求解函数
def f(x):
    return np.sin(5*np.pi*(x-0.05))+np.cos(np.pi*(x-0.04))
   


#核心算法

def sa():
    T=0             #当前温度
    T_max=1
    k=10
    best=f(T)
    i=0
    break_i=0                #迭代次数
    
    while T_max>T:
        T=T+0.005
        ca=f(T)-f(T-0.05)
        if ca<0:               #如果当前值小于以前值可以继续下降
            best=min(best,f(T))
            break_i=0
        else:                 #如果当前值大于等于以前值一定的几率使用当前值e(-ca/k*T)
            if np.exp(-ca/k*T)>np.random.random(1):       #np.random.random 表示随机概率
                best=min(best,f(T))
                break_i=0
            #如果30次找不到下降值,则退出
            break_i=break_i+1
            if break_i>30:
                break
        i=i+1
        save_list.append([T,best])

    return best
        

point_x,point_y=sa()

#函数图像
fig=plt.figure()
wind=fig.add_subplot(111)
x=np.linspace(0,1,200)
y=f(x)
wind.plot(x,y)


#动态画图
plt.ion()
x=[]
y=[]
for i,j in save_list:
    x.append(i)
    y.append(j)
    plt.plot(x, y,c='r',ls='-', marker='o', mec='b',mfc='w')  ## 保存历史数据
        #plt.plot(t, np.sin(t), 'o')
    plt.pause(0.1)


 

模拟退火算法_第1张图片

总:后续待补充

你可能感兴趣的:(算法)