模拟退火

模拟退火算法来源于固体退火原理,是一种基于概率的算法,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。

模拟退火算法的模型

1模拟退火算法可以分解为解空间、目标函数和初始解三部分。
2模拟退火的基本思想:
(1) 初始化:初始温度T(充分大),初始解状态S(是算法迭代的起点),每个T值的迭代次数L
(2) 对k=1, …, L做第(3)至第6步:
(3) 产生新解S′
(4) 计算增量ΔT=C(S′)-C(S),其中C(S)为评价函数
(5) 若ΔT<0则接受S′作为新的当前解,否则以概率exp(-ΔT/T)接受S′作为新的当前解.
(6) 如果满足终止条件则输出当前解作为最优解,结束程序。
终止条件通常取为连续若干个新解都没有被接受时终止算法。
(7) T逐渐减少,且T->0,然后转第2步。
模拟退火算法的步骤

模拟退火算法新解的产生和接受可分为如下四个步骤:

第一步是由一个产生函数从当前解产生一个位于解空间的新解;为便于后续的计算和接受,减少算法耗时,通常选择由当前新解经过简单地变换即可产生新解的方法,如对构成新解的全部或部分元素进行置换、互换等,注意到产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。
第二步是计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生,所以目标函数差的计算最好按增量计算。事实表明,对大多数应用而言,这是计算目标函数差的最快方法。
第三步是判断新解是否被接受,判断的依据是一个接受准则,最常用的接受准则是Metropolis准则: 若ΔT<0则接受S′作为新的当前解S,否则以概率exp(-ΔT/T)接受S′作为新的当前解S。
第四步是当新解被确定接受时,用新解代替当前解,这只需将当前解中对应于产生新解时的变换部分予以实现,同时修正目标函数值即可。此时,当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。
PS:由于matlab对矩阵操作方便,使用matlab写模拟退火法解TSP旅行商问题:
数据地址:
https://wwwproxy.iwr.uni-heidelberg.de/groups/comopt/software/TSPLIB95/tsp/
下载berlin52.tsp

clear
    clc
    a=0.99;     %温度衰减函数的参数
    t0 = 97;tf=3;t=t0;
    Markov_length = 10000;%马尔可夫链长度
    fid = fopen('G:\berlin52.tsp');
    coordinates = textscan(fid,'%d %f %f');
    fclose(fid);
    coordinates(1) = [];
    coordinates = cell2mat(coordinates);
    amount = size(coordinates,1);%城市的数量
    %计算距离矩阵
    dist_matrix =zeros(amount,amount);
    coor_x_tmp1 = coordinates(:,1)*ones(1,amount);
    coor_x_tmp2 = coor_x_tmp1';
    coor_y_tmp1 = coordinates(:,2)*ones(1,amount);
    coor_y_tmp2 = coor_y_tmp1';
    dist_matrix = sqrt((coor_x_tmp1-coor_x_tmp2).^2+(coor_y_tmp1-coor_y_tmp2).^2);
    
    sol_new = 1:amount;  %产生初始解
    %sol_new是新解 sol_current是当前解 sol_best 是冷却中的最优解
    E_current = inf;E_best = inf; %E_currrent是当前解对应的回路距离
    %E_new 是新解的回路距离
    %E_best 是最优解
    sol_current = sol_new;sol_best = sol_new;
    p =1;
   
    %退火过程
    while t>=tf
        for r= 1:Markov_length  %马尔可夫链长度
            %产生随机扰动项
            if(rand<0.5)
                %两交换
                ind1 = 0;ind2 =0;
                while(ind1==ind2)
                    ind1 = ceil(rand.*amount);
                    ind2 = ceil(rand.*amount);
                end
                tmp1 = sol_new(ind1);
                sol_new(ind1) = sol_new(ind2);
                sol_new(ind2) = tmp1;
            else
                %三交换
                ind1 = 0;ind2 = 0;ind3 =0;
                while(ind1==ind2||ind2==ind3||ind1==ind3||abs(ind1-ind2)==1)
                     ind1 = ceil(rand.*amount);
                     ind2 = ceil(rand.*amount);
                     ind3 = ceil(rand.*amount);
                end
                tmp = sort([ind1 ind2 ind3]);
                ind1=tmp(1);ind2=tmp(2);ind3=tmp(3);
                tmplist1 = sol_new((ind1+1):(ind2-1));
                sol_new((ind1+1):(ind1+ind3-ind2+1)) =...
                    sol_new(ind2:ind3);
                sol_new((ind1+ind3-ind2+2):ind3) =...
                    tmplist1;
            end
            
            %检查是否满足约束?
            
            %计算目标的函数值 内能
            E_new = 0;
            for i =1:(amount-1)
                E_new = E_new + ...
                    dist_matrix(sol_new(i),sol_new(i+1));
            end
            %最后一个城市到第一个城市的距离
            E_new = E_new + dist_matrix(sol_new(1),sol_new(end));
            
            if E_new 

每次解差距有点大,可以运行多次,选取最优解

你可能感兴趣的:(模拟退火)