模拟退火算法在求解最优值问题上有很大的优势,前面一篇博文介绍了用模拟退火算法实现求函数的最大、最小值问题。本文主要介绍如何用python实现模拟退火在TSP(旅行商)问题中的应用,源代码请移步pySA。网络上有不少文章介绍模拟退火TSP应用,可以对比着看。我们对实现的算法进行了测试,动态可视化更加形象。
这个问题实际上就是求解最小路劲的问题,不过目前pySA实现还不是真正意义上的TSP,TSP问题中要求固定起点,pySA实现的是任意给定数目的地点,地点位置的生成也是随意的,然后模拟退火找到一条最短路劲。实际上要实现TSP也容易,固定起始点即可。
在实际编程中出现一个bug,debug好久,心累……下面把这个bug做下记录,提醒以后的自己注意避坑。
在产生新解的函数中:
def newTSP(self, oldList):
'''
for TSO question
:oldList : old path list
:return : new path list solution
'''
length = self.numCity
for i in range(self.Markov_chain):
x, y = 0, 0
while x == y:
x = np.random.randint(0, length)
y = np.random.randint(0, length)
oldList[i][x], oldList[i][y] = oldList[i][y], oldList[i][x]
return oldList
输入尝试解oldList,根据以上程序,返回新解,只不过这个新解是修改后的oldList,这在第一步退火没什么问题,可是当得到局部优解时,我们需要利用这个作为下一次的尝试解,也就chain_length个尝试解都是它,新解只是各自对它进行微扰。由于刚开始程序中是直接先一次性都生成chain_length个尝试解,然后一次性生成chain_length个新解,这里其实oldList已经在第一次生成新解时改变了,下次模拟退火尝试解已经不是原来的,相当于又回到解放前…所以最好是新建个newList,把更新赋值给它。
import copy
def newTSP(self, oldList):
'''
for TSO question
:oldList : old path list
:return : new path list solution
'''
length = self.numCity
x, y = 0, 0
newList = copy.copy(oldList)
while x == y:
x = np.random.randint(0, length)
y = np.random.randint(0, length)
if np.random.random() <= 0.5:
newList[x], newList[y] = newList[y], newList[x]
else:
newList[x:(y+1)] = newList[x:(y+1)][::-1]
return newList
上面提到刚开始,产生尝试解、新解都是直接一步到位(通过列表解析),但是这就会有问题,出现在random函数上,x,y连续用random产生的随机数,增大了出来相同数值的概率,也就造成不随机问题。改进方法就是不一次性产生:原先oldList=[[0,1,2,3,4,5],[0,1,2,3,4,5]], newList=[[0,2,1,3,4,5],[1,2,3,0,4,5]]; 改为oldList=[0,1,2,3,4,5], newList=[0,2,1,3,4,5],在后续迭代中次序生成。
我们发现模拟退火最终找到了理论的最小值,检验了程序的可靠性。
类似的对比结果,可以移步Traveling Salesman (TSP): Simulated Annealing