[洛谷日报第60期]浅谈玄学算法——模拟退火

转载自落谷日报
原文地址:https://m-sea.blog.luogu.org/qian-tan-SA

初级篇

本篇讲解SA的基本概念。

如果您已经了解SA的基本概念,您可以跳过这一段。

简介

模拟退火算法(Simulate Anneal,SA)是一种通用概率演算法,用来在一个大的搜寻空间内找寻命题的最优解。模拟退火是由S.Kirkpatrick, C.D.Gelatt和M.P.Vecchi在1983年所发明的。V.Černý在1985年也独立发明此演算法。模拟退火算法是解决TSP问题的有效方法之一。

模拟退火的出发点是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性。模拟退火算法是一种通用的优化算法,其物理退火过程由加温过程、等温过程、冷却过程这三部分组成。

——百度百科

简单说,模拟退火是一种随机化算法。当一个问题的方案数量极大(甚至是无穷的)而且不是一个单峰函数时,我们常使用模拟退火求解。

它与爬山算法最大的不同是,在寻找到一个局部最优解时,赋予了它一个跳出去的概率,也就有更大的机会能找到全局最优解。

原理

模拟退火的原理也和金属退火的原理近似:将热力学的理论套用到统计学上,将搜寻空间内每一点想像成空气内的分子;分子的能量,就是它本身的动能;而搜寻空间内的每一点,也像空气分子一样带有“能量”,以表示该点对命题的合适程度。演算法先以搜寻空间内一个任意点作起始:每一步先选择一个“邻居”,然后再计算从现有位置到达“邻居”的概率。

——百度百科

要将模拟退火,首先要知道金属退火(https://baike.baidu.com/item/退火/1039313?fr=aladdin)。

简单来说,就是将金属加热到一定温度,保持足够时间,然后以适宜速度冷却。

那么对应到OI上,就是每次随机出一个新解,如果这个解更优,则接受它,否则以一个与温度和与最优解的差相关的概率接受它。

过程

降温

模拟退火时有三个参数,分别是初始温度 T_0 、降温系数 \Delta 、终止温度 T_k 。

其中, T_0 是一个比较大的数, \Delta 是一个略小于 1 的正数, T_k 是一个略大于 0 的正数。

我们先让温度 T=T_0 ,然后每次降温时 T=T\cdot \Delta ,直到 T\leq T_k 为止。

大致过程如下:

可以看出,随着温度的降低,解逐渐稳定下来,并逐渐集中在最优解附近。

其它

程序开始时,我们要先srand(一个常数)。这个常数可以决定分数。你可以使用233333,2147483647,甚至某个八位质数。

一遍SA往往无法跑出最优解,所以可以多跑几遍。

可以用一个全局变量记录所有跑过的SA的最优解,每次从那个最优解开始继续SA,可以减小误差。

时间复杂度

时间复杂度 O(\text{玄学}) 。

一般降温系数 \Delta 与 1 的差减少一个数量级, 耗时大约多 10 倍; T_0 和 T_k 变化一个数量级, 耗时不会变化很大。

中级篇

本篇讲解SA的实际应用。

如何调参

[洛谷日报第60期]浅谈玄学算法——模拟退火_第1张图片
这是我P1337的提交记录。可以看到,不同的 \Delta 、 T_0 , T_k ,甚至 srand() 和SA的次数都会影响到答案。

我们探讨一下SA的玄学调参。

Q:答案不是最优的怎么办?

A:有以下几种方法:调大 \Delta 、调大 T_0 、调小 T_k ,以及多跑几遍SA。

当您的程序跑的比较快时,可以选择多跑几遍SA,或者调大 \Delta ,从而增大得到最优解的概率。

调大 T_0 和调小 T_k 也可以,而且时间并不会增大太多。

Q:还是跑不出最优解怎么办?

A:那可能是您太非了。 \quad 尝试更换随机数种子,或者 srand(rand()) ,总之,总有可能跑出正解。

Q:我是非酋,交了两页也没有用模拟退火AC,怎么办?

A:您还是选择打正解吧。

如何生成新解

坐标系内:随机生成一个点,或者生成一个向量。
序列问题: random_shuffle 或者随机交换两个数。
网格问题:可以看做二维序列,每次交换两个格子即可。

例题

这里以洛谷1337 [JSOI2004]平衡点 / 吊打XXX为例,讲解SA的实际应用。(https://www.luogu.org/problemnew/show/P1337)

题目要使整个系统的能量最小。那么我们只要用SA跑出这个最小值即可。
[洛谷日报第60期]浅谈玄学算法——模拟退火_第2张图片[洛谷日报第60期]浅谈玄学算法——模拟退火_第3张图片

这份代码跑了 476\ ms ,可以通过,而且时间比较充裕。

高级篇

本篇讲解SA的其它毒瘤应用,以及如何结合其它算法。

分块模拟退火

这是管理员@ComeIntoPower 在第一次审稿时要我加上去的内容。

我们发现,有时候模拟退火是不适用的,比如这种情况:
[洛谷日报第60期]浅谈玄学算法——模拟退火_第4张图片

此时函数的峰特别多,所以我们要用分块模拟退火的做法。

大致算法是:将其分为几块,然后对每块跑一遍SA,最后再合并答案。

然而好像没有要用这个的题。不过万一以后考了呢【雾】

upd:这里块的数量不是 \sqrt{n} ,而是一个比较小的数。要根据不同的题用不同的大小。

模拟退火套其它算法

其实只是在SA的板子内,用其它算法获得答案而已。

例题

洛谷2503 [HAOI2006]均分数据(https://www.luogu.org/problemnew/show/P2503)

我们可以随机一个序列,然后用DP跑出这个序列的最小。

其它的就是板子。

事实证明我还是太非,交了一页多才过,而且还暴力枚举了一下qwq
[洛谷日报第60期]浅谈玄学算法——模拟退火_第5张图片[洛谷日报第60期]浅谈玄学算法——模拟退火_第6张图片
在不会TLE的情况下尽量多地跑SA

我们知道,有一个 clock() 函数,返回程序运行时间。

那么这样即可:

其中MAX_TIME是一个自定义的略小于1的正数,可以取0.7~0.8。

习题

自己找题去吧(逃)

反正什么求最优解的题都可以用模拟退火搞一搞

本文发布于洛谷日报,特约作者:M_sea

你可能感兴趣的:([洛谷日报第60期]浅谈玄学算法——模拟退火)