模拟退火总结+洛谷模板题(P1337 [JSOI2004]平衡点 / 吊打XXX)

原来就听说过模拟退火,然后一直觉得神奇,但是没有真正的去实现这个算法。
模拟退火对TSP之类的问题很实用。

1.概念:模拟退火算法(Simulate Anneal,SA)是一种通用概率演算法,用来在一个大的搜寻空间内找寻命题的最优解。模拟退火是由S.Kirkpatrick, C.D.Gelatt和M.P.Vecchi在1983年所发明的。V.Černý在1985年也独立发明此演算法。模拟退火算法是解决TSP问题的有效方法之一。

模拟退火的出发点是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性。模拟退火算法是一种通用的优化算法,其物理退火过程由加温过程、等温过程、冷却过程这三部分组成。

实际上模拟退火是一个很好理解的东西。简单地说,就是将热力学的理论套用到统计学上,将搜寻空间内每一点想像成空气内的分子;分子的能量,就是它本身的动能;而搜寻空间内的每一点,也像空气分子一样带有“能量”,以表示该点对命题的合适程度。演算法先以搜寻空间内一个任意点作起始:每一步先选择一个“邻居”,然后再计算从现有位置到达“邻居”的概率。
与之相对的是爬山算法,爬山算法是找到一个局部最优值之后就不会再往下搜索下去了。但是模拟退火会有一定的概率再去往下搜索下去,然后就会越来越接近最优值。

2.模拟退火的基本要素
状态空间与状态产生函数
(1).搜索空间(又叫状态空间)。一般范围比较大,事我们自定义的可行解的集合。

(2).状态函数。状态函数将决定你是否要选用当前的解,对于一个好的退火来说,状态函数的搜索空间应该足够大。

(3).候选解。一般采用随机数来在一定密度内随机选取。

(4).概率分布。大多采取均匀分布或指数分布。

状态转移概率
(1).状态转移概率是指从一个状态向另一个状态的转移概率。

(2).通俗的理解是接受一个新解为当前解的概率。

(3).它与当前的温度参数T有关,随温度下降而减小。

(4).一般采用Metropolis准则。

3.模拟退火模型
第一步是由一个产生函数从当前解产生一个位于解空间的新解;为便于后续的计算和接受,减少算法耗时,通常选择由当前新解经过简单地变换即可产生新解的方法,如对构成新解的全部或部分元素进行置换、互换等,注意到产生新解的变换方法决定了当前新解的邻域结构,因而对冷却进度表的选取有一定的影响。

第二步是计算与新解所对应的目标函数差。因为目标函数差仅由变换部分产生,所以目标函数差的计算最好按增量计算。事实表明,对大多数应用而言,这是计算目标函数差的最快方法。

第三步是判断新解是否被接受,判断的依据是一个接受准则,最常用的接受准则是Metropolis准则: 若Δt′<0则接受S′作为新的当前解S,否则以概率exp(-Δt′/T)接受S′作为新的当前解S。

第四步是当新解被确定接受时,用新解代替当前解,这只需将当前解中对应于产生新解时的变换部分予以实现,同时修正目标函数值即可。此时,当前解实现了一次迭代。可在此基础上开始下一轮试验。而当新解被判定为舍弃时,则在原当前解的基础上继续下一轮试验。

模拟退火算法与初始值无关,算法求得的解与初始解状态S(是算法迭代的起点)无关;模拟退火算法具有渐近收敛性,已在理论上被证明是一种以概率收敛于全局最优解的全局优化算法;模拟退火算法具有并行性。
4.参数控制
模拟退火算法的应用很广泛,可以求解NP完全问题,但其参数难以控制,其主要问题有以下三点:

(1) 温度T的初始值设置问题。 温度T的初始值设置是影响模拟退火算法全局搜索性能的重要因素之一、初始温度高,则搜索到全局最优解的可能性大,但因此要花费大量的计算时间;反之,则可节约计算时间,但全局搜索性能可能受到影响。实际应用过程中,初始温度一般需要依据实验结果进行若干次调整。

(2) 退火速度问题。 模拟退火算法的全局搜索性能也与退火速度密切相关。一般来说,同一温度下的“充分”搜索(退火)是相当必要的,但这需要计算时间。实际应用中,要针对具体问题的性质和特征设置合理的退火平衡条件。

(3) 温度管理问题。 温度管理问题也是模拟退火算法难以处理的问题之一。实际应用中,由于必须考虑计算复杂度的切实可行性等问题,常采用如下所示的降温方式:式中k为正的略小于1.00的常数,t为降温的次数。
模拟退火总结+洛谷模板题(P1337 [JSOI2004]平衡点 / 吊打XXX)_第1张图片
5.算法改进
(1)设计合适的状态产生函数,使其根据搜索进程的需要表现出状态的全空间分散性或局部区域性;

(2)设计高效的退火策略;

(3)避免状态的迂回搜索;

(4)采用并行搜索结构;

(5)为避免陷入局部极小,改进对温度的控制方式;

(6)选择合适的初始状态;

(7)设计合适的算法终止准则。
对于洛谷这个题目。系统最稳定的时候就是系统的整体能量最小的时候,系统能量就是整体的重力势能。因为物重一定,绳子越短,重物越低,势能越小,势能又与物重成正比,所以,只要使得在这里插入图片描述也就是总的重力势能最小,就可以使系统平衡。
代码如下:

#include
#define ll long long
#define esp 1e-15
using namespace std;

const int maxx=1e3+100;
struct node{
	double x;
	double y;
	double w;
}p[maxx];
int n;node ans;

inline double dis(node a,node b)//返回两点的距离
{
	return sqrt((a.x-b.x)*(a.x-b.x)+(a.y-b.y)*(a.y-b.y));
}
inline double dev(node ans)//计算当前节点的整体重力势能
{
	double a=0.0;
	for(int i=1;i<=n;i++) 
		a+=(dis(p[i],ans)*p[i].w);
	return a;
}
inline void SA()
{
	double t=3000;//起始温度
	double delta=0.996;
	node a;
	while(t>esp)
	{
		a.x=ans.x+(rand()*2-RAND_MAX)*t;
		a.y=ans.y+(rand()*2-RAND_MAX)*t;//这样坐标的范围是[-RAND_MAX,RAND_MAX]。
		//rand()的范围是0~RAND_MAX-1
        //rand()*2-RAND_MAX的范围是-RAND_MAX到RAND_MAX-1
		a.w=dev(a);
		if(a.w-ans.w<0) ans=a;
		else if(exp((ans.w-a.w)/t)*RAND_MAX>rand()) ans=a;//模拟退火的精髓(△t=ans-a,之前最优值-当前计算的值)
		t*=delta;
	}
}
inline void solve()
{
	for(int i=1;i<5;i++) SA();
}
int main()
{
	while(~scanf("%d",&n))
	{
		ans.x=0.0;ans.y=0.0;
		for(int i=1;i<=n;i++) 
		{
			scanf("%lf%lf%lf",&p[i].x,&p[i].y,&p[i].w);
			ans.x+=p[i].x;
			ans.y+=p[i].y;
		}
		ans.x/=n;//起始值选取平均值。
		ans.y/=n;
		ans.w=dev(ans);
		solve();
		printf("%.3lf %.3lf\n",ans.x,ans.y);
	}
	return 0;
}

努力加油a啊,(o)/~

你可能感兴趣的:(模拟退火总结+洛谷模板题(P1337 [JSOI2004]平衡点 / 吊打XXX))