实数编码遗传算法的评述
演化算法中各种选择算子的选择压力比较_林广明
1、首先实现从性状到基因的映射,即编码工作,然后从代表问题可能潜在解集的一个种群开始进行进化求解;
2、初代种群(编码集合)产生后,按照优胜劣汰的原则,根据个体适应度大小挑选(选择)个;
3、进行复制、交叉、变异,产生出代表新的解集的群体,再对其进行挑选以及一系列遗传操作,如此往复,逐代演化产生出越来越好的近似解。
1、两者的区别
遗传算法以决策变量的编码作为运算对象。传统的优化算法往往直接利用决策变量的实际值本身进行优化计算,但遗传算法不是直接以决策变量的值,而是以决策变量的某种形式的编码为运算对象,从而可以很方便地引入和应用遗传操作算子。(编码)
遗传算法直接以目标函数值作为搜索信息。传统的优化算法往往不只需要目标函数值,还需要目标函数的导数等其它信息。这样对许多目标函数无法求导或很难求导的函数,遗传算法就比较方便。(对函数要求低)
遗传算法同时进行解空间的多点搜索。传统的优化算法往往从解空间的一个初始点开始搜索,这样容易陷入局部极值点。遗传算法进行群体搜索,而且在搜索的过程中引入遗传运算,使群体又可以不断进化。这也是遗传算法所特有的一种隐含并行性。(群体优化,并行计算,避免陷入局部最优)
遗传算法使用概率搜索技术 。遗传算法属于一种自适应概率搜索技术,其选择、交叉、变异等运算都是以一种概率的方式来进行的,从而增加了其搜索过程的灵活性。实践和理论都已证明了在一定条件下遗传算法总是以概率1收敛于问题的最优解。(概率搜索)
2、遗传算法的特点:
- 遗传算法是对决策变量的编码进行操作,这样提供的参数信息量大,优化效果好。(编码)
- 遗传算法是从许多点开始并行操作,因而可以有效地防止搜索过程收敛于局部最优解。(多点并行)
- 遗传算法通过目标函数来计算适配值,而不需要其他推导和附加信息,从而对问题的依赖性小。(函数要求低)
- 遗传算法的寻优规则是由概率决定的,而非确定性的。 (概率搜索)
- 遗传算法对于待寻优的函数基本无限制,因而应用范围较广。(函数无限制)
- 遗传算法在解空间进行高效启发式搜索,而非盲目地穷举或完全随机搜索。(启发式搜索)
- 遗传算法具有并行计算的特点,因而可通过大规模并行计算来提高计算速度。(并行计算)
- 遗传算法更适合大规模复杂问题的优化。(大规模)
- 遗传算法计算简单,功能强。
3、传统算法的特点:
渐进收敛;经典的优化搜索算法往往是基于梯度的,梯度方向提高个体性能;单点搜索;局部最优。
A genetic representation of potential solutions to the problem.(编码);
A way to create a population (an initial set of potential solutions).(群体初始化);
An evaluation function rating solutions in terms of their fitness.(个体评价);
Genetic operators that alter the genetic composition of offspring (selection, crossover, mutation, etc.).(遗传算子) ;
Parameter values that genetic algorithm uses (population size, probabilities of applying genetic operators, etc.).(参数选择)。
2mj−1<(bj−aj)×105≤2mj−1 2 m j − 1 < ( b j − a j ) × 10 5 ≤ 2 m j − 1
xj=aj+decimal(substringj)×bj−aj2mj−1 x j = a j + d e c i m a l ( s u b s t r i n g j ) × b j − a j 2 m j − 1
轮盘赌是适应度比例选择的一种,它根据个体适应度来分配选择概率,个体适应度越好,则它被选中的概率越高。例如:种群大小为 n n ,个体 ind i n d 的适应度为 Find F i n d ,则它被选中的概率为: Pind=Find∑i=1nFi P i n d = F i n d ∑ i = 1 n F i
选择压力大会使种群迅速收敛,失去多样性。较小会使种群收敛速度变得很慢。在算法的初始阶段,希望选择压力小一些,保证种群的多样性,在算法的后期希望选择压力大一些使算法迅速收敛。
轮盘赌 < < 线性排序选择 < < 锦标赛选择 < < (μ+λ) ( μ + λ ) 选择 < < (μ,λ) ( μ , λ ) 选择。
确定性选择 > > 混合性选择 > > 随机选择
精英保留策略 > > 锦标赛选择 > > 轮盘赌
①不确定性选择:轮盘赌(比例)选择,个体被选中的概率与其适应度大小成正比;
普通采样,采用均匀分布且个数等于种群规模的旋转指针。
②确定性选择: [λ+μ] [ λ + μ ] 选择(选择压力最大); [μ,λ] [ μ , λ ] 选择;截断选择;块选择;贪婪选择
③混合选择:竞赛选择;规模为2的竞赛选择。
To maintain a reasonable differential between relative fitness ratings of chromosomes.(维持个体之间的合理差距,加速竞争);
To prevent a too-rapid takeover by some supper chromosomes in order to meet the requirement to limit competition early on, but to stimulate it later.(避免个体之间的差距过大,限制竞争)。
经典算子: 简单交叉(单割点,二割点,多割点,均匀);随机交叉(平面交叉,混合交叉);随机突变(边界突变,纯突变)。
算数算子:算术交叉(凸、仿射变换、线性、平均,中间);扩展的中间交叉;动态突变(非均匀突变)。
PSO算子:基于方向交叉;定向突变。
随机算子:单峰正态分布的交叉;高斯变异。
遗传算法中在选择,交叉,变异算子的作用下,具有低阶,短距,高平均适应度的模式将呈现指数增长;
模式阶:指模式中具有明确含义的字符个数记作 o(s) o ( s ) ;
模式的长度:指模式中第一个和最后一个具有明确含义字符之间的距离,记作 δ(s)=b−a δ ( s ) = b − a 。
遗传算法中的模式定理:经过交叉和变异的操作之后,下一代种群中模式 s s 所拥有的个数为:
复制:
m(s,t+1)=m(s,t)⋅f¯(s)f m ( s , t + 1 ) = m ( s , t ) ⋅ f ¯ ( s ) f
交叉:
ps=1−pc⋅δ(s)λ−1 p s = 1 − p c ⋅ δ ( s ) λ − 1
变异:
ps=(1−pm)o(s)≈1−pm∗o(s) p s = ( 1 − p m ) o ( s ) ≈ 1 − p m ∗ o ( s )
结果:
m(s,t+1)≈m(s,t)∗f¯(s)f¯∗[1−pc∗δ(s)λ−1−pm∗o(s)] m ( s , t + 1 ) ≈ m ( s , t ) ∗ f ¯ ( s ) f ¯ ∗ [ 1 − p c ∗ δ ( s ) λ − 1 − p m ∗ o ( s ) ]
其中 λ λ 表示字符串的长度。
低阶,短距,且高适应度的模式,在选择,交叉和变异的遗传算子的作用下,相互结合,能生成高阶、长距、平均适应度高的模式,最终找到最优值。
所谓优化就是在某种确定规则下,使得个体的性能最优。多目标优化,多于一个的数值目标在给定区域上的最优化问题称为多目标优化。
求解多目标优化问题的过程就是寻找Pareto最优解(非劣解、有效解)的过程。即在多目标优化中对某些子目标的优化不能影响到其它子目标的优化而容许的整个多目标的最优解。所谓多目标优化问题的最优解就是指Pareto最优解,且不再包含其他最优解。
(1)权重和方法:权重可以理解为目标之间相对重要性或价值,或者对目标的偏好。
(优点:通过算中和求得的全局最优解对应Pareto前端的一个解;局部最优解对应局部Pareto最优解;通过改变权值可以搜索到所有凸Pareto解)
(缺点:不能处理非凸的Pareto;很难找到均匀分布的Pareto解)
(2)矢量评价法(VEGA):在循环过程中根据多个目标选出若干下一代中的优秀个体(即子种群),然后将整个种群打乱并执行交叉变异,目的在于不同种群之间进行信息交流,它保护了单个目标上的最优个体的生存,同时为那些多于一个目标上好于平均值的个体提供合理被选择概率。(优点:简单,适合寻找Pareto front 的端点),(缺点:很难处理非凸问题)
(3)Pareto等级法:根据占优划分等级,对个体适应度的分配策略。
(优点:可以快速找到Pareto前端,有效保护种群多样性)
(缺点:非支配排序的时间复杂度很大;不支持精英策略;需要自己指定共享参数)
(4)贪婪保护法(SPEA):在外部群体中对占优解进行排序;个体适应度与外部群体比它性能优的个体数目相关,使用Pareto支配关系保持种群多样性,使用聚类方法减少非支配集。
(优点:可处理任意的目标函数,可产生解的分布,确定了一种无需参数的共享方法)
(缺点:因为确定了一个外部解集,故计算量大)
(1)多目标优化算法的评级指标通常有以下几项:逼近性GD(Generational Distance)、均匀性SP(Spacing)、宽广性EX、最优解数目ER(Error Ratio)、收敛性度量值 γ γ 和多样性度量值 Δ Δ 。
逼近性GD用来描述算法所获得的非劣最优解与Pareto前端的距离
均匀性SP用来描述非劣解在Pareto前端上的分布范围。
宽广性EX用来描述非劣最优解的分布范围。
收敛性度量值 γ γ 用来衡量一组已知的Pareto最优解集的收敛范围。
多样性度量值 Δ Δ 用来衡量Pareto前端的分布。
(2)以上三点对应于多目标求解的三个目标
- 希望算法找到的Pareto 前端与实际的Pareto 前端的距离应尽可能的接近;
- 希望找到的Pareto 最优解具有较好的分布(如均匀分布、正态分布);
- 希望所找到的Pareto 前端的分布范围尽可能的宽广,即尽可能的覆盖每个子目标函数的可能取值范围
(3)性能的比较
- 直接比较法:它比较了两个非支配集 A A 和 B B 直接使用标量测度 R(A,B) R ( A , B ) ,其中描述了A 比B 好多少。如: A A , B B 。计算 R(A,B) R ( A , B ) 。
优点:与独立比较相比,计算量低,不需要知道任何帕累托集;
缺点:如果两套不同的基数和/或集合的分布是不均匀的,那么C 的度量提供了不可靠的结果。
- 间接比较法:它选择一个参考集,比较两个非支配集与这个参考集,然后比较结果。如: A A , B B 。中间变量为Pareto,分别和他进行对比。
优点:易于理解、计算量低;
缺点:需要知道Pareto 前端,:度量只适用于有限数量的帕累托最优解。
- 独立比较法:它是衡量某些独立的属性的每个设置,并比较了这两种测量结果。如: S(A) S ( A ) ,和 S(B) S ( B ) ,再比较它们。
优点:没有必要知道帕累托或其他参考点使用、它是独立的、意义直观;
缺点:需要非常大的计算量,这使得它完全适合于目标或大非大量支配集。