基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II

多目标优化简介

多目标优化问题

在很多实际工程问题中，我们的优化目标不止一个，而是对多个目标函数求一个综合最优解。例如在物流配送问题中，不仅要求配送路径最短，还可能需要参与运输车辆最少等。

多目标优化问题的数学模型可以表达为：

多目标优化问题通常具有如下特点：

各目标函数往往相互冲突，无法同时取到最优解。这种冲突使得解的搜索变得更加复杂；
各目标函数的单位不同，不能简单比较。因此多目标优化问题的合理解集通常是Pareto最优解。

多目标优化求解思路

对于多目标优化问题，传统方法是将原问题通过加权方式变换为单目标优化问题，进而求得最优解。该方法具有两大问题：

权重的量化设定困难；
多目标优化问题的求解结果是包含一组非支配解的解集，用这种方法每次只能求得一个不同解（运气好的话），要求解具有足够多样性的Pareto最优解集非常困难。

遗传算法具有多点多方向搜索的特征，在一次搜索中可以得到多个Pareto最优解，因此更适合求解多目标优化问题。

而当前用于求解多目标优化问题的遗传算法一般有两种思路：

Pareto排序评价方法：其思想是构造基于解的优劣关系排序的适应值函数；在子代中更多保留非支配解，从而在迭代一定次数后获得Pareto前沿。最经典的是Glodberg提出的Pareto ranking genetic algorithm，另外我们这里介绍的NSGA-II也是基于Pareto排序评价的方法。
多目标函数加权方法：给多目标函数加以各种权重，转化为单目标优化问题；相对于传统方法中的固定权重，这类方法通常会在遗传操作前以一定规律生成权重，指导个体的多方向搜索。代表性的算法有Ishibuchi的random weight GA和Gen-Cheng的adaptive weight GA等。

NSGA-II算法解析

NSGA-II(nondominated sorting genetic algorithm II)是2002年Deb教授提出的NSGA的改进型，这个算法主要解决了第一版NSGA的三个痛点：

非支配排序的高计算复杂度
共享参数难以确定
缺少保存精英策略

针对这三个问题，在NSGA-II中，Deb提出了快速非支配排序算子，引入了保存精英策略，并用“拥挤距离”(crowding distance)替代了共享(sharing)。

在介绍NSGA-II的整体流程之前，我们需要先了解快速非支配排序和拥挤距离的定义。

快速非支配排序(Fast non-dominated sort)

解的支配关系与Pareto最优解

在最小化问题中，对于两个解，如果对于任意的目标函数，都有，称支配。

如果对于任意的目标函数，都有，称强支配。

下图表示了解之间的支配和强支配关系：

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II_第1张图片

pareto dominance

若解空间中不存在强支配的解，则称为弱Pareto最优解。

若解空间中不存在支配的解，则称为Pareto最优解。

下图表示了一个最小化问题解集中的Pareto最优解和Pareto弱最优解：

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II_第2张图片

pareto optimal

快速非支配排序步骤

快速非支配排序就是将解集分解为不同次序的Pareto前沿的过程。

它可以描述为：

为每个解分配两个关键量：支配的解个数以及被支配的解集；
设置，将的个体归入；
对于中的个体，遍历每个解的，将其中每个解的减1；
，将中的解归入;
重复3、4，直到解集中所有个体都被归入某一个。

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II_第3张图片

fast nondominance sorting

DEAP实现

DEAP内置了实现快速非支配排序操作的函数tools.emo.sortNondominated

tools.emo.sortNondominated(individuals, k, first_front_only=False)

参数：

individuals：被排序的个体列表
k：需要选择的个体个数。注意这里不一定会返回正好k个个体，需要看pareto前沿的个体个数：假设设置k=100，而selectedPop+len(Front[i-1])<100，返回的个数会是selectedPop+len(Front[i-1])+len(Front[i])，应该是一个大于100的值。
first_front_only：如果设为'True'则对次序为1的前沿排序之后就返回

Pareto前沿的列表

拥挤距离计算(Crowding distance assignment)

拥挤距离的定义

在NSGA II中，为了衡量在同一个前沿中各个解质量的优劣，作者为每个解分配了一个拥挤距离。其背后的思想是让求得的Pareto最优解在objective space中尽量分散。也就有更大可能让解在Pareto最优前沿上均匀分布。

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II_第4张图片

assign crowding distance

DEAP实现

DEAP中内置了计算拥挤距离的函数tools.emo.assignCrowdingDist

tools.emo.assignCrowdingDist(individuals)

参数：

individuals：用来计算拥挤距离的个体列表

没有返回值，拥挤距离保存在传入的individuals中的每个个体的individual.fitness.crowding_dist属性中

精英保存策略(Elitism)

比较操作

根据快速非支配排序和拥挤距离计算的结果，对族群中的个体进行排序：

对两个解，

如果，那么解较更优；
如果，而，那么解较更优；

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II_第5张图片

NSGA II elitism

在每个迭代步的最后，将父代与子代合为一个族群，依照比较操作对合并后族群中的个体进行排序，然后从中选取数量等同于父代规模的优秀子代，这就是NSGA-II算法中的精英保存策略。

DEAP实现

DEAP内置了实现NSGA-II中的基于拥挤度的选择函数tools.selNSGA2用来实现精英保存策略：

tools.selNSGA2(individuals, k, nd='standard')

参数：

individuals：被选择的个体列表，在NSGA-II中是父代与子代的并集
k：需要选择的个体个数，通常要比被选择的个体数量小；如果与被选择的个体数量相同，那么效果等同于基于pareto前沿的排序
nd：选择使用的非支配(non-dominated)算法，可以设置为'standard'或'log'

被选择的个体列表

NSGA算法实现

测试函数

这里选用ZDT3函数作为测试函数，函数可表达为：

其Pareto最优解集为

这里为了方便可视化取。

下图给出了该函数在Decision Space和Objective Space中的对应：

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II_第6张图片

ZDT3_with_2variables

其pareto最优解在Objective Space中如下图红点所示：

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II_第7张图片

Pareto-optimal_front

代码实现

#-------------- NSGA-II 算法实现-----------
## 问题定义
creator.create('MultiObjMin', base.Fitness, weights=(-1.0, -1.0))
creator.create('Individual', list, fitness=creator.MultiObjMin)

## 个体编码
def uniform(low, up):
    # 用均匀分布生成个体
    return [random.uniform(a,b) for a,b in zip(low, up)]

toolbox = base.Toolbox()
NDim = 2 # 变量数为2
low = [0]*NDim # 变量下界
up = [1]*NDim # 变量上界

toolbox.register('attr_float', uniform, low, up)
toolbox.register('individual', tools.initIterate, creator.Individual, toolbox.attr_float)
toolbox.register('population', tools.initRepeat, list, toolbox.individual)

## 评价函数
def ZDT3(ind):
    # ZDT3评价函数，ind长度为2
    n = len(ind)
    f1 = ind[0]
    g = 1 + 9 * np.sum(ind[1:]) / (n-1)
    f2 = g * (1 - np.sqrt(ind[0]/g) - ind[0]/g * np.sin(10*np.pi*ind[0]))
    return f1, f2

toolbox.register('evaluate', ZDT3)

## 注册工具
toolbox.register('selectGen1', tools.selTournament, tournsize=2)
toolbox.register('select', tools.emo.selTournamentDCD) # 该函数是binary tournament，不需要tournsize
toolbox.register('mate', tools.cxSimulatedBinaryBounded, eta=20.0, low=low, up=up)
toolbox.register('mutate', tools.mutPolynomialBounded, eta=20.0, low=low, up=up, indpb=1.0/NDim)

## 遗传算法主程序
# 参数设置
toolbox.popSize = 100
toolbox.maxGen = 200
toolbox.cxProb = 0.7
toolbox.mutateProb = 0.2

# 迭代部分
# 第一代
pop = toolbox.population(toolbox.popSize) # 父代
fitnesses = toolbox.map(toolbox.evaluate, pop)
for ind, fit in zip(pop,fitnesses):
    ind.fitness.values = fit
fronts = tools.emo.sortNondominated(pop, k=toolbox.popSize)
# 将每个个体的适应度设置为pareto前沿的次序
for idx, front in enumerate(fronts):
    for ind in front:
        ind.fitness.values = (idx+1),
# 创建子代
offspring = toolbox.selectGen1(pop, toolbox.popSize) # binary Tournament选择
offspring = algorithms.varAnd(offspring, toolbox, toolbox.cxProb, toolbox.mutateProb)

# 第二代之后的迭代
for gen in range(1, toolbox.maxGen):
    combinedPop = pop + offspring # 合并父代与子代
    # 评价族群
    fitnesses = toolbox.map(toolbox.evaluate, combinedPop)
    for ind, fit in zip(combinedPop,fitnesses):
        ind.fitness.values = fit
    # 快速非支配排序
    fronts = tools.emo.sortNondominated(combinedPop, k=toolbox.popSize, first_front_only=False)
    # 拥挤距离计算
    for front in fronts:
        tools.emo.assignCrowdingDist(front)
    # 环境选择 -- 精英保留
    pop = []
    for front in fronts:
        pop += front
    pop = toolbox.clone(pop)
    pop = tools.selNSGA2(pop, k=toolbox.popSize, nd='standard')
    # 创建子代
    offspring = toolbox.select(pop, toolbox.popSize)
    offspring = toolbox.clone(offspring)
    offspring = algorithms.varAnd(offspring, toolbox, toolbox.cxProb, toolbox.mutateProb)

将结果可视化：

# front = tools.emo.sortNondominated(pop, len(pop))[0]
for ind in front:
    plt.plot(ind.fitness.values[0], ind.fitness.values[1], 'r.', ms=2)
for ind in gridPop:
    plt.plot(ind.fitness.values[0], ind.fitness.values[1], 'b.', ms=1)    
plt.title('Pareto optimal front derived with NSGA-II', fontsize=12)
plt.xlabel('$f_1$')
plt.ylabel('$f_2$')
plt.tight_layout()
plt.savefig('Pareto_optimal_front_derived_with_NSGA-II.png')

得到：

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II_第8张图片

Pareto_optimal_front_derived_with_NSGA-II

可以看到NSGA-II算法得到的Pareto最优前沿质量很高：最优解均匀分布在不连续前沿的各个线段上；同时在最优前沿以外没有个体存在。

基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II

多目标优化简介

多目标优化问题

多目标优化求解思路

NSGA-II算法解析

快速非支配排序(Fast non-dominated sort)

拥挤距离计算(Crowding distance assignment)

精英保存策略(Elitism)

NSGA算法实现

测试函数

代码实现

你可能感兴趣的:(基于DEAP库的Python进化算法从入门到入土--（六）多目标遗传算法 NSGA-II)