优化算法之手推遗传算法(Genetic Algorithm)的详细步骤图解

遗传算法可以做什么?

遗传算法是元启发式算法之一。它有与达尔文理论(1859 年发表)的自然演化相似的机制。如果你问我什么是元启发式算法,我们最好谈谈启发式算法的区别。

启发式和元启发式都是优化的主要子领域,它们都是用迭代方法寻找一组解的过程。启发式算法是一种局部搜索方法,它只能处理特定的问题,不能用于广义问题。而元启发式是一个全局搜索解决方案,该方法可以用于一般性问题,但是遗传算法在许多问题中还是被视为黑盒。

那么,遗传算法能做什么呢?和其他优化算法一样,它会根据目标函数、约束条件和初始解给我们一组解。

最优局部解与最优全局解

遗传算法是如何工作的?

遗传算法有5个主要任务,直到找到最终的解决方案。它们如下。

  • 初始化
  • 适应度函数计算
  • 选择
  • 交叉
  • 突变

定以我们的问题

我们将使用以下等式作为遗传算法的示例。它有 5 个变量和约束,其中 X1、X2、X3、X4 和 X5 是非负整数且小于 10(0、1、2、4、5、6、7、8、9)。使用遗传算法,我们将尝试找到 X1、X2、X3、X4 和 X5 的最优解。

将上面的方程转化为目标函数。遗传算法将尝试最小化以下函数以获得 X1、X2、X3、X4 和 X5 的解决方案。

由于目标函数中有 5 个变量,因此染色体将由 5 个基因组成,如下所示。

初始化

在初始化时,确定每一代的染色体数。在这种情况下,染色体的数量是 5。因此,每个染色体有 5 个基因,在整个种群中总共有 25 个基因。使用 0 到 9 之间的随机数生成基因。

在算法中:一条染色体由几个基因组成。一组染色体称为种群

下图是第一代的染色体。

适应度函数计算

它也被称为评估。在这一步中,评估先前初始化中的染色体。对于上面示例,使用以下的计算方式。

这是第一代种群中的第一个染色体。

将 X1、X2、X3、X4 和 X5 代入目标函数,得到 53。

适应度函数是 1 除以误差,其中误差为 (1 + f(x))。

下面公式中加 1 是为了避免零问题

这些步骤也适用于其他染色体。

选择

轮盘赌法是遗传算法中的一种随机选择方法。这就像赌场里的轮盘赌。它有一个固定点,并且轮子旋转直到轮子上的一个区域到达固定点的前面。

在遗传算法的背景下,具有较高适应度值的染色体将更有可能在轮盘赌中被选中。

首先,计算 5 条染色体的总适应度值。

总计 = .
总计 = 0.0185 + 0.0400 + 0.0178 + 0.0181 + 0.0434

然后,计算每个染色体的概率。下图是第一条染色体概率的样本计算(P1 = 0.1342)。

再次应用到所有的染色体:

计算概率后,对于轮盘赌方法,需要计算其累积概率。

计算累积概率后,要使用轮盘进行选择,需要生成5个随机数Uniform(0,1),这些随机数决定了从选择中剔除哪条染色体。

产生5个数字因为我们有5条染色体

下图就是挑选和消除染色体的方法。首先,根据累积概率排列染色体,所选择的染色体由随机数决定如下:

选择后的新染色体如下所示。

交叉

在生物学中,交叉是指生殖的一个术语。两条染色体被随机选择并通过数学运算进行匹配。在本例中使用单点交叉。

单点交叉意味着两个亲本的基因被一个交叉线交换

下图包含使用Uniform(0,1)生成的随机数。选择用于交叉的染色体数量是由交叉率(Pc)控制的,其中最小值为0,最大值为1。例如确定Pc = 0.25,这意味着随机数目小于0.25的染色体将成为交叉中的亲本。

随机数对染色体。例如,R1对1号染色体,R2对2号染色体,以此类推

交叉的染色体是染色体1,染色体3和染色体5。这三条染色体的结合如下所示。

为了确定交叉线的位置,需要生成一个1到n之间的随机数,其中n是染色体- 1的长度。我们生成了1到4。

染色体1和染色体3之间的交叉(称为CO1)如下所示。

1号染色体和5号染色体之间的交叉(称为CO2)如下所示。

3号染色体和5号染色体(称为CO3)

突变

1号染色体和2号染色体来自新的2号染色体和4号染色体。他们没有被选中进行交叉。而染色体3、4和5来自前代的交叉。

下图就是与“染色体选择后使用交叉的结果”进行的对比。

突变是我们赋予任何基因新的价值的过程。在本例中使用随机突变,突变基因的数量由突变率决定()。首先,计算一个种群中的基因数量。

基因总数 = 染色体 x 染色体中的基因数

接下来,发生突变的基因数量如下。

#突变的基因数 = 基因总数 x 

因此,一个种群中的基因数量如下。

#genes = 5 x 6
#genes = 30

突变基因数(= 0.1)

#genes mutation = 30 x 0.1
#genes mutation = 3

所以需要生成从1到30的随机数。随机数的结果是7、19和23。它们是突变基因的位置。接下来,对于每一个被选中的基因,生成一个从0到9的随机数来替换旧的值。

这些突变后的新染色体是第二代

评估

对突变后的染色体进行评估。

使用生成的新一代重复这个过程,就可以以获得X1、X2、X3、X4和X5的最佳解。经过几代后,得到的最佳染色体如下。

这个目标函数是有不同解的,所以我们这里只给出一个。如果需要添加限制条件,可以修改目标函数。

代码

下面的Jupyter Notebook是上面我们过程的代码实现:

https://www.overfit.cn/post/163b199a59154a058a3b4293f33b124b

引用

[1] M. Fronita, R. Gernowo, V. Gunawan. 2017. Comparison of Genetic Algorithm and Hill Climbing for Shortest Path Optimization Mapping. The 2nd International Conference on Energy, Environment and Information System (ICENIS 2017). August 15th — 16th 2017. Semarang (ID). pp: 1–5.

[2] N. Arfandi, Faizah. 2013. Implementation of genetic algorithm for student placement process of community development program in Universitas Gadjah Mada. Journal of Computer Science and Information. 6(2): 70–75.

[3] T. Suratno, N. Rarasati, Z. Gusmanely. 2019. Optimization of genetic algorithm for implementation designing and modelling in academic scheduling. Eksakta: Berkala Ilmiah Bidang MIPA. 20(1): 17–24.

作者:Audhi Aprilliant

你可能感兴趣的:(人工智能神经网络机器学习算法)