计算机智能专题-遗传算法(1不带约束的)

前言:

         遗传算法是一种群智能优化算法,它主要解决的是排列组合问题。通过模仿遗传学中染色体的交叉、变异、并通过“优选”,使父代产生更优的“子代”,在不断的“优胜略汰”中,最终得到最优的组合。更新ing,,,,

本篇文章讲的是:遗传算法的整数编码,原理较为简单可以用作入门。

第二篇遗传算法“实数编码”,是模仿二进制交叉和编译,适用范围更广泛。

一、基本概念

1.编码:

>>生物学定义:DNA中遗传信息在一个长链上按一定的模式排列

>>计算机学定义:将实际问题抽象成"染色体",所建立的数学模型,具体来讲,实际问题中的排列组合问题,并不是涉及染色体,要使用遗传算法解决问题需要进行模型转化。

2.解码:

>>生物学定义: 从遗传DNA到表现型的映射

>>计算机学定义:实际问题通过“编码”过程映射为染色体并使用遗产算法处理之后,需要重新映射到实际问题中,来获得真实的自由组合,这个过程叫做解码。

3.交叉

>>生物学定义:在两个染色体的某一相同位置处DNA被切断,其前后两串分别交叉组合形成两个新的染色体。

>>计算机学定义:在实际的操作中会模仿这样的操作,对编码后的数据进行交叉。

4.变异:

>>生物学定义:很小概率产生基因突变,产生出新的染色体,然后表现出新的性状

5.适应度

度量某个物种对于生存环境的适应程度。对于生存化境适应程度较高的物种将获得更多的繁殖机会,反之机会较少,甚至灭绝。

6.选择

指定以一定的概率从种群中选择若干个体进行"优胜略汰"。

二、基本流程

计算机智能专题-遗传算法(1不带约束的)_第1张图片

 三、具体实例

3.1一个连续问题的实列

实现遗传算法求解:
(x−5)(x−10)(x−6)(x−16)+21

=-x^4+37*x^3-476*x^2+2540*x-4779

的最大值,其中x为0到31之间的整数,
f = lambda x:-x**4+37*x**3-476*x**2+2540*x-4779

函数图像如下图所示:

计算机智能专题-遗传算法(1不带约束的)_第2张图片

这里做下说明,对于给出的这个实际问题,可以通过遍历循环得到0到31中满足要求的值,这里通过简单的示例,解释用遗传算法解决这个问题。

1. 参数初始化

>>遗传算法进化迭代次数epochs,这个根据遗传算迭代收敛的情况而定。

>>种群个体数N,设N=8。这个根据经验设置,作为超参数调试。

>>个体的编码长度M=5,这个根据实际问题的需要求而来,一般设置为最少能够用二进制表示的数码范围。[0,31]32位<=2^{5}.

2. 种群初始化

这里已经隐含了编码过程,十进制到二进制。

对于这个编码过程做简单的解释:

后面的遗传算法使用,需要进行染色体的交叉、编译操作,而二进制作为和染色体DNA最接近的数制要比十进制更符合操作习惯,将十进制转化为二进制后,二进制的每一位代表一个染色片段,而“交叉”“变异”的操作是以染色体片段为单位进行的。下面结合一个例子讲解种群初始化的过程。

初始化代码如下,产生一个N*M的矩阵,每一行代表一个个体。

    def __init__(self,N=8,M=5):
        _groups = np.zeros([N,M],int)
        for index in range(0,N):
            for _index in range(0,M):
                _groups[index,_index] = np.random.choice([0,1])
        self._groups = _groups

计算机智能专题-遗传算法(1不带约束的)_第3张图片

说明:

 在这N*M的矩阵中,每一行是一个1*M的向量,这代表一个十进制个体的二进制表示。所以后面应用时还需要设计一个解码器,以便经过遗传算法操作过后的染色体编码可以映射到实际问题中,

这里的解码器,是将二进制转化为十进制的函数:Binary2Decimal

    def Binary2Decimal(self,Binary,include_negative=False):
        '''
        fct: 将二进制转化为十进制
        :param Binary: 输入的二进制数组
        :param include_negative: 最高位是不是 符号位
        :return:
        '''
        sum = 0
        bit_flag = -1 if include_negative==True else 1
        for index in range(1,len(Binary)):
            sum = sum + Binary[-index]*2**(index-1)
        if  bit_flag==-1:
            if Binary[0]==1:
               sum = sum * bit_flag
            else:
               sum = sum + 0
        else:
            sum = sum + Binary[0]*2**(index)

        return sum

3. 优选

        优选的方法有很多,本文中的问题是:求函数的最大值,所以优化的对象是函数值,最简单的方案是:比较种群中个体间的函数值的大小,根据值的大小进行优胜略汰。

具体的分析:

计算得到的值存在几种情况:

1.全为正、2.全为负、3.有正有负、4.值一样

优选的方式需要考虑这几种情况,通常常用的几种优选的方式有:“赌轮盘”、“锦标赛”、“小生境”

>>赌轮盘:2021.12.23晚上更新一点

按照某个标准,计算得到每一个个体的得分,然后将每个个体分布在一个圆盘上面,个体所占圆心角的大小取决于个体得分所占总分的比例。计算机智能专题-遗传算法(1不带约束的)_第4张图片

 这样盘的模型就制作好了,接下来就按照“运气”进行筛选。转动红色的指针,指针指到哪里,哪一个个体就被"优选"到下一个轮回。一般需要筛选出几个个体,就转几次轮盘。

这样做的理论依据:

        可以通过设置 评价函数 ,使较优的值的评价分数较高,这样相应的它在轮盘中所占的圆心角就越大,被选择的机会就越大,参与繁殖的机会就越大,这也符合自然法则中的优胜略汰。但是通过这种转轮盘的方式,没有直接选择最好的那一个,也给了劣势群体的一些机会,说不定有些:个体的得分不高,但是他的后代可能产生更优的性状,这种几率发生的比较低,但也是自然法则中的一个现象,所以赌轮盘这种优选方式需要考虑这种情况。

赌轮盘制作函数:

1.将初始化的二进制值,通过函数Binary2Decimal转化为十进制

2.十进制直接计算得到函数值

3. 拿着所有值减去最小值,并加以上一个数

4. 计算所有的个体的的占比,用于制作轮盘

    def calculate_suitability(self,input,error=0.01):
        y_get = list(map(lambda x:f(x),input))
        y_get_ = y_get-np.min(y_get)+error #让最小的那个数值 不为零
        out_data = [y_get__/np.sum(y_get_) for y_get__ in y_get_]
        return out_data

摇轮盘函数:

        这个函数自行理解,关于需要优选的次数:为了保证后代的种群的数量保持不变,所以有几个个体就需要摇几次。当然个体所占圆心角较大的被优选的机会更多,可以是一个个体被多次优选到。

    def optimize_choose(self,input_Data):
        out_data_index = []
        for index in range(len(input_Data)):         # 需要优选的次数
            random_value = np.random.rand(1)         # 随机轮盘指针位置
            sum_value = 0
            for _index in range(len(input_Data)):    # 手动转到对应位置
                sum_value = sum_value + input_Data[_index]
                if random_value <= sum_value:
                    out_data_index.append(_index)
                    break
                else:
                    continue
        return out_data_index

 >>锦标赛:2021.12.24早上更新一点

        锦标赛制,保留最好的那个一个,或者择优录取,是人类绝大数情况下进行社交活动中所采用的较为公平的优选方式,是否得到“优选”,完全取决于个体的实力,而不考虑个体的社会关系。一般的做法,将个体按照评价标准进行打分,按照打分从高到低排序,然后“优选”取前N个个体。

>>"小生境":

小生境优选,可以说综合了赌轮盘和锦标赛,考虑个体在种群中的“社会关系”,避免陷入局部最优。这个后面有机会,单独开一个博客来讲。

4. 交叉-变异 (2021.12.27更新)

后代之间的基因融合(交叉、变异)的基本原理如下图所示。

计算机智能专题-遗传算法(1不带约束的)_第5张图片

 这里是简单的原理描述,一些超参数的设置解释如下:

1. 关于交叉的起始位置一般是随机的,通过设置随机函数来实现

2. 关于交叉的长度也可以按照经验来指定,或者如上图所示的

3. 值得注意的是:交叉规则也完全可以由经验来设计

4. 关于变异的位置,这里也采用随机的位置。

5. 变异的长度一般是一位

6.交叉是子代之间一定进行的,但是变异却是按照概率发生的。

一个具体的交叉变异函数代码如下:

    def cross_variation(self,last_groups, opt_chose):
        '''
        :fct 对优选的后代进行交叉、变异
        :param last_groups: 上一代种群中的所有个体
        :param opt_chose: 经过优选 算法产生的"优秀个体的索引",
                          用于从上一代种群中筛选出优秀的个体进行下一步的繁殖
        :return:进行交叉变异后的下一代
        '''
        opt_chose_data = [] # 优选的后的结果
        for opt_flag in opt_chose:
            opt_chose_data.append(last_groups[opt_flag,:])
        cross_Data = copy.deepcopy(opt_chose_data)

        # 分组 因为交叉和变异,需要两两进行,所以要进行分组
        index_groups = list(range(0,len(last_groups)))
        np.random.shuffle(index_groups) #分组是随机的,按顺序排完之后,再次打乱

        # 染色体 交叉,
        # 1. 交叉的位置是随机的
        for index in range(0,int(len(index_groups)/2)):
            index = index*2
            # 交叉的起始位置 是随机的
            variation_site = np.random.choice(list(range(0,np.shape(last_groups)[-1]))[1:]) 
            variation_data = opt_chose_data[index_groups[index]][variation_site:] # 保存 中间变量
            cross_Data[index_groups[index]][variation_site:] = opt_chose_data[index_groups[index+1]][variation_site:]
            cross_Data[index_groups[index + 1]][variation_site:] = variation_data

        # 染色体 变异
        # 2. 变异是否 发生是随机的
        variation_Data = copy.deepcopy(cross_Data)
        variation_value = 1/np.shape(last_groups)[-1]  #变异发生的概率
        for index in range(len(variation_Data)):
            variation_random_value = np.random.rand(1) #当前变异发生的概率
            if variation_random_value>=variation_value:
               # 变异发生的位置
               variation_site = np.random.choice(list(range(0, np.shape(last_groups)[-1]))[1:]) 
               # 变异的表示:0->1: 1->0
               variation_Data[index][variation_site] = 1 - variation_Data[index][variation_site]

        return np.array(variation_Data)

该函数中做一下解释:

关于变异的发生概率一般设置为染色体长度的倒数,在繁殖中,会产生一个随机数,若随机数的概率大于变异发生概率时,就让其变异。

5. 遗传循环

遗传循环:包括以下几个步骤

>>解码

>>计算生存适应度

>>优选

>>交叉、变异

>>解码,求输出值

函数如下:

    def run(self):
        init_groups = self._groups
        data_collect = []
        for epochs in range(100):

            y_group = [self.Binary2Decimal(Binary,False) for Binary in init_groups]
            y_suit = self.calculate_suitability(y_group)
            opt_chose = self.optimize_choose(y_suit)

            cross_variation_data = self.cross_variation(init_groups, opt_chose)

            init_groups = copy.deepcopy(cross_variation_data)

            y_get = list(map(lambda x: f(self.Binary2Decimal(x,True)), init_groups))
            data_collect.append(np.max(y_get))
            print('epoch: %d 当前最优值为%f'%(epochs,np.max(data_collect)))

结果

计算机智能专题-遗传算法(1不带约束的)_第6张图片

汇总代码:

import numpy as np
import copy

'''目标函数'''

# f = lambda x:−x^4+37x^3−476x^2+2540x−4779  −(x−5)(x−10)(x−6)(x−16)+21
f = lambda x:-x**4+37*x**3-476*x**2+2540*x-4779

class genetic_algorithms():
    def __init__(self,N=8,M=5):
        _groups = np.zeros([N,M],int)
        for index in range(0,N):
            for _index in range(0,M):
                _groups[index,_index] = np.random.choice([0,1])
        self._groups = _groups

    def Binary2Decimal(self,Binary,include_negative=False):
        '''
        fct: 将二进制转化为十进制
        :param Binary: 输入的二进制数组
        :param include_negative: 最高位是不是 符号位
        :return:
        '''
        sum = 0
        bit_flag = -1 if include_negative==True else 1
        for index in range(1,len(Binary)):
            sum = sum + Binary[-index]*2**(index-1)
        if  bit_flag==-1:
            if Binary[0]==1:
               sum = sum * bit_flag
            else:
               sum = sum + 0
        else:
            sum = sum + Binary[0]*2**(index)

        return sum


    # 适宜度的设计 很重要
    # 会出现负数,负数怎么处理
    # 这里将 负数变成正数 进行处理
    def calculate_suitability(self,input,error=0.01):
        y_get = list(map(lambda x:f(x),input))
        y_get_ = y_get-np.min(y_get)+error #让最小的那个数值 不为零
        out_data = [y_get__/np.sum(y_get_) for y_get__ in y_get_]
        return out_data


    def optimize_choose(self,input_Data):
        out_data_index = []
        for index in range(len(input_Data)):         # 需要优选的次数
            random_value = np.random.rand(1)         # 随机轮盘指针位置
            sum_value = 0
            for _index in range(len(input_Data)):    # 手动转到对应位置
                sum_value = sum_value + input_Data[_index]
                if random_value <= sum_value:
                    out_data_index.append(_index)
                    break
                else:
                    continue
        return out_data_index

    def cross_variation(self,last_groups, opt_chose):
        '''
        :fct 对优选的后代进行交叉、变异
        :param last_groups: 上一代种群中的所有个体
        :param opt_chose: 经过优选 算法产生的"优秀个体的索引",
                          用于从上一代种群中筛选出优秀的个体进行下一步的繁殖
        :return:进行交叉变异后的下一代
        '''
        opt_chose_data = [] # 优选的后的结果
        for opt_flag in opt_chose:
            opt_chose_data.append(last_groups[opt_flag,:])
        cross_Data = copy.deepcopy(opt_chose_data)

        # 分组 因为交叉和变异,需要两两进行,所以要进行分组
        index_groups = list(range(0,len(last_groups)))
        np.random.shuffle(index_groups) #分组是随机的,按顺序排完之后,再次打乱

        # 染色体 交叉,
        # 1. 交叉的位置是随机的
        for index in range(0,int(len(index_groups)/2)):
            index = index*2
            # 交叉的起始位置 是随机的
            variation_site = np.random.choice(list(range(0,np.shape(last_groups)[-1]))[1:])
            variation_data = opt_chose_data[index_groups[index]][variation_site:] # 保存 中间变量
            cross_Data[index_groups[index]][variation_site:] = opt_chose_data[index_groups[index+1]][variation_site:]
            cross_Data[index_groups[index + 1]][variation_site:] = variation_data

        # 染色体 变异
        # 2. 变异是否 发生是随机的
        variation_Data = copy.deepcopy(cross_Data)
        variation_value = 1/np.shape(last_groups)[-1]  #变异发生的概率
        for index in range(len(variation_Data)):
            variation_random_value = np.random.rand(1) #当前变异发生的概率
            if variation_random_value>=variation_value:
               # 变异发生的位置
               variation_site = np.random.choice(list(range(0, np.shape(last_groups)[-1]))[1:])
               # 变异的表示:0->1: 1->0
               variation_Data[index][variation_site] = 1 - variation_Data[index][variation_site]

        return np.array(variation_Data)

    def run(self):
        init_groups = self._groups
        data_collect = []
        for epochs in range(100):

            y_group = [self.Binary2Decimal(Binary,False) for Binary in init_groups]
            y_suit = self.calculate_suitability(y_group)
            opt_chose = self.optimize_choose(y_suit)

            cross_variation_data = self.cross_variation(init_groups, opt_chose)

            init_groups = copy.deepcopy(cross_variation_data)

            y_get = list(map(lambda x: f(self.Binary2Decimal(x,True)), init_groups))
            data_collect.append(np.max(y_get))
            print('epoch: %d 当前最优值为%f'%(epochs,np.max(data_collect)))
            # print('epoch: %d 当前最优值为%f'%(epochs,np.max(y_get)))

if __name__=='__main__':
    obj = genetic_algorithms(N=8,M=5)
    obj.run()

你可能感兴趣的:(计算机智能算法,python)