前言:
遗传算法是一种群智能优化算法,它主要解决的是排列组合问题。通过模仿遗传学中染色体的交叉、变异、并通过“优选”,使父代产生更优的“子代”,在不断的“优胜略汰”中,最终得到最优的组合。更新ing,,,,
本篇文章讲的是:遗传算法的整数编码,原理较为简单可以用作入门。
第二篇遗传算法“实数编码”,是模仿二进制交叉和编译,适用范围更广泛。
>>生物学定义:DNA中遗传信息在一个长链上按一定的模式排列
>>计算机学定义:将实际问题抽象成"染色体",所建立的数学模型,具体来讲,实际问题中的排列组合问题,并不是涉及染色体,要使用遗传算法解决问题需要进行模型转化。
>>生物学定义: 从遗传DNA到表现型的映射
>>计算机学定义:实际问题通过“编码”过程映射为染色体并使用遗产算法处理之后,需要重新映射到实际问题中,来获得真实的自由组合,这个过程叫做解码。
>>生物学定义:在两个染色体的某一相同位置处DNA被切断,其前后两串分别交叉组合形成两个新的染色体。
>>计算机学定义:在实际的操作中会模仿这样的操作,对编码后的数据进行交叉。
>>生物学定义:很小概率产生基因突变,产生出新的染色体,然后表现出新的性状
度量某个物种对于生存环境的适应程度。对于生存化境适应程度较高的物种将获得更多的繁殖机会,反之机会较少,甚至灭绝。
指定以一定的概率从种群中选择若干个体进行"优胜略汰"。
实现遗传算法求解:
(x−5)(x−10)(x−6)(x−16)+21
=-x^4+37*x^3-476*x^2+2540*x-4779
的最大值,其中x为0到31之间的整数,
f = lambda x:-x**4+37*x**3-476*x**2+2540*x-4779
函数图像如下图所示:
这里做下说明,对于给出的这个实际问题,可以通过遍历循环得到0到31中满足要求的值,这里通过简单的示例,解释用遗传算法解决这个问题。
>>遗传算法进化迭代次数epochs,这个根据遗传算迭代收敛的情况而定。
>>种群个体数N,设N=8。这个根据经验设置,作为超参数调试。
>>个体的编码长度M=5,这个根据实际问题的需要求而来,一般设置为最少能够用二进制表示的数码范围。[0,31]32位<=.
这里已经隐含了编码过程,十进制到二进制。
对于这个编码过程做简单的解释:
后面的遗传算法使用,需要进行染色体的交叉、编译操作,而二进制作为和染色体DNA最接近的数制要比十进制更符合操作习惯,将十进制转化为二进制后,二进制的每一位代表一个染色片段,而“交叉”“变异”的操作是以染色体片段为单位进行的。下面结合一个例子讲解种群初始化的过程。
初始化代码如下,产生一个N*M的矩阵,每一行代表一个个体。
def __init__(self,N=8,M=5):
_groups = np.zeros([N,M],int)
for index in range(0,N):
for _index in range(0,M):
_groups[index,_index] = np.random.choice([0,1])
self._groups = _groups
说明:
在这N*M的矩阵中,每一行是一个1*M的向量,这代表一个十进制个体的二进制表示。所以后面应用时还需要设计一个解码器,以便经过遗传算法操作过后的染色体编码可以映射到实际问题中,
这里的解码器,是将二进制转化为十进制的函数:Binary2Decimal
def Binary2Decimal(self,Binary,include_negative=False):
'''
fct: 将二进制转化为十进制
:param Binary: 输入的二进制数组
:param include_negative: 最高位是不是 符号位
:return:
'''
sum = 0
bit_flag = -1 if include_negative==True else 1
for index in range(1,len(Binary)):
sum = sum + Binary[-index]*2**(index-1)
if bit_flag==-1:
if Binary[0]==1:
sum = sum * bit_flag
else:
sum = sum + 0
else:
sum = sum + Binary[0]*2**(index)
return sum
优选的方法有很多,本文中的问题是:求函数的最大值,所以优化的对象是函数值,最简单的方案是:比较种群中个体间的函数值的大小,根据值的大小进行优胜略汰。
具体的分析:
计算得到的值存在几种情况:
1.全为正、2.全为负、3.有正有负、4.值一样
优选的方式需要考虑这几种情况,通常常用的几种优选的方式有:“赌轮盘”、“锦标赛”、“小生境”
按照某个标准,计算得到每一个个体的得分,然后将每个个体分布在一个圆盘上面,个体所占圆心角的大小取决于个体得分所占总分的比例。
这样盘的模型就制作好了,接下来就按照“运气”进行筛选。转动红色的指针,指针指到哪里,哪一个个体就被"优选"到下一个轮回。一般需要筛选出几个个体,就转几次轮盘。
这样做的理论依据:
可以通过设置 评价函数 ,使较优的值的评价分数较高,这样相应的它在轮盘中所占的圆心角就越大,被选择的机会就越大,参与繁殖的机会就越大,这也符合自然法则中的优胜略汰。但是通过这种转轮盘的方式,没有直接选择最好的那一个,也给了劣势群体的一些机会,说不定有些:个体的得分不高,但是他的后代可能产生更优的性状,这种几率发生的比较低,但也是自然法则中的一个现象,所以赌轮盘这种优选方式需要考虑这种情况。
赌轮盘制作函数:
1.将初始化的二进制值,通过函数Binary2Decimal转化为十进制
2.十进制直接计算得到函数值
3. 拿着所有值减去最小值,并加以上一个数
4. 计算所有的个体的的占比,用于制作轮盘
def calculate_suitability(self,input,error=0.01):
y_get = list(map(lambda x:f(x),input))
y_get_ = y_get-np.min(y_get)+error #让最小的那个数值 不为零
out_data = [y_get__/np.sum(y_get_) for y_get__ in y_get_]
return out_data
摇轮盘函数:
这个函数自行理解,关于需要优选的次数:为了保证后代的种群的数量保持不变,所以有几个个体就需要摇几次。当然个体所占圆心角较大的被优选的机会更多,可以是一个个体被多次优选到。
def optimize_choose(self,input_Data):
out_data_index = []
for index in range(len(input_Data)): # 需要优选的次数
random_value = np.random.rand(1) # 随机轮盘指针位置
sum_value = 0
for _index in range(len(input_Data)): # 手动转到对应位置
sum_value = sum_value + input_Data[_index]
if random_value <= sum_value:
out_data_index.append(_index)
break
else:
continue
return out_data_index
锦标赛制,保留最好的那个一个,或者择优录取,是人类绝大数情况下进行社交活动中所采用的较为公平的优选方式,是否得到“优选”,完全取决于个体的实力,而不考虑个体的社会关系。一般的做法,将个体按照评价标准进行打分,按照打分从高到低排序,然后“优选”取前N个个体。
小生境优选,可以说综合了赌轮盘和锦标赛,考虑个体在种群中的“社会关系”,避免陷入局部最优。这个后面有机会,单独开一个博客来讲。
后代之间的基因融合(交叉、变异)的基本原理如下图所示。
这里是简单的原理描述,一些超参数的设置解释如下:
1. 关于交叉的起始位置一般是随机的,通过设置随机函数来实现
2. 关于交叉的长度也可以按照经验来指定,或者如上图所示的
3. 值得注意的是:交叉规则也完全可以由经验来设计
4. 关于变异的位置,这里也采用随机的位置。
5. 变异的长度一般是一位
6.交叉是子代之间一定进行的,但是变异却是按照概率发生的。
一个具体的交叉变异函数代码如下:
def cross_variation(self,last_groups, opt_chose):
'''
:fct 对优选的后代进行交叉、变异
:param last_groups: 上一代种群中的所有个体
:param opt_chose: 经过优选 算法产生的"优秀个体的索引",
用于从上一代种群中筛选出优秀的个体进行下一步的繁殖
:return:进行交叉变异后的下一代
'''
opt_chose_data = [] # 优选的后的结果
for opt_flag in opt_chose:
opt_chose_data.append(last_groups[opt_flag,:])
cross_Data = copy.deepcopy(opt_chose_data)
# 分组 因为交叉和变异,需要两两进行,所以要进行分组
index_groups = list(range(0,len(last_groups)))
np.random.shuffle(index_groups) #分组是随机的,按顺序排完之后,再次打乱
# 染色体 交叉,
# 1. 交叉的位置是随机的
for index in range(0,int(len(index_groups)/2)):
index = index*2
# 交叉的起始位置 是随机的
variation_site = np.random.choice(list(range(0,np.shape(last_groups)[-1]))[1:])
variation_data = opt_chose_data[index_groups[index]][variation_site:] # 保存 中间变量
cross_Data[index_groups[index]][variation_site:] = opt_chose_data[index_groups[index+1]][variation_site:]
cross_Data[index_groups[index + 1]][variation_site:] = variation_data
# 染色体 变异
# 2. 变异是否 发生是随机的
variation_Data = copy.deepcopy(cross_Data)
variation_value = 1/np.shape(last_groups)[-1] #变异发生的概率
for index in range(len(variation_Data)):
variation_random_value = np.random.rand(1) #当前变异发生的概率
if variation_random_value>=variation_value:
# 变异发生的位置
variation_site = np.random.choice(list(range(0, np.shape(last_groups)[-1]))[1:])
# 变异的表示:0->1: 1->0
variation_Data[index][variation_site] = 1 - variation_Data[index][variation_site]
return np.array(variation_Data)
该函数中做一下解释:
关于变异的发生概率一般设置为染色体长度的倒数,在繁殖中,会产生一个随机数,若随机数的概率大于变异发生概率时,就让其变异。
5. 遗传循环
遗传循环:包括以下几个步骤
>>解码
>>计算生存适应度
>>优选
>>交叉、变异
>>解码,求输出值
函数如下:
def run(self):
init_groups = self._groups
data_collect = []
for epochs in range(100):
y_group = [self.Binary2Decimal(Binary,False) for Binary in init_groups]
y_suit = self.calculate_suitability(y_group)
opt_chose = self.optimize_choose(y_suit)
cross_variation_data = self.cross_variation(init_groups, opt_chose)
init_groups = copy.deepcopy(cross_variation_data)
y_get = list(map(lambda x: f(self.Binary2Decimal(x,True)), init_groups))
data_collect.append(np.max(y_get))
print('epoch: %d 当前最优值为%f'%(epochs,np.max(data_collect)))
结果
汇总代码:
import numpy as np
import copy
'''目标函数'''
# f = lambda x:−x^4+37x^3−476x^2+2540x−4779 −(x−5)(x−10)(x−6)(x−16)+21
f = lambda x:-x**4+37*x**3-476*x**2+2540*x-4779
class genetic_algorithms():
def __init__(self,N=8,M=5):
_groups = np.zeros([N,M],int)
for index in range(0,N):
for _index in range(0,M):
_groups[index,_index] = np.random.choice([0,1])
self._groups = _groups
def Binary2Decimal(self,Binary,include_negative=False):
'''
fct: 将二进制转化为十进制
:param Binary: 输入的二进制数组
:param include_negative: 最高位是不是 符号位
:return:
'''
sum = 0
bit_flag = -1 if include_negative==True else 1
for index in range(1,len(Binary)):
sum = sum + Binary[-index]*2**(index-1)
if bit_flag==-1:
if Binary[0]==1:
sum = sum * bit_flag
else:
sum = sum + 0
else:
sum = sum + Binary[0]*2**(index)
return sum
# 适宜度的设计 很重要
# 会出现负数,负数怎么处理
# 这里将 负数变成正数 进行处理
def calculate_suitability(self,input,error=0.01):
y_get = list(map(lambda x:f(x),input))
y_get_ = y_get-np.min(y_get)+error #让最小的那个数值 不为零
out_data = [y_get__/np.sum(y_get_) for y_get__ in y_get_]
return out_data
def optimize_choose(self,input_Data):
out_data_index = []
for index in range(len(input_Data)): # 需要优选的次数
random_value = np.random.rand(1) # 随机轮盘指针位置
sum_value = 0
for _index in range(len(input_Data)): # 手动转到对应位置
sum_value = sum_value + input_Data[_index]
if random_value <= sum_value:
out_data_index.append(_index)
break
else:
continue
return out_data_index
def cross_variation(self,last_groups, opt_chose):
'''
:fct 对优选的后代进行交叉、变异
:param last_groups: 上一代种群中的所有个体
:param opt_chose: 经过优选 算法产生的"优秀个体的索引",
用于从上一代种群中筛选出优秀的个体进行下一步的繁殖
:return:进行交叉变异后的下一代
'''
opt_chose_data = [] # 优选的后的结果
for opt_flag in opt_chose:
opt_chose_data.append(last_groups[opt_flag,:])
cross_Data = copy.deepcopy(opt_chose_data)
# 分组 因为交叉和变异,需要两两进行,所以要进行分组
index_groups = list(range(0,len(last_groups)))
np.random.shuffle(index_groups) #分组是随机的,按顺序排完之后,再次打乱
# 染色体 交叉,
# 1. 交叉的位置是随机的
for index in range(0,int(len(index_groups)/2)):
index = index*2
# 交叉的起始位置 是随机的
variation_site = np.random.choice(list(range(0,np.shape(last_groups)[-1]))[1:])
variation_data = opt_chose_data[index_groups[index]][variation_site:] # 保存 中间变量
cross_Data[index_groups[index]][variation_site:] = opt_chose_data[index_groups[index+1]][variation_site:]
cross_Data[index_groups[index + 1]][variation_site:] = variation_data
# 染色体 变异
# 2. 变异是否 发生是随机的
variation_Data = copy.deepcopy(cross_Data)
variation_value = 1/np.shape(last_groups)[-1] #变异发生的概率
for index in range(len(variation_Data)):
variation_random_value = np.random.rand(1) #当前变异发生的概率
if variation_random_value>=variation_value:
# 变异发生的位置
variation_site = np.random.choice(list(range(0, np.shape(last_groups)[-1]))[1:])
# 变异的表示:0->1: 1->0
variation_Data[index][variation_site] = 1 - variation_Data[index][variation_site]
return np.array(variation_Data)
def run(self):
init_groups = self._groups
data_collect = []
for epochs in range(100):
y_group = [self.Binary2Decimal(Binary,False) for Binary in init_groups]
y_suit = self.calculate_suitability(y_group)
opt_chose = self.optimize_choose(y_suit)
cross_variation_data = self.cross_variation(init_groups, opt_chose)
init_groups = copy.deepcopy(cross_variation_data)
y_get = list(map(lambda x: f(self.Binary2Decimal(x,True)), init_groups))
data_collect.append(np.max(y_get))
print('epoch: %d 当前最优值为%f'%(epochs,np.max(data_collect)))
# print('epoch: %d 当前最优值为%f'%(epochs,np.max(y_get)))
if __name__=='__main__':
obj = genetic_algorithms(N=8,M=5)
obj.run()