假设有无约束优化问题:
z = f ( x , y ) z=f(x,y) z=f(x,y)
如何通过遗传算法求解?
在这里需要将该优化问题与遗传算法中的概念进行对比。
先来说说编码。
编码实际上就是将自变量编码为基因,以方便后续的遗传模拟过程。本文以二进制编码为例进行讲解。
为了方便模拟染色体,我们将行向量 [ x , y ] [x,y] [x,y]分开进行编码,如对 x , y = [ 13 , 27 ] x,y=[13,27] x,y=[13,27]有:
可以发现其长度并不相等,但是不要着急,我们可以在其之前补上若干个0,使得二者最终的长度 n n n相等。
那么问题来了, n n n取多少呢?8,16还是32?再或者其他的值?
当然不是随便取,因为:
所以, n n n的取值取决于我们自变量的范围与精度。
举个例子:
对于一个自变量 x ∈ [ − 2 , 2 ] x \in [-2,2] x∈[−2,2],需要精确到小数点后5位,那么该二进制编码的总长度应为多少?
显然,问题转化为:需要一个多长的二进制编码才能表示该区间内所有具有小数点后5的数字?
很显然,该区间内所有具有小数点后5的数字共有 4 × 1 0 5 4 \times10^5 4×105个。
所以,需要找到一个最小的正整数 n n n,使得 2 n ≥ 4 × 1 0 5 2^n\ge 4 \times10^5 2n≥4×105。
for i in range(40):
if 2**i>=4e5:
print(i)
break
解得n=19.
解码就是编码的逆过程,在二进制编码中,实际上就是由二进制转换为十进制的问题,但同时需要注意不能使得解码后的值超出我们规定的自变量的区间:
def decode(x,a,b):
"""解码针对染色体的某个变量"""
xt=0
for i in range(len(x)):
xt+=x[i]*np.power(2,i)
return a+xt*(b-a)/(np.power(2,len(x))-1) # a,b是自变量的取值范围
注意,通过上面的函数,我们只对某一条基因进行了解码,实际上我们在算法中,所有个体以及每个个体的基因都是在一个大的矩阵中,取 n = 20 n=20 n=20,自变量 x , y ∈ [ − 5 , 5 ] x,y \in [-5,5] x,y∈[−5,5]为例,对于基因种群解码:
def decode_X(X:np.ndarray):
"""对整个种群的基因解码"""
X2=np.zeros((X.shape[0],2))
for i in range(X.shape[0]):
xi=decode(X[i,:20],-5,5)
yi=decode(X[i,20:],-5,5)
X2[i]=np.array([xi,yi])
return X2
物竞天择,适者生存。
不像之前介绍的粒子群算法,在遗传算法中,不合适的个体会被淘汰掉。因此我们要进行模拟选择的过程,我们选择当然要选择适应能力好的个体。(在最小化问题中适应度越小越好)
def select(X,fitness):
"""根据轮盘赌法选择优秀个体"""
fitness=1/fitness # fitness越小的个体越优秀,其对应的概率越大,因此需要取一下倒数
fitness=fitness/fitness.sum() # 归一化
idx=np.arange(X.shape[0]) # 每个个体的索引
X2_idx=np.random.choice(idx,size=X.shape[0],p=fitness)
X2=X[X2_idx,:]
return X2
注意我们这里还是比较仁慈的,没有淘汰辣鸡个体,这是为了后面的程序好编写。
显然,这个是模拟自然界中个体与个体之间的交 配操作。
def mutation(X,m):
for i in range(0,X.shape[0],2):
xa=X[i,:]
xb=X[i+1,:]
for j in range(X.shape[1]):
if np.random.rand()<m:
xa[j],xb[j]=xb[j],xa[j] # 交叉
X[i,:]=xa
X[i+1,:]=xb
return X
代码也很简单。
同样,模拟自然界中的变异,这通常会带来意想不到的结果:
def mutation(X,m):
for i in range(X.shape[0]):
for j in range(X.shape[1]):
if np.random.rand()<m:
X[i,j]=(X[i,j]+1)%2
return X
代码也很简单。
来到主函数,只需在每次迭代中进行解码,选择,交叉,变异等操作即可,而这些操作我们上面已经定义完毕,所以主函数代码非常简单明了:
def ga(target_func,size,gene_num,p_cross=0.3,p_muta=0.05,iter_num=100):
"""遗传算法主函数
params:
p_cross:交叉操作的概率阈值
p_muta:变异操作的概率阈值
iter_num:最大迭代次数
size:种群中个体的个数
gene_num:表示所有自变量所需要的基因位 数量
"""
c=p_cross # 交叉概率
m=p_muta # 变异概率
best_fitness=[] # 记录每次迭代的效果
best_xy=[]
iter_num=100
X0=np.random.randint(0,2,(size,gene_num)) # 初始化种群
for i in range(iter_num):
X1=decode_X(X0)
fitness=target_func(X1) # 初始化适应度
X2=select(X0,fitness) # 选择操作
X3=crossover(X2,c) # 交叉操作
X4=mutation(X3,m) # 变异
X5=decode_X(X4) # 解码
fitness=target_func(X5)
best_fitness.append(fitness.min())
x,y=X5[fitness.argmin()]
best_xy.append((x,y))
X0=X4 # 最后别忘了更新种群
# 多次迭代后的最新效果
print("最优val是: ",best_fitness[-1])
print("最优解是:\n x=%.5f, y=%.5f"%best_xy[-1])
return best_fitness
最后来看一下迭代的过程:
import matplotlib.pyplot as plt
fitnessList=ga(fitness_func,50,40)
plt.plot(fitnessList)