粒子群算法(PSO)——总体概述

粒子群算法(Particle swarm optimization ,PSO)

PSO 是1995年由 Kennedy 和 Eberhart提出的一种算法。PSO和GA的相似之处在种群的初始化,都是随机生成初始解,但对于PSO的每个潜在解都会设置一个随机速度和位置,这被称为粒子,粒子在问题空间飞行来搜寻最优解。粒子个体执行很简单行为:去模拟其周围个体的“成功”与该粒子本身的“成功”。从这些简单个体简单行为的群体涌现实现了在高维空间中的最优解搜索。

PSO根据他们邻居规模的不同被分为两种算法,分别是局部最优PSO( l − b e s t l-best lbest PSO)和全局最优PSO( g − b e s t g-best gbest PSO)。

PSO的速度成分

粒子 i 最佳位置以 y i ( t ) \mathbf y_i(t) yi(t) 表示(截止 t 时刻,粒子 i 搜索到的最优位置);邻居的最佳位置,记为 y ^ ( t ) \hat\mathbf y(t) y^(t); 粒子 i 的当前位置以 x i ( t ) \mathbf x_i(t) xi(t) 表示。将速度更新以矢量形式描述,则有:

v i ( t + 1 ) = v i ( t ) + c 1 ⋅ r 1 ( t ) ⋅ [ y i ( t ) − x i ( t ) ] + c 2 ⋅ r 2 ( t ) ⋅ [ y ^ i ( t ) − x i ( t ) ] \mathbf v_{i}(t+1)=\mathbf v_{i}(t)+c_1\cdot \mathbf r_{1}(t)\cdot [\mathbf y_{i}(t)-\mathbf x_{i}(t)]+c_2\cdot \mathbf r_{2}(t)\cdot [\hat \mathbf y_{i}(t)-\mathbf x_{i}(t)] vi(t+1)=vi(t)+c1r1(t)[yi(t)xi(t)]+c2r2(t)[y^i(t)xi(t)]

其中 v i ( t ) \mathbf v_{i}(t) vi(t) 是前速度,表示对之前飞行方向的记忆,这一项可视为动量,它阻止粒子改变方向,是惯性项

c 1 ⋅ r 1 ( t ) ⋅ [ y i ( t ) − x i ( t ) ] c_1\cdot \mathbf r_{1}(t)\cdot [\mathbf y_{i}(t)-\mathbf x_{i}(t)] c1r1(t)[yi(t)xi(t)] 是对粒子 i 过去表现的量化,被称为认知部分。某种意义上讲,认知部分是粒子 i 关于最优位置的个体记忆。这一项的影响是会使粒子退回到它曾经的最优位置;

c 2 ⋅ r 2 ( t ) ⋅ [ y ^ i ( t ) − x i ( t ) ] c_2\cdot \mathbf r_{2}(t)\cdot [\hat \mathbf y_{i}(t)-\mathbf x_{i}(t)] c2r2(t)[y^i(t)xi(t)] 是对邻居信息的量化,即社会信息,被称为社会部分。社会部分类似于个人寻求达到的群体规范或标准;这一项的影响是使得每个粒子向该粒子邻居发现的最优位置移动。

认知部分和社会部分分别由 c 1 ⋅ r 1 ( t ) c_1\cdot \mathbf r_{1}(t) c1r1(t) c 2 ⋅ r 2 ( t ) c_2\cdot \mathbf r_{2}(t) c2r2(t) 赋予权重。当从时间 t 到 t+1 时,速度和位置的变化如下:
粒子群算法(PSO)——总体概述_第1张图片

全局最优PSO

每个粒子的邻居是整个粒子群, g − b e s t g-best gbest PSO的社会网络结构应用的是星型拓扑结构,这种结构中,粒子速度更新的社会部分反映的是从种群中的所有粒子中得到信息。
粒子群算法(PSO)——总体概述_第2张图片

g − b e s t g-best gbest PSO的速度为: v i j ( t + 1 ) = v i j ( t ) + c 1 ⋅ r 1 j ( t ) ⋅ [ y i j ( t ) − x i j ( t ) ] + c 2 ⋅ r 2 j ( t ) ⋅ [ y ^ i j ( t ) − x i j ( t ) ] v_{ij}(t+1)=v_{ij}(t)+c_1\cdot r_{1j}(t)\cdot [y_{ij}(t)-x_{ij}(t)]+c_2\cdot r_{2j}(t)\cdot [\hat y_{ij}(t)-x_{ij}(t)] vij(t+1)=vij(t)+c1r1j(t)[yij(t)xij(t)]+c2r2j(t)[y^ij(t)xij(t)]

其中 v i j ( t ) v_{ij}(t) vij(t) 是粒子 i i i 在第 j j j 维的速度, x i j ( t ) x_{ij}(t) xij(t) 是粒子 i i i 在第 j j j 维的位置, j = 1 , 2 , ⋯   , n x j=1,2,\cdots,n_x j=1,2,,nx c 1 , c 2 c_1,c_2 c1,c2 是加速度常数(用于衡量认知部分和社会部分分别的贡献程度), r 1 j ( t ) , r 2 j ( t ) ∼ U ( 0 , 1 ) r_{1j}(t),r_{2j}(t)\sim U(0,1) r1j(t),r2j(t)U(0,1) 是从均匀分布中采样得到的随机值。

在最小化问题中, y i ( t ) \mathbf y_i(t) yi(t) 的更新规则为: y i ( t + 1 ) = { y i ( t ) , i f    f ( x i ( t + 1 ) ) ≥ f ( y i ( t ) ) x i ( t + 1 ) i f    f ( x i ( t + 1 ) ) < f ( y i ( t ) ) \displaystyle \mathbf y_i(t+1)=\left\{ \begin{aligned} \mathbf y_i(t), & & {if\,\,f(\mathbf x_i(t+1))\ge f(y_i(t))}\\ \mathbf x_i(t+1) & & {if\,\,f(\mathbf x_i(t+1))< f(y_i(t))}\\ \end{aligned} \right. yi(t+1)={yi(t),xi(t+1)iff(xi(t+1))f(yi(t))iff(xi(t+1))<f(yi(t))
其中, f : R n x → R f:\mathbb R^{n_x}\to\mathbb R f:RnxR 是适应度函数。

y ^ ( t ) = m i n { f ( x 0 ( t ) ) , ⋯   , x n s ( t ) ) } \displaystyle \hat\mathbf y(t)=min\{f(\mathbf x_0(t)),\cdots,\mathbf x_{n_s}(t))\} y^(t)=min{f(x0(t)),,xns(t))}

其算法伪代码可表示如下:
粒子群算法(PSO)——总体概述_第3张图片

对于一个二维变量的寻优问题,以符号 “ × \times ×” 表示最优解位置,则在第 t 步和 t + 1步,粒子变化示意图为:
粒子群算法(PSO)——总体概述_第4张图片

局部最优PSO

l − b e s t l-best lbest PSO 中每个粒子的邻居相比于 g − b e s t g-best gbest PSO要少很多,它采用的是环形社会网络拓扑结构。这种结构中,粒子速度更新的社会部分反映的是粒子周边邻居中得到的信息,反映的是局部环境信息。这种情况下,社会信息是该粒子的邻居中的最佳位置,记为 y ^ ( t ) ∈ N i \hat\mathbf y(t)\in\mathcal N_i y^(t)Ni
粒子群算法(PSO)——总体概述_第5张图片

其邻居集合可表示为: N i = { y i − n N i ( t ) , y i − n N i + 1 ( t ) , ⋯   , y i − 1 ( t ) , y i + 1 ( t ) , ⋯   , y i + n N i ( t ) } \mathcal N_i=\{\mathbf y_{i-n_{\mathcal N_i}}(t),\mathbf y_{i-n_{\mathcal N_i}+1}(t),\cdots,\mathbf y_{i-1}(t),\mathbf y_{i+1}(t),\cdots,\mathbf y_{i+n_{\mathcal N_i}}(t)\} Ni={yinNi(t),yinNi+1(t),,yi1(t),yi+1(t),,yi+nNi(t)},邻居数量为 n N i n_{\mathcal N_i} nNi。个体最佳位置以 y i ( t ) \mathbf y_i(t) yi(t) 表示(截止 t 时刻,粒子 i 搜索到的最优位置)。则该方法的速度更新与 g − b e s t g-best gbest PSO相同。

在基础的PSO中,粒子彼此之间没有联系,而邻居的选择是基于粒子索引的。基于索引的邻居选择,其不需要粒子的空间序列,因此计算是很便宜的,利用粒子之间的距离来生成邻居;同时,它不需要粒子在空间中的相对位置,还有助于所有粒子相关的优良解的信息的传播。

一个粒子可以作为许多粒子的邻居,这种邻居之间的交互作用促进了邻居之间的信息交换,使得种群向最优解收敛。
粒子群算法(PSO)——总体概述_第6张图片

对于一个二维变量的寻优问题,以符号 “ × \times ×” 表示最优解位置,则在第 t 步和 t + 1步,粒子变化示意图为:
粒子群算法(PSO)——总体概述_第7张图片

如图所示,在邻居 1 中,粒子 a 和 b 向 c 移动;邻居 2 中, 粒子 d 和 e 向 f 移动,但在下一次迭代中,粒子 e 变成了这一组的最优位置,则粒子 d 和 f 向 e 移动。

因为 g − b e s t g-best gbest PSO 有着更大的粒子连通性,它的收敛比 l − b e s t l-best lbest PSO更快;但是,它的多样性比 l − b e s t l-best lbest PSO要差。因为 l − b e s t l-best lbest PSO 的多样性更大,即其可以覆盖更大的搜索空间,因此不容易陷入局部最优,而其邻居的网络拓扑结构对 l − b e s t l-best lbest PSO的性能也有影响。

关于粒子群算法参数及其他方面的讨论,可看以下两篇:
粒子群算法(PSO)——算法详解(一)
粒子群算法(PSO)——算法详解(二)

你可能感兴趣的:(计算智能,算法,机器学习,人工智能)