weixin_34342207

遗传算法，vector

小袋鼠你往哪儿跳－－遗传算法

基础及其本质

有很多袋鼠，它们降落到喜玛拉雅山脉的任意地方。这些袋鼠并不知道它们的任务是寻找珠穆朗玛峰。但每过几年，就在一些海拔高度较低的地方射杀一些袋鼠，并希望存活下来的袋鼠是多产的，在它们所处的地方生儿育女。

想了很久，应该用一个怎么样的例子带领大家走进遗传算法的神奇世界呢？遗传算法的有趣应用很多，诸如寻路问题，8数码问题，囚犯困境，动作控制，找圆心问题（这是一个国外网友的建议：在一个不规则的多边形中，寻找一个包含在该多边形内的最大圆圈的圆心。），TSP问题（在以后的章节里面将做详细介绍。），生产调度问题，人工生命模拟等。直到最后看到一个非常有趣的比喻，觉得由此引出的袋鼠跳问题（暂且这么叫它吧），既有趣直观又直达遗传算法的本质，确实非常适合作为初学者入门的例子。这一章将告诉读者，我们怎么让袋鼠跳到珠穆朗玛峰上去(如果它没有过早被冻坏的话)。

问题的提出与解决方案

现在要求在既定的区间内找出函数的最大值。

极大值、最大值、局部最优解、全局最优解

在解决上面提出的问题之前我们有必要先澄清几个以后将常常会碰到的概念：极大值、最大值、局部最优解、全局最优解。学过高中数学的人都知道极大值在一个小邻域里面左边的函数值递增，右边的函数值递减，在图2.1里面的表现就是一个“山峰”。当然，在图上有很多个“山峰”，所以这个函数有很多个极大值。而对于一个函数来说，最大值就是在所有极大值当中，最大的那个。所以极大值具有局部性，而最大值则具有全局性。

因为遗传算法中每一条染色体，对应着遗传算法的一个解决方案，一般我们用适应性函数（fitness function）来衡量这个解决方案的优劣。所以从一个基因组到其解的适应度形成一个映射。所以也可以把遗传算法的过程看作是一个在多元函数里面求最优解的过程。在这个多维曲面里面也有数不清的“山峰”，而这些最优解所对应的就是局部最优解。而其中也会有一个“山峰”的海拔最高的，那么这个就是全局最优解。而遗传算法的任务就是尽量爬到最高峰，而不是陷落在一些小山峰。（另外，值得注意的是遗传算法不一定要找“最高的山峰”，如果问题的适应度评价越小越好的话，那么全局最优解就是函数的最小值，对应的，遗传算法所要找的就是“最深的谷底”）如果至今你还不太理解的话，那么你先往下看。本章的示例程序将会非常形象的表现出这个情景。

“袋鼠跳”问题

既然我们把函数曲线理解成一个一个山峰和山谷组成的山脉。那么我们可以设想所得到的每一个解就是一只袋鼠，我们希望它们不断的向着更高处跳去，直到跳到最高的山峰（尽管袋鼠本身不见得愿意那么做）。所以求最大值的过程就转化成一个“袋鼠跳”的过程。下面介绍介绍“袋鼠跳”的几种方式。

爬山法、模拟退火和遗传算法

解决寻找最大值问题的几种常见的算法：

1. 爬山法（最速上升爬山法）：

从搜索空间中随机产生邻近的点，从中选择对应解最优的个体，替换原来的个体，不断重复上述过程。因为只对“邻近”的点作比较，所以目光比较“短浅”，常常只能收敛到离开初始位置比较近的局部最优解上面。对于存在很多局部最优点的问题，通过一个简单的迭代找出全局最优解的机会非常渺茫。（在爬山法中，袋鼠最有希望到达最靠近它出发点的山顶，但不能保证该山顶是珠穆朗玛峰，或者是一个非常高的山峰。因为一路上它只顾上坡，没有下坡。）

2. 模拟退火：

这个方法来自金属热加工过程的启发。在金属热加工过程中，当金属的温度超过它的熔点（Melting Point）时，原子就会激烈地随机运动。与所有的其它的物理系统相类似，原子的这种运动趋向于寻找其能量的极小状态。在这个能量的变迁过程中，开始时。温度非常高，使得原子具有很高的能量。随着温度不断降低，金属逐渐冷却，金属中的原子的能量就越来越小，最后达到所有可能的最低点。利用模拟退火的时候，让算法从较大的跳跃开始，使到它有足够的“能量”逃离可能“路过”的局部最优解而不至于限制在其中，当它停在全局最优解附近的时候，逐渐的减小跳跃量，以便使其“落脚 ”到全局最优解上。（在模拟退火中，袋鼠喝醉了，而且随机地大跳跃了很长时间。运气好的话，它从一个山峰跳过山谷，到了另外一个更高的山峰上。但最后，它渐渐清醒了并朝着它所在的峰顶跳去。）

3. 遗传算法：

模拟物竞天择的生物进化过程，通过维护一个潜在解的群体执行了多方向的搜索，并支持这些方向上的信息构成和交换。以面为单位的搜索，比以点为单位的搜索，更能发现全局最优解。（在遗传算法中，有很多袋鼠，它们降落到喜玛拉雅山脉的任意地方。这些袋鼠并不知道它们的任务是寻找珠穆朗玛峰。但每过几年，就在一些海拔高度较低的地方射杀一些袋鼠，并希望存活下来的袋鼠是多产的，在它们所处的地方生儿育女。）（后来，一个叫天行健的网游给我想了一个更恰切的故事：从前，有一大群袋鼠，它们被莫名其妙的零散地遗弃于喜马拉雅山脉。于是只好在那里艰苦的生活。海拔低的地方弥漫着一种无色无味的毒气，海拔越高毒气越稀薄。可是可怜的袋鼠们对此全然不觉，还是习惯于活蹦乱跳。于是，不断有袋鼠死于海拔较低的地方，而越是在海拔高的袋鼠越是能活得更久，也越有机会生儿育女。就这样经过许多年，这些袋鼠们竟然都不自觉地聚拢到了一个个的山峰上，可是在所有的袋鼠中，只有聚拢到珠穆朗玛峰的袋鼠被带回了美丽的澳洲。）

下面主要介绍介绍遗传算法实现的过程。

遗传算法的实现过程

遗传算法的实现过程实际上就像自然界的进化过程那样。首先寻找一种对问题潜在解进行“数字化”编码的方案。（建立表现型和基因型的映射关系。）然后用随机数初始化一个种群（那么第一批袋鼠就被随意地分散在山脉上。），种群里面的个体就是这些数字化的编码。接下来，通过适当的解码过程之后，（得到袋鼠的位置坐标。）用适应性函数对每一个基因个体作一次适应度评估。（袋鼠爬得越高，越是受我们的喜爱，所以适应度相应越高。）用选择函数按照某种规定择优选择。（我们要每隔一段时间，在山上射杀一些所在海拔较低的袋鼠，以保证袋鼠总体数目持平。）让个体基因交叉变异。（让袋鼠随机地跳一跳）然后产生子代。（希望存活下来的袋鼠是多产的，并在那里生儿育女。）遗传算法并不保证你能获得问题的最优解，但是使用遗传算法的最大优点在于你不必去了解和操心如何去“找”最优解。（你不必去指导袋鼠向那边跳，跳多远。）而只要简单的“否定”一些表现不好的个体就行了。（把那些总是爱走下坡路的袋鼠射杀。）以后你会慢慢理解这句话，这是遗传算法的精粹！

题外话：

这里想提一提一个非主流的进化论观点：拉马克主义的进化论。

法国学者拉马克（Jean-Baptiste de Lamarck,1744～1891）的进化论观点表述在他的《动物学哲学》（1809）一书中。该书提出生物自身存在一种是结构更加复杂化的“内驱力 ”，这种内驱力是与生俱来的，在动物中表现为“动物体新器官的产生来自它不断感觉到的新需要。”不过具体的生物能否变化，向什么方向变化，则要受环境的影响。拉马克称其环境机制为“获得性遗传”，这一机制分为两个阶段：一是动物器官的用与不用（即“用进废退”：在环境的作用下，某一器官越用越发达，不使用就会退化，甚至消失。）；二是在环境作用下，动物用与不用导致的后天变异通过繁殖传给后代（即“获得性遗传”）。

德国动物学家魏斯曼（August Weismann,1834～1914）对获得性遗传提出坚决的质疑。他用老鼠做了一个著名的“去尾实验”，他切去老鼠的尾巴，并使之适应了短尾的生活。用这样的老鼠进行繁殖，下一代老鼠再切去尾巴，一连切了22代老鼠的尾巴，第23代老鼠仍然长出正常的尾巴。由此魏斯曼认为后天后天获得性不能遗传。（择自《怀疑----科学探索的起点》）

我举出这个例子，一方面希望初学者能够更加了解正统的进化论思想，能够分辨进化论与伪进化论的区别。另一方面想让读者知道的是，遗传算法虽然是一种仿生的算法，但我们不需要局限于仿生本身。大自然是非常智慧的，但不代表某些细节上人不能比她更智慧。另外，具体地说，大自然要解决的问题，毕竟不是我们要解决的问题，所以解决方法上的偏差是非常正常和在所难免的。（下一章，读者就会看到一些非仿生而有效的算法改进。）譬如上面这个“获得性遗传”我们先不管它在自然界存不存在，但是对于遗传算法的本身，有非常大的利用价值。即变异不一定发生在产生子代的过程中，而且变异方向不一定是随机性的。变异可以发生在适应性评估的过程当中，而且可以是有方向性的。（当然，进一步的研究有待进行。）

所以我们总结出遗传算法的一般步骤：

开始循环直至找到满意的解。

1.评估每条染色体所对应个体的适应度。

2.遵照适应度越高，选择概率越大的原则，从种群中选择两个个体作为父方和母方。

3.抽取父母双方的染色体，进行交叉，产生子代。

4.对子代的染色体进行变异。

5.重复2，3，4步骤，直到新种群的产生。

结束循环。

接下来，我们将详细地剖析遗传算法过程的每一个细节。

编制袋鼠的染色体----基因的编码方式

通过前一章的学习，读者已经了解到人类染色体的编码符号集，由4种碱基的两种配合组成。共有4种情况，相当于2 bit的信息量。这是人类基因的编码方式，那么我们使用遗传算法的时候编码又该如何处理呢？

受到人类染色体结构的启发，我们可以设想一下，假设目前只有“0”，“1”两种碱基，我们也用一条链条把他们有序的串连在一起，因为每一个单位都能表现出 1 bit的信息量，所以一条足够长的染色体就能为我们勾勒出一个个体的所有特征。这就是二进制编码法，染色体大致如下：

010010011011011110111110

上面的编码方式虽然简单直观，但明显地，当个体特征比较复杂的时候，需要大量的编码才能精确地描述，相应的解码过程（类似于生物学中的DNA翻译过程，就是把基因型映射到表现型的过程。）将过份繁复，为改善遗传算法的计算复杂性、提高运算效率，提出了浮点数编码。染色体大致如下：

1.2 – 3.3 – 2.0 – 5.4 – 2.7 – 4.3

那么我们如何利用这两种编码方式来为袋鼠的染色体编码呢？因为编码的目的是建立表现型到基因型的映射关系，而表现型一般就被理解为个体的特征。比如人的基因型是46条染色体所描述的（总长度两米的纸条？），却能解码成一个个眼，耳，口，鼻等特征各不相同的活生生的人。所以我们要想为“袋鼠”的染色体编码，我们必须先来考虑“袋鼠”的“个体特征”是什么。也许有的人会说，袋鼠的特征很多，比如性别，身长，体重，也许它喜欢吃什么也能算作其中一个特征。但具体在解决这个问题的情况下，我们应该进一步思考：无论这只袋鼠是长短，肥瘦，只要它在低海拔就会被射杀，同时也没有规定身长的袋鼠能跳得远一些，身短的袋鼠跳得近一些。当然它爱吃什么就更不相关了。我们由始至终都只关心一件事情：袋鼠在哪里。因为只要我们知道袋鼠在那里，我们就能做两件必须去做的事情：

（1）通过查阅喜玛拉雅山脉的地图来得知袋鼠所在的海拔高度（通过自变量求函数值。）以判断我们有没必要把它射杀。

（2）知道袋鼠跳一跳后去到哪个新位置。

如果我们一时无法准确的判断哪些“个体特征”是必要的，哪些是非必要的，我们常常可以用到这样一种思维方式：比如你认为袋鼠的爱吃什么东西非常必要，那么你就想一想，有两只袋鼠，它们其它的个体特征完全同等的情况下，一只爱吃草，另外一只爱吃果。你会马上发现，这不会对它们的命运有丝毫的影响，它们应该有同等的概率被射杀！只因它们处于同一个地方。（值得一提的是，如果你的基因编码设计中包含了袋鼠爱吃什么的信息，这其实不会影响到袋鼠的进化的过程，而那只攀到珠穆朗玛峰的袋鼠吃什么也完全是随机的，但是它所在的位置却是非常确定的。）

以上是对遗传算法编码过程中经常经历的思维过程，必须把具体问题抽象成数学模型，突出主要矛盾，舍弃次要矛盾。只有这样才能简洁而有效的解决问题。希望初学者仔细琢磨。

既然确定了袋鼠的位置作为个体特征，具体来说位置就是横坐标。那么接下来，我们就要建立表现型到基因型的映射关系。就是说如何用编码来表现出袋鼠所在的横坐标。由于横坐标是一个实数，所以说透了我们就是要对这个实数编码。回顾我们上面所介绍的两种编码方式，读者最先想到的应该就是，对于二进制编码方式来说，编码会比较复杂，而对于浮点数编码方式来说，则会比较简洁。恩，正如你所想的，用浮点数编码，仅仅需要一个浮点数而已。而下面则介绍如何建立二进制编码到一个实数的映射。

明显地，一定长度的二进制编码序列，只能表示一定精度的浮点数。譬如我们要求解精确到六位小数，由于区间长度为2 – (-1) = 3 ,为了保证精度要求，至少把区间[-1,2]分为3 × 10⁶等份。

例如一个二进制串<1000101110110101000111>表示实数值0.637197。

二进制串<0000000000000000000000>和<1111111111111111111111>则分别表示区间的两个端点值-1和2。

由于往下章节的示例程序几乎都只用到浮点数编码，所以这个“袋鼠跳”问题的解决方案也是采用浮点数编码的。往下的程序示例（包括装载基因的类，突变函数）都是针对浮点数编码的。（对于二进制编码这里只作简单的介绍，不过这个“袋鼠跳”完全可以用二进制编码来解决的，而且更有效一些。所以读者可以自己尝试用二进制编码来解决。）

小知识：vector（容器）的使用。

在具体写代码的过程中，读者将会频繁用到vector这种数据结构，所以大家必须先对它有所了解。

std::vector是STL（standard template library）库里面的现成的模板类。它用起来就像动态数组。利用vector（容器）我们可以方便而且高效的对容器里面的元素进行操作。示例如下：

//添加头文件，并使用std名空间。
#include
using namespace std;
//定义一个vector,<>内的是这个vector所装载的类型。
vector MyVector;
//为vector后面添加一个整型元素0。
MyVector.push_back(0);
//把vector的第一个元素的值赋给变量a。值得注意的是如果vector的长度只有1，而你
//去访问它的下一个元素的话，编译和运行都不会报错，它会返回一个随机值给你，所以使
//用的时候一定要注意这个潜伏的BUG。
int a = MyVector[0];
//把vector里面的元素全部清空。
MyVector.clear();
//返回vector里面的元素的个数。
MyVector.size()

呵呵，如果你没用过这个模板类，请完全不必介意，因为现在为止，你已经学会了在本书里面将用到的所有功能。

另外，我也顺便提一提，为什么我用vector而不用其它数据结构比如数组，来承载一条基因，还有后面我们将会学到的神经网络中的权值向量。诚然，用数组作为基因或者权值向量的载体，速度会快一些。但是我用vector主要出于下面几个考虑。首先，vector的使用比较方便，方便得到其大小，也方便添加和访问元素，还有排序。其次，使用vector也便于代码的维护与及重用（在这本书的学习过程中，学习者将会逐步建立起遗传算法和人工神经网络的引擎，通过对代码少量的修改就能用于解决新的问题。）。另外，我还希望在研究更前缘的应用方向――通过遗传算法动态改变神经网络的拓扑结构的时候，大家仍然可以通过少量的修改后继续利用这些代码。（因为动态地改变神经网络的拓扑结构非常需要不限定大小的容器。）

我们定义一个类作为袋鼠基因的载体。（细心的人会提出这样的疑问：为什么我用浮点数的容器来储藏袋鼠的基因呢？袋鼠的基因不是只用一个浮点数来表示就行吗？恩，没错，事实上对于这个实例，我们只需要用上一个浮点数就行了。我们这里用上容器是为了方便以后利用这些代码处理那些编码需要一串浮点数的问题。）

class CGenome
{
public:
//定义装载基因的容器（事实上从英文解释来看，Weights是权值的意思，这用来表示
//基因的确有点名不符实，呵呵。这主要是因为这些代码来自于GA-ANN引擎，所以在
//它里面基因实质就是神经网络的权值，所以习惯性的把它引入过来就只好这样了。）
vector vecWeights;
// dFitness用于存储对该基因的适应性评估。
double dFitness;
//类的无参数初始化参数。
CGenome():dFitness(0){}
//类的带参数初始化参数。
CGenome(vector w, double f): vecWeights(w), dFitness(f){}
};

好了，目前为止我们把袋鼠的染色体给研究透了，让我们继续跟进袋鼠的进化旅程。

物竞天择－－适应性评分与及选择函数。

1.物竞――适应度函数（fitness function）

自然界生物竞争过程往往包含两个方面：生物相互间的搏斗与及生物与客观环境的搏斗过程。但在我们这个实例里面，你可以想象到，袋鼠相互之间是非常友好的，它们并不需要互相搏斗以争取生存的权利。它们的生死存亡更多是取决于你的判断。因为你要衡量哪只袋鼠该杀，哪只袋鼠不该杀，所以你必须制定一个衡量的标准。而对于这个问题，这个衡量的标准比较容易制定：袋鼠所在的海拔高度。（因为你单纯地希望袋鼠爬得越高越好。）所以我们直接用袋鼠的海拔高度作为它们的适应性评分。即适应度函数直接返回函数值就行了。

2.天择――选择函数（selection）

自然界中，越适应的个体就越有可能繁殖后代。但是也不能说适应度越高的就肯定后代越多，只能是从概率上来说更多。（毕竟有些所处海拔高度较低的袋鼠很幸运，逃过了你的眼睛。）那么我们怎么来建立这种概率关系呢？下面我们介绍一种常用的选择方法――轮盘赌（Roulette Wheel Selection）选择法。

呵呵，有人会问为什么我们把它叫成轮盘赌选择法啊？其实你只要看看图2-2的轮盘就会明白了。这个轮盘是按照各个个体的适应度比例进行分块的。你可以想象一下，我们转动轮盘，轮盘停下来的时候，指针会随机地指向某一个个体所代表的区域，那么非常幸运地，这个个体被选中了。（很明显，适应度评分越高的个体被选中的概率越大。）

那么接下来我们看看如何用代码去实现轮盘赌。

//轮盘赌函数
CGenome GetChromoRoulette()
{
//产生一个0到人口总适应性评分总和之间的随机数.
//中m_dTotalFitness记录了整个种群的适应性分数总和)
double Slice = (RandFloat()) * m_dTotalFitness;
//这个基因将承载转盘所选出来的那个个体.
CGenome TheChosenOne;
//累计适应性分数的和.
double FitnessSoFar = 0;
//遍历总人口里面的每一条染色体。
for (int i=0; i
{
//累计适应性分数.
FitnessSoFar += m_vecPop[i].dFitness;
//如果累计分数大于随机数,就选择此时的基因.
if (FitnessSoFar >= Slice)
{
TheChosenOne = m_vecPop[i];
break;
}
}
//返回转盘选出来的个体基因
return TheChosenOne;
}

遗传变异――基因重组（交叉）与基因突变。

应该说这两个步骤就是使到子代不同于父代的根本原因（注意，我没有说是子代优于父代的原因，只有经过自然的选择后，才会出现子代优于父代的倾向。）。对于这两种遗传操作，二进制编码和浮点型编码在处理上有很大的差异，其中二进制编码的遗传操作过程，比较类似于自然界里面的过程，下面将分开讲述。

1.基因重组/交叉(recombination/crossover)

（1）二进制编码

回顾上一章介绍的基因交叉过程：同源染色体联会的过程中，非姐妹染色单体（分别来自父母双方）之间常常发生交叉，并且相互交换一部分染色体。事实上，二进制编码的基因交换过程也非常类似这个过程――随机把其中几个位于同一位置的编码进行交换，产生新的个体。

（2）浮点数编码

如果一条基因中含有多个浮点数编码，那么也可以用跟上面类似的方法进行基因交叉，不同的是进行交叉的基本单位不是二进制码，而是浮点数。而如果对于单个浮点数的基因交叉，就有其它不同的重组方式了，比如中间重组：

这样只要随机产生_,就能得到介于父代基因编码值和母代基因编码值之间的值作为子代基因编码的值。

考虑到“袋鼠跳”问题的具体情况――袋鼠的个体特征仅仅表现为它所处的位置。可以想象，同一个位置的袋鼠的基因是完全相同的，而两条相同的基因进行交叉后，相当于什么都没有做，所以我们不打算在这个例子里面使用交叉这一个遗传操作步骤。（当然硬要这个操作步骤也不是不行的，你可以把两只异地的袋鼠捉到一起，让它们交配，然后产生子代，再把它们送到它们应该到的地方。）

题外话：

性的起源

生命进化中另一个主要的重大进展是伴随着两性的发育――两个生物个体间遗传物质的交换而来的。正是这种交换提供了自然选择可以发生作用的变异水平。

性可能起源于在某种同类相食中。一个生物吞噬了另一个生物。含有双倍遗传物质的吞噬后生物为了解救自己而一分为二。这时，一种单倍遗传物质与双倍遗传物质的单位持续相互交换替的模式就会产生。直至到达一个各项规则都适合于双倍系统的环境。在这个系统中，从双倍体到单倍体的分裂只发生在性细胞或配子形成中，然后来自不同母体的配子结合成一个新的个体而恢复正常的双倍体系统。由于两性的出现，使进化的步伐加快了。（择自《吉尼斯－百科全书》1999年版）

由于基因交叉和两性有莫大的关联，所以我们可以从这个角度去深入了解基因交叉。性别的出现是在生物已经进化得相对复杂的时候。那个时候生物的基因基本形成了一种功能分块的架构。而自然界的基因交叉过程又一般不是单个基因，或者随便几个基因的交叉，而是一块基因，往往是表现某种个体性状的那块基因，所以从宏观上看，基因交叉的表现是性状的分离（孟德尔在实验中总结出来的规律。）。而性状又往往表现相对独立的个体特征。比如豌豆的高茎和矮茎，圆滑和皱缩。（参照第一章对孟德尔实验的介绍。）这些都是相对独立的特征，它们之间可以自由组合互相搭配。这时候，交叉过程将起到从宏观上调整基因块之间搭配的作用。经过物竞天择的过程，最后就能得到相对较好的特征组合方式，从而产生更优的个体。我想这才是基因交叉的意义所在吧。所以对于很多问题，使用基因交叉操作的效果不太明显，往往只能充当跳出局部最优解，相当于大变异的功能。真正意义上的基因交叉应该使用在大规模参数的进化过程当中，它将承担起对基因块进行组合优化的职责，从更宏观的角度去优化个体。对于交叉操作以后还将进行更具体的探讨。

2.基因突变(Mutation)

（1）二进制编码

同样回顾一下上一章所介绍的基因突变过程：基因突变是染色体的某一个位点上基因的改变。基因突变使一个基因变成它的等位基因，并且通常会引起一定的表现型变化。恩，正如上面所说，二进制编码的遗传操作过程和生物学中的过程非常相类似，基因串上的 “ 0”或“ 1”有一定几率变成与之相反的“ 1”或“ 0”。例如下面这串二进制编码：

101101001011001

经过基因突变后，可能变成以下这串新的编码：

001101011011001

（2）浮点型编码

浮点型编码的基因突变过程一般是对原来的浮点数增加或者减少一个小随机数。比如原来的浮点数串如下：

1.2, 3.4, 5.1, 6.0, 4.5

变异后，可能得到如下的浮点数串：

1.3, 3.1, 4.9, 6.3, 4.4

当然，这个小随机数也有大小之分，我们一般管它叫“步长”。（想想“袋鼠跳”问题，袋鼠跳的长短就是这个步长。）一般来说步长越大，开始时进化的速度会比较快，但是后来比较难收敛到精确的点上。而小步长却能较精确的收敛到一个点上。所以很多时候为了加快遗传算法的进化速度，而又能保证后期能够比较精确地收敛到最优解上面，会采取动态改变步长的方法。其实这个过程与前面介绍的模拟退火过程比较相类似，读者可以做简单的回顾。

下面是针对浮点型编码的基因突变函数的写法：

//基因突变函数
void Mutate(vector &chromo)
{
//遵循预定的突变概率,对基因进行突变
for (int i=0; i
{
//如果发生突变的话
if (RandFloat() < m_dMutationRate)
{
//使该权值增加或者减少一个很小的随机数值
chromo[i] += (RandomClamped() * g_dMaxPerturbation);
//保证袋鼠不至于跳出自然保护区.
if(chromo[i] < g_LeftPoint)
{
chromo[i] = g_RightPoint;
}
else if(chromo[i] > g_RightPoint)
{
chromo[i] = g_LeftPoint;
}
//以上代码非基因变异的一般性代码只是用来保证基因编码的可行性。
}
}
}

值得一提的是遗传算法中基因突变的特点和上一章提到的生物学中的基因突变的特点非常相类似，这里回顾一下：

1.基因突变是随机发生的，且突变频率很低。（不过某些应用中需要高概率的变异）

2.大多数基因变异对生物本身是有害的。

3.基因突变是不定向的。

题外话：

染色体变异

基因突变是染色休的某一个位点上基因的改变，这种改变在光学显微镜下是无法直接观察到的。而染色休变异（chromosomal variations）是可以用显微镜直接观察到的，如染色体结构的改变、染色体数目的增减等。

1.染色体结构的变异

人类的许多遗传病是由染色体结构改变引起的。例如，猫叫综合征是人的第5号染色体部分缺失引起的遗传病，因为患病儿童哭声轻，音调高，很像猫叫而得名。猫叫综合症患者的生长发育迟缓，而且存在严重的智力障碍。

在自然条件或人为因素的影响下，染色体发生的结构变异主要有以下4种类型。（如图组2-5）

（1）染色体某一段缺失引起变异。

（2）染色体中增加某一片段引起变异。

（3）染色体某一片段移接到另一条非同源染色体上引起变异。

（4）染色体中某一片段位置颠倒也可引起变异。

上述染色体结构的改变，都会使排列在染色体上的基因的数目和排列顺序发生改变，从而导致性状的变异。大多数染色体结构变异对生物体是不利的，有的甚至导致生物体死亡。

2. 染色体数目的变异

一般来说，每一种生物的染染色体数目都是稳定的，但是，在某些特定的环境条件下生物体的染色体数目会发生改变，从而产生可遗传变异。染色体数目的变异可以分为两类：一类是细胞内的个别染色体增加或减少，另一类是细胞内的染色体数目以染色体组的形式成倍地增加或减少。（择自《高中生物课本》）

读者应该察觉到我们用在遗传算法上的基因突变也没有包括染色体的变异过程。因为一般来说这种大规模的变异对原来的个体的基因序列破坏性比较大。所以一般来说很难得到一个适应度高的个体。但是染色体变异，特别是染色体数目的突变使到生物从简单进化到复杂成为了可能，这也是非常具有意义的。


1.染色体某一段缺失引起变异。	2.染色体中增加某一片段引起变异。

3.染色体某一片段移接到另一条非同源染色体上引起变异。	4.染色体中某一片段位置颠倒也可引起变异。

好了，到此为止，基因编码，基因适应度评估，基因选择，基因变异都一一实现了，剩下来的就是把这些遗传过程的“零件”装配起来了。先让我们定义一个遗传算法的类：CGenAlg

遗传算法引擎――CGenAlg

class CGenAlg
{
public:
//这个容器将储存每一个个体的染色体
vector m_vecPop;
//人口(种群)数量
int m_iPopSize;
//每一条染色体的基因的总数目
int m_iChromoLength;
//所有个体对应的适应性评分的总和
double m_dTotalFitness;
//在所有个体当中最适应的个体的适应性评分
double m_dBestFitness;
//所有个体的适应性评分的平均值
double m_dAverageFitness;
//在所有个体当中最不适应的个体的适应性评分
double m_dWorstFitness;
//最适应的个体在m_vecPop容器里面的索引号
int m_iFittestGenome;
//基因突变的概率,一般介于0.05和0.3之间
double m_dMutationRate;
//基因交叉的概率一般设为0.7
double m_dCrossoverRate;
//代数的记数器
int m_cGeneration;
//构造函数
CGenAlg();
//初始化m_dTotalFitness, m_dBestFitness, m_dWorstFitness, m_dAverageFitness 等变量
void Reset();
//初始化函数
void init(int popsize, double MutRate, double CrossRate, int GenLenght);
//计算m_dTotalFitness, m_dBestFitness, m_dWorstFitness, m_dAverageFitness等变量
void CalculateBestWorstAvTot();
//轮盘赌选择函数
CGenome GetChromoRoulette();
//基因变异函数
void Mutate(vector &chromo);
//这函数产生新一代基因
void Epoch(vector &vecNewPop);
};

其中Reset()函数，init()函数和CalculateBestWorstAvTot()函数都比较简单，读者查看示例程序的代码就能明白了。而下面分别介绍init函数和Epoch函数。

类的初始化函数――init函数

init函数主要充当CGenAlg类的初始化工作，把一些成员变量都变成可供重新开始遗传算法的状态。（为什么我不在构造函数里面做这些工作呢？因为我的程序里面CGenAlg类是View类的成员变量，只会构造一次，所以需要另外的初始化函数。）下面是init函数的代码：

void CGenAlg::init(int popsize, double MutRate, double CrossRate, int GenLenght)
{
m_iPopSize = popsize;
m_dMutationRate = MutRate;
m_dCrossoverRate = CrossRate;
m_iChromoLength = GenLenght;
m_dTotalFitness = 0;
m_cGeneration = 0;
m_iFittestGenome = 0;
m_dBestFitness = 0;
m_dWorstFitness = 99999999;
m_dAverageFitness = 0;
//清空种群容器，以初始化
m_vecPop.clear();
for (int i=0; i
{
//类的构造函数已经把适应性评分初始化为0
m_vecPop.push_back(CGenome());
//把所有的基因编码初始化为函数区间内的随机数。
for (int j=0; j
{
m_vecPop[i].vecWeights.push_back(RandFloat() *
(g_RightPoint - g_LeftPoint) + g_LeftPoint);
}
}
}

恩，正如我之前说的，我们这个程序不但要应付基因编码只有一个浮点数的“袋鼠跳”问题的情况，还希望以后在处理一串浮点数编码的时候也一样适用，所以从这里开始我们就把基因当成串来对待。

开创新的纪元――Epoch函数

现在万事具备了，只差把所有现成的“零件”装配起来而已。而Epoch函数就正好充当这个职能。下面是这个函数的实现：

//此函数产生新的一代,见证着整个进化的全过程.
//以父代种群的基因组容器作为参数传进去,该函数将往该容器里放入新一代的基因组(当然是经过了优胜劣汰的)
void Epoch(vector &vecNewPop)
{
//用类的成员变量来储存父代的基因组(在此之前m_vecPop储存的是不带估值的所有基因组)
m_vecPop = vecNewPop;
//初始化相关变量
Reset();
//为相关变量赋值
CalculateBestWorstAvTot();
//清空装载新种群的容器
vecNewPop.clear();
//产生新一代的所有基因组
while (vecNewPop.size() < m_iPopSize)
{
//转盘随机抽出两个基因
CGenome mum = GetChromoRoulette();
CGenome dad = GetChromoRoulette();
//创建两个子代基因组
vector baby1, baby2;
//先把他们分别设置成父方和母方的基因
baby1 = mum.vecWeights;
baby2 = dad.vecWeights;
//使子代基因发生基因突变
Mutate(baby1);
Mutate(baby2);
//把两个子代基因组放到新的基因组容器里面
vecNewPop.push_back( CGenome(baby1, 0) );
vecNewPop.push_back( CGenome(baby2, 0) );
}//子代产生完毕
//如果你设置的人口总数非单数的话,就会出现报错
if(vecNewPop.size() != m_iPopSize)
{
AfxMessageBox("你的人口数目不是单数!!!");
return;
}
}

呵呵，现在我们可以为袋鼠传宗接代了。（细心的读者会发现，上面每次处理两个基因个体其实是没必要的，恩，那也是为了以后能够使用交叉函数而准备的，因为交叉函数需要两个相异的个体参与。）接下来，我们要把命令袋鼠跳正式开始的函数（大家注意，这个函数非CGenAlg类的成员函数，而是CSearchMaxView类的成员函数，因为这个命令并非CGenAlg类自发的，而是由你“通知”CSearchMaxView类，然后再由CSearchMaxView类通知CGenAlg类的。）也一并实现：

上帝的一声令下――OnStartGenAlg函数

下面将列出OnStartGenAlg函数的主要代码（为了不要太占版面，只列出那些关键性的代码及其解释。），读者要注意里面的适应度评价是怎么实现的。

void CSearchMaxView::OnStartGenAlg()
{
//产生随机数
srand( (unsigned)time( NULL ) );
//初始化遗传算法引擎
GenAlg.init(g_popsize, g_dMutationRate, g_dCrossoverRate, g_numGen);
//清空种群容器
m_population.clear();
//种群容器装进经过随机初始化的种群
m_population = GenAlg.m_vecPop;
//定义两个容器，以装进函数的输入与及输出（我们这个函数是单输入单输出的，但是以后往往不会那么简单，所以我们这里先做好这样的准备。）
vector input, output;
input.push_back(0);
for(int Generation = 0;Generation <= g_Generation;Generation++)
{
//里面是对每一条染色体进行操作
for(int i=0;i
{
input = m_population[i].vecWeights;
//为每一个个体做适应性评价，如之前说的，评价分数就是函数值。其
//Function函数的作用是输入自变量返回函数值，读者可以参考其代码。
output = Curve.Function(input);
m_population[i].dFitness = output[0];
}
//由父代种群进化出子代种群（长江后浪退前浪。）
GenAlg.Epoch(m_population);
}
}

恩，到这里“袋鼠跳”的主要代码就完成了。(其它一些代码，比如图形曲线的显示，和MFC的相关代码在这就不作介绍了，建议初学者不必理会那些代码，只要读懂算法引擎部分就可以了。)下面就只等着我们下达命令了！

让袋鼠在你的电脑里进化――程序的运行

我想没有什么别的方法比自己亲手写一个程序然后通过修改相关参数不断调试程序，更能理解并且掌握一种算法了。不知道你还记不记得你初学程序的日子，我想你上机动手写程序比坐在那里看一本厚厚的程序开发指南效率不知高上多少倍，兴趣也特命浓厚，激情也特别高涨。恩，你就是需要那样的感觉，学遗传算法也是一样的。你需要把自己的代码运行起来，然后看看程序是否按照你所想象的去运行，如果没有，你就要思考原因，按照你的想法去改善代码，试着去弄清其中的内在联系。这是一个思维激活的过程，你大脑中的神经网络正在剧烈抖动（呵呵，或许学到后面你就知道你大脑的神经网络是如何“抖动”的。），试图去接受这新鲜而有趣的知识。遗传算法（包括以后要学到的人工神经网络）包含大量的可控参数，比如进化代数、人口数目、选择概率、交叉概率、变异概率、变异的步长还有以后学到的很多。这些参数之间的搭配关系，不能指望别人用“灌输”的方式让你被动接受，这需要你自己在不断的尝试，不断的调整中去形成一种“感觉”的。很多时候一个参数的量变在整个算法中会表现出质的变化。而算法的效果又能从宏观上反映参数的设置。

现在就让我们来对这个程序做简单的说明。

参数的设置：

这个程序有很多的需要预先设置好的参数，为了方便修改，我把它们都定义为全局变量，定义和初始化都放在Parameter.h的头文件里面。下面对几个主要参数的说明：

//目标函数的左右区间，目前的设置是[-1,2]
double g_LeftPoint = -1;
double g_RightPoint = 2;
遗传算法相关参数
int g_numGen = 1; //每条染色体的编码个数，这里是1个
int g_Generation = 1000; //进化的代数
int g_popsize = 50; //种群的人口数目（就是说你要放多少只袋鼠到山上）
double g_dMutationRate = 0.8; //基因变异的概率
double g_dMaxPerturbation = 0.005; //基因变异的步长（袋鼠跳的最大距离）

当然，一些主要的参数在程序运行后可以通过参数设置选项进行设置。（其中缓冲时间是每进化一代之后，暂停的时间，单位为毫秒）。

运行程序：

程序运行后请选择菜单项：控制－>让袋鼠们开始跳吧，开始遗传算法的过程。其中蓝色的线条是函数曲线（恩，那就是喜玛拉雅山脉。其中最高的波峰，就是珠穆朗玛峰。）绿色的点是一只只袋鼠。上方的黑色曲线图表是对每一代最优的个体的适应性评分的统计图表。下方的黑色曲线图表是对每一代所有个体的平均适应性评分的统计图表。（如果你认为它们阻碍了你的视线，你可以在参数设置里面取消掉。）如图2-7所示。另外还可以用键盘的上下左右键来控制视窗的移动，加减键控制函数曲线的放缩。

刚开始的时候，袋鼠分布得比较分散它们遍布了各个山岭，有的在高峰上，有的在深谷里。

经过了几代的进化后，一些海拔高度比较低的都被我们射杀了，而海拔较高的袋鼠却不断的生儿育女。

最后整个袋鼠种群就只出现在最高峰上面（最优解上）

当然，袋鼠不是每一次都能跳到珠穆朗玛峰的。（就是说不是每次都能收敛到最优解）也许它们跳到了某一个山峰，就自大的认为它们已经“会当凌绝顶”了。（当然，事实上是因为不管它们向前还是向后跳都只能得到更小的适应度，所以不等它们跳过山谷，再跳到旁边更高的山峰，就被我们射杀了。）所以，我们为了使到袋鼠每次都尽可能的攀到珠穆朗玛峰，而不是留恋在某一个低一些的山峰，我们有两个改进的办法，其一是初始人口数目更多一些，以使最好有一些袋鼠一开始就降落到最高峰的附近，但是这种方法对于搜索空间非常大的问题往往是无能为力的。我们常常采用的方法是使袋鼠有一定的概率跳一个很大的步长，以使袋鼠有可能跳过一个山谷到更高的山峰去。这些改进的方法留给读者自己去实现。

另外，如果把变异的机率调得比较高，那么就会出现袋鼠跳得比较活跃的局面，但是很可能丢失了最优解；而如果变异的机率比较低的话，袋鼠跳得不太活跃，找到最优解的速度就会慢一些，这也留给读者自己去体验。

作为一个寻找大值的程序，这个的效率还很低。我希望留给初学者更多改进的空间，大家不必受限于现有的方法，大可以发挥丰富的想象力，自己想办法去提高程序的效率，然后自己去实现它，让事实去验证你的想法是否真的能提高效率，抑或刚好相反。恩，在这个过程当中，大家不知不觉地走进了遗传算法的圣殿了，胜于一切繁复公式的摆设和教条式的讲解。

总结与及扩充

经过本章的学习，我想读者应该能基本上把握遗传算法的基本步骤与及隐约的看到了她的本质。当然同时还会带着许多许多的疑问和不解。好的，不必急躁，让我们在以后的章节中慢慢领会。下面我们回顾一下前面所学过的内容，同时也做一些扩充。（为了适应学习新知识的客观规律，我对知识点的介绍所遵循的原则是：先对理论作简单的介绍，目的是让读者对新鲜理论有一个感性的认识。然后用实际的例子实现理论并且在实践中加深对理论的理解。最后对理论作更为深入系统的总结与及扩充。）

对编码方式的回顾与扩充

1．二进制编码

二进制编码的编码符号集由0和1组成，因此染色体是一个二进制符号串，其优点在于编码、解码操作简单，交叉、变异等遗传操作便于实现，对于全局搜索能力有一定的优势;其缺点在于，不便于反映所求间题的特定知识，对于一些连续函数的优化问题等，也由于遗传算法的随机特性而使得其局部搜索能力较差，对于一些多维、高精度要求的连续函数优化，二进制编码存在着连续函数离散化时的映射误差，个体编码串较短时，可能达不到精度要求;而个体编码串的长度较长时，虽然能提高精度，但却会使算法的搜索空间急剧扩大。如果个体编码串特别长时，会造成遗传算法的性能降低。

2．浮点数编码

浮点数编码方式，以浮点数为编码的单位。就二进制编码和浮点数编码比较而言，浮点数编码一些情况下比较能反映所求问题的特定知识，编码结构一般比二进制来得简单些。一般二进制编码比浮点数编码搜索能力强，但浮点数编码比二进制编码在变异操作上能够保持更好的种群多样性。

3．其它编码方式

其实编码的方式是多种多样的，有时候还会用到混合编码，而且编码形式对具体问题的依赖性比较强。设计编码的时候不必拘泥于现有的几种编码方式，解决具体问题的时候，很多情况下需要为具体问题“度身定做”。有时候一种合适的编码方式，配合合适的交换算子，变异算子（交换算子和变异算子常常需要适合特定的编码方式。），这些都会影响到解决问题的效率，在以后的深入学习过程中大家将会有深刻体会。（下一章的例子将用到混合编码。）

接下来总结出遗传算法选取编码过程的几个原则：

1.完全性，原则上问题的所有可能的解都能找到与之对应的编码组合。

2.合法性，每个基因编码都对应一个可接受的个体。

3.多重性，多个基因型解码成一个表现型，即从基因型到相应的表现型空间是多对一的关系，这是基因的多重性。若相同的基因型被解码成不同的表现型，这是表现型多重性。当然，基因型到表现型的映射关系最好是一对一的关系。

4.紧致性,若两种基因编码能解码成相同的个体，那么占用空间越小的编码方式就越紧致。

5.复杂性，指基因型结构的复杂性，解码的复杂性，计算时空的复杂性。

这些特征常常是鱼与熊掌，不可兼得的。（整理《遗传算法――理论、应用与软件实现》相关资料而来）

对适应性函数的回顾与扩充

适应性函数有一个更形象的名字――压力函数。为什么这样说呢？如果你对遗传算法没有一定程度上的理解的话很难把握它的意思，但是经过上面那个例子――对“袋鼠逃”问题解决，读者会发现经过一段时间的进化过程，袋鼠都被无形的力“压”到了山顶。这其实是适应性函数的力量，如果你喜欢的话，你可以通过对适应性函数的作简单修改，就能把袋鼠“压”到谷底。（建议初学者自己尝试尝试如何修改，虽然简单，但是你不一定那么容易成功的。）由此可见适应性函数是一个影响进化趋势的函数，有非常重要的地位。

尺度变换(fitness scaling)

并不是每个问题的适应性函数都像“袋鼠跳”问题的那么简单明了。我们常常需要对目标函数值作一些变换。这种对目标函数值域的映射变换就称为适应度的尺度变换(fitness scaling)。下面是几种常见的尺度变换。

下面介绍一下适应度函数应该遵循的几个原则。

(1)适应性评分应该是非负的：这主要是因为轮盘赌函数只能处理非负的适应度评分，否则会打乱个体的选择概率的。（回想前面我要大家尝试一下把袋鼠“压”到山谷下，我想很多初学者都会想到把适应性评分，但是这样做的话会出现问题的，为什么呢？主要是因为轮盘赌函数的问题，它需要正数才能正常执行，所以就需要上面提到的尺度变换的第一类办法，就是保证适应度评价是正数。）

(2)合理、一致性：要求适应度值反映对应解的优劣程度。

(3)计算量小：适应度函数设计应尽可能简单，这样可以减少计算时间和空间上的复杂性，降低计算成本。

欺骗

在使用遗传算法解决实际问题的时候我们常常遇到一些简单的问题，但是遗传算法却又难以收敛到最优解上面。是什么原因导致一个简单的问题对遗传算法来说是难以求解的呢？我们称那些引导遗传算法出错的函数编码组合为遗传算法的欺骗问题。一般来说，欺骗的出现可能是下面的原因：

（1）在遗传进化的初期，产生一些适应性评分特别高的个体，若按照比例选择法，这些个体因竞争力太突出而控制了选择过程，影响算法的全局优化性能。（在袋鼠跳问题里面，大家也许看见过这样的情景：当种群初始化的时候，有些袋鼠非常幸运的降落到一个比较高的山峰，但是那不是珠穆朗玛峰，由于其它的适应度较高，生的儿女特别多，为了保持人口总数的平衡，那些爬在珠穆朗玛峰半山腰的就不幸被杀了。）

（2）在遗传进化的后期，即算法接近收敛时，由于种群中个体适应度差异较小时，继续优化的潜能降低，可能获得某个局部最优解。

后记

如果读者还能硬着头皮看到这里的话，那么恭喜你了，你已经走进遗传算法的殿堂。当然你现在还未能把每个房间都仔细观摩，更没来得及去端详那些油光亮瓦。事实上，你也许还在纳闷，遗传算法能做什么，遗传算法的魔力何在？呵呵，不必着急，只管带着这些问题继续往下读，要记住一句话：把宝贝用到适当的地方去，就会发挥其巨大作用。

经过这章的学习，大家将基本把握遗传算法的一般步骤，而且能够利用遗传算法解决简单的实际问题。但是那距离高效而有实际应用价值的遗传算法还有一段距离，但是你的确已经跨过了那道最深的鸿沟，接下来的路子将更加平坦而舒适，更加有趣而更具实际意义。好的，让我们带着满脑的疑问，与及美好的憧憬进入下一次的学习――星际旅行中的人工智能(1)，让我们看看科幻影片里面的人工智能是如何代替人类操纵宇宙飞船飞出险境的！

转载于:https://www.cnblogs.com/xiaomei0323/p/4476984.html

你可能感兴趣的:(遗传算法，vector)

回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
c++ opencv4.3 sift匹配图像处理大大大大大牛啊图像处理 opencv实战代码讲解 opencv sift c++opencv4 特征点
c++opencv4.3sift匹配main.cppintmain(){vectorkeypoints1,keypoints2;Matimg1,img2,descriptors1,descriptors2;intnumF
leetcode 11. 盛最多水的容器 Source_Chang
leetcode核心思想：双指针，数字小的那个指针移动classSolution{public:intmaxArea(vector&height){intleft=0;intright=height.size()-1;intmaxArea=0;while(left
滑动窗口+动态规划 wniuniu_ 算法动态规划算法
前言：分析这个题目的时候，就知道要这两个线段要分开，但是要保证得到最优解，那么我们在选取第二根线段的时候，要保证我们第一根线段是左边最优解并且我们选的两根线段的右端点一定是我们的数组的点（贪心思想）classSolution{public:intmaximizeWin(vector&prizePositions,intk){intn=prizePositions.size();vectormx(n
svg图片兼容性和用法优缺点独行侠_ef93
svg图片的使用方法第一次来认认真真的研究了下svg图片，之前只是在网上见过，但都是一晃而过也没当回事，最近网站改版看到同事有用到svg格式的图片，想想自己干了几年的重构也没用过，这些细节的知识是应该好好研究研究了。暂时还没研究得完全透切，先记下目前为止所看到的吧不然又给忘了。svg可缩放矢量图形（ScalableVectorGraphics），顾名思义就是任意改变其大小也不会变形，是基于可扩展标
Vector和Stack的用法蟹道人 JavaSe java
/***作者：*日期：*功能：vector的用法*/packagecom.cg;importjava.util.*;publicclassDemo5{publicstaticvoidmain(String[]args){//Vector的使用Vectorvec=newVector();Empemp=newEmp("2011",25,"zhang");vec.add(emp);for(inti=0;
Vector与Stack简述 Sun_Jingjing Java 集合
Vector：线程安全，默认容量为10，容量增长量默认为0，每次进行扩容是旧的容量乘以2。支持null的添加。基于数组实现。Stack：Stack继承Vector的栈结构。
FRotation FVector 相互转换我真的不知道该起什么名字了
FVectortoFRotatorFRotatorFVector::Rotation()const{returnToOrientationRotator();}FRotatortoFVectorCORE_APIFVectorFRotator::Vector()const{floatCP,SP,CY,SY;FMath::SinCos(&SP,&CP,FMath::DegreesToRadians(P
C++ | Leetcode C++题解之第398题随机数索引 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{vector&nums;public:Solution(vector&nums):nums(nums){}intpick(inttarget){intans;for(inti=0,cnt=0;i
AtCoder Beginner Contest 363 菜比乌斯反演 AtCoder 算法 c++开发语言
A-PilingUp题意不同的分数段有不同的^数量，Takahashi想要使得他的^数量增加，问他所需要的最少分数增幅。思路我们只需要找到下一阶段的下限。a/100是本阶段+1变成下一阶段，再*100变成下限，再与原来的相减即可。代码inlinevoidsolve(){inta;cin>>a;cout>n>>t>>p;vectora(n+1);for(inti=1;i>a[i];nth_eleme
面试经典 150 题 2 —（二分查找）— 74. 搜索二维矩阵 BreezeChasingDrizzle leetcode 矩阵算法 leetcode c++二分查找
74.搜索二维矩阵方法classSolution{public:boolsearchMatrix(vector>&matrix,inttarget){intmatrixRows=matrix.size(),matrixCols=matrix[0].size();//先找target所在的行inttargetAtRow=-1;for(inti=0;i>&matrix,inttarget){intma
【无线通信】误差矢量幅度（EVM）守月满空山雪照窗无线通信无线通信
误差矢量幅度(ErrorVectorMagnitude,EVM)是一种用来评估数字通信系统中调制质量的重要指标。EVM衡量的是理想信号与实际接收信号之间的差异，通常用来评估调制质量、信号完整性和接收机性能。EVM的定义在一个数字通信系统中，理想情况下接收到的信号应该精确地落在特定的理想星座点上（比如QAM或PSK星座图）。然而，由于各种现实因素，如噪声、失真、非线性效应和相位误差，接收到的信号可能
java 基础 i0208 java 开发语言
基础数据类型，方法，类，异常处理：Java零基础入门学习（小白也能看懂！）_java零基础自学-CSDN博客List在Java中，List接口是集合框架中非常重要的一个接口，它提供了存储和操作有序集合的方法。List是一个接口，因此不能直接实例化，但可以通过其实现类（如ArrayList,LinkedList,Vector等）来使用。List接口的主要实现类ArrayList:动态数组实现，适用于
C++vector类 Ssorrymaker C++c++
系列文章目录C++入门C++类和对象（上）C++类和对象（中）C++类和对象（下）C/C++内存管理C++string类文章目录系列文章目录一、vector是什么？二、常用接口说明1.常见的构造函数2.vectoriterator的使用3.关于vector的容量4.vector的增删改查5.迭代器失效一、vector是什么？vector是表示可变大小数组的序列容器，类似于数组，vector也采用连
【C++】手把手教你写出自己的vector类 Ornamrr C++c++vector
在上一篇博客中，我们学习了vector的基本使用，以及迭代器的失效问题：【C++】深入理解vector类(一)今天我们来模拟实现以下vector类。目录成员变量接口实现构造函数迭代器拷贝构造赋值reserveresizepush_backpop_back实现[]访问成员变量我们先从原码中找出其成员变量：可以看到，原码中有三个成员变量：startfinishend_of_storage数据类型是it
CVE-2020-24186 WordPress评论插件wpDiscuz任意文件上传漏洞 sukusec
0x00漏洞介绍Wordfence的威胁情报团队在一款名叫wpDiscuz的Wordpress评论插件（wpDiscuz是WordPress功能丰富的评论系统插件，可充实网站评论部分）中发现了一个高危漏洞，此漏洞将允许未经认证的攻击者在目标站点中上传任意文件，从而实现远程代码执行。0x01漏洞环境WordPress的gVectorswpDiscuz插件7.0至7.0.4版本中存在远程代码执行漏洞，
7-7 六度空间 polebugzhuzhu 算法数据结构
输入样例:1091223344556677889910输出样例:1:70.00%2:80.00%3:90.00%4:100.00%5:100.00%6:100.00%7:100.00%8:90.00%9:80.00%10:70.00%分析：对每个点bfs前六层，为了使得d数组除了能表示距离，还能表示是否visted，所以d从1开始。用vectore[N];邻接表，对一个点的bfs=O(m),总时间
图论篇--代码随想录算法训练营第五十八天打卡|拓扑排序，dijkstra（朴素版）热爱编程的OP leetcode 算法图论数据结构 c++
拓扑排序题目链接：117.软件构建题目描述：某个大型软件项目的构建系统拥有N个文件，文件编号从0到N-1，在这些文件中，某些文件依赖于其他文件的内容，这意味着如果文件A依赖于文件B，则必须在处理文件A之前处理文件B（0#include#include#includeusingnamespacestd;intmain(){intm,n,s,t;cin>>n>>m;vectorinDegree(n,0
C++ 中 vector 的常用功能介绍 a.原味瓜子 C++c++算法开发语言
在C++中，vector是一种常用的动态数组容器，提供了方便的自动扩展、内存管理以及各种便捷的操作方法。它是C++标准模板库（STL）的一部分，适用于需要动态存储和管理大量元素的场景。在本文中，我们将简要介绍vector的常用功能，展示如何对其进行操作和排序。为了简洁起见，假设我们已经使用了usingnamespacestd;。1.创建与初始化要创建一个vector，可以直接通过以下几种方式初始化
遗传算法（Genetic Algorithm,GA）-基于MATLAB环境实现朱佩棋（代码版）启发式算法启发式算法算法 matlab
1.GA简介geneticalgorithm，美国Holland教授创立，基于达尔文进化论和孟德尔的遗传学说。遗传算法类比了生物界中自然选择、交叉、变异等自然进化方式，利用数码串类比染色体，通过选择、交叉、变异等遗传算子模拟生物的进化过程。1.1遗传算法的流程1.编码伪代码：2.产生初始群体Chooseinitialpopulation3.计算适应度Evaluatethefitnessofeach
c++——vector so_what_is c++c++
1、一维数组2、二维数组定义：vector>vec(N1,vector(N2,value));N1：数组行；N2：数组列；value：数组值（默认为0）；
Java集合-----List接口及其实现类：ArrayList、LinkedList、Vector Colourful． Java集合 java 集合
文章目录List接口概述List接口的常用方法List接口的实现类ArrayList源码分析类继承关系ArrayList中的属性：ArrayList构造函数：ArrayList中常用方法添加操作：add()删除操作：remove()获取元素：get()ArrayList是如何实现序列化的？ArrayList的总结LinkedList源码分析类继承关系类成员属性类构造器LinkedList的List
15. 3Sum jecyhw
题目链接https://leetcode.com/problems/3sum/解题思路题目要使得a+b+c=0，且不重复，那就可以按照a>threeSum(vector&nums){vector>ans;intlen=nums.size()-1;if(len0){break;}if(i>0&&nums[i]==nums[i-1]){//a和前一个数相等，也不再找continue;}//最右边的两个
如何通过Python SDK描述Collection DashVector python java 服务器数据库数据库架构人工智能
本文介绍如何通过PythonSDK获取已创建的Collection的状态和Schema信息。前提条件已创建Cluster：创建Cluster。已获得API-KEY：API-KEY管理。已安装最新版SDK：安装DashVectorSDK。接口定义Python示例：Client.describe(name:str)->DashVectorResponse使用示例说明需要使用您的api-key替换示例中
分区Partition DashVector embedding 数据库 python 人工智能数据挖掘
理解Partition向量检索服务DashVector的Collection具有分区（Partition）的能力，同一个Collection下的Doc可通过不同的Partition进行物理和逻辑上的分区。各种Doc操作（如插入Doc、检索Doc等）若指定Partition，则该操作将限定在该指定的Paritition内进行。通过合理的Partition设置，可有效提升Doc操作的效率。同一个Col
如何通过Python SDK新建一个DashVector Client DashVector python java 数据库 embedding 大数据人工智能
本文介绍如何通过PythonSDK新建一个DashVectorClient。说明通过DashVectorClient可连接DashVector服务端，进行Collection相关操作。前提条件已创建Cluster：创建Cluster。已获得API-KEY：API-KEY管理。已安装最新版SDK：安装DashVectorSDK。接口定义Python示例：dashvector.Client(api_k
从Milvus迁移DashVector DashVector milvus 数据库阿里云人工智能数据结构向量检索
本文档演示如何从Milvus将Collection数据全量导出，并适配迁移至DashVector。方案的主要流程包括：首先，升级Milvus版本，目前Milvus只有在最新版本(v.2.3.x)中支持全量导出其次，将MilvusCollection的Schema信息和数据信息导出到具体的文件中最后，以导出的文件作为输入来构建DashVectorCollection并数据导入下面，将详细阐述迁移方案
【408DS算法题】041进阶-并查集基本操作 Owlet_woodBird 算法数据结构
Index题目分析实现总结题目编写函数，实现并查集的基本操作（查找、合并）。分析实现并查集中包含数据结构parent数组，存储每个结点的父结点。对于查找操作，可以通过递归找到当前结点的根结点，然后进行路径压缩——令当前结点的父结点为根节点，最后返回根节点。对于合并操作，只需要将两节点的根结点进行合并即可。具体实现如下：classUnionFind{private:vectorparent;publ
1049. 最后一块石头的重量 II 杰克尼 LeetCode leetcode 算法动态规划
目录一：题目：二：代码：三：结果：一：题目：有一堆石头，用整数数组stones表示。其中stones[i]表示第i块石头的重量。每一回合，从中选出任意两块石头，然后将它们一起粉碎。假设石头的重量分别为x和y，且x&stones){vectordp(150001,0);intsum=0;for(inti=0;i=stones[i];j--){dp[j]=max(dp[j],dp[j-stones[i
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring