M2MGroup

小袋鼠你往哪儿跳——遗传算法基础及其本质

小袋鼠你往哪儿跳－－遗传算法

基础及其本质

有很多袋鼠，它们降落到喜玛拉雅山脉的任意地方。这些袋鼠并不知道它们的任务是寻找珠穆朗玛峰。但每过几年，就在一些海拔高度较低的地方射杀一些袋鼠，并希望存活下来的袋鼠是多产的，在它们所处的地方生儿育女。

想了很久，应该用一个怎么样的例子带领大家走进遗传算法的神奇世界呢？遗传算法的有趣应用很多，诸如寻路问题，8数码问题，囚犯困境，动作控制，找圆心问题（这是一个国外网友的建议：在一个不规则的多边形中，寻找一个包含在该多边形内的最大圆圈的圆心。），TSP问题（在以后的章节里面将做详细介绍。），生产调度问题，人工生命模拟等。直到最后看到一个非常有趣的比喻，觉得由此引出的袋鼠跳问题（暂且这么叫它吧），既有趣直观又直达遗传算法的本质，确实非常适合作为初学者入门的例子。这一章将告诉读者，我们怎么让袋鼠跳到珠穆朗玛峰上去(如果它没有过早被冻坏的话)。

问题的提出与解决方案

让我们先来考虑考虑下面这个问题的解决办法。

已知一元函数：

图2-1

现在要求在既定的区间内找出函数的最大值。函数图像如图2-1所示。

极大值、最大值、局部最优解、全局最优解

在解决上面提出的问题之前我们有必要先澄清几个以后将常常会碰到的概念：极大值、最大值、局部最优解、全局最优解。学过高中数学的人都知道极大值在一个小邻域里面左边的函数值递增，右边的函数值递减，在图2.1里面的表现就是一个“山峰”。当然，在图上有很多个“山峰”，所以这个函数有很多个极大值。而对于一个函数来说，最大值就是在所有极大值当中，最大的那个。所以极大值具有局部性，而最大值则具有全局性。

因为遗传算法中每一条染色体，对应着遗传算法的一个解决方案，一般我们用适应性函数（fitness function）来衡量这个解决方案的优劣。所以从一个基因组到其解的适应度形成一个映射。所以也可以把遗传算法的过程看作是一个在多元函数里面求最优解的过程。在这个多维曲面里面也有数不清的“山峰”，而这些最优解所对应的就是局部最优解。而其中也会有一个“山峰”的海拔最高的，那么这个就是全局最优解。而遗传算法的任务就是尽量爬到最高峰，而不是陷落在一些小山峰。（另外，值得注意的是遗传算法不一定要找“最高的山峰”，如果问题的适应度评价越小越好的话，那么全局最优解就是函数的最小值，对应的，遗传算法所要找的就是“最深的谷底”）如果至今你还不太理解的话，那么你先往下看。本章的示例程序将会非常形象的表现出这个情景。

“袋鼠跳”问题

既然我们把函数曲线理解成一个一个山峰和山谷组成的山脉。那么我们可以设想所得到的每一个解就是一只袋鼠，我们希望它们不断的向着更高处跳去，直到跳到最高的山峰（尽管袋鼠本身不见得愿意那么做）。所以求最大值的过程就转化成一个“袋鼠跳”的过程。下面介绍介绍“袋鼠跳”的几种方式。

爬山法、模拟退火和遗传算法

解决寻找最大值问题的几种常见的算法：

1. 爬山法（最速上升爬山法）：

从搜索空间中随机产生邻近的点，从中选择对应解最优的个体，替换原来的个体，不断重复上述过程。因为只对“邻近”的点作比较，所以目光比较“短浅”，常常只能收敛到离开初始位置比较近的局部最优解上面。对于存在很多局部最优点的问题，通过一个简单的迭代找出全局最优解的机会非常渺茫。（在爬山法中，袋鼠最有希望到达最靠近它出发点的山顶，但不能保证该山顶是珠穆朗玛峰，或者是一个非常高的山峰。因为一路上它只顾上坡，没有下坡。）

2. 模拟退火：

这个方法来自金属热加工过程的启发。在金属热加工过程中，当金属的温度超过它的熔点（Melting Point）时，原子就会激烈地随机运动。与所有的其它的物理系统相类似，原子的这种运动趋向于寻找其能量的极小状态。在这个能量的变迁过程中，开始时。温度非常高，使得原子具有很高的能量。随着温度不断降低，金属逐渐冷却，金属中的原子的能量就越来越小，最后达到所有可能的最低点。利用模拟退火的时候，让算法从较大的跳跃开始，使到它有足够的“能量”逃离可能“路过”的局部最优解而不至于限制在其中，当它停在全局最优解附近的时候，逐渐的减小跳跃量，以便使其“落脚 ”到全局最优解上。（在模拟退火中，袋鼠喝醉了，而且随机地大跳跃了很长时间。运气好的话，它从一个山峰跳过山谷，到了另外一个更高的山峰上。但最后，它渐渐清醒了并朝着它所在的峰顶跳去。）

3. 遗传算法：

模拟物竞天择的生物进化过程，通过维护一个潜在解的群体执行了多方向的搜索，并支持这些方向上的信息构成和交换。以面为单位的搜索，比以点为单位的搜索，更能发现全局最优解。（在遗传算法中，有很多袋鼠，它们降落到喜玛拉雅山脉的任意地方。这些袋鼠并不知道它们的任务是寻找珠穆朗玛峰。但每过几年，就在一些海拔高度较低的地方射杀一些袋鼠，并希望存活下来的袋鼠是多产的，在它们所处的地方生儿育女。）（后来，一个叫天行健的网游给我想了一个更恰切的故事：从前，有一大群袋鼠，它们被莫名其妙的零散地遗弃于喜马拉雅山脉。于是只好在那里艰苦的生活。海拔低的地方弥漫着一种无色无味的毒气，海拔越高毒气越稀薄。可是可怜的袋鼠们对此全然不觉，还是习惯于活蹦乱跳。于是，不断有袋鼠死于海拔较低的地方，而越是在海拔高的袋鼠越是能活得更久，也越有机会生儿育女。就这样经过许多年，这些袋鼠们竟然都不自觉地聚拢到了一个个的山峰上，可是在所有的袋鼠中，只有聚拢到珠穆朗玛峰的袋鼠被带回了美丽的澳洲。）

下面主要介绍介绍遗传算法实现的过程。

遗传算法的实现过程

遗传算法的实现过程实际上就像自然界的进化过程那样。首先寻找一种对问题潜在解进行“数字化”编码的方案。（建立表现型和基因型的映射关系。）然后用随机数初始化一个种群（那么第一批袋鼠就被随意地分散在山脉上。），种群里面的个体就是这些数字化的编码。接下来，通过适当的解码过程之后，（得到袋鼠的位置坐标。）用适应性函数对每一个基因个体作一次适应度评估。（袋鼠爬得越高，越是受我们的喜爱，所以适应度相应越高。）用选择函数按照某种规定择优选择。（我们要每隔一段时间，在山上射杀一些所在海拔较低的袋鼠，以保证袋鼠总体数目持平。）让个体基因交叉变异。（让袋鼠随机地跳一跳）然后产生子代。（希望存活下来的袋鼠是多产的，并在那里生儿育女。）遗传算法并不保证你能获得问题的最优解，但是使用遗传算法的最大优点在于你不必去了解和操心如何去“找”最优解。（你不必去指导袋鼠向那边跳，跳多远。）而只要简单的“否定”一些表现不好的个体就行了。（把那些总是爱走下坡路的袋鼠射杀。）以后你会慢慢理解这句话，这是遗传算法的精粹！

题外话：

这里想提一提一个非主流的进化论观点：拉马克主义的进化论。

法国学者拉马克（Jean-Baptiste de Lamarck,1744～1891）的进化论观点表述在他的《动物学哲学》（1809）一书中。该书提出生物自身存在一种是结构更加复杂化的“内驱力 ”，这种内驱力是与生俱来的，在动物中表现为“动物体新器官的产生来自它不断感觉到的新需要。”不过具体的生物能否变化，向什么方向变化，则要受环境的影响。拉马克称其环境机制为“获得性遗传”，这一机制分为两个阶段：一是动物器官的用与不用（即“用进废退”：在环境的作用下，某一器官越用越发达，不使用就会退化，甚至消失。）；二是在环境作用下，动物用与不用导致的后天变异通过繁殖传给后代（即“获得性遗传”）。

德国动物学家魏斯曼（August Weismann,1834～1914）对获得性遗传提出坚决的质疑。他用老鼠做了一个著名的“去尾实验”，他切去老鼠的尾巴，并使之适应了短尾的生活。用这样的老鼠进行繁殖，下一代老鼠再切去尾巴，一连切了22代老鼠的尾巴，第23代老鼠仍然长出正常的尾巴。由此魏斯曼认为后天后天获得性不能遗传。（择自《怀疑----科学探索的起点》）

我举出这个例子，一方面希望初学者能够更加了解正统的进化论思想，能够分辨进化论与伪进化论的区别。另一方面想让读者知道的是，遗传算法虽然是一种仿生的算法，但我们不需要局限于仿生本身。大自然是非常智慧的，但不代表某些细节上人不能比她更智慧。另外，具体地说，大自然要解决的问题，毕竟不是我们要解决的问题，所以解决方法上的偏差是非常正常和在所难免的。（下一章，读者就会看到一些非仿生而有效的算法改进。）譬如上面这个“获得性遗传”我们先不管它在自然界存不存在，但是对于遗传算法的本身，有非常大的利用价值。即变异不一定发生在产生子代的过程中，而且变异方向不一定是随机性的。变异可以发生在适应性评估的过程当中，而且可以是有方向性的。（当然，进一步的研究有待进行。）

所以我们总结出遗传算法的一般步骤：

开始循环直至找到满意的解。

1.评估每条染色体所对应个体的适应度。

2.遵照适应度越高，选择概率越大的原则，从种群中选择两个个体作为父方和母方。

3.抽取父母双方的染色体，进行交叉，产生子代。

4.对子代的染色体进行变异。

5.重复2，3，4步骤，直到新种群的产生。

结束循环。

接下来，我们将详细地剖析遗传算法过程的每一个细节。

编制袋鼠的染色体----基因的编码方式

通过前一章的学习，读者已经了解到人类染色体的编码符号集，由4种碱基的两种配合组成。共有4种情况，相当于2 bit的信息量。这是人类基因的编码方式，那么我们使用遗传算法的时候编码又该如何处理呢？

受到人类染色体结构的启发，我们可以设想一下，假设目前只有“0”，“1”两种碱基，我们也用一条链条把他们有序的串连在一起，因为每一个单位都能表现出1 bit的信息量，所以一条足够长的染色体就能为我们勾勒出一个个体的所有特征。这就是二进制编码法，染色体大致如下：

010010011011011110111110

上面的编码方式虽然简单直观，但明显地，当个体特征比较复杂的时候，需要大量的编码才能精确地描述，相应的解码过程（类似于生物学中的DNA翻译过程，就是把基因型映射到表现型的过程。）将过份繁复，为改善遗传算法的计算复杂性、提高运算效率，提出了浮点数编码。染色体大致如下：

1.2 – 3.3 – 2.0 – 5.4 – 2.7 – 4.3

那么我们如何利用这两种编码方式来为袋鼠的染色体编码呢？因为编码的目的是建立表现型到基因型的映射关系，而表现型一般就被理解为个体的特征。比如人的基因型是46条染色体所描述的（总长度两米的纸条？），却能解码成一个个眼，耳，口，鼻等特征各不相同的活生生的人。所以我们要想为“袋鼠”的染色体编码，我们必须先来考虑“袋鼠”的“个体特征”是什么。也许有的人会说，袋鼠的特征很多，比如性别，身长，体重，也许它喜欢吃什么也能算作其中一个特征。但具体在解决这个问题的情况下，我们应该进一步思考：无论这只袋鼠是长短，肥瘦，只要它在低海拔就会被射杀，同时也没有规定身长的袋鼠能跳得远一些，身短的袋鼠跳得近一些。当然它爱吃什么就更不相关了。我们由始至终都只关心一件事情：袋鼠在哪里。因为只要我们知道袋鼠在那里，我们就能做两件必须去做的事情：

（1）通过查阅喜玛拉雅山脉的地图来得知袋鼠所在的海拔高度（通过自变量求函数值。）以判断我们有没必要把它射杀。

（2）知道袋鼠跳一跳后去到哪个新位置。

如果我们一时无法准确的判断哪些“个体特征”是必要的，哪些是非必要的，我们常常可以用到这样一种思维方式：比如你认为袋鼠的爱吃什么东西非常必要，那么你就想一想，有两只袋鼠，它们其它的个体特征完全同等的情况下，一只爱吃草，另外一只爱吃果。你会马上发现，这不会对它们的命运有丝毫的影响，它们应该有同等的概率被射杀！只因它们处于同一个地方。（值得一提的是，如果你的基因编码设计中包含了袋鼠爱吃什么的信息，这其实不会影响到袋鼠的进化的过程，而那只攀到珠穆朗玛峰的袋鼠吃什么也完全是随机的，但是它所在的位置却是非常确定的。）

以上是对遗传算法编码过程中经常经历的思维过程，必须把具体问题抽象成数学模型，突出主要矛盾，舍弃次要矛盾。只有这样才能简洁而有效的解决问题。希望初学者仔细琢磨。

既然确定了袋鼠的位置作为个体特征，具体来说位置就是横坐标。那么接下来，我们就要建立表现型到基因型的映射关系。就是说如何用编码来表现出袋鼠所在的横坐标。由于横坐标是一个实数，所以说透了我们就是要对这个实数编码。回顾我们上面所介绍的两种编码方式，读者最先想到的应该就是，对于二进制编码方式来说，编码会比较复杂，而对于浮点数编码方式来说，则会比较简洁。恩，正如你所想的，用浮点数编码，仅仅需要一个浮点数而已。而下面则介绍如何建立二进制编码到一个实数的映射。

明显地，一定长度的二进制编码序列，只能表示一定精度的浮点数。譬如我们要求解精确到六位小数，由于区间长度为2 – (-1) = 3 ,为了保证精度要求，至少把区间[-1,2]分为3 × 10⁶等份。又因为

所以编码的二进制串至少需要22位。

把一个二进制串转化位区间里面对应的实数值通过下面两个步骤。

（1）将一个二进制串代表的二进制数转化为10进制数：

（2）对应区间内的实数：

例如一个二进制串<1000101110110101000111>表示实数值0.637197。

二进制串<0000000000000000000000>和<1111111111111111111111>则分别表示区间的两个端点值-1和2。

由于往下章节的示例程序几乎都只用到浮点数编码，所以这个“袋鼠跳”问题的解决方案也是采用浮点数编码的。往下的程序示例（包括装载基因的类，突变函数）都是针对浮点数编码的。（对于二进制编码这里只作简单的介绍，不过这个“袋鼠跳”完全可以用二进制编码来解决的，而且更有效一些。所以读者可以自己尝试用二进制编码来解决。）

小知识：vector（容器）的使用。

在具体写代码的过程中，读者将会频繁用到vector这种数据结构，所以大家必须先对它有所了解。

std::vector是STL（standard template library）库里面的现成的模板类。它用起来就像动态数组。利用vector（容器）我们可以方便而且高效的对容器里面的元素进行操作。示例如下：

 
     //添加头文件，并使用std名空间。
#include
using namespace std;
//定义一个vector,<>内的是这个vector所装载的类型。
vector<int> MyVector;
//为vector后面添加一个整型元素0。
MyVector.push_back(0);
//把vector的第一个元素的值赋给变量a。值得注意的是如果vector的长度只有1，而你
//去访问它的下一个元素的话，编译和运行都不会报错，它会返回一个随机值给你，所以使
//用的时候一定要注意这个潜伏的BUG。
int a = MyVector[0];
//把vector里面的元素全部清空。
MyVector.clear();
//返回vector里面的元素的个数。
MyVector.size()
 
    

呵呵，如果你没用过这个模板类，请完全不必介意，因为现在为止，你已经学会了在本书里面将用到的所有功能。

另外，我也顺便提一提，为什么我用vector而不用其它数据结构比如数组，来承载一条基因，还有后面我们将会学到的神经网络中的权值向量。诚然，用数组作为基因或者权值向量的载体，速度会快一些。但是我用vector主要出于下面几个考虑。首先，vector的使用比较方便，方便得到其大小，也方便添加和访问元素，还有排序。其次，使用vector也便于代码的维护与及重用（在这本书的学习过程中，学习者将会逐步建立起遗传算法和人工神经网络的引擎，通过对代码少量的修改就能用于解决新的问题。）。另外，我还希望在研究更前缘的应用方向――通过遗传算法动态改变神经网络的拓扑结构的时候，大家仍然可以通过少量的修改后继续利用这些代码。（因为动态地改变神经网络的拓扑结构非常需要不限定大小的容器。）

我们定义一个类作为袋鼠基因的载体。（细心的人会提出这样的疑问：为什么我用浮点数的容器来储藏袋鼠的基因呢？袋鼠的基因不是只用一个浮点数来表示就行吗？恩，没错，事实上对于这个实例，我们只需要用上一个浮点数就行了。我们这里用上容器是为了方便以后利用这些代码处理那些编码需要一串浮点数的问题。）

 
    class CGenome
{
public:
    //定义装载基因的容器（事实上从英文解释来看，Weights是权值的意思，这用来表示
//基因的确有点名不符实，呵呵。这主要是因为这些代码来自于GA-ANN引擎，所以在
//它里面基因实质就是神经网络的权值，所以习惯性的把它引入过来就只好这样了。）
    vector <double> vecWeights;
    // dFitness用于存储对该基因的适应性评估。
    double dFitness;
    //类的无参数初始化参数。
    CGenome():dFitness(0){}
    //类的带参数初始化参数。
    CGenome(vector <double> w, double f): vecWeights(w), dFitness(f){}
};
 
   

好了，目前为止我们把袋鼠的染色体给研究透了，让我们继续跟进袋鼠的进化旅程。

物竞天择－－适应性评分与及选择函数。

1.物竞――适应度函数（fitness function）

自然界生物竞争过程往往包含两个方面：生物相互间的搏斗与及生物与客观环境的搏斗过程。但在我们这个实例里面，你可以想象到，袋鼠相互之间是非常友好的，它们并不需要互相搏斗以争取生存的权利。它们的生死存亡更多是取决于你的判断。因为你要衡量哪只袋鼠该杀，哪只袋鼠不该杀，所以你必须制定一个衡量的标准。而对于这个问题，这个衡量的标准比较容易制定：袋鼠所在的海拔高度。（因为你单纯地希望袋鼠爬得越高越好。）所以我们直接用袋鼠的海拔高度作为它们的适应性评分。即适应度函数直接返回函数值就行了。

2.天择――选择函数（selection）

自然界中，越适应的个体就越有可能繁殖后代。但是也不能说适应度越高的就肯定后代越多，只能是从概率上来说更多。（毕竟有些所处海拔高度较低的袋鼠很幸运，逃过了你的眼睛。）那么我们怎么来建立这种概率关系呢？下面我们介绍一种常用的选择方法――轮盘赌（Roulette Wheel Selection）选择法。假设种群数目,某个个体其适应度为,则其被选中的概率为：

比如我们有5条染色体，他们所对应的适应度评分分别为：5，7，10，13，15。

所以累计总适应度为：

所以各个个体被选中的概率分别为：

呵呵，有人会问为什么我们把它叫成轮盘赌选择法啊？其实你只要看看图2-2的轮盘就会明白了。这个轮盘是按照各个个体的适应度比例进行分块的。你可以想象一下，我们转动轮盘，轮盘停下来的时候，指针会随机地指向某一个个体所代表的区域，那么非常幸运地，这个个体被选中了。（很明显，适应度评分越高的个体被选中的概率越大。）

图2-2

那么接下来我们看看如何用代码去实现轮盘赌。

 
    //轮盘赌函数
CGenome GetChromoRoulette()
{
    //产生一个0到人口总适应性评分总和之间的随机数.
    //中m_dTotalFitness记录了整个种群的适应性分数总和)
    double Slice = (RandFloat()) * m_dTotalFitness;
    //这个基因将承载转盘所选出来的那个个体.
    CGenome TheChosenOne;
    //累计适应性分数的和.
    double FitnessSoFar = 0;
    //遍历总人口里面的每一条染色体。
    for (int i=0; i 
     
    {
        //累计适应性分数.
        FitnessSoFar += m_vecPop[i].dFitness;
        //如果累计分数大于随机数,就选择此时的基因.
        if (FitnessSoFar >= Slice)
        {
            TheChosenOne = m_vecPop[i];
            break;
        }
    }
    //返回转盘选出来的个体基因
    return TheChosenOne;
}
 
   

遗传变异――基因重组（交叉）与基因突变。

应该说这两个步骤就是使到子代不同于父代的根本原因（注意，我没有说是子代优于父代的原因，只有经过自然的选择后，才会出现子代优于父代的倾向。）。对于这两种遗传操作，二进制编码和浮点型编码在处理上有很大的差异，其中二进制编码的遗传操作过程，比较类似于自然界里面的过程，下面将分开讲述。

1.基因重组/交叉(recombination/crossover)

（1）二进制编码

回顾上一章介绍的基因交叉过程：同源染色体联会的过程中，非姐妹染色单体（分别来自父母双方）之间常常发生交叉，并且相互交换一部分染色体，如图2-3。事实上，二进制编码的基因交换过程也非常类似这个过程――随机把其中几个位于同一位置的编码进行交换，产生新的个体，如图2-4所示。

图2-3 图2-4

（2）浮点数编码

如果一条基因中含有多个浮点数编码，那么也可以用跟上面类似的方法进行基因交叉，不同的是进行交叉的基本单位不是二进制码，而是浮点数。而如果对于单个浮点数的基因交叉，就有其它不同的重组方式了，比如中间重组：

这样只要随机产生就能得到介于父代基因编码值和母代基因编码值之间的值作为子代基因编码的值。

考虑到“袋鼠跳”问题的具体情况――袋鼠的个体特征仅仅表现为它所处的位置。可以想象，同一个位置的袋鼠的基因是完全相同的，而两条相同的基因进行交叉后，相当于什么都没有做，所以我们不打算在这个例子里面使用交叉这一个遗传操作步骤。（当然硬要这个操作步骤也不是不行的，你可以把两只异地的袋鼠捉到一起，让它们交配，然后产生子代，再把它们送到它们应该到的地方。）

题外话：

性的起源

生命进化中另一个主要的重大进展是伴随着两性的发育――两个生物个体间遗传物质的交换而来的。正是这种交换提供了自然选择可以发生作用的变异水平。

性可能起源于在某种同类相食中。一个生物吞噬了另一个生物。含有双倍遗传物质的吞噬后生物为了解救自己而一分为二。这时，一种单倍遗传物质与双倍遗传物质的单位持续相互交换替的模式就会产生。直至到达一个各项规则都适合于双倍系统的环境。在这个系统中，从双倍体到单倍体的分裂只发生在性细胞或配子形成中，然后来自不同母体的配子结合成一个新的个体而恢复正常的双倍体系统。由于两性的出现，使进化的步伐加快了。（择自《吉尼斯－百科全书》1999年版）

由于基因交叉和两性有莫大的关联，所以我们可以从这个角度去深入了解基因交叉。性别的出现是在生物已经进化得相对复杂的时候。那个时候生物的基因基本形成了一种功能分块的架构。而自然界的基因交叉过程又一般不是单个基因，或者随便几个基因的交叉，而是一块基因，往往是表现某种个体性状的那块基因，所以从宏观上看，基因交叉的表现是性状的分离（孟德尔在实验中总结出来的规律。）。而性状又往往表现相对独立的个体特征。比如豌豆的高茎和矮茎，圆滑和皱缩。（参照第一章对孟德尔实验的介绍。）这些都是相对独立的特征，它们之间可以自由组合互相搭配。这时候，交叉过程将起到从宏观上调整基因块之间搭配的作用。经过物竞天择的过程，最后就能得到相对较好的特征组合方式，从而产生更优的个体。我想这才是基因交叉的意义所在吧。所以对于很多问题，使用基因交叉操作的效果不太明显，往往只能充当跳出局部最优解，相当于大变异的功能。真正意义上的基因交叉应该使用在大规模参数的进化过程当中，它将承担起对基因块进行组合优化的职责，从更宏观的角度去优化个体。对于交叉操作以后还将进行更具体的探讨。

2.基因突变(Mutation)

（1）二进制编码

同样回顾一下上一章所介绍的基因突变过程：基因突变是染色体的某一个位点上基因的改变。基因突变使一个基因变成它的等位基因，并且通常会引起一定的表现型变化。恩，正如上面所说，二进制编码的遗传操作过程和生物学中的过程非常相类似，基因串上的 “ 0”或“ 1”有一定几率变成与之相反的“ 1”或“ 0”。例如下面这串二进制编码：

101101001011001

经过基因突变后，可能变成以下这串新的编码：

001101011011001

（2）浮点型编码

浮点型编码的基因突变过程一般是对原来的浮点数增加或者减少一个小随机数。比如原来的浮点数串如下：

1.2, 3.4, 5.1, 6.0, 4.5

变异后，可能得到如下的浮点数串：

1.3, 3.1, 4.9, 6.3, 4.4

当然，这个小随机数也有大小之分，我们一般管它叫“步长”。（想想“袋鼠跳”问题，袋鼠跳的长短就是这个步长。）一般来说步长越大，开始时进化的速度会比较快，但是后来比较难收敛到精确的点上。而小步长却能较精确的收敛到一个点上。所以很多时候为了加快遗传算法的进化速度，而又能保证后期能够比较精确地收敛到最优解上面，会采取动态改变步长的方法。其实这个过程与前面介绍的模拟退火过程比较相类似，读者可以做简单的回顾。

下面是针对浮点型编码的基因突变函数的写法：

 
    //基因突变函数
void Mutate(vector<double> &chromo)
{
    //遵循预定的突变概率,对基因进行突变
    for (int i=0; i 
     
    {
        //如果发生突变的话
        if (RandFloat() < m_dMutationRate)
        {
            //使该权值增加或者减少一个很小的随机数值
            chromo[i] += (RandomClamped() * g_dMaxPerturbation);
            //保证袋鼠不至于跳出自然保护区.
            if(chromo[i] < g_LeftPoint)
            {
                chromo[i] = g_RightPoint;
            }
            else if(chromo[i] > g_RightPoint)
            {
                chromo[i] = g_LeftPoint;
            }
            //以上代码非基因变异的一般性代码只是用来保证基因编码的可行性。
        }
    }
}
 
   

值得一提的是遗传算法中基因突变的特点和上一章提到的生物学中的基因突变的特点非常相类似，这里回顾一下：

1.基因突变是随机发生的，且突变频率很低。（不过某些应用中需要高概率的变异）

2.大多数基因变异对生物本身是有害的。

3.基因突变是不定向的。

题外话：

染色体变异

基因突变是染色休的某一个位点上基因的改变，这种改变在光学显微镜下是无法直接观察到的。而染色休变异（chromosomal variations）是可以用显微镜直接观察到的，如染色体结构的改变、染色体数目的增减等。

1.染色体结构的变异

人类的许多遗传病是由染色体结构改变引起的。例如，猫叫综合征是人的第5号染色体部分缺失引起的遗传病，因为患病儿童哭声轻，音调高，很像猫叫而得名。猫叫综合症患者的生长发育迟缓，而且存在严重的智力障碍。

在自然条件或人为因素的影响下，染色体发生的结构变异主要有以下4种类型。（如图组2-5）

（1）染色体某一段缺失引起变异。

（2）染色体中增加某一片段引起变异。

（3）染色体某一片段移接到另一条非同源染色体上引起变异。

（4）染色体中某一片段位置颠倒也可引起变异。

上述染色体结构的改变，都会使排列在染色体上的基因的数目和排列顺序发生改变，从而导致性状的变异。大多数染色体结构变异对生物体是不利的，有的甚至导致生物体死亡。

2. 染色体数目的变异

一般来说，每一种生物的染染色体数目都是稳定的，但是，在某些特定的环境条件下生物体的染色体数目会发生改变，从而产生可遗传变异。染色体数目的变异可以分为两类：一类是细胞内的个别染色体增加或减少，另一类是细胞内的染色体数目以染色体组的形式成倍地增加或减少。（择自《高中生物课本》）

读者应该察觉到我们用在遗传算法上的基因突变也没有包括染色体的变异过程。因为一般来说这种大规模的变异对原来的个体的基因序列破坏性比较大。所以一般来说很难得到一个适应度高的个体。但是染色体变异，特别是染色体数目的突变使到生物从简单进化到复杂成为了可能，这也是非常具有意义的。


1.染色体某一段缺失引起变异。	2.染色体中增加某一片段引起变异。

3.染色体某一片段移接到另一条非同源染色体上引起变异。	4.染色体中某一片段位置颠倒也可引起变异。

图组2-5

好了，到此为止，基因编码，基因适应度评估，基因选择，基因变异都一一实现了，剩下来的就是把这些遗传过程的“零件”装配起来了。先让我们定义一个遗传算法的类：CGenAlg

遗传算法引擎――CGenAlg

 
    class CGenAlg
{
public:
//这个容器将储存每一个个体的染色体
vector        m_vecPop;
//人口(种群)数量
int m_iPopSize;
//每一条染色体的基因的总数目
int m_iChromoLength;
//所有个体对应的适应性评分的总和
double m_dTotalFitness;
//在所有个体当中最适应的个体的适应性评分
double m_dBestFitness;
//所有个体的适应性评分的平均值
double m_dAverageFitness;
//在所有个体当中最不适应的个体的适应性评分
double m_dWorstFitness;
//最适应的个体在m_vecPop容器里面的索引号
int m_iFittestGenome;
//基因突变的概率,一般介于0.05和0.3之间
double m_dMutationRate;
//基因交叉的概率一般设为0.7
double m_dCrossoverRate;
//代数的记数器
int m_cGeneration;
//构造函数
CGenAlg();
//初始化m_dTotalFitness, m_dBestFitness, m_dWorstFitness, m_dAverageFitness  等变量
void Reset();
//初始化函数
void init(int popsize, double MutRate, double CrossRate, int GenLenght);
//计算m_dTotalFitness, m_dBestFitness, m_dWorstFitness, m_dAverageFitness等变量
void CalculateBestWorstAvTot();
//轮盘赌选择函数
CGenome GetChromoRoulette();
//基因变异函数
void Mutate(vector<double> &chromo);
//这函数产生新一代基因
void Epoch(vector &vecNewPop);
};
 
   

其中Reset()函数，init()函数和CalculateBestWorstAvTot()函数都比较简单，读者查看示例程序的代码就能明白了。而下面分别介绍init函数和Epoch函数。

类的初始化函数――init函数

init函数主要充当CGenAlg类的初始化工作，把一些成员变量都变成可供重新开始遗传算法的状态。（为什么我不在构造函数里面做这些工作呢？因为我的程序里面CGenAlg类是View类的成员变量，只会构造一次，所以需要另外的初始化函数。）下面是init函数的代码：

 
    void CGenAlg::init(int popsize, double MutRate, double CrossRate, int GenLenght)
{
       m_iPopSize = popsize;
       m_dMutationRate = MutRate;
       m_dCrossoverRate = CrossRate;
       m_iChromoLength = GenLenght;
       m_dTotalFitness = 0;
       m_cGeneration = 0;
       m_iFittestGenome = 0;
       m_dBestFitness = 0;
       m_dWorstFitness = 99999999;
       m_dAverageFitness = 0;
       //清空种群容器，以初始化
       m_vecPop.clear();
       for (int i=0; i 
     
       {     
              //类的构造函数已经把适应性评分初始化为0
              m_vecPop.push_back(CGenome());
              //把所有的基因编码初始化为函数区间内的随机数。
              for (int j=0; j 
     
              {
m_vecPop[i].vecWeights.push_back(RandFloat() * 
(g_RightPoint - g_LeftPoint) + g_LeftPoint);
              }
       }
}
 
   

恩，正如我之前说的，我们这个程序不但要应付基因编码只有一个浮点数的“袋鼠跳”问题的情况，还希望以后在处理一串浮点数编码的时候也一样适用，所以从这里开始我们就把基因当成串来对待。

开创新的纪元――Epoch函数

现在万事具备了，只差把所有现成的“零件”装配起来而已。而Epoch函数就正好充当这个职能。下面是这个函数的实现：

 
    //此函数产生新的一代,见证着整个进化的全过程.
//以父代种群的基因组容器作为参数传进去,该函数将往该容器里放入新一代的基因组(当然是经过了优胜劣汰的)
void Epoch(vector &vecNewPop)
{
       //用类的成员变量来储存父代的基因组(在此之前m_vecPop储存的是不带估值的所有基因组)
       m_vecPop = vecNewPop;
       //初始化相关变量
       Reset();
       //为相关变量赋值
       CalculateBestWorstAvTot();
       //清空装载新种群的容器
vecNewPop.clear();       
       //产生新一代的所有基因组
       while (vecNewPop.size() < m_iPopSize)
       {
              //转盘随机抽出两个基因
              CGenome mum = GetChromoRoulette();
              CGenome dad = GetChromoRoulette();
              //创建两个子代基因组
              vector<double> baby1, baby2;
              //先把他们分别设置成父方和母方的基因
              baby1 = mum.vecWeights;
              baby2 = dad.vecWeights;
              //使子代基因发生基因突变
              Mutate(baby1);
              Mutate(baby2);
              //把两个子代基因组放到新的基因组容器里面
              vecNewPop.push_back( CGenome(baby1, 0) );
              vecNewPop.push_back( CGenome(baby2, 0) );
       }//子代产生完毕
       //如果你设置的人口总数非单数的话,就会出现报错
       if(vecNewPop.size() != m_iPopSize)
       {
              AfxMessageBox("你的人口数目不是单数!!!");
              return;
       }
}
 
   

呵呵，现在我们可以为袋鼠传宗接代了。（细心的读者会发现，上面每次处理两个基因个体其实是没必要的，恩，那也是为了以后能够使用交叉函数而准备的，因为交叉函数需要两个相异的个体参与。）接下来，我们要把命令袋鼠跳正式开始的函数（大家注意，这个函数非CGenAlg类的成员函数，而是CSearchMaxView类的成员函数，因为这个命令并非CGenAlg类自发的，而是由你“通知”CSearchMaxView类，然后再由CSearchMaxView类通知CGenAlg类的。）也一并实现：

上帝的一声令下――OnStartGenAlg函数

下面将列出OnStartGenAlg函数的主要代码（为了不要太占版面，只列出那些关键性的代码及其解释。），读者要注意里面的适应度评价是怎么实现的。

 
    void CSearchMaxView::OnStartGenAlg()
{
       //产生随机数
       srand( (unsigned)time( NULL ) );
       //初始化遗传算法引擎
       GenAlg.init(g_popsize, g_dMutationRate, g_dCrossoverRate, g_numGen);
       //清空种群容器
       m_population.clear();
       //种群容器装进经过随机初始化的种群
       m_population = GenAlg.m_vecPop;
       //定义两个容器，以装进函数的输入与及输出（我们这个函数是单输入单输出的，但是以后往往不会那么简单，所以我们这里先做好这样的准备。）
       vector <double> input, output;
       input.push_back(0);
       for(int Generation = 0;Generation <= g_Generation;Generation++)
       {
              //里面是对每一条染色体进行操作
for(int i=0;i 
     
              {
input = m_population[i].vecWeights;
//为每一个个体做适应性评价，如之前说的，评价分数就是函数值。其
//Function函数的作用是输入自变量返回函数值，读者可以参考其代码。
                     output = Curve.Function(input);
                     m_population[i].dFitness = output[0];
              }
              //由父代种群进化出子代种群（长江后浪退前浪。）
              GenAlg.Epoch(m_population);
       }
}
 
   

恩，到这里“袋鼠跳”的主要代码就完成了。(其它一些代码，比如图形曲线的显示，和MFC的相关代码在这就不作介绍了，建议初学者不必理会那些代码，只要读懂算法引擎部分就可以了。)下面就只等着我们下达命令了！

让袋鼠在你的电脑里进化――程序的运行

我想没有什么别的方法比自己亲手写一个程序然后通过修改相关参数不断调试程序，更能理解并且掌握一种算法了。不知道你还记不记得你初学程序的日子，我想你上机动手写程序比坐在那里看一本厚厚的程序开发指南效率不知高上多少倍，兴趣也特命浓厚，激情也特别高涨。恩，你就是需要那样的感觉，学遗传算法也是一样的。你需要把自己的代码运行起来，然后看看程序是否按照你所想象的去运行，如果没有，你就要思考原因，按照你的想法去改善代码，试着去弄清其中的内在联系。这是一个思维激活的过程，你大脑中的神经网络正在剧烈抖动（呵呵，或许学到后面你就知道你大脑的神经网络是如何“抖动”的。），试图去接受这新鲜而有趣的知识。遗传算法（包括以后要学到的人工神经网络）包含大量的可控参数，比如进化代数、人口数目、选择概率、交叉概率、变异概率、变异的步长还有以后学到的很多。这些参数之间的搭配关系，不能指望别人用“灌输”的方式让你被动接受，这需要你自己在不断的尝试，不断的调整中去形成一种“感觉”的。很多时候一个参数的量变在整个算法中会表现出质的变化。而算法的效果又能从宏观上反映参数的设置。

现在就让我们来对这个程序做简单的说明。

参数的设置：

这个程序有很多的需要预先设置好的参数，为了方便修改，我把它们都定义为全局变量，定义和初始化都放在Parameter.h的头文件里面。下面对几个主要参数的说明：

 
    //目标函数的左右区间，目前的设置是[-1,2]
double g_LeftPoint = -1;
double g_RightPoint = 2;
遗传算法相关参数
int g_numGen = 1;       //每条染色体的编码个数，这里是1个
int g_Generation = 1000;      //进化的代数
int g_popsize = 50;       //种群的人口数目（就是说你要放多少只袋鼠到山上）
double g_dMutationRate = 0.8;    //基因变异的概率
double g_dMaxPerturbation = 0.005;   //基因变异的步长（袋鼠跳的最大距离） 
 
   

当然，一些主要的参数在程序运行后可以通过参数设置选项进行设置。（其中缓冲时间是每进化一代之后，暂停的时间，单位为毫秒）如图2-6。

图2-6

运行程序：

程序运行后请选择菜单项：控制－>让袋鼠们开始跳吧，开始遗传算法的过程。其中蓝色的线条是函数曲线（恩，那就是喜玛拉雅山脉。其中最高的波峰，就是珠穆朗玛峰。）绿色的点是一只只袋鼠。上方的黑色曲线图表是对每一代最优的个体的适应性评分的统计图表。下方的黑色曲线图表是对每一代所有个体的平均适应性评分的统计图表。（如果你认为它们阻碍了你的视线，你可以在参数设置里面取消掉。）如图2-7所示。另外还可以用键盘的上下左右键来控制视窗的移动，加减键控制函数曲线的放缩。

图2-7

刚开始的时候，袋鼠分布得比较分散它们遍布了各个山岭，有的在高峰上，有的在深谷里。（如图2-8）

图2-8

经过了几代的进化后，一些海拔高度比较低的都被我们射杀了，而海拔较高的袋鼠却不断的生儿育女。（如图2-9）

图2-9

最后整个袋鼠种群就只出现在最高峰上面（最优解上）。（如图2-10）

图2-10

当然，袋鼠不是每一次都能跳到珠穆朗玛峰的，如图2-11所示。（就是说不是每次都能收敛到最优解）也许它们跳到了某一个山峰，就自大的认为它们已经“会当凌绝顶”了。（当然，事实上是因为不管它们向前还是向后跳都只能得到更小的适应度，所以不等它们跳过山谷，再跳到旁边更高的山峰，就被我们射杀了。）所以，我们为了使到袋鼠每次都尽可能的攀到珠穆朗玛峰，而不是留恋在某一个低一些的山峰，我们有两个改进的办法，其一是初始人口数目更多一些，以使最好有一些袋鼠一开始就降落到最高峰的附近，但是这种方法对于搜索空间非常大的问题往往是无能为力的。我们常常采用的方法是使袋鼠有一定的概率跳一个很大的步长，以使袋鼠有可能跳过一个山谷到更高的山峰去。这些改进的方法留给读者自己去实现。

图2-11

另外，如果把变异的机率调得比较高，那么就会出现袋鼠跳得比较活跃的局面，但是很可能丢失了最优解；而如果变异的机率比较低的话，袋鼠跳得不太活跃，找到最优解的速度就会慢一些，这也留给读者自己去体验。

作为一个寻找大值的程序，这个的效率还很低。我希望留给初学者更多改进的空间，大家不必受限于现有的方法，大可以发挥丰富的想象力，自己想办法去提高程序的效率，然后自己去实现它，让事实去验证你的想法是否真的能提高效率，抑或刚好相反。恩，在这个过程当中，大家不知不觉地走进了遗传算法的圣殿了，胜于一切繁复公式的摆设和教条式的讲解。

总结与及扩充

经过本章的学习，我想读者应该能基本上把握遗传算法的基本步骤与及隐约的看到了她的本质。当然同时还会带着许多许多的疑问和不解。好的，不必急躁，让我们在以后的章节中慢慢领会。下面我们回顾一下前面所学过的内容，同时也做一些扩充。（为了适应学习新知识的客观规律，我对知识点的介绍所遵循的原则是：先对理论作简单的介绍，目的是让读者对新鲜理论有一个感性的认识。然后用实际的例子实现理论并且在实践中加深对理论的理解。最后对理论作更为深入系统的总结与及扩充。）

对编码方式的回顾与扩充

1．二进制编码

二进制编码的编码符号集由0和1组成，因此染色体是一个二进制符号串，其优点在于编码、解码操作简单，交叉、变异等遗传操作便于实现，对于全局搜索能力有一定的优势;其缺点在于，不便于反映所求间题的特定知识，对于一些连续函数的优化问题等，也由于遗传算法的随机特性而使得其局部搜索能力较差，对于一些多维、高精度要求的连续函数优化，二进制编码存在着连续函数离散化时的映射误差，个体编码串较短时，可能达不到精度要求;而个体编码串的长度较长时，虽然能提高精度，但却会使算法的搜索空间急剧扩大。如果个体编码串特别长时，会造成遗传算法的性能降低。

2．浮点数编码

浮点数编码方式，以浮点数为编码的单位。就二进制编码和浮点数编码比较而言，浮点数编码一些情况下比较能反映所求问题的特定知识，编码结构一般比二进制来得简单些。一般二进制编码比浮点数编码搜索能力强，但浮点数编码比二进制编码在变异操作上能够保持更好的种群多样性。

3．其它编码方式

其实编码的方式是多种多样的，有时候还会用到混合编码，而且编码形式对具体问题的依赖性比较强。设计编码的时候不必拘泥于现有的几种编码方式，解决具体问题的时候，很多情况下需要为具体问题“度身定做”。有时候一种合适的编码方式，配合合适的交换算子，变异算子（交换算子和变异算子常常需要适合特定的编码方式。），这些都会影响到解决问题的效率，在以后的深入学习过程中大家将会有深刻体会。（下一章的例子将用到混合编码。）

接下来总结出遗传算法选取编码过程的几个原则：

1.完全性，原则上问题的所有可能的解都能找到与之对应的编码组合。

2.合法性，每个基因编码都对应一个可接受的个体。

3.多重性，多个基因型解码成一个表现型，即从基因型到相应的表现型空间是多对一的关系，这是基因的多重性。若相同的基因型被解码成不同的表现型，这是表现型多重性。当然，基因型到表现型的映射关系最好是一对一的关系。

4.紧致性,若两种基因编码能解码成相同的个体，那么占用空间越小的编码方式就越紧致。

5.复杂性，指基因型结构的复杂性，解码的复杂性，计算时空的复杂性。

这些特征常常是鱼与熊掌，不可兼得的。（整理《遗传算法――理论、应用与软件实现》相关资料而来）

对适应性函数的回顾与扩充

适应性函数有一个更形象的名字――压力函数。为什么这样说呢？如果你对遗传算法没有一定程度上的理解的话很难把握它的意思，但是经过上面那个例子――对“袋鼠逃”问题解决，读者会发现经过一段时间的进化过程，袋鼠都被无形的力“压”到了山顶。这其实是适应性函数的力量，如果你喜欢的话，你可以通过对适应性函数的作简单修改，就能把袋鼠“压”到谷底。（建议初学者自己尝试尝试如何修改，虽然简单，但是你不一定那么容易成功的。）由此可见适应性函数是一个影响进化趋势的函数，有非常重要的地位。

尺度变换(fitness scaling)

并不是每个问题的适应性函数都像“袋鼠跳”问题的那么简单明瞭。我们常常需要对目标函数值作一些变换。这种对目标函数值域的映射变换就称为适应度的尺度变换(fitness scaling)。下面是几种常见的尺度变换。（为适应度函数，为目标函数）

（1）当目标函数为最大问题时：（是的最小值估计）

当目标函数为最小问题时：（是的最大值估计）

（2）当目标函数为最大问题时：（C是界限的保守估计值）

当目标函数为最小问题时：

下面介绍一下适应度函数应该遵循的几个原则。

(1)适应性评分应该是非负的：这主要是因为轮盘赌函数只能处理非负的适应度评分，否则会打乱个体的选择概率的。（回想前面我要大家尝试一下把袋鼠“压”到山谷下，我想很多初学者都会想到把适应性评分取，但是这样做的话会出现问题的，为什么呢？主要是因为轮盘赌函数的问题，它需要正数才能正常执行，所以就需要上面提到的尺度变换的第一类办法，就是保证适应度评价是正数。）

(2)合理、一致性：要求适应度值反映对应解的优劣程度。

(3)计算量小：适应度函数设计应尽可能简单，这样可以减少计算时间和空间上的复杂

性，降低计算成本。

欺骗

在使用遗传算法解决实际问题的时候我们常常遇到一些简单的问题，但是遗传算法却又难以收敛到最优解上面。是什么原因导致一个简单的问题对遗传算法来说是难以求解的呢？我们称那些引导遗传算法出错的函数编码组合为遗传算法的欺骗问题。一般来说，欺骗的出现可能是下面的原因：

（1）在遗传进化的初期，产生一些适应性评分特别高的个体，若按照比例选择法，这些个体因竞争力太突出而控制了选择过程，影响算法的全局优化性能。（在袋鼠跳问题里面，大家也许看见过这样的情景：当种群初始化的时候，有些袋鼠非常幸运的降落到一个比较高的山峰，但是那不是珠穆朗玛峰，由于其它的适应度较高，生的儿女特别多，为了保持人口总数的平衡，那些爬在珠穆朗玛峰半山腰的就不幸被杀了。）

（2）在遗传进化的后期，即算法接近收敛时，由于种群中个体适应度差异较小时，继续优化的潜能降低，可能获得某个局部最优解。

后记

如果读者还能硬着头皮看到这里的话，那么恭喜你了，你已经走进遗传算法的殿堂。当然你现在还未能把每个房间都仔细观摩，更没来得及去端详那些油光亮瓦。事实上，你也许还在纳闷，遗传算法能做什么，遗传算法的魔力何在？呵呵，不必着急，只管带着这些问题继续往下读，要记住一句话：把宝贝用到适当的地方去，就会发挥其巨大作用。

经过这章的学习，大家将基本把握遗传算法的一般步骤，而且能够利用遗传算法解决简单的实际问题。但是那距离高效而有实际应用价值的遗传算法还有一段距离，但是你的确已经跨过了那道最深的鸿沟，接下来的路子将更加平坦而舒适，更加有趣而更具实际意义。好的，让我们带着满脑的疑问，与及美好的憧憬进入下一次的学习――星际旅行中的人工智能(1)，让我们看看科幻影片里面的人工智能是如何代替人类操纵宇宙飞船飞出险境的！

你可能感兴趣的:(理论研究,算法,vector,生物,generation,网络,优化)

华为OD机试E卷 --英文输入法--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例JS算法源码Java算法源码python算法源码c算法源码c++算法源码题目描述主管期望你来实现英文输入法单词联想功能。需求如下：•依据用户输入的单词前缀，从已输入的英文语句中联想出用户想输入的单词，按字典序输出联想到的单词序列，•如果联想不到，请输出用户输入的单词前缀。注意：英文单词联想时，区分大小写缩略形式如”don’t”，判定为两个单词，”don”和”t”
Python 编译Edge-TTS（edge_tts）转MP3工具浩读语音朗读 edge-tts python edge 自然语言处理前端
Python编译Edge-TTS利用PIPEdge-tts库来实现Azure神经网络自然语音转MP3，这应该是微软给老百姓们一个共享前沿科技大餐。（edge_tts）找了网上的很多源代，现在利用现有公开的代码混编译一个个人的学习工具。代码仅供学习研究。fromtkinterimport*fromtkinter.filedialogimport*fromtkinter.messageboximpor
深度学习｜表示学习｜卷积神经网络｜局部链接是什么？｜06 漂亮_大男孩表示学习深度学习学习 cnn
如是我闻：局部连接（LocalConnectivity），是卷积神经网络（CNN）中的一个关键特性。什么是局部连接（LocalConnectivity）？局部连接指的是：在卷积操作中，每个神经元（或输出单元）只与输入数据的一个局部区域相关联，而不是与整个输入数据相连。换句话说：全连接网络（FullyConnectedLayer）中，每个神经元会与上一层所有的神经元相连。卷积网络（Convoluti
MySQL-分库分表飘飘渺渺渺红尘 Java Web Service mysql java 数据库
目录一、shardingsphere1、官方文档2、入门环境搭建2.1、引入依赖2.2、创建数据库2.3、sharding-jdbc分片策略配置2.4、事务2.5、mybatis-plus配置3、分片策略3.1、行表达式分片策略3.2、标准分片策略（1）精准分片算法精准分库算法精准分表算法（2）范围分片算法范围分库算法范围分表算法3.3、复合分片策略复合分片算法4、事务4.1、背景4.2、挑战4.
计算之魂1.3 例题总和最大区间问题独正己身算法 python 算法
一、题目给定一个实数序列，设计一个最有效的算法，找到一个总和最大的区间。如[1.5,-12.3,3.2,-5.5,23.2,3.2,-1.4,-12.2,34.2,5.4,-7.8,1.1,-4.9]总和区间为[4,9]，即第5个数23.2到第10个数5.4。二、解法这道题作者的目的是让我们对算法复杂度产生了解，不同的算法之间存在复杂度优劣，在写代码时最直观的想法写出来的代码效率可能不是最高的。2
Debian常用命令梅见十柒软件工程 debian 运维
以下是完整的Linux命令大全，适用于Debian、Ubuntu及其衍生系统，涵盖系统管理、文件操作、磁盘管理、用户管理、网络调试、安全、进程管理等多个方面。目录基本命令关机与重启文件和目录管理文件搜索挂载文件系统磁盘空间管理用户和群组管理文件和目录权限文件的特殊属性打包和压缩文件DEB包管理查看文件内容文本处理字符设置和文件格式转换文件系统分析初始化文件系统SWAP文件系统备份与恢复光盘操作网络
虚拟机VMware Workstation Pro安装集群+hadoop+spark+scala 落枫兮 hadoop spark scala
参考资料：参考视频教程链接：大数据实验虚拟机安装Hadoop和Spark_哔哩哔哩_bilibiliup主：孤独时代的硕硕namenode安装选择镜像、路径、磁盘（最好不要c盘）、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置。选择语言、时区、软件、位置和网络
开发中使用RabbitMQ的注意事项无德皇叔
使用消息队列处理消息的时候，我们可能会遇到以下问题：消息处理失败消息体本身有误消息重复处理消息丢失对于消息处理失败，有可能有由于网络波动导致的数据处理异常，待网络稳定时消息就会正常处理，对于这种处理失败，我们应该继续尝试去处理消息。消息体本身有误，这会导致消息连续处理失败，占用较多的资源，写大量的无用日志，这种错误应该丢弃这部分无用消息，但要记录下日志，记清消息体本身数据，以及丢弃消息的原因。消息
高斯混合模型（GMM）：用“高斯家族”描绘数据的“模样” ningaiiii 机器学习与深度学习机器学习人工智能
高斯混合模型（GMM）：用“高斯家族”描绘数据的“模样”1.引言高斯混合模型（GaussianMixtureModel,GMM）是一种基于概率密度的生成式模型。它的核心思想是用多个“高斯分布”（即正态分布）的加权组合来描述数据的分布。GMM就像是一个“画家”，用不同的“高斯画笔”描绘出数据的“模样”，特别适合处理复杂的分类任务。2.算法原理2.1模型结构GMM的核心组成包括：混合权重：每个高斯分量
大数据手写面试题Scala语言实现大全（持续更新）大模型大数据攻城狮大数据数据结构算法面试题面试宝典
在大数据领域，Scala语言因其强大的函数式编程特性和对并发处理的良好支持而成为了开发者们的热门选择。有些面试官，为了考验面试者的基本功，需要让手写一些面试题，以数据结构和算法类的居多。本文将为您提供一些常见的Scala手写面试题及参考答案，帮助您在面试或工作中更好地运用Scala。目录1.冒泡排序2.二分查找3.快速排序4.归并排序5.手写Spark-WordCount6.手写Spark程序求平
树莓派4基于Debian GNU/Linux 12 (Bookworm)配置静态ipv4网络 Christal_pyy debian linux 网络
【注意】此版本的树莓派桌面系统是使用NetworkManager的网络管理工具1.查看当前网络连接配置nmclidevshoweth0使用上面指令查看网络配置如果在执行nmclidevshoweth0时，只显示了IP4.GATEWAY，而没有显示IP4.ADDRESS，这通常意味着NetworkManager没有为eth0接口配置静态IP地址1）首先，确保网络连接配置正确，并检查是否配置了静态IP
C#实现的中软WebServer架构范例解析艾古力斯
本文还有配套的精品资源，点击获取简介：本示例详细探讨了如何使用C#语言和.NET框架构建一个基于Northwind数据库的Web服务器应用程序。演示了C#在编写服务器端代码、处理HTTP请求和数据库交互中的应用，并提供了关于ASP.NET框架、路由规则和MVC设计模式的深入理解。此外，通过分析源码，开发者可以学习到代码组织、错误处理和性能优化的实践方法。1.C#语言和.NET框架在Web服务中的应
代码随想录day1 独正己身 c语言算法数据结构 c++
704.二分查找：1.左闭右闭intsearch(vector&nums,inttarget){intright=nums.size()-1;intleft=0;while(left>1);if(nums.at(middle)==target){returnmiddle;}elseif(nums[middle]>target){right=middle-1;}else{left=middle+1;
人形机器人将制造iPhone！ Cherry Xie 人工智能机器人制造人工智能
前言优必选机器人和富士康通过一项突破性的合作伙伴关系，正在将先进的人形机器人（如WalkerS1及其升级版WalkerS2）整合到制造流程中，以改变iPhone的生产方式。这一合作旨在通过提升机器人能力、优化工作流程以及实现更智能的自动化，应对劳动力挑战、提高效率，并为电子行业设定新的标杆。富士康的机器人劳动力由优必选开发的WalkerS1人形机器人计划在初期物流操作之外，彻底革新富士康的制造流程
【网络安全】零基础小白如何入门CTF 程序员橘子 web安全安全网络渗透测试网络安全
新手小白应该怎么入门CTF？要如何学习CTF？分几阶段学习？想打CTF，但是没有思路怎么办？这是我花了两天，整理的CTF学习的思路与方法，方便大家学习时可以参考。如果觉得有帮助的小伙伴，记得点赞收藏关注！一、CTF简介01」简介中文一般译作夺旗赛（对大部分新手也可以叫签到赛），在网络安全领域中指的是网络安全技术人员之间进行技术竞技的一种比赛形式。CTF起源于1996年DEFCON全球黑客大会，以代
ArkUI原生页面滑动性能分析优化实践 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第20课。本次交流核心为ArkUI原生页面的滑动性能相关内容。从HarmonyOS渲染原理切入，这是理解页面呈现与滑动效果的根基。深入剖析应用滑动性能问题的分析思路，为开发者提供排查问题的有效方法。详细阐述针对典型性能问题的优化手段，涵盖代码优化、资源管理等多方面。开发者通过此次交流，能够精准把握ArkUI原生页面滑动性能的关键要点，提升性能
HarmonyOS Next Developer Beta5 8月尝鲜版版本说明 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第13课。本次主要围绕HarmonyOSNEXT的DeveloperBeta5-8月尝鲜版展开介绍。HarmonyOSNEXT代表着鸿蒙系统的未来发展方向，此次的DeveloperBeta5版本尤为值得关注。版本配套涵盖了一系列的开发工具和文档，为开发者提供全面支持。新增特性方面，可能会有新的功能模块或技术优化，为系统带来新的活力。变更特性则
DevEcoStudio性能工具集介绍 harmonyos
课程简介本课程是【HarmonyOSTechTalk】的第15课。本次交流聚焦于IDE性能工具集这一关键开发辅助资源。该工具集涵盖多方面重要功能，性能检测可精准定位应用运行中可能存在的效率瓶颈与问题所在；性能分析则深入挖掘问题根源，剖析各类性能数据背后的关联与原因；而性能指导依据专业知识与经验提供最佳解决方案。开发者借助这一强大的IDE性能工具集，能在鸿蒙应用开发过程中显著提升性能优化分析效率，有
1688商品类目API接口的开发应用与收益前端后端运维数据挖掘api
在电子商务领域，数据的获取与分析是企业决策的关键。阿里巴巴旗下的1688平台，作为全球领先的B2B在线交易市场，提供了丰富的API接口，助力企业高效获取商品信息，优化供应链管理，提升市场竞争力。本文将深入探讨1688商品类目API接口的开发应用，结合实际案例，展示其为企业带来的显著收益，并附上Python代码示例，以便开发者快速上手。一、1688商品类目API接口概述1688商品类目API接口允许
这有一份神秘新年礼物！编程语言
亲爱的MoonBit社区成员们：烟花[烟花]随着新年的钟声即将敲响，我们满怀感激地回顾过去一年的成长与进步。感谢您一路的支持与陪伴！爱心[爱心]为了更好地服务大家，我们正式启动了2024年MoonBit社区年度调查。我们诚挚地邀请您参与问卷调查，完成问卷只需1~3分钟，您的每一条反馈都将是我们不断优化和提升MoonBit平台服务质量的宝贵财富。特别福利：前50名填写问卷并留下建议的参与者将获得Mo
这有一份神秘新年礼物！编程语言
亲爱的MoonBit社区成员们：烟花[烟花]随着新年的钟声即将敲响，我们满怀感激地回顾过去一年的成长与进步。感谢您一路的支持与陪伴！爱心[爱心]为了更好地服务大家，我们正式启动了2024年MoonBit社区年度调查。我们诚挚地邀请您参与问卷调查，完成问卷只需1~3分钟，您的每一条反馈都将是我们不断优化和提升MoonBit平台服务质量的宝贵财富。特别福利：前50名填写问卷并留下建议的参与者将获得Mo
帮助应用实现实时语音与文本的相互转换 harmonyos
课程简介本课程是【HarmonyOS主题课：HarmonyOSSDK开放能力】的第10课。本课程专为助力应用实现实时语音与文本相互转换而设。课程将深入讲解CoreSpeechKit这一基础语音服务，详细阐述其语音识别（SpeechRecognizer）能力，使开发者能精准掌握语音转文本的技术要点与应用方式。同时全面剖析文本转语音（TextToSpeech）功能，包括其原理、参数设置及优化策略。通过
如何查看商品销量 API 接口的性能指标数据前端后端运维数据挖掘api
在当今电商蓬勃发展的时代，数据成为驱动业务决策的关键因素。商品销量作为衡量产品受欢迎程度和销售业绩的核心指标，其获取依赖于高效稳定的API接口。对于电商开发者、数据分析师以及业务决策者而言，了解如何查看商品销量API接口的性能指标数据至关重要。这些性能指标不仅能反映接口的运行状态，还能为优化接口、提升用户体验以及保障业务连续性提供有力依据。本文将深入探讨查看商品销量API接口性能指标数据的方法，并
ArkTS（Ark TypeScript）荔枝寄 typescript javascript 前端
在现代编程语言的丰富生态系统中，循环结构是构建复杂逻辑和处理重复任务不可或缺的一部分。鸿蒙操作系统（HarmonyOS），作为一款面向未来的分布式操作系统，引入了ArkTS（ArkTypeScript）作为其主要的开发语言之一。ArkTS是一种基于TypeScript的静态类型语言，它不仅继承了TypeScript的所有特性，还特别针对HarmonyOS进行了优化，以满足高性能和跨设备开发的需求。
驱动程序的优化与调试荔枝寄 harmonyos
鸿蒙操作系统（HarmonyOS）是由华为公司自主开发的一款面向全场景的分布式操作系统。鸿蒙驱动开发作为系统级开发的一部分，其目标是为硬件设备提供与Linux内核兼容的驱动程序，确保设备能够高效地与操作系统进行交互。本文将深入探讨鸿蒙驱动开发的核心概念、开发流程以及实际应用中的代码示例，旨在为读者提供一个全面的技术指南。鸿蒙操作系统的背景鸿蒙操作系统的设计初衷是为了应对未来物联网时代的挑战，它不仅
YOLOv5模型版本详解：n/s/m/l的区别与选型指南我的青春不太冷 YOLO android 经验分享程序人生笔记测试
文章目录一、模型版本概述二、核心参数对比2.1基本性能指标2.2计算复杂度三、架构设计差异3.1网络宽度控制3.1.1通道数变化3.1.2参数配置对比3.2网络深度配置四、性能表现分析4.1精度-速度曲线4.2资源消耗对比五、工程部署建议5.1设备适配方案5.2模型优化技巧5.2.1量化压缩5.2.2网络剪枝六、版本选型指南6.1决策流程图6.2场景化推荐七、总结建议一、模型版本概述YOLOv5是
强化学习代码实践1.DDQN:在CartPole游戏中实现 Double DQN 洪小帅游戏 python gym pytorch 深度学习
强化学习代码实践1.DDQN:在CartPole游戏中实现DoubleDQN1.导入依赖2.定义Q网络3.创建Agent4.训练过程5.解释6.调整超参数在CartPole游戏中实现DoubleDQN（DDQN）训练网络时，我们需要构建一个使用两个Q网络（一个用于选择动作，另一个用于更新目标）的方法。DoubleDQN通过引入目标网络来减少Q-learning中过度估计的偏差。下面是一个基于PyT
基于Python的三种主流网络爬虫技术吃肉肉335 python 爬虫开发语言
一、网络爬虫是什么网络爬虫，通常也被称为网络蜘蛛或网络机器人，是一种按照一定方法，获取网络各种信息的自动化脚本程序，也可以将其理解为一个在互联网上自动提取网页信息并进行解析抓取的程序。网络爬虫的功能不仅局限于复制网页内容、下载音视频文件，更包括自动化执行行为链以及模拟用户登录等复杂操作。在当前大数据背景下，无论是人工智能应用还是数据分析工作，均依赖于海量的数据支持。如果仅依赖人工采集这一种方式，不
CentOS8下安装wget、wget2 奔跑吧邓邓子高效运维 linux centos wget wget2
提示：“奔跑吧邓邓子”的高效运维专栏聚焦于各类运维场景中的实际操作与问题解决。内容涵盖服务器硬件（如IBMSystem3650M5）、云服务平台（如腾讯云、华为云）、服务器软件（如Nginx、Apache、GitLab、Redis、Elasticsearch、Kubernetes、Docker等）、开发工具（如Git、HBuilder）以及网络安全（如挖矿病毒排查、SSL证书配置）等多个方面。无论
Python网络爬虫核心面试题闲人编程程序员面试 python 爬虫开发语言面试网络编程
网络爬虫1.爬虫项目中如何处理请求失败的问题？2.解释HTTP协议中的持久连接和非持久连接。3.什么是HTTP的持久化Cookie和会话Cookie？4.如何在爬虫项目中检测并处理网络抖动和丢包？5.在爬虫项目中，如何使用HEAD请求提高效率？6.如何在爬虫项目中实现HTTP请求的限速？7.解释HTTP2相对于HTTP1.1的主要改进。8.如何在爬虫项目中模拟HTTP重试和重定向？9.什么是COR
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod