Hou_Rj

用平常语言介绍神经网络(Neural Networks in Plain English)

用平常语言介绍神经网络
(Neural Networks in Plain English)

因为我们没有很好了解大脑，我们经常试图用最新的技术作为一种模型来解释它。在我童年的时候，我们都坚信大脑是一部电话交换机。(否则它还能是什么呢？)我当时还看到英国著名神经学家谢林顿把大脑的工作挺有趣地比作一部电报机。更早些时候，弗罗伊德经常把大脑比作一部水力发电机，而莱布尼茨则把它比作了一台磨粉机。我还听人说，古希腊人把大脑功能想象为一付弹弓。显然，目前要来比喻大脑的话，那只可能是一台数字电子计算机了。－John R.Searle [注1]

神经网络介绍（Introduction to Neural Networks）
　　曾有很长一个时期，人工神经网络对我来说是完全神秘的东西。当然，有关它们我在文献中已经读过了，我也能描述它们的结构和工作机理，但我始终没有能“啊哈！”一声，如同你头脑中一个难于理解的概念有幸突然得到理解时的感觉那样。我的头上好象一直有个榔头在敲着，或者像电影Animal House(中文片名为“动物屋”)中那个在痛苦地尖叫“先生，谢谢您，再给我一个啊！”的可怜家伙那样。我无法把数学概念转换成实际的应用。有时我甚至想把我读过的所有神经网络的书的作者都抓起来，把他们缚到一棵树上，大声地向他们吼叫：“不要再给我数学了，快给我一点实际东西吧！”。但无需说，这是永远不可能发生的事情。我不得不自己来填补这个空隙...由此我做了在那种条件下唯一可以做的事情。我开始干起来了。<一笑>

这样几个星期后，在一个美丽的日子里，当时我在苏格兰海边度假，当我越过一层薄雾凝视着狭长的海湾时，我的头脑突然受到一个冲击。一下子悟到了人工神经网络是怎样工作的。我得到“啊哈！”的感觉了！但我此时身边只有一个帐篷和一个睡袋，还有半盒子的脆玉米片，没有电脑可以让我迅速写出一些代码来证实我的直觉。Arghhhhh！这时我才想到我应该买一台手提电脑。不管怎样，几天后我回到家了，我立刻让我的手指在键盘上飞舞起来。几个小时后我的第一人工神经网络程序终于编成和运行了，并且工作得挺好！自然，代码写的有点乱，需要进行整理，但它确实已能工作了，并且，更重要的是，我还知道它为什么能工作！我可以告诉你，那天我是一位非常得意的人。

我希望本书传递给你的就是这种“啊哈！”感觉。当我们学完遗传算法时，你可能已尝到了一点感觉，但你希望这种感觉是美妙的话，那就要等把神经网络部分整个学完。

生物学的神经网络-大脑
(A Biological Neural Network–The Brain)
....你的大脑是一块灰色的、像奶冻一样的东西。它并不像电脑中的CPU那样，利用单个的处理单元来进行工作。如果你有一具新鲜地保存到福尔马林中的尸体，用一把锯子小心地将它的头骨锯开，搬掉头盖骨后，你就能看到熟悉的脑组织皱纹。大脑的外层象一个大核桃那样，全部都是起皱的[图0左]，这一层组织就称皮层(Cortex)。如果你再小心地用手指把整个大脑从头颅中端出来，再去拿一把外科医生用的手术刀，将大脑切成片，那么你将看到大脑有两层[图0右]: 灰色的外层(这就是“灰质”一词的来源，但没有经过福尔马林固定的新鲜大脑实际是粉红色的。) 和白色的内层。灰色层只有几毫米厚，其中紧密地压缩着几十亿个被称作neuron（神经细胞、神经元）的微小细胞。白色层在皮层灰质的下面，占据了皮层的大部分空间，是由神经细胞相互之间的无数连接组成。皮层象核桃一样起皱，这可以把一个很大的表面区域塞进到一个较小的空间里。这与光滑的皮层相比能容纳更多的神经细胞。人的大脑大约含有1OG（即100亿）个这样的微小处理单元;一只蚂蚁的大脑大约也有250,OOO个。

以下表l显示了人和几种动物的神经细胞的数目。


图0-1 大脑半球像核桃	图0-2 大脑皮层由灰质和白质组成

图0 大脑的外形和切片形状

表l 人和几种动物的神经细胞的数目

动物	神经细胞的数目（数量级）
蜗牛	10,000 （=10^4）
蜜蜂	100,000 （=10^5）
蜂雀	10,000,000 （=10^7）
老鼠	100,000,000 （=10^8）
人类	10,000,000,000 （=10^10）
大象	100,000,000,000 （=10^11）

用平常语言介绍神经网络(Neural Networks in Plain English)_第3张图片

图1神经细胞的结构

　　在人的生命的最初9个月内，这些细胞以每分钟25,000个的惊人速度被创建出来。神经细胞和人身上任何其他类型细胞十分不同，每个神经细胞都长着一根像电线一样的称为轴突（axon）的东西，它的长度有时伸展到几厘米［译注］，用来将信号传递给其他的神经细胞。神经细胞的结构如图1所示。它由一个细胞体(soma)、一些树突(dendrite) 、和一根可以很长的轴突组成。神经细胞体是一颗星状球形物，里面有一个核(nucleus)。树突由细胞体向各个方向长出，本身可有分支，是用来接收信号的。轴突也有许多的分支。轴突通过分支的末梢(terminal)和其他神经细胞的树突相接触,形成所谓的突触（Synapse，图中未画出），一个神经细胞通过轴突和突触把产生的信号送到其他的神经细胞。

每个神经细胞通过它的树突和大约10,000个其他的神经细胞相连。这就使得你的头脑中所有神经细胞之间连接总计可能有l,000,000,000,000,000个。这比100兆个现代电话交换机的连线数目还多。所以毫不奇怪为什么我们有时会产生头疼毛病！

有趣的事实
曾经有人估算过，如果将一个人的大脑中所有神经细胞的轴突和树突依次连接起来，并拉成一根直线，可从地球连到月亮，再从月亮返回地球。如果把地球上所有人脑的轴突和树突连接起来，则可以伸展到离开们最近的星系！

神经细胞利用电-化学过程交换信号。输入信号来自另一些神经细胞。这些神经细胞的轴突末梢（也就是终端）和本神经细胞的树突相遇形成突触（synapse），信号就从树突上的突触进入本细胞。信号在大脑中实际怎样传输是一个相当复杂的过程，但就我们而言，重要的是把它看成和现代的计算机一样，利用一系列的0和1来进行操作。就是说，大脑的神经细胞也只有两种状态：兴奋（fire）和不兴奋（即抑制）。发射信号的强度不变，变化的仅仅是频率。神经细胞利用一种我们还不知道的方法,把所有从树突上突触进来的信号进行相加，如果全部信号的总和超过某个阀值，就会激发神经细胞进入兴奋（fire）状态，这时就会有一个电信号通过轴突发送出去给其他神经细胞。如果信号总和没有达到阀值，神经细胞就不会兴奋起来。这样的解释有点过分简单化，但已能满足我们的目的。

　　神经细胞利用电-化学过程交换信号。输入信号来自另一些神经细胞。这些神经细胞的轴突末梢（也就是终端）和本神经细胞的树突相遇形成突触（synapse），信号就从树突上的突触进入本细胞。信号在大脑中实际怎样传输是一个相当复杂的过程，但就我们而言，重要的是把它看成和现代的计算机一样，利用一系列的0和1来进行操作。就是说，大脑的神经细胞也只有两种状态：兴奋（fire）和不兴奋（即抑制）。发射信号的强度不变，变化的仅仅是频率。神经细胞利用一种我们还不知道的方法,把所有从树突上突触进来的信号进行相加，如果全部信号的总和超过某个阀值，就会激发神经细胞进入兴奋（fire）状态，这时就会有一个电信号通过轴突发送出去给其他神经细胞。如果信号总和没有达到阀值，神经细胞就不会兴奋起来。这样的解释有点过分简单化，但已能满足我们的目的。

正是由于数量巨大的连接，使得大脑具备难以置信的能力。尽管每一个神经细胞仅仅工作于大约100Hz的频率，但因各个神经细胞都以独立处理单元的形式并行工作着，使人类的大脑具有下面这些非常明显的特点：

　　能实现无监督的学习。 有关我们的大脑的难以置信的事实之一，就是它们能够自己进行学习，而不需要导师的监督教导。如果一个神经细胞在一段时间内受到高频率的刺激，则它和输入信号的神经细胞之间的连接强度就会按某种过程改变，使得该神经细胞下一次受到激励时更容易兴奋。这一机制是50多年以前由Donard Hebb在他写的Organination of Behavior一书中阐述的。他写道:

“当神经细胞 A的一个轴突重复地或持久地激励另一个神经细胞B后，则其中的一个或同时两个神经细胞就会发生一种生长过程或新陈代谢式的变化，使得励 B细胞之一的A细胞，它的效能会增加”

与此相反的就是，如果一个神经细胞在一段时间内不受到激励，那么它的连接的有效性就会慢慢地衰减。这一现象就称可塑性（plasticity）。

对损伤有冗余性(tolerance)。大脑即使有很大一部分受到了损伤，它仍然能够执行复杂的工作。一个著名的试验就是训练老鼠在一个迷宫中行走。然后，科学家们将其大脑一部分一部分地、越来越大地加以切除。他们发现，即使老鼠的很大的一部大脑被切除后，它们仍然能在迷宫中找到行走路径。这一事实证明了，在大脑中，知识并不是保存在一个局部地方。另外所作的一些试验则表明，如果大脑的一小部分受到损伤，则神经细胞能把损伤的连接重新生长出来。

处理信息的效率极高。神经细胞之间电-化学信号的传递，与一台数字计算机中CPU的数据传输相比，速度是非常慢的，但因神经细胞采用了并行的工作方式，使得大脑能够同时处理大量的数据。例如，大脑视觉皮层在处理通过我们的视网膜输入的一幅图象信号时，大约只要100ms的时间就能完成。考虑到你的神经细胞的平均工作频率只有100Hz，100ms的时间就意味只能完成10个计算步骤！想一想通过我们眼睛的数据量有多大，你就可以看到这真是一个难以置信的伟大工程了。

善于归纳推广。大脑和数字计算机不同，它极擅长的事情之一就是模式识别，并能根据已熟悉信息进行归纳推广(generlize)。例如，我们能够阅读他人所写的手稿上的文字，即使我们以前从来没见过他所写的东西。

它是有意识的。意识（consciousness）是神经学家和人工智能的研究者广泛而又热烈地在辩论的一个话题。有关这一论题已有大量的文献出版了，但对于意识实际究竟是什么，至今尚未取得实质性的统一看法。我们甚至不能同意只有人类才有意识，或者包括动物王国中人类的近亲在内才有意识。一头猩猩有意识吗？你的猫有意识吗？上星期晚餐中被你吃掉的那条鱼有意识吗？

因此，一个人工神经网络(Artificial neural network,简称ANN)就是要在当代数字计算机现有规模的约束下，来模拟这种大量的并行性,并在实现这一工作时，使它能显示许多和生物学大脑相类似的特性。下面就让我们瞧瞧它们的表演吧！

游戏编程中的人工智能技术
.

<神经网络入门>

.
(连载之二)

3 数字版的神经网络 (The Digital Version)

　　上面我们看到了生物的大脑是由许多神经细胞组成，同样，模拟大脑的人工神经网络ANN是由许多叫做人工神经细胞（Artificial neuron，也称人工神经原，或人工神经元）的细小结构模块组成。人工神经细胞就像真实神经细胞的一个简化版，但采用了电子方式来模拟实现。一个人工神经网络中需要使用多少个数的人工神经细胞，差别可以非常大。有的神经网络只需要使用10个以内的人工神经细胞，而有的神经网络可能需要使用几千个人工神经细胞。这完全取决于这些人工神经网络准备实际用来做什么。

有趣的事实
有一个叫 Hugo de Garis的同行，曾在一个雄心勃勃的工程中创建并训练了一个包含1000,000,000个人工神经细胞的网络。这个人工神经网络被他非常巧妙地建立起来了，它采用蜂房式自动机结构，目的就是为一机器客户定制一个叫做CAM BrainMachine(“CAM大脑机器”) 的机器（CAM就是Cellular Automata Machine的缩写）。此人曾自夸地宣称这一人工网络机器将会有一只猫的智能。许多神经网络研究人员认为他是在“登星”了，但不幸的是，雇用他的公司在他的梦想尚未实现之前就破产了。此人现在犹他州，是犹他州大脑工程（Utah Brain Project）的领导。时间将会告诉我们他的思想最终是否能变成实际有意义的东西。[译注]

　　我想你现在可能很想知道，一个人工神经细胞究竟是一个什么样的东西？但是，它实际上什么东西也不像; 它只是一种抽象。还是让我们来察看一下图2吧，这是表示一个人工神经细胞的一种形式。

[译注]Hugo de Garis现在为犹他州立大学教授，有关他和他的CAM机器，可在该校网站的一个网页上看到报道，其上有真实的照片，见http://www.cs.usu.edu/~degaris

图2 一个人工神经细胞

　　图中，左边几个灰底圆中所标字母w代表浮点数，称为权重（weight，或权值，权数）。进入人工神经细胞的每一个input(输入)都与一个权重w相联系，正是这些权重将决定神经网络的整体活跃性。你现在暂时可以设想所有这些权重都被设置到了-１和１之间的一个随机小数。因为权重可正可负，故能对与它关联的输入施加不同的影响，如果权重为正，就会有激发（excitory）作用，权重为负，则会有抑制（inhibitory）作用。当输入信号进入神经细胞时，它们的值将与它们对应的权重相乘，作为图中大圆的输入。大圆的‘核’是一个函数，叫激励函数(activation function)，它把所有这些新的、经过权重调整后的输入全部加起来，形成单个的激励值(activation value)。激励值也是一浮点数，且同样可正可负。然后，再根据激励值来产生函数的输出也即神经细胞的输出：如果激励值超过某个阀值（作为例子我们假设阀值为1.0），就会产生一个值为1的信号输出；如果激励值小于阀值1.0，则输出一个0。这是人工神经细胞激励函数的一种最简单的类型。在这里，从激励值产生输出值是一个阶跃函数[译注]。看一看图3后你就能猜到为什么有这样的名称。

图3 阶跃激励函数

[译注] 由图可知阶跃函数是一元的，而激励函数既然能把多个输入相加应为多元，故需加以区别。
如果到目前为止你对这些还没有获得很多感觉，那也不必担心。窍门就是: 不要企图去感觉它，暂时就随波逐流地跟我一起向前走吧。在经历本章的若干处后，你最终就会开始弄清楚它们的意义。而现在，就放松一点继续读下去吧。

3.1 现在需要一些数学了（Now for Some Math）
　　今后讨论中，我将尽量把数学降低到绝对少量，但学习一些数学记号对下面还是很有用的。我将把数学一点一点地喂给你，在到达有关章节时向你介绍一些新概念。我希望采用这样的方式能使你的头脑能更舒适地吸收所有的概念，并使你在开发神经网络的每个阶段都能看到怎样把数学应用到工作中。现在首先让我们来看一看，怎样把我在此之前告诉你的所有知识用数学方式表达出来。

　　一个人工神经细胞(从现在开始，我将把“人工神经细胞”简称它为“神经细胞”) 可以有任意n个输入，n代表总数。可以用下面的数学表达式来代表所有n个输入：

x1, x2, x3, x4, x5, ..., xn

同样 n 个权重可表达为:

w1, w2, w3, w4, w5 ..., wn

请记住，激励值就是所有输入与它们对应权重的之乘积之总和，因此，现在就可以写为:

a = w1x1 + w2x2 + w3x3 + w4x4 + w5x5 +...+ wnxn

以这种方式写下的求和式，我在第5章“建立一个更好的遗传算法”中已提到，可以用希腊字母Σ来简化：

注：
神经网络的各个输入，以及为各个神经细胞的权重设置，都可以看作一个n维的向量。你在许多技术文献中常常可以看到是以这样的方式来引用的。

　　下面我们来考察在程序中应该怎样实现？假设输入数组和权重数组均已初始化为x[n]和w[n]，则求和的代码如下:

double activation = 0;
for(int i=0; i<n; ++i)
{
activation += x[i] * w[i];
}

　　图4以图形的方式表示了此方程。请别忘记，如果激励值超过了阀值，神经细胞就输出1; 如果激活小于阀值，则神经细胞的输出为0。这和一个生物神经细胞的兴奋和抑制是等价的。我们假设一个神经细胞有5个输入，他们的权重w都初始化成正负1之间的随机值(-1 < w < 1) 。表2说明了激励值的求和计算过程。

图4 神经细胞的激励函数

如果我们假定激活所需阀值=1，则因激励值1.1 > 激活阀值１，所以这个神经细胞将输出1。
在进一步读下去之前，请你一定要确切弄懂激励函数怎样计算。

表2 神经细胞激励值的计算

输入	权重	*输入权重的乘积**	运行后总和
1	0.5	0.5	0.5
0	-0.2	0	0.5
1	-0.3	-0.3	0.2
1	0.9	0.9	1.1
0	0.1	0	1.1

3.2 行，我知道什么是神经细胞了，但用它来干什么呢？
　　大脑里的生物神经细胞和其他的神经细胞是相互连接在一起的。为了创建一个人工神经网络，人工神经细胞也要以同样方式相互连接在一起。为此可以有许多不同的连接方式，其中最容易理解并且也是最广泛地使用的，就是如图5所示那样，把神经细胞一层一层地连结在一起。这一种类型的神经网络就叫前馈网络（feedforword network）。这一名称的由来，就是因为网络的每一层神经细胞的输出都向前馈送（feed）到了它们的下一层（在图中是画在它的上面的那一层)，直到获得整个网络的输出为止。

　　　　图5 一个前馈网络

　　由图可知，网络共有三层（译注：输入层不是神经细胞，神经细胞只有两层）。输入层中的每个输入都馈送到了隐藏层，作为该层每一个神经细胞的输入；然后，从隐藏层的每个神经细胞的输出都连到了它下一层（即输出层）的每一个神经细胞。图中仅仅画了一个隐藏层，作为前馈网络，一般地可以有任意多个隐藏层。但在对付你将处理的大多数问题时一层通常是足够的。事实上，有一些问题甚至根本不需要任何隐藏单元，你只要把那些输入直接连结到输出神经细胞就行了。另外，我为图5选择的神经细胞的个数也是完全任意的。每一层实际都可以有任何数目的神经细胞，这完全取决于要解决的问题的复杂性。但神经细胞数目愈多，网络的工作速度也就愈低，由于这一缘故，以及为了其他的几种原因（我将在第9章作出解释），网络的规模总是要求保持尽可能的小。

　　到此我能想象你或许已对所有这些信息感到有些茫然了。我认为，在这种情况下，我能做的最好的事情，就是向你介绍一个神经网络在现实世界中的实际应用例子，它有望使你自己的大脑神经细胞得到兴奋！不错吧？好的，下面就来了...

　你可能已听到或读到过神经网络常常用来作模式识别。这是因为它们善于把一种输入状态（它所企图识别的模式）映射到一种输出状态（它曾被训练用来识别的模式）。

　　下面我们来看它是怎么完成的。我们以字符识别作为例子。设想有一个由8x8个格子组成的一块面板。每一个格子里放了一个小灯，每个小灯都可独立地被打开（格子变亮）或关闭（格子变黑），这样面板就可以用来显示十个数字符号。图6显示了数字“4”。

图6 用于字符显示的矩阵格点

　　要解决这一问题，我们必需设计一个神经网络，它接收面板的状态作为输入，然后输出一个1或0；输出1代表ANN确认已显示了数字“4”，而输出0表示没有显示“4”。因此，神经网络需要有64个输入(每一个输入代表面板的一个具体格点) 和由许多神经细胞组成的一个隐藏层，还有仅有一个神经细胞的输出层，隐藏层的所有输出都馈送到它。我真希望你能在你的头脑中画出这个图来，因为要我为你把所有这些小圆和连线统统画出来确实不是一桩愉快的事<一笑>。

　　一旦神经网络体系创建成功后，它必须接受训练来认出数字“4”。为此可用这样一种方法来完成：先把神经网的所有权重初始化为任意值。然后给它一系列的输入，在本例中，就是代表面板不同配置的输入。对每一种输入配置，我们检查它的输出是什么，并调整相应的权重。如果我们送给网络的输入模式不是“4”，则我们知道网络应该输出一个0。因此每个非“4”字符时的网络权重应进行调节，使得它的输出趋向于0。当代表“4”的模式输送给网络时，则应把权重调整到使输出趋向于1。

　　如果你考虑一下这个网络，你就会知道要把输出增加到10是很容易的。然后通过训练，就可以使网络能识别0到9 的所有数字。但为什么我们到此停止呢？我们还可以进一步增加输出，使网络能识别字母表中的全部字符。这本质上就是手写体识别的工作原理。对每个字符，网络都需要接受许多训练，使它认识此文字的各种不同的版本。到最后，网络不单能认识已经训练的笔迹，还显示了它有显著的归纳和推广能力。也就是说，如果所写文字换了一种笔迹，它和训练集中所有字迹都略有不同，网络仍然有很大几率来认出它。正是这种归纳推广能力，使得神经网络已经成为能够用于无数应用的一种无价的工具，从人脸识别、医学诊断，直到跑马赛的预测，另外还有电脑游戏中的bot（作为游戏角色的机器人）的导航，或者硬件的robot（真正的机器人）的导航。

　这种类型的训练称作有监督的学习（supervised learnig），用来训练的数据称为训练集（training set）。调整权重可以采用许多不同的方法。对本类问题最常用的方法就是反向传播（backpropagation，简称backprop或BP）方法。有关反向传播问题，我将会在本书的后面，当你已能训练神经网络来识别鼠标走势时，再来进行讨论。在本章剩余部分我将集中注意力来考察另外的一种训练方式，即根本不需要任何导师来监督的训练，或称无监督学习（unsupervised learnig）。

　这样我已向你介绍了一些基本的知识，现在让我们来考察一些有趣的东西，并向你介绍第一个代码工程。

游戏编程中的人工智能技术

<神经网络入门>

(连载之三)

4. 聪明的扫雷机工程（Smart Minesweeper Project）

我要向你介绍的第一个完整例子，是怎么使用神经网络来控制具有人工智能的扫雷机的行为。扫雷机工作在一个很简单的环境中，那里只有扫雷机以及随机散布的许多地雷。

图7　运行中的演示程序。

　　尽管书上图形画成了黑白色，但当你运行程序时性能最好的扫雷机将显现为红色。地雷，你可能已经猜到，就是那些小方形。工程的目标是创建一个网络，它不需要从我们这里得到任何帮助，就能自己进行演化（evolve）去寻找地雷。为了实现这一功能，网络的权重将被编码到基因组中，并用一个遗传算法来演化它们。

怎么样，很酷吧？

提示（重要）
如果你跳过前面的一些章节来到这里，而你又不了解怎样使用遗传算法，则在进一步阅读下面的内容之前，你应回到前面去补读一下有关遗传算法的内容。

首先让我解释人工神经网络(ANN)的体系结构。我们需要决定输入的数目、输出的数目、还有隐藏层和每个隐藏层中隐藏单元的数目。

4.1 选择输出（Choosing the Outputs）

那么，人工神经网络怎样控制扫雷机的行动呢？很好！我们把扫雷机想象成和坦克车一样，通过左右2个能转动的履带式轮轨（track）来行动的。见图案9.8。

图8 扫雷机的控制

　　扫雷机向前行进的速度，以及向左、向右转弯的角度，都是通过改变2个履带轮的相对速度来实现的。因此，神经网络需要2个输入，1个是左侧履带轮的速度，另一个是右侧履带轮的速度。

　　啊，但是...,我听见你在嘀咕了。如果网络只能输出一个１或一个０，我们怎么能控制车轨移动的快慢呢？ 你是对的；如果利用以前描述的阶跃函数来决定输出，我们就根本无法控制扫雷机实际移动。幸好，我有一套戏法，让我卷起袖子来，把激励函数的输出由阶跃式改变成为在０－１之间连续变化的形式，这样就可以供扫雷机神经细胞使用了。为此，有几种函数都能做到这样，我们使用的是一个被称为逻辑斯蒂S形函数（logistic sigmoid function）[译注1]。该函数所实现的功能，本质上说，就是把神经细胞原有的阶跃式输出曲线钝化为一光滑曲线，后者绕y轴0.5处点对称[译注2]，如图9所示。

[译注1] logistic有’计算的’或’符号逻辑的’等意思在内，和’逻辑的(logic)’意义不同。
[译注2] 点对称图形绕对称点转180度后能与原图重合。若f(x)以原点为点对称,则有f(-x)=-f(x)

图9　S形曲线。

　　当神经细胞的激励值趋于正、负无穷时，S形函数分别趋于１或０。负的激励值对应的函数值都<0.5; 正激励值对应的函数值都>0.5。S形函数用数学表达式写出来则为:

　　这个方程看上去可能会吓唬一些人，但其实很简单。e是数学常数，近似等于2.7183，a是神经细胞的激励值，它是函数的自变量，而p是一个用来控制曲线形状变化快慢或陡峭性的参数。p通常设定为1。当p赋以较大值时，曲线就显得平坦，反之，就会使曲线变为陡峭。见图1O。很低的p值所生成的函数就和阶跃函数近似。P值的大小用来控制何时使神经网络由低变高开始翻转有很大作用，但是在本例子中我们将它保持为１。

注：“S型”的英文原名Sigmoid 或Sigmoidal 原来是根据希腊字“Sigma”得来的，但非常巧它也可以说成是曲线的一种形状。

图7。10 不同的S形响应曲线。

4.2 选择输入（Choosing the Inputs）

　　上面我们已经把输出安排好了，现在我们来考虑输入，确定网络需要什么样的输入？为此，我们必须想象一下扫雷机的具体细节：需要什么样的信息才能使它朝地雷前进？你可能想到的第一个输入信息清单是：

扫雷机的位置(x1,y1)
与扫雷机最靠近的地雷的位置(x2,y2)
代表扫雷机前进方向的向量(x3,y3)

　　这样一共得到6个输入。但是，要网络使用这些输入，工作起来就非常困难，因为，网络在像我们希望的那样执行工作之前，必须寻找所有6个输入之间的数学关系，而这有相当工作量。可以把此作为一个练习倒是很理想的：去试试如何给出最少数量的输入而仍能为网络传达解决问题所需要的全部信息。你的网络使用的输入愈少，网络所要求的神经细胞数目也愈少。而较少的神经细胞就意味更快速的训练和更少的计算，有利于网络更高速度的工作。

　　只要作少量的额外考虑，就能够把输入的个数减少为4，这就是图11中所画出的两个向量的４个参数。
把神经网络的所有输入进行规范化是一种好想法。这里的意思并不是说每个输入都要改变大小使它们都在0～1间，而是说每一个输入应该受到同等重视。例如，拿我们已经讨论过的扫雷机输入为例。瞄准向量或视线向量（look-at vector）总是一个规范化向量，即长度等于1，分量x和y都在0～1间。但从扫雷机到达其最近地雷的向量就可能很大，其中的一个分量甚至有可能和窗体的宽度或高度一样大。如果这个数据以它的原始状态输入到网络，网络对有较大值的输入将显得更灵敏，由此就会使网络性能变差。因此，在信息输入到神经网络中去之前，数据应预先定比（scaled）和标准化（standardized），使它们大小相似（similar）。在本特例中，由扫雷机引到与其最接近地雷的向量需要进行规范化（normalized）。这样可以使扫雷机的性能得到改良。

图11 选择输入。

小技巧：
有时，你把输入数据重新换算（rescale）一下，使它以0点为中心，就能从你的神经网络获得最好的性能。这一小窍门在你设计网络时永远值得一试。但我在扫雷机工程中没有采用这一方法，这是因为我想使用一种更直觉的方法。

4.3 隐藏的神经细胞要多少？（How many Hidden Neurons?）

　　到此我们已把输入、输出神经细胞的数目和种类确定下来了，下一步是确定隐藏层的数目，并确定每个隐藏层中神经细胞必须有多少？但遗憾的是，还没有一种确切的规则可用来计算这些。它们的开发又需要凭个人的“感觉”了。某些书上和文章中确实给过一些提纲性的东西,告诉你如何去决定隐藏神经细胞个数，但业内专家们的一致看法是：你只能把任何建议当作不可全信的东西，主要还要靠自己的不断尝试和失败中获得经验。但你通常会发现，你所遇到的大多数问题都只要用一个隐藏层就能解决。所以，本领的高低就在于如何为这一隐藏层确定最合适的神经细胞数目了。显然，个数是愈少愈好，因为我前面已经提及，数目少的神经细胞能够造就快速的网络。通常，为了确定出一个最优总数，我总是在隐藏层中采用不同数目的神经细胞来进行试验。我在本章所编写的神经网络工程的.

　　第一版本中一共使用了10个隐藏神经细胞（当然，我的这个数字也不一定是最好的<一笑>）。你应围绕这个数字的附近来做游戏，并观察隐藏层神经细胞的数目对扫雷机的演化会产生什么样的影响。不管怎样，理论已经够了，让我们拿一个具体程序来看看吧！你可以在本书所附光盘的Chapter7/Smart Sweepers v1.0文件夹中找到本章下面几页即将描述的所有程序的源码。

游戏编程中的人工智能技术
.

<神经网络入门>

.
(连载之四)

4.4 CNeuralNet.h（神经网络类的头文件）
　　在CNeuralNet.h 文件中，我们定义了人工神经细胞的结构、定义了人工神经细胞的层的结构、以及人工神经网络本身的结构。首先我们来考察人工神经细胞的结构。

4.4.1 SNeuron（神经细胞的结构）

　　这是很简单的结构。人工神经细胞的结构中必须有一个正整数来纪录它有多少个输入，还需要有一个向量std:vector来表示它的权重。请记住，神经细胞的每一个输入都要有一个对应的权重。

Struct SNeuron
{
     // 进入神经细胞的输入个数
     int m_NumInputs;

     // 为每一输入提供的权重
     vector<double> m_vecWeight;

     //构造函数
     SNeuron(int NumInputs);
};

以下就是SNeuron 结构体的构造函数形式:

SNeuron::SNeuron(int NumInputs): m_NumInputs(NumInputs+1)
(
     // 我们要为偏移值也附加一个权重，因此输入数目上要 +1
     for (int i=0; i<NumInputs+1; ++i)
     {
         // 把权重初始化为任意的值
        m_vecWeight.push_back(RandomClamped());
     }
}
　　由上可以看出，构造函数把送进神经细胞的输入数目NumInputs作为一个变元，并为每个输入创建一个随机的权重。所有权重值在-1和1之间。

        这是什么？ 我听见你在说。这里多出了一个权重！ 不错，我很高兴看到你能注意到这一点，因为这一个附加的权重十分重要。但要解释它为什么在那里，我必须更多地介绍一些数学知识。回忆一下你就能记得，激励值是所有输入*权重的乘积的总和，而神经细胞的输出值取决于这个激励值是否超过某个阀值(t)。这可以用如下的方程来表示:

w1x1 + w2x2 + w3x3 +...+ wnxn >= t

　　上式是使细胞输出为１的条件。因为网络的所有权重需要不断演化（进化），如果阀值的数据也能一起演化，那将是非常重要的。要实现这一点不难，你使用一个简单的诡计就可以让阀值变成权重的形式。从上面的方程两边各减去t，得:

w1x1 + w2x2 + w3x3 +...+ wnxn –t >= 0

这个方程可以再换用一种形式写出来，如下:

w1x1 + w2x2 + w3x3 +...+ wnxn + t *(–1) >= 0

　　到此，我希望你已能看出，阀值t为什么可以想像成为始终乘以输入为 -１的权重了。这个特殊的权重通常叫偏移（bias），这就是为什么每个神经细胞初始化时都要增加一个权重的理由。现在，当你演化一个网络时，你就不必再考虑阀值问题，因为它已被内建在权重向量中了。怎么样，想法不错吧？为了让你心中绝对敲定你所学到的新的人工神经细胞是什么样子，请再参看一下图12。

图12 带偏移的人工神经细胞。

4.4.2 SNeuronLayer（神经细胞层的结构）
　　神经细胞层SNeuronLayer的结构很简单；它定义了一个如图13中所示的由虚线包围的神经细胞SNeuron所组成的层。

　　　　　图13 一个神经细胞层。

　　以下就是层的定义的源代码，它应该不再需要任何进一步的解释:

struct SNeuronLayer
{
   　// 本层使用的神经细胞数目
　 int                 　　　 m_NumNeurons;

     // 神经细胞的层
　 vector<SNeuron>   m_vecNeurons;

　 SNeuronLayer(int NumNeurons, int NumInputsPerNeuron);
}；

4.4.3 CNeuralNet（神经网络类）

　　这是创建神经网络对象的类。让我们来通读一下这一个类的定义:

class CNeuralNet
{
private:
int m_NumInputs;

int m_NumOutputs;

int m_NumHiddenLayers;

int 　　m_NeuronsPerHiddenLyr;

// 为每一层（包括输出层）存放所有神经细胞的存储器
vector<SNeuronLayer> m_vecLayers;

　　所有private成员由其名称容易得到理解。需要由本类定义的就是输入的个数、输出的个数、隐藏层的数目、以及每个隐藏层中神经细胞的个数等几个参数。

public:

CNeuralNet();

该构造函数利用ini文件来初始化所有的Private成员变量，然后再调用CreateNet来创建网络。

// 由SNeurons创建网络
void CreateNet();

我过一会儿马上就会告诉你这个函数的代码。

// 从神经网络得到（读出）权重
vector<double> GetWeights()const;

　　由于网络的权重需要演化，所以必须创建一个方法来返回所有的权重。这些权重在网络中是以实数型向量形式表示的，我们将把这些实数表示的权重编码到一个基因组中。当我开始谈论本工程的遗传算法时，我将为您确切说明权重如何进行编码。

// 返回网络的权重的总数
int GetNumberOfWeights()const;

   // 用新的权重代替原有的权重
    void PutWeights(vector<double> &weights);

        这一函数所做的工作与函数GetWeights所做的正好相反。当遗传算法执行完一代时，新一代的权重必须重新插入神经网络。为我们完成这一任务的是PutWeight方法。

     // S形响应曲线
    inline double 　Sigmoid(double activation, double response);

    当已知一个神经细胞的所有输入*重量的乘积之和时，这一方法将它送入到S形的激励函数。

     // 根据一组输入，来计算输出
     vector<double> Update(vector<double> &inputs);

对此Update函数函数我马上就会来进行注释的。

}; // 类定义结束

4.4.3.1 CNeuralNet::CreateNet（创建神经网络的方法）

　　我在前面没有对CNeuralNet的2个方法加以注释，这是因为我要为你显示它们的更完整的代码。这2个方法的第一个是网络创建方法CreateNet。它的工作就是把由细胞层SNeuronLayers所收集的神经细胞SNeurons聚在一起来组成整个神经网络，代码为:

void CNeuralNet::CreateNet()
{
   // 创建网络的各个层
    if (m_NumHiddenLayers > 0)
     {
      //创建第一个隐藏层［译注］
     m_vecLayers.push_back(SNeuronLayer(m_NeuronsPerHiddenLyr,
                                           m_NumInputs));

    for( int i=O; i<m_NumHiddenLayers-l; ++i)
    {
        m_vecLayers.push_back(SNeuronLayer(m_NeuronsPerHiddenLyr，
                                                  m_NeuronsPerHiddenLyr));
      }

［译注］如果允许有多个隐藏层，则由接着for循环即能创建其余的隐藏层。
      // 创建输出层
      m_vecLayers.push_back(SNeuronLayer(m_NumOutput,m_NeuronsPerHiddenLyr));
   }

else //无隐藏层时，只需创建输出层
   {
      // 创建输出层
       m_vecLayers.push_back(SNeuronLayer(m_NumOutputs, m_NumInputs));
   }
}

4.4.3.2 CNeuralNet::Update（神经网络的更新方法）

　　Update函数(更新函数)称得上是神经网络的“主要劳动力”了。这里，输入网络的数据input是以双精度向量std::vector的数据格式传递进来的。Update函数通过对每个层的循环来处理输入*权重的相乘与求和，再以所得的和数作为激励值，通过S形函数来计算出每个神经细胞的输出，正如我们前面最后几页中所讨论的那样。Update函数返回的也是一个双精度向量std::vector，它对应的就是人工神经网络的所有输出。

请你自己花两分钟或差不多的时间来熟悉一下如下的Update函数的代码，这能使你正确理解我们继续要讲的其他内容:

vector<double> CNeuralNet::Update(vector<double> &inputs)
{
// 保存从每一层产生的输出
vector<double> outputs;

int cWeight = 0;

    // 首先检查输入的个数是否正确
    if (inputs.size() != m_NumInputs)
      {
        // 如果不正确，就返回一个空向量
          return outputs;
     }

     // 对每一层,...
     for (int i=0; i<m_NumHiddenLayers+1; ++i)
     {
       if (i>O)
         {
            inputs = outputs;
         }
   outputs.clear();

   cWeight = 0;

   // 对每个神经细胞,求输入*对应权重乘积之总和。并将总和抛给S形函数,以计算输出
   for (int j=0; j<m_vecLayers[i].m_NumNeurons; ++j)
        {
          double netinput = 0;

          int NumInputs = m_vecLayers[i].m_vecNeurons[j].m_NumInputs;

         // 对每一个权重
         for (int k=O; k<NumInputs-l; ++k)
         {
            // 计算权重*输入的乘积的总和。
            netinput += m_vecLayers[i].m_vecNeurons[j].m_vecWeight[k] *
     　   　　　　　      inputs[cWeight++];
         }

        // 加入偏移值
        netinput += m_vecLayers[i].m_vecNeurons[j].m_vecWeight[NumInputs-1] *
                    CParams::dBias;

　　别忘记每个神经细胞的权重向量的最后一个权重实际是偏移值，这我们已经说明过了，我们总是将它设置成为 –1的。我已经在ini文件中包含了偏移值，你可以围绕它来做文章，考察它对你创建的网络的功能有什么影响。不过，这个值通常是不应该改变的。

     // 每一层的输出，当我们产生了它们后，我们就要将它们保存起来。但用Σ累加在一起的
     // 激励总值首先要通过S形函数的过滤，才能得到输出
outputs.push_back(Sigmoid(netinput,CParams::dActivationResponse)); cWeight = 0:
    }
}

return outputs;
}

游戏编程中的人工智能技术
.

<神经网络入门>

.
(连载之五)

4.5 神经网络的编码（Encoding the Network）
　　在本书的开始几章中，你已经看到过怎样用各种各样的方法为遗传算法编码。但当时我并没有向你介绍过
一个用实数编码的具体例子，因为我知道我要留在这里向你介绍。我曾经讲到，为了设计一个前馈型神经网络，
编码是很容易的。我们从左到右读每一层神经细胞的权重，读完第一个隐藏层，再向上读它的下一层，把所读
到的数据依次保存到一个向量中，这样就实现了网络的编码。因此，如果我们有图14所示的网络，则它的权重
编码向量将为:

0.3, -O.8， -O.2， 0.6， O.1， -0.l， 0.4， 0.5

　　在这一网络中，为了简单，我没有把偏移值的权重包括进去。但在实际实现编码时，你必须包含偏移值这
个权重，否则你肯定无法获得你所需要的结果。

图14 为权重编码。

在此之前讲的事情你都懂了吗？好极了，那下面就让我们转来考虑，怎样用遗传算法来操纵已编码的基因吧。

4.6 遗传算法（The Genetic Algorithm）
        到此，所有的权重已经象二进制编码的基因组那样，形成了一个串，我们就可以象本书早先讨论过的那样
来应用遗传算法了。遗传算法（GA）是在扫雷机已被允许按照用户指定的帧数（为了某种缘故, 我下面更喜欢
将帧数称作滴答数，英文是ticks）运转后执行的。你可以在ini文件中找到这个滴答数（iNumTicks）的设置。
下面是基因组结构体的代码。这些对于你应该是十分面熟的东西了。

Struct SGenome
{
vector <double> 　 vecWeights;

double 　　　　　 dFitness;

SGenome():dFitness(0) {}

SGenome(vector <double> w, double f):vecWeights(w),dFitness(f){}

//重载'<'的排序方法
      friend bool operator<(const SGenome& lhs, const SGenome& rhs)
         {
     　      return (lhs.dFitness < rhs.dFitness);
         }
};

　　从上面的代码你可看出，这一SGenome结构和我们在本书所有其他地方见到的SGenome结构几乎完全一致，唯一的差别就是这里的染色体是一个双精度向量std::vector。因此，可以和通常一样来应用杂交操作和选择
操作。但突变操作则稍微有些不同，这里的权重值是用一个最大值为dMaxPerturbation的随机数来搔扰的。这一
参数dMaxPerturbation在ini文件中已作了声明。另外，作为浮点数遗传算法，突变率也被设定得更高些。在本工
程中，它被设成为0.1。

下面就是扫雷机工程遗传算法类中所见到的突变函数的形式:

void CGenAlg::Mutate(vector<double> &chromo)
{
// 遍历权重向量，按突变率将每一个权重进行突变
for (int i=0; i<chromo.size(); ++i)
{
     // 我们要骚扰这个权重吗？
     if (RandFloat() < m_dMutationRate)
     {
       // 为权重增加或减小一个小的数量
       chromo[i] += (RandomClamped() * CParams::dMaxPerturbatlon);
     }
}
}

　　如同以前的工程那样，我已为v1.0版本的Smart Minesweepers工程保留了一个非常简单的遗传算法。这样
就能给你留下许多余地，可让你利用以前学到的技术来改进它。就象大多数别的工程一样，v1.O版只用轮盘赌
方式选精英，并采用单点式杂交。

注意:
当程序运行时，权重可以被演化成为任意的大小，它们不受任何形式的限制。

4.7 扫雷机类（The CMinesweeper Class）
　　这一个类用来定义一个扫雷机。就象上一章描述的登月艇类一样，扫雷机类中有一个包含了扫雷机位置、
速度、以及如何转换方向等数据的纪录。类中还包含扫雷机的视线向量（look-at vector）；它的2个分量被用
来作为神经网络的2个输入。这是一个规范化的向量，它是在每一帧中根据扫雷机本身的转动角度计算出来的，
它指示了扫雷机当前是朝着哪一个方向，如图11所示。

下面就是扫雷机类CMinesweeper的声明:

class CMinesweeper
{
private:
// 扫雷机的神经网络
CNeuralNet m_ItsBrain;

     // 它在世界坐标里的位置
     SVector2D         m_vPosition;

     // 扫雷机面对的方向
     SVector2D          m_vLookAt;

// 它的旋转(surprise surprise)
double m_dRotation;

double m_dSpeed;

     // 根据ANN保存输出
     double         m_lTrack,
                    m_rTrack;

m_lTrack和m_rTrack根据网络保存当前帧的输出。
这些就是用来决定扫雷机的移动速率和转动角度的数值。

// 用于度量扫雷机适应性的分数
double 　　　 m_dFitness;

每当扫雷机找到一个地雷，它的适应性分数就要增加。

// 扫雷机画出来时的大小比例
double m_dScale;

// 扫雷机最邻近地雷的下标位置
int m_iClosestMine;

在控制器类CControl1er中，有一个属于所有地雷的成员向量std::vector。
而m_iClosestMine就是代表最靠近扫雷机的那个地雷在该向量中的位置的下标。

public:

CMinesweeper();

// 利用从扫雷机环境得到的信息来更新人工神经网
bool Update(vector<SVector2D> &mines);

    // 用来对扫雷机各个顶点进行变换，以便接着可以画它出来
    void WorldTransform(vector<SPoint> &sweeper);

    // 返回一个向量到最邻近的地雷
    5Vector2D GetClosestMine(vector<SVector2D> &objects);

    // 检查扫雷机看它是否已经发现地雷
    int        CheckForMine(vector<SVector2D> &mines, double size);

    void       Reset();

    // ----------------- 定义各种供访问用的函数
    SVector2D Position()const { return m_vPosition; }
    void       IncrementFitness(double val) { m_dFitness += val; }
    double     Fitness()const { return m_dFitness; }
    void       PutWeights(vector<double> &w) { m_ItsBrain.PutWeights(w); }
    int        GetNumberOfWeights()const
                              { return m_ItsBrain.GetNumberOfWeights(); }
};

4.7.1 The CMinesweeper::Update Function（扫雷机更新函数）

　　需要更详细地向你说明的CMinesweeper类的方法只有一个，这就是Update更新函数。该函数在每一帧中
都要被调用，以更新扫雷机神经网络。让我们考察这函数的肚子里有些什么货色:

bool CMinesweeper::Update(vector<SVector2D> &mines)

{
//这一向量用来存放神经网络所有的输入
vector<double> inputs;

//计算从扫雷机到与其最接近的地雷（2个点）之间的向量
SVector2D vClosestMine = GetClosestMine(mines);

//将该向量规范化
Vec2DNormalize(vClosestMine);

　　首先，该函数计算了扫雷机到与其最靠近的地雷之间的向量，然后使它规范化。（记住，向量规范化后它
的长度等于1。）但扫雷机的视线向量（look-at vector）这时不需要再作规范化，因为它的长度已经等于1了。
由于两个向量都有效地化成了同样的大小范围，我们就可以认为输入已经是标准化了，这我前面已讲过了。

     //加入扫雷机->最近地雷之间的向量
     Inputs.push_back(vClosestMine.x);
     Inputs.push_back(vCIosestMine.y);

     //加入扫雷机的视线向量
     Inputs.push_back(m_vLookAt.x);
     Inputs.push_back(m_vLookAt.y);

//更新大脑，并从网络得到输出
vector<double> output = m_ItsBrain.Update(inputs);

然后把视线向量，以及扫雷机与它最接近的地雷之间的向量，都输入到神经网络。函数CNeuralNet::Update利
用这些信息来更新扫雷机网络，并返回一个std::vector向量作为输出。

     //保证在输出的计算中没有发生错误
     if (output.size() < CParams::iNumOutputs)
      {
         return false;
      }

     // 把输出赋值到扫雷机的左、右轮轨
     m_lTrack = output[0];
     m_rTrack = output[1];

　　在更新神经网络时，当检测到确实没有错误时，程序把输出赋给m_lTrack和m_rTrack。这些值代表施加
到扫雷机左、右履带轮轨上的力。

// 计算驾驶的力
double RotForce = m_lTrack - m_rTrack;

     // 进行左转或右转
     Clamp(RotForce, -CParams::dMaxTurnRate, CParams::dMaxTurnRate);

    m_dSpeed = (m_lTrack + m_rTrack);

　　扫雷机车的转动力是利用施加到它左、右轮轨上的力之差来计算的。并规定，施加到左轨道上的力减去施
加到右轨道上的力，就得到扫雷机车辆的转动力。然后就把此力施加给扫雷机车，使它实行不超过ini文件所规
定的最大转动率的转动。而扫雷机车的行进速度不过就是它的左侧轮轨速度与它的右侧轮轨速度的和。既然我
们知道了扫雷机的转动力和速度，它的位置和偏转角度也就都能更新了。

     //更新扫雷机左右转向的角度
     m_dRotation += RotForce;

     // 更新视线角度
     m_vLookAt.x = -sin(m_dRotation);
     m_vLookAt.y = cos(m_dRotation);

// 更新它的位置
m_vPosition += (m_vLookAt* m_dSpeed);

     // 如果扫雷机到达窗体四周，则让它实行环绕，使它不至于离开窗体而消失
     If (m_vPosition.x > CParams::WindowWidth) m_vPosition.x = 0;
     If (m_vPosition.x < 0) m_vPosition.x = CParams::WindowWidth;
     If (m_vPosition.y > CParams::WindowHeight) m_vPosition.y = 0;
     If (m_vPosition.y < D) m_vPosition.y = CParams::WindowHeight;

　　为了使事情尽可能简单，我已让扫雷机在碰到窗体边框时就环绕折回(wrap)。采用这种方法程序就不再需
要做任何碰撞-响应方面的工作。环绕一块空地打转对我们人来说是一桩非常不可思议的动作，但对扫雷机，这
就像池塘中的鸭子。

Returen true;
}

4.8 CController Class（控制器类）
CController类是和一切都有联系的类。图15指出了其他的各个类和CController类的关系。
下面就是这个类的定义:

class CController
{
private:
// 基因组群体的动态存储器（一个向量）
vector<SGenome> m_vecThePopulation;

图15 minesweeper工程的程序流程图

    // 保存扫雷机的向量
    vector<CMinesweeper> m_vecSweepers;

    // 保存地雷的向量
    vector<SVector2D>   m_vecMines;

    // 指向遗传算法对象的指针
CGenAIg*          m_pGA;

int               m_NumSweepers;

int               m_NumMines;

// 神经网络中使用的权重值的总数
int m_NumWeightsInNN;

// 存放扫雷机形状各顶点的缓冲区
vector<SPoint> m_SweeperVB;

// 存放地雷形状各顶点的缓冲区
vector<SPoint> m_MineVB;

// 存放每一代的平均适应性分数，供绘图用
vector<double> m_vecAvFitness;

// 存放每一代的最高适应性分
vector<double> m_vecBestFitness;

// 我们使用的各种不同类型的画笔
HPEN              m_RedPen;
HPEN              m_BluePen;
HPEN              m_GreenPen;
HPEN              m_OldPen;

// 应用程序窗口的句柄
HWND m_hwndMain;

// 切换扫雷机程序运行的速度
    bool              m_bFastRender;

    // 每一代的帧数（滴答数）
    int               m_iTicks;

// 代的计数
int m_iGenerations;

// 窗体客户区的大小
int cxClient，cyClient;

// 本函数在运行过程中画出具有平均-，和最优适应性值的图
void PlotStats(HDC surface);

public:

CController(HWND hwndMain);

~CController();

void Render(HDC surface);

void WorldTransform(vector<SPoint> &VBuffer,
SVector2D vPos);

bool Update();

    // 几个公用的访问方法
    bool   FastRender() { return m_bFastRender; }
    void   FastRender(bool arg){ m_bFastRender = arg; }
    void   FastRenderToggle() { m_bFastRender = !m_bFastRender; }
};

当创建CController类的某个实例时，会有一系列的事情发生：

创建CMinesweeper对象。
统计神经网络中所使用的权重的总数，然后此数字即被利用来初始化遗传算法类的一个实例。
从遗传算法对象中随机提取染色体(权重)并(利用细心的脑外科手术)插入到扫雷机的经网络中。
创建了大量的地雷并被随机地散播到各地。
为绘图函数创建了所有需要用到的GDI画笔。
为扫雷机和地雷的形状创建了顶点缓冲区。

所有的一切现都已完成初始化，由此Update方法就能在每一帧中被调用来对扫雷机进行演化。

4.8.1 CController::Update Method（控制器的更新方法）

　　控制器更新方法CController::Update方法（或函数）在每一帧中都要被调用。当调用update函数时，函数
的前一半通过对所有扫雷机进行循环，如发现某一扫雷机找到了地雷，就update该扫雷机的适应性分数。由于m_vecThePopulation包含了所有基因组的拷贝，相关的适应性分数也要在这时进行调整。如果为完成一个代（generation）所需要的帧数均已通过，本方法就执行一个遗传算法的时代(epoch)来产生新一代的权重。这些
权重被用来代替扫雷机神经网络中原有的旧的权重，使扫雷机的每一个参数被重新设置，从而为进入新一generation做好准备。

bool CController::Update()
{
     // 扫雷机运行总数为CParams::iNumTicks次的循环。在此循环周期中，扫雷机的神经网络
     // 不断利用它周围特有的环境信息进行更新。而从神经网络得到的输出，使扫雷机实现所需的
     // 动作。如果扫雷机遇见了一个地雷，则它的适应性将相应地被更新，且同样地更新了它对应
     // 基因组的适应性。
     if (m_iTicks++ < CParams::iNumTicks)
       {
        for (int i=O; i<m_NumSweepers; ++i)
        {
        //更新神经网络和位置
          if (!m_vecSweepers[i].Update(m_vecMines))
           {
            //处理神经网络时出现了错误，显示错误后退出
             MessageBox(m_hwndMain, 'Wrong amount of NN inputs!",
              "Error", MB_OK);

             return false;
          }

        // 检查这一扫雷机是否已经发现地雷
         int GrabHit = m_vecSweepers[i].CheckForMine(m_vecMines，
                                                     CParams::dMineScale);

         if (GrabHit >= 0)
          {
            // 扫雷机已找到了地雷，所以要增加它的适应性分数
            m_vecSweepers[i].IncrementFitness();

           // 去掉被扫雷机找到的地雷，用在随机位置放置的一个新地雷来代替
            m_vecMines[GrabHit] = SVector2D(RandFloat() * cxClient，
                                          RandFloat() * cyClient);
          }

       // 更新基因组的适应性值
        m-vecThePopulation[i].dFitness = m_vecSweepers[i].Fitness();
      }
   }
   // 一个代已被完成了。
   // 进入运行遗传算法并用新的神经网络更新扫雷机的时期
   else
    {
     // 更新用在我们状态窗口中状态
     m_vecAvFitness.push_back(m_pGA->AverageFitness());
     m_vecBestFitness.push_back(m_pGA->BestFitness());

     // 增加代计数器的值
     ++m_iGenerations;

     // 将帧计数器复位
     m_iTicks = 0;

// 运行GA创建一个新的群体
m-vecThePopulation = m_pGA->Epoch(m_vecThePopulation);

     // 在各扫雷机中从新插入新的（有希望）被改进的大脑
     // 并将它们的位置进行复位，等
     for(int i=O; i<m_NumSweepers; ++i)
      {m_vecSweepers[i].m_ItsBrain.PutWeights(m_vecThePopulation[i].vecWeights);

       m_vecSweepers[i].Reset();
      }
    }
returen true;
}

概括起来，程序为每一世代做的工作是:

     l．为所有扫雷机和为iNumTicks个帧组织循环，调用Update函数
       　并根据情况增加扫雷机适应值的得分。
     2．从扫雷机神经网络提取权重向量。
     3．用遗传算法去演化出一个新的网络权重群体。
     4．把新的权重插入到扫雷机神经网络。
　5．转到第1步进行重复，直到获得理想性能时为止。

最后，表3列出了Smart Sweepers工程 v1.0版所有缺省参数的设置值。

表3 Smart Sweepers v1.0工程的缺省设置

神经网络
参数	设置值
输入数目	4
输出数目	2
隐藏层数目	1
隐藏层神经元数目	10
激励响应	1

遗传算法
参数	设置值
群体大小	30
选择类型	旋转轮
杂交类型	单点
杂交率	0.7
突变率	0.1
精英设置（on/off）	On
精英数目（N/copies）	4/1

总体特性
参数	设置值
每时代的帧数	2000

4.9 运行此程序 (Running the Program)

　　当你运行程序时，“F”键用来切换2种不同的显示状态，一种是显示扫雷机怎样学习寻找地雷，一种是
示在运行期中产生的最优的与平均的适当性分数的统计图表。当显示图表时，程序将会加速运行。

游戏编程中的人工智能技术
.

<神经网络入门>

.
(连载之六)

4.10 功能的两个改进 (A Couple of Improvements)

　　尽管扫雷机学习寻找地雷的本领十分不错，这里我仍有两件事情要告诉你，它们能进一步改进扫雷机的性能。

4.10.1 改进一（Improvement Number One）

　　首先，单点crossover算子留下了许多可改进的余地。按照它的规定，算子是沿着基因组长度任意地方切开的，这样常有可能使个别神经细胞的基因组在权重的中间被一刀两段地分开。

　　为清楚起见，我们来考察图16的权重。这是我们以前在说明基因组如何编码时看过的一个简单网络。在这
里，杂交算子可以沿向量长度的任意一处切开，这样，就会有极大几率在某个神经细胞（如第二个）的权重中
间断开，也就是说，在权重0.6和-0.1之间某处切开。这可能不会是我们想要的，因为，如果我们把神经细胞作
为一个完整的单元来看待，则它在此以前所获得的任何改良就要被骚扰了。事实上，这样的杂交操作有可能非
常非常象断裂性突变（disruptive mutation）操作所起的作用。

图16 简单的网络

　　与此针锋相对，我已创建了另一种类型的杂交运算，它只在神经细胞的边界上进行切开。在图16的例子中，
就是在第3、4或第6、7的两个基因之间切开，如小箭头所示。为了实现这一算法，我已在CNeuralNet类中补
充了另一个切割方法: CalculateSplitPoints。这一方法创建了一个用于保存所有网络权重边界的矢量，它的代
码如下:

vector<int> CNeuralNet::CalculateSplitPoints() const
{
   vector<int> SplitPoints;

   int WeightCounter = 0;

   // 对每一层
   for (int i=O; i<m_NumHiddenLayers + 1; ++i)
    {
     // 对每一个神经细胞
     for (int j=O; j<m_vecLayers[i].m_NumNeurons; ++j)
　　{
       　 // 对每一个权重
       　 for (int k=O; k<m_vecLayers[i].m_vecNeurons[j].m_NumInputs; ++k)
        　 {
           　 ++WeightCounter;
        　 }

        SplitPoints.push_back(WeightCounter - 1);
      }
   }

return SplitPoints;
}

　　这一方法是CController类构造函数在创建扫雷机并把断裂点向量传递给遗传算法类时调用的。它们被存储
在一个名叫m_vecSplitPoints的std::vector向量中。然后遗传算法就利用这些断裂点来实现两点杂交操作，其代
码如下:

void CGenAlg::CrossoverAtSplits(const vector<double> &mum,
                                   const vector<double> &dad,
                                   vector<double>         &babyl,
                                   vector<double>         &baby2)
{
   // 如果超过了杂交率，就不再进行杂交，把2个上代作为2个子代输出
   // 如果2个上辈相同，也把它们作为2个下辈输出
   if ( (RandFloat() > m_dCrossoverRate) || (mum == dad))
     {
      baby1 = mum;
      baby2 = dad;

return;
}

   // 确定杂交的2个断裂点
   int index1 = RandInt(0, m_vecSplitPoints.size()-2);
   int index2 = RandInt(Index1, m_vecSplitPoints.size()-1);

int cp1 = m_vecSplitPoints[Index1];
int cp2 = m_vecSplitPoints[Index2];

   // 创建子代

for (int i=0; i<mum.size(); ++i)
   {
     if ( (i<cp1) || (i>=cp2) )
       {
           // 如果在杂交点外，保持原来的基因
           babyl.push_back(mum[i]);
           baby2.push_back(dad[i]);
       }

    else
       {
           // 把中间段进行交换
           baby1.push_back(dad[1]);
           baby2.push_back(mum[1]);
       }
   }

return;
}

　　根据我的经验，我已发现，在进行杂交时，把神经细胞当作一个不可分割的单位，比在染色体长度上任意
一点分裂基因组，能得到更好的结果。

4.10.2 改进二（Improvement Number Two）

　　我想和你讨论的另一个性能改进，是用另一种方式来观察网络的那些输入。在你已看到的例子中，我们为
网络使用了4个输入参数: ２个用于表示扫雷机视线方向的向量,另外２个用来指示扫雷机与其最靠近的地雷的方
向的向量。然而，有一种办法，可以把这些参数的个数减少到只剩下一个。

　　其实你想一想就可知道，扫雷机为了确定地雷的位置，只要知道从它当前的位置和朝向出发，需要向左或
向右转动多大的一个角度这一简单的信息就够了(如果你已经考虑到了这一点，那我在这里要顺便向您道贺了)。
由于我们已经计算了扫雷机的视线向量和从它到最邻近地雷的向量，再来计算它们之间的角度(θ)应是一件极为
简单的事情 – 这就是这两个向量的点积，这我们在第6章“使登陆月球容易一点”中已讨论过。见图17。

图17 计算到最邻近地雷的转动角度。

　　不幸的是，点积仅仅给出角度的大小; 它不能指示这一角度是在扫雷机的那一侧。因此，我已写了另一个向
量函数返回一个向量相对于另一个向量的正负号。该函数的原型如下所示:

　inline int Vec2DSign(SVector2D &v1,SVector2D &v2);

　　如果你对它的机理感兴趣，你可以在文件SVector2D.h中找到它的源码。但它的基本点就是: 如果v1至v2是
按顺时针方向转的，则函数返回 +1；如果v1至v2是按逆时针方向转，则函数返回 -1。

　　把点积和Vec2Dsign二者联合起来，就能把输入的精华提纯出来，使网络只需接受一个输入就行了。下面
就是新的CMinesweeper::Update函数有关段落的代码形式:

// 计算到最邻近地雷的向量
SVector2D vClosestMine = GetClosestMine(mines);

// 将它规范化
　Vec2DNormalize(vClosestMine);

　 // 计算扫雷机视线向量和它到最邻近地雷的向量的点积。它给出了我们要面对
　 // 最邻近地雷所需转动的角度
double dot = Vec2DDot(m_vLookAt, vClosestMine);

// 计算正负号
int sign = Vec2DSign(m_vLookAt, vClosestMine);

Inputs.push_back(dot*sign);

　　运行一下光盘Chapter7/Smart Sweepers v1.1目录下的可执行程序executable，你就知道经过以上２个改
进，能为演化过程提速多少。

　　需要注意的一桩重要事情是，带有4个输入的网络要花很长时间进行演化，因为它必须在各输入数据之间找
出更多的关系才能确定它应如何行动。事实上，网络实际就是在学习怎么做点积并确定它的正负极性。因此，当
你设计自己的网络时，你应仔细权衡一下，是由你自己预先来计算许多输入数据好呢(它将使CPU负担增加，但
导致进化时间加快)还是让网络来找输入数据之间的复杂关系好(它将使演化时间变长，但能使CPU减少紧张)？

5 结束语（last words）

　　我希望你已享受到了你第一次攻入神经网络这一奇妙世界的快乐。我打赌你一定在为如此简单就能使用它
们而感到惊讶吧，对吗？我想我是猜对了。

　　在下面几章里我将要向你介绍更多的知识，告诉你一些新的训练手段和演绎神经网络结构的更多的方法。
但首先请你利用本章下面的提示去玩一下游戏是有意义的。

6 练习题 (Stuff to Try)

　　1。在v1.0中，不用look-at向量作为输入，而改用旋转角度θ作为输入，由此就可以使网络的输入个数减少
成为1个。请问这对神经网络的演化有什么影响？你对此的看法怎样？

　　2。试以扫雷机的位置（x1,y1）、和扫雷机最接近的地雷的位置（x2,y2）、以及扫雷机前进方向的向量
（x3,y3）等6个参数作为输入，来设计一个神经网络，使它仍然能够演化去寻找地雷。

　　3。改变激励函数的响应。试用O.1 - O.3 之间的低端值，它将产生和阶跃函数非常相像的一种激励函数。
然后再试用高端值，它将给出较为平坦的响应曲线。考察这些改变对演化进程具有什么影响？

　　4。改变神经网络的适应性函数，使得扫雷机不是去扫除地雷，而是要演化它，使它能避开地雷。

　　5。理一理清楚有关遗传算法的各种不同设置和运算中使你感到模糊的东西！

　　6。加入其他的对象类型，比如人。给出一个新环境来演化扫雷机，使它能避开人，但照样能扫除地雷。
（这可能没有你想象那么容易！)

return outputs;
      }

     // 对每一层,...
     for (int i=0; i<m_NumHiddenLayers+1; ++i)
     {
       if (i>O)
         {
            inputs = outputs;
         }
    outputs.clear();

    cWeight = 0;

    // 对每个神经细胞,求输入*对应权重乘积之总和。并将总和抛给S形函数,以计算输出
   for (int j=0; j<m_vecLayers[i].m_NumNeurons; ++j)
        {
          double netinput = 0;

          int NumInputs = m_vecLayers[i].m_vecNeurons[j].m_NumInputs;

         // 对每一个权重
         for (int k=O; k<NumInputs-l; ++k)
         {
            // 计算权重*输入的乘积的总和。
            netinput += m_vecLayers[i].m_vecNeurons[j].m_vecWeight[k] *
     　   　　　　　      inputs[cWeight++];
         }

        // 加入偏移值
        netinput += m_vecLayers[i].m_vecNeurons[j].m_vecWeight[NumInputs-1] *
                    CParams::dBias;

return outputs;
}

游戏编程中的人工智能技术
.
<神经网络入门>
.
(连载之五)
4.5 神经网络的编码（Encoding the Network）
　　在本书的开始几章中，你已经看到过怎样用各种各样的方法为遗传算法编码。但当时我并没有向你介绍过
一个用实数编码的具体例子，因为我知道我要留在这里向你介绍。我曾经讲到，为了设计一个前馈型神经网络，
编码是很容易的。我们从左到右读每一层神经细胞的权重，读完第一个隐藏层，再向上读它的下一层，把所读
到的数据依次保存到一个向量中，这样就实现了网络的编码。因此，如果我们有图14所示的网络，则它的权重
编码向量将为:

0.3, -O.8， -O.2， 0.6， O.1， -0.l， 0.4， 0.5

图14 为权重编码。

在此之前讲的事情你都懂了吗？好极了，那下面就让我们转来考虑，怎样用遗传算法来操纵已编码的基因吧。

4.6 遗传算法（The Genetic Algorithm）
        到此，所有的权重已经象二进制编码的基因组那样，形成了一个串，我们就可以象本书早先讨论过的那样
来应用遗传算法了。遗传算法（GA）是在扫雷机已被允许按照用户指定的帧数（为了某种缘故, 我下面更喜欢
将帧数称作滴答数，英文是ticks）运转后执行的。你可以在ini文件中找到这个滴答数（iNumTicks）的设置。
下面是基因组结构体的代码。这些对于你应该是十分面熟的东西了。

Struct SGenome
{
vector <double> 　 vecWeights;

double 　　　　　 dFitness;

SGenome():dFitness(0) {}

SGenome(vector <double> w, double f):vecWeights(w),dFitness(f){}

//重载'<'的排序方法
      friend bool operator<(const SGenome& lhs, const SGenome& rhs)
         {
     　      return (lhs.dFitness < rhs.dFitness);
         }
};

下面就是扫雷机工程遗传算法类中所见到的突变函数的形式:

注意:
当程序运行时，权重可以被演化成为任意的大小，它们不受任何形式的限制。

4.7 扫雷机类（The CMinesweeper Class）
　　这一个类用来定义一个扫雷机。就象上一章描述的登月艇类一样，扫雷机类中有一个包含了扫雷机位置、
速度、以及如何转换方向等数据的纪录。类中还包含扫雷机的视线向量（look-at vector）；它的2个分量被用
来作为神经网络的2个输入。这是一个规范化的向量，它是在每一帧中根据扫雷机本身的转动角度计算出来的，
它指示了扫雷机当前是朝着哪一个方向，如图11所示。

下面就是扫雷机类CMinesweeper的声明:

class CMinesweeper
{
private:
// 扫雷机的神经网络
CNeuralNet m_ItsBrain;

// 它在世界坐标里的位置
SVector2D m_vPosition;

// 扫雷机面对的方向
SVector2D m_vLookAt;

// 它的旋转(surprise surprise)
double m_dRotation;

double m_dSpeed;

     // 根据ANN保存输出
     double         m_lTrack,
                    m_rTrack;

m_lTrack和m_rTrack根据网络保存当前帧的输出。
这些就是用来决定扫雷机的移动速率和转动角度的数值。

// 用于度量扫雷机适应性的分数
double 　　　 m_dFitness;

每当扫雷机找到一个地雷，它的适应性分数就要增加。

// 扫雷机画出来时的大小比例
double m_dScale;

// 扫雷机最邻近地雷的下标位置
int m_iClosestMine;

在控制器类CControl1er中，有一个属于所有地雷的成员向量std::vector。
而m_iClosestMine就是代表最靠近扫雷机的那个地雷在该向量中的位置的下标。

public:

CMinesweeper();

// 利用从扫雷机环境得到的信息来更新人工神经网
bool Update(vector<SVector2D> &mines);

// 用来对扫雷机各个顶点进行变换，以便接着可以画它出来
void WorldTransform(vector<SPoint> &sweeper);

// 返回一个向量到最邻近的地雷
5Vector2D GetClosestMine(vector<SVector2D> &objects);

    // 检查扫雷机看它是否已经发现地雷
    int        CheckForMine(vector<SVector2D> &mines, double size);

    void       Reset();

4.7.1 The CMinesweeper::Update Function（扫雷机更新函数）

bool CMinesweeper::Update(vector<SVector2D> &mines)

{
//这一向量用来存放神经网络所有的输入
vector<double> inputs;

//计算从扫雷机到与其最接近的地雷（2个点）之间的向量
SVector2D vClosestMine = GetClosestMine(mines);

//将该向量规范化
Vec2DNormalize(vClosestMine);

     //加入扫雷机的视线向量
     Inputs.push_back(m_vLookAt.x);
     Inputs.push_back(m_vLookAt.y);

//更新大脑，并从网络得到输出
vector<double> output = m_ItsBrain.Update(inputs);

     //保证在输出的计算中没有发生错误
     if (output.size() < CParams::iNumOutputs)
      {
         return false;
      }

     // 把输出赋值到扫雷机的左、右轮轨
     m_lTrack = output[0];
     m_rTrack = output[1];

　　在更新神经网络时，当检测到确实没有错误时，程序把输出赋给m_lTrack和m_rTrack。这些值代表施加
到扫雷机左、右履带轮轨上的力。

// 计算驾驶的力
double RotForce = m_lTrack - m_rTrack;

     // 进行左转或右转
     Clamp(RotForce, -CParams::dMaxTurnRate, CParams::dMaxTurnRate);

     m_dSpeed = (m_lTrack + m_rTrack);

　　扫雷机车的转动力是利用施加到它左、右轮轨上的力之差来计算的。并规定，施加到左轨道上的力减去施
加到右轨道上的力，就得到扫雷机车辆的转动力。然后就把此力施加给扫雷机车，使它实行不超过ini文件所规
定的最大转动率的转动。而扫雷机车的行进速度不过就是它的左侧轮轨速度与它的右侧轮轨速度的和。既然我
们知道了扫雷机的转动力和速度，它的位置和偏转角度也就都能更新了。

     //更新扫雷机左右转向的角度
     m_dRotation += RotForce;

     // 更新视线角度
     m_vLookAt.x = -sin(m_dRotation);
     m_vLookAt.y = cos(m_dRotation);

// 更新它的位置
m_vPosition += (m_vLookAt* m_dSpeed);

Returen true;
}

4.8 CController Class（控制器类）
CController类是和一切都有联系的类。图15指出了其他的各个类和CController类的关系。
下面就是这个类的定义:

class CController
{
private:
// 基因组群体的动态存储器（一个向量）
vector<SGenome> m_vecThePopulation;

图15 minesweeper工程的程序流程图

    // 保存扫雷机的向量
    vector<CMinesweeper> m_vecSweepers;

    // 保存地雷的向量
    vector<SVector2D>   m_vecMines;

    // 指向遗传算法对象的指针
    CGenAIg*          m_pGA;

    int               m_NumSweepers;

    int               m_NumMines;

// 神经网络中使用的权重值的总数
int m_NumWeightsInNN;

// 存放扫雷机形状各顶点的缓冲区
vector<SPoint> m_SweeperVB;

// 存放地雷形状各顶点的缓冲区
vector<SPoint> m_MineVB;

    // 存放每一代的平均适应性分数，供绘图用
    vector<double>    m_vecAvFitness;

    // 存放每一代的最高适应性分
    vector<double>    m_vecBestFitness;

    // 我们使用的各种不同类型的画笔
    HPEN              m_RedPen;
    HPEN              m_BluePen;
    HPEN              m_GreenPen;
    HPEN              m_OldPen;

// 应用程序窗口的句柄
HWND m_hwndMain;

   // 切换扫雷机程序运行的速度
    bool              m_bFastRender;

    // 每一代的帧数（滴答数）
    int               m_iTicks;

// 代的计数
int m_iGenerations;

// 窗体客户区的大小
int cxClient，cyClient;

// 本函数在运行过程中画出具有平均-，和最优适应性值的图
void PlotStats(HDC surface);

public:

CController(HWND hwndMain);

~CController();

void Render(HDC surface);

void WorldTransform(vector<SPoint> &VBuffer,
SVector2D vPos);

bool Update();

当创建CController类的某个实例时，会有一系列的事情发生：

创建CMinesweeper对象。
统计神经网络中所使用的权重的总数，然后此数字即被利用来初始化遗传算法类的一个实例。
从遗传算法对象中随机提取染色体(权重)并(利用细心的脑外科手术)插入到扫雷机的经网络中。
创建了大量的地雷并被随机地散播到各地。
为绘图函数创建了所有需要用到的GDI画笔。
为扫雷机和地雷的形状创建了顶点缓冲区。

所有的一切现都已完成初始化，由此Update方法就能在每一帧中被调用来对扫雷机进行演化。

4.8.1 CController::Update Method（控制器的更新方法）

　　控制器更新方法CController::Update方法（或函数）在每一帧中都要被调用。当调用update函数时，函数
的前一半通过对所有扫雷机进行循环，如发现某一扫雷机找到了地雷，就update该扫雷机的适应性分数。由于m_vecThePopulation包含了所有基因组的拷贝，相关的适应性分数也要在这时进行调整。如果为完成一个代（generation）所需要的帧数均已通过，本方法就执行一个遗传算法的时代(epoch)来产生新一代的权重。这些
权重被用来代替扫雷机神经网络中原有的旧的权重，使扫雷机的每一个参数被重新设置，从而为进入新一generation做好准备。

bool CController::Update()
{
     // 扫雷机运行总数为CParams::iNumTicks次的循环。在此循环周期中，扫雷机的神经网络
     // 不断利用它周围特有的环境信息进行更新。而从神经网络得到的输出，使扫雷机实现所需的
     // 动作。如果扫雷机遇见了一个地雷，则它的适应性将相应地被更新，且同样地更新了它对应
     // 基因组的适应性。
     if (m_iTicks++ < CParams::iNumTicks)
       {
        for (int i=O; i<m_NumSweepers; ++i)
        {
        //更新神经网络和位置
          if (!m_vecSweepers[i].Update(m_vecMines))
           {
            //处理神经网络时出现了错误，显示错误后退出
             MessageBox(m_hwndMain, 'Wrong amount of NN inputs!",
               "Error", MB_OK);

             return false;
           }

         // 检查这一扫雷机是否已经发现地雷
         int GrabHit = m_vecSweepers[i].CheckForMine(m_vecMines，
                                                     CParams::dMineScale);

         if (GrabHit >= 0)
          {
            // 扫雷机已找到了地雷，所以要增加它的适应性分数
            m_vecSweepers[i].IncrementFitness();

     // 增加代计数器的值
     ++m_iGenerations;

     // 将帧计数器复位
     m_iTicks = 0;

// 运行GA创建一个新的群体
m-vecThePopulation = m_pGA->Epoch(m_vecThePopulation);

       m_vecSweepers[i].Reset();
      }
    }
returen true;
}

概括起来，程序为每一世代做的工作是:

表3 Smart Sweepers v1.0工程的缺省设置

神经网络

参数
设置值

输入数目
4

输出数目
2

隐藏层数目
1

隐藏层神经元数目
10

激励响应
1

遗传算法

参数
设置值

群体大小
30

选择类型
旋转轮

杂交类型
单点

杂交率
0.7

突变率
0.1

精英设置（on/off）
On

精英数目（N/copies）
4/1

总体特性

参数
设置值

每时代的帧数
2000

4.9 运行此程序 (Running the Program)

　　当你运行程序时，“F”键用来切换2种不同的显示状态，一种是显示扫雷机怎样学习寻找地雷，一种是
示在运行期中产生的最优的与平均的适当性分数的统计图表。当显示图表时，程序将会加速运行。

游戏编程中的人工智能技术
.
<神经网络入门>
.
(连载之六)
4.10 功能的两个改进 (A Couple of Improvements)

　　尽管扫雷机学习寻找地雷的本领十分不错，这里我仍有两件事情要告诉你，它们能进一步改进扫雷机的性能。

4.10.1 改进一（Improvement Number One）

　　首先，单点crossover算子留下了许多可改进的余地。按照它的规定，算子是沿着基因组长度任意地方切开的，这样常有可能使个别神经细胞的基因组在权重的中间被一刀两段地分开。

图16 简单的网络

        SplitPoints.push_back(WeightCounter - 1);
      }
   }

return SplitPoints;
}

return;
}

   // 确定杂交的2个断裂点
   int index1 = RandInt(0, m_vecSplitPoints.size()-2);
   int index2 = RandInt(Index1, m_vecSplitPoints.size()-1);

int cp1 = m_vecSplitPoints[Index1];
int cp2 = m_vecSplitPoints[Index2];

    else
       {
           // 把中间段进行交换
           baby1.push_back(dad[1]);
           baby2.push_back(mum[1]);
       }
   }

return;
}

　　根据我的经验，我已发现，在进行杂交时，把神经细胞当作一个不可分割的单位，比在染色体长度上任意
一点分裂基因组，能得到更好的结果。

4.10.2 改进二（Improvement Number Two）

图17 计算到最邻近地雷的转动角度。

　inline int Vec2DSign(SVector2D &v1,SVector2D &v2);

　　如果你对它的机理感兴趣，你可以在文件SVector2D.h中找到它的源码。但它的基本点就是: 如果v1至v2是
按顺时针方向转的，则函数返回 +1；如果v1至v2是按逆时针方向转，则函数返回 -1。

　　把点积和Vec2Dsign二者联合起来，就能把输入的精华提纯出来，使网络只需接受一个输入就行了。下面
就是新的CMinesweeper::Update函数有关段落的代码形式:

// 计算到最邻近地雷的向量
SVector2D vClosestMine = GetClosestMine(mines);

// 计算正负号
int sign = Vec2DSign(m_vLookAt, vClosestMine);

Inputs.push_back(dot*sign);

　　运行一下光盘Chapter7/Smart Sweepers v1.1目录下的可执行程序executable，你就知道经过以上２个改
进，能为演化过程提速多少。

　　需要注意的一桩重要事情是，带有4个输入的网络要花很长时间进行演化，因为它必须在各输入数据之间找
出更多的关系才能确定它应如何行动。事实上，网络实际就是在学习怎么做点积并确定它的正负极性。因此，当
你设计自己的网络时，你应仔细权衡一下，是由你自己预先来计算许多输入数据好呢(它将使CPU负担增加，但
导致进化时间加快)还是让网络来找输入数据之间的复杂关系好(它将使演化时间变长，但能使CPU减少紧张)？

5 结束语（last words）

　　我希望你已享受到了你第一次攻入神经网络这一奇妙世界的快乐。我打赌你一定在为如此简单就能使用它
们而感到惊讶吧，对吗？我想我是猜对了。

　　在下面几章里我将要向你介绍更多的知识，告诉你一些新的训练手段和演绎神经网络结构的更多的方法。
但首先请你利用本章下面的提示去玩一下游戏是有意义的。

6 练习题 (Stuff to Try)

　　1。在v1.0中，不用look-at向量作为输入，而改用旋转角度θ作为输入，由此就可以使网络的输入个数减少
成为1个。请问这对神经网络的演化有什么影响？你对此的看法怎样？

　　2。试以扫雷机的位置（x1,y1）、和扫雷机最接近的地雷的位置（x2,y2）、以及扫雷机前进方向的向量
（x3,y3）等6个参数作为输入，来设计一个神经网络，使它仍然能够演化去寻找地雷。

　　3。改变激励函数的响应。试用O.1 - O.3 之间的低端值，它将产生和阶跃函数非常相像的一种激励函数。
然后再试用高端值，它将给出较为平坦的响应曲线。考察这些改变对演化进程具有什么影响？

　　4。改变神经网络的适应性函数，使得扫雷机不是去扫除地雷，而是要演化它，使它能避开地雷。

　　5。理一理清楚有关遗传算法的各种不同设置和运算中使你感到模糊的东西！

　　6。加入其他的对象类型，比如人。给出一个新环境来演化扫雷机，使它能避开人，但照样能扫除地雷。
（这可能没有你想象那么容易！)

本文来自CSDN博客，转载请标明出处：http://blog.csdn.net/starxu85/archive/2008/10/25/3143533.aspx

你可能感兴趣的:(算法,工作,网络,vector,语言,generation)

eNSP-DHCP服务 2022级计算机网络一班何宏超网络服务器 linux
DHCP：动态主机配置协议DHCP（DynamicHostConfigurationProtocol，动态主机配置协议）DHCP用途：用来分配IP地址等网络参数一、基于全局地址池的DHCP服务器1、在R1上配置G0/0/1的IP地址[R1]intg0/0/1[R1-GigabitEthernet0/0/1]ipadd192.168.100.254242、创建全局地址池[R1]ippoolpool1
深度剖析C语言数组和指针的区别（非常详细） xiecoding.cn c语言算法开发语言 c++青少年编程 C语言入门数据结构
对于刚刚接触C语言指针的初学者，很容易认为数组和指针是等价的，数组名表示数组的首地址。不幸的是，这是一种非常危险的想法，并不完全正确。耐心看完本文，我保证会颠覆你的认知。数组和指针绝不等价数组和指针不等价的一个典型案例就是求数组的长度，这个时候只能使用数组名，不能使用数组指针，前面我们已经强调过了，这里不妨再来演示一下：#includeintmain(){inta[6]={0,1,2,3,4,5}
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
计算机端口的作用 U_p_ 计算机网络知识运维服务器 windows linux
计算机端口的作用在计算机网络中，端口（Port）的作用是用于区分不同的网络服务和应用进程，使得计算机能够在同一个IP地址上同时运行多个网络服务。1.端口的基本概念端口是软件层面的概念，用于标识同一设备上的不同网络服务。端口号是0~65535之间的整数，由操作系统管理。端口号通常与IP地址结合使用，形成IP:端口（如192.168.1.1:80）来标识特定的网络服务。2.端口的分类端口号范围：0-6
977.有序数组的平方 U_p_ C++算法 leetcode 职场和发展
写法1.classSolution{public:vectorsortedSquares(vector&A){intk=A.size()-1;vectorresult(A.size(),0);for(inti=0,j=A.size()-1;iresult(A.size(),0);`初始化一个大小与输入数组`A`相同且所有元素都是0的数组`result`，这样做有几个理由：1.**安全性**：通过初
医图论文 CVPR‘24 | 适应医学图像中泛化异常检测的视觉-语言模型小白学视觉医学图像处理论文解读语言模型人工智能计算机视觉医学图像顶会医学图像处理 CVPR 论文解读
论文信息题目：AdaptingVisual-LanguageModelsforGeneralizableAnomalyDetectioninMedicalImages适应医学图像中泛化异常检测的视觉-语言模型作者：ChaoqinHuang，AofanJiang，JinghaoFeng，YaZhang，XinchaoWang，YanfengWang源码：https://github.com/Medi
深入理解 TypeScript 中的迭代器（Iterators）与生成器（Generators）念九_ysl typescript 前端 typescript
一、为什么需要迭代协议？在现代JavaScript/TypeScript开发中，我们经常需要处理各种集合型数据：数组、Map、Set甚至是自定义数据结构。ES6引入的迭代协议（IterationProtocols）正是为了解决统一遍历机制的问题。通过迭代器模式，我们可以：为不同的数据结构提供统一的访问接口实现惰性计算（LazyEvaluation）支持现代语言特性（for...of,扩展运算符等）
【C#语言】C#中的同步与异步编程：原理、示例与最佳实践 JosieBook #C#语言 c#开发语言同步异步
文章目录⭐前言⭐一、同步编程：简单但低效的线性执行代码示例执行流程示意图同步编程特点⭐二、异步编程：非阻塞的高效执行代码示例执行流程示意图异步编程核心机制适用场景⭐三、并行异步编程：最大化性能代码示例执行流程示意图并行异步优势⭐四、同步vs异步vs并行异步：对比总结⭐五、实际开发中的选择建议何时用同步？何时用异步？何时用并行异步？⭐总结标题详情作者JosieBook头衔CSDN博客专家资格、阿里云
「TCP/IP」图解TCP的通信机制肥肥技术宅 java tcp/ip 网络网络协议
TCP（TransmissionControlProtocol）是传输控制协议，其作用于传输层，是一种提供了面向连接通信服务的协议看TCP的英文全称就知道，其主要作用就是传输、控制，传输的是数据，控制的是在传输过程中丢包后的重发、分包乱序后的有序重组、控制数据传输的速率防止网络拥塞等这也是我们口中一直说的TCP是一种可靠的传输协议的原因。本文就将对TCP的作用过程以及一些机制进行讲解TCP的通信机
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
思途CMS高并发、高性能、高可用架构设计 php
一、整体架构概述思途CMS采用分层架构设计，整体架构分为客户层、接入层、站点层、数据存储层和缓存层。各层之间通过松耦合的方式协同工作，确保系统在高并发场景下的高性能和高可用性。通过分布式部署、负载均衡、多级缓存等技术手段，思途CMS能够有效应对大规模用户访问，保障系统的稳定性和响应速度。二、各层技术特点及实现方式客户层1.1CDN加速思途CMS支持与主流CDN服务商（如阿里云CDN、腾讯云CDN等
创建在线工具来测量 PDF图纸程序员
在线处理PDF文件时，能够直接在浏览器中测量尺寸和内容可以显著提高工作效率。本指南将引导您完成使用ComPDFKit的WebSDK构建在线PDF测量工具的简单过程。先决条件首先，您需要访问我们的“WebSDK指南”页面来检查您是否满足这些要求：Node.js的最新稳定版本。与npm兼容的包管理器。应用许可证密钥如何获取30天免费许可证ComPDFKit为每个人提供30天免费许可证密钥，以测试他们的
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
css知识点总结吃橘子的Crow css html 前端
1.css概述css是CascadingStyleSheets(级联样式表)css是一种样式表语言,用于为HTML文档控制外观,定义布局.可将页面的内容与表现形式分离,页面内容存放在HTML文档中,而用于定义白线形式的css在一个.css文件中或HTML文档的某一部分HTML如同网页的骨架,css如同修饰骨架的装饰品(样式)2.基本语法1.行内样式表行内样式表,又称内联样式、行间样式、内嵌样式。是
工业相机的主要参数及计算 51camera 工业相机
工业相机是机器视觉系统中的关键组件，其本质是将光信号转变为有序的电信号，进而实现数字图像的获取，广泛应用于工业生产、检测、测量等领域。其成像原理与小孔成像类似，但更为复杂。当被摄物体反射的光线通过工业镜头折射后，会投射到相机的感光传感器上，这个感光传感器通常是电荷耦合器件（CCD）或互补金属氧化物半导体（CMOS）。dalsanano系列工业相机1、工作原理图像采集：通过镜头收集被拍摄物体反射或透
从数据中心机房来看云服务器的可用性与性能！数据中心云服务器
数据中心机房是云服务器的物理承载基础，机房的硬件设施、运行环境和管理水平直接影响云服务器的可用性和性能表现。了解数据中心机房，明白哪些因素可能导致云服务器出现故障或性能下降，就能够依据数据中心机房的实际情况做出更明智的决策，保障自身业务的稳定运行。数据中心机房的硬件设施是保障云服务器可用性的基础。网络设备作为数据传输的桥梁，高性能的路由器、交换机等确保了数据的快速、准确传输。电力供应则是云服务器运
PDCA循环：从目标设定到持续改进的流程图数据可视化
通过图形天下的关系数据可视化，PDCA循环关系清晰地展现了从目标设定到改进措施的动态流程。通过计划制定、任务分解与资源配置，再到执行控制、监控调整，直至评估反馈，每个阶段紧密相连，形成持续优化的闭环。通过这种可视化方式，用户可以更容易地理解PDCA循环的本质，并应用到实际工作中去。 PDCA循环图 PDCA循环，即计划（Plan）、执行（Do）、检查（C
HTTP 408 Request Timeout 请求超时，远程 GitHub 服务器断开了连接 linff911 http github 服务器
你的gitpush遇到了HTTP408RequestTimeout错误，说明请求超时，远程GitHub服务器断开了连接。解决方法：检查你的网络(1)测试GitHub是否正常pinggithub.com如果返回：Requesttimedout.说明你的网络连接GitHub有问题，建议：尝试换个网络（如手机热点）使用VPN连接GitHub稍后再试如果网络没有问题，修改Git连接方式(1)使用SSH代替
深入学习 DNS 域名解析 dns解析
一、前言在平时工作中相信大家都离不开DNS解析，因为DNS解析是互联网访问的第一步，无论是使用笔记本浏览器访问网络还是打开手机APP的时候，访问网络资源的第一步必然要经过DNS解析流程。二、DNS是什么DNS（域名系统DomainNameSystem），它是一个记录域名和Ip地址相互映射的一个系统，是互联网的“电话簿”，负责将人类可读的域名（如example.com）转换为机器可识别的IP地址（如
Python自动化运维开发系列—CICD项目 weixin_46240874
导语都忘记是什么时候知道python的了，我是搞linux运维的，早先只是知道搞运维必须会shell,要做一些运维自动化的工作，比如实现一些定时备份数据啊、批量执行某个操作啊、写写监控脚本什么的。后来发现工作量大的时候shell开始变慢，实现某个功能使用shell感觉力不从心，听人说python能实现shell能做的一切功能，而且开发效率高，速度快，慢慢的就认识了python,多多少少看点简单的东
企业数据存储的几种方式对比存储
在当今信息化时代，企业常见的数据存储方式包括本地存储、云存储、网络附加存储（NAS）、对象存储等，它们在安全性、扩展性与成本方面各有优势。其中，云存储凭借高弹性、低维护成本等特点备受青睐。它利用网络将数据托管于远程服务器，企业无需自建机房，也能快速扩容并进行全球化部署，极大降低了初期投入成本。这种方式实现了随用随付、自动备份，为众多中小型企业提供了便捷且经济的选择。一、本地存储本地存储是指企业将数
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
深入探索 dubbo-rpc-jsonrpc：跨语言服务调用的高效桥梁郁铎舒
深入探索dubbo-rpc-jsonrpc：跨语言服务调用的高效桥梁dubbo-rpc-jsonrpcApacheDubbo-rpc-jsonrpc是一个用于ApacheDubbo的JSON-RPC协议实现项目。它提供了一个用于ApacheDubbo的JSON-RPC协议实现库和工具。适合用于在应用程序中处理分布式服务。项目地址:https://gitcode.com/gh_mirrors/dub
使用LangChain实现大规模语言模型自发现推理结构 VYSAHF langchain 语言模型人工智能 python
使用LangChain实现大规模语言模型自发现推理结构在现代自然语言处理(NLP)的研究中，大规模语言模型（LLMs）已经展示了强大的能力。然而，在应对复杂的推理问题时，传统的提示方法常常力不从心。这篇文章将带您了解SELF-DISCOVER，一种新兴的框架，如何通过LangChain来实现自动化、动态化的推理结构构建，以提高LLMs的性能。技术背景介绍大规模语言模型（如GPT-4和PaLM2）已
成为编程大佬！！-----＞数据结构与算法（2）——顺序表！！ Elnaij 算法数据结构 c语言
前言：线性表是数据结构与算法的重中之重，所有具有线性逻辑结构的数据结构，都能称为线性表。这篇文章我们先来讨论线性表中的顺序表，顺序表和线性表都是后续实现栈，树，串和图等等结构的重要基础。目录❀简单介绍线性表❀顺序表❀顺序表的存储❀动态存储❀静态存储❀静态存储与动态存储的优缺点❀顺序表操作❀1.初始化顺序表❀2.销毁顺序表❀3.插入数据❀插入数据之判断已满否❀插入操作之尾插❀插入操作之头插❀插入数据
基于C语言的数据结构之串——带你熟练掌握串的基本操作！！超级详细！！ Elnaij 数据结构 c语言算法
目录前言1.数据结构——串1.1基本知识主串、子串、模式串1.2对几个字符串库函数的简单介绍1.2.1strcmp1.2.2strcpy1.2.3strlen1.2.4strcat1.3串的分类1.3.1静态分配内存的串1.3.2动态分配内存的串2.串的基本操作2.1初始化串2.2输出字符2.3插入子串2.4删除子串2.5取子串操作2.6撤销删除操作结束语前言掌握串之前最好先去学习好顺序表和单链表
字符串模式匹配——Brute-Force暴力查找算法以及KMP算法具象图解，超级详细！！ Elnaij 算法数据结构 c语言
目录前言1.串的模式匹配算法目的1.1Brute-Force算法图解Brute-force算法Brute-force暴力查找算法的弊端1.2KMP算法next数组1.2.1Getnext——求next数组的函数图解Getnext函数Getnext函数总结1.2.2KMP模式匹配操作KMP匹配过程图解KMP算法总结结束语：前言这两个算法，尤其是KMP算法，可以说是让许多算法小白头痛的了。如果你也十分
C++与C语言的区别 @haihi c++c语言开发语言
前言本文主要用C语言和C++做对比来学习C++，便于个人理解。C++包含C语言，是对C语言的扩展，在C++中，支持C语言的语法使用，C++是C语言的超集一、C++与C语言的区别C语言简单高效，适合低级系统编程和硬件相关的开发。C++更加灵活、强大，适合大型项目开发，尤其是需要面向对象、代码复用和复杂数据结构的应用。1.编程范式C语言：C是一种过程式编程语言，主要关注函数和过程。程序是通过一系列函数
基于 Python 将 PDF 转 Markdown 并拆解为 JSON，支持自定义标题处理 drebander python pdf json
在日常工作中，我们经常需要将PDF文件转换为可编辑、可结构化的数据格式，比如Markdown和JSON。但实际操作中，自动化工具往往会出现标题识别不准确的问题，尤其是PDF转换过程中，缺乏明确的标题标识。这篇文章将教你如何使用Python将PDF转换为Markdown，并通过自定义规则精准识别标题，最终将内容按标题结构拆解为JSON，方便后续快速检索与使用。1.实现目标将PDF文件转换为Markd
java线程Thread和Runnable区别和联系 zx_code java jvm thread 多线程 Runnable
我们都晓得java实现线程2种方式，一个是继承Thread，另一个是实现Runnable。模拟窗口买票，第一例子继承thread，代码如下 package thread; public class ThreadTest { public static void main(String[] args) { Thread1 t1 = new Thread1(
【转】JSON与XML的区别比较丁_新 json xml
1.定义介绍 (1).XML定义扩展标记语言 (Extensible Markup Language, XML) ，用于标记电子文件使其具有结构性的标记语言，可以用来标记数据、定义数据类型，是一种允许用户对自己的标记语言进行定义的源语言。 XML使用DTD(document type definition)文档类型定义来组织数据;格式统一，跨平台和语言，早已成为业界公认的标准。 XML是标
c++ 实现五种基础的排序算法 CrazyMizzz C++c 算法
#include<iostream> using namespace std; //辅助函数，交换两数之值 template<class T> void mySwap(T &x, T &y){ T temp = x; x = y; y = temp; } const int size = 10; //一、用直接插入排
我的软件麦田的设计者我的软件音乐类娱乐放松
这是我写的一款app软件，耗时三个月，是一个根据央视节目开门大吉改变的，提供音调，猜歌曲名。1、手机拥有者在android手机市场下载本APP，同意权限，安装到手机上。2、游客初次进入时会有引导页面提醒用户注册。（同时软件自动播放背景音乐）。3、用户登录到主页后，会有五个模块。a、点击不胫而走，用户得到开门大吉首页部分新闻，点击进入有新闻详情。b、
linux awk命令详解被触发 linux awk
awk是行处理器: 相比较屏幕处理的优点，在处理庞大文件时不会出现内存溢出或是处理缓慢的问题，通常用来格式化文本信息 awk处理过程: 依次对每一行进行处理，然后输出 awk命令形式: awk [-F|-f|-v] ‘BEGIN{} //{command1; command2} END{}’ file [-F|-f|-v]大参数，-F指定分隔符，-f调用脚本，-v定义变量 var=val
各种语言比较 _wy_ 编程语言
Java Ruby PHP 擅长领域
oracle 中数据类型为clob的编辑知了ing oracle clob
public void updateKpiStatus(String kpiStatus,String taskId){ Connection dbc=null; Statement stmt=null; PreparedStatement ps=null; try { dbc = new DBConn().getNewConnection(); //stmt = db
分布式服务框架 Zookeeper -- 管理分布式环境中的数据矮蛋蛋 zookeeper
原文地址： http://www.ibm.com/developerworks/cn/opensource/os-cn-zookeeper/ 安装和配置详解本文介绍的 Zookeeper 是以 3.2.2 这个稳定版本为基础，最新的版本可以通过官网 http://hadoop.apache.org/zookeeper/来获取，Zookeeper 的安装非常简单，下面将从单机模式和集群模式两
tomcat数据源 alafqq tomcat
数据库 JNDI(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。没有使用JNDI时我用要这样连接数据库： 03. Class.forName("com.mysql.jdbc.Driver"); 04. conn
遍历的方法百合不是茶遍历
遍历在java的泛
linux查看硬件信息的命令 bijian1013 linux
linux查看硬件信息的命令一.查看CPU： cat /proc/cpuinfo 二.查看内存： free 三.查看硬盘： df linux下查看硬件信息 1、lspci 列出所有PCI 设备； lspci - list all PCI devices:列出机器中的PCI设备（声卡、显卡、Modem、网卡、USB、主板集成设备也能
java常见的ClassNotFoundException bijian1013 java
1.java.lang.ClassNotFoundException: org.apache.commons.logging.LogFactory 添加包common-logging.jar2.java.lang.ClassNotFoundException: javax.transaction.Synchronization
【Gson五】日期对象的序列化和反序列化 bit1129 反序列化
对日期类型的数据进行序列化和反序列化时，需要考虑如下问题： 1. 序列化时，Date对象序列化的字符串日期格式如何 2. 反序列化时，把日期字符串序列化为Date对象，也需要考虑日期格式问题 3. Date A -> str -> Date B,A和B对象是否equals 默认序列化和反序列化 import com
【Spark八十六】Spark Streaming之DStream vs. InputDStream bit1129 Stream
1. DStream的类说明文档： /** * A Discretized Stream (DStream), the basic abstraction in Spark Streaming, is a continuous * sequence of RDDs (of the same type) representing a continuous st
通过nginx获取header信息 ronin47 nginx header
1. 提取整个的Cookies内容到一个变量，然后可以在需要时引用，比如记录到日志里面， if ( $http_cookie ~* "(.*)$") { set $all_cookie $1; } 变量$all_cookie就获得了cookie的值，可以用于运算了
java-65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 bylijinnan java
参考了网上的http://blog.csdn.net/peasking_dd/article/details/6342984 写了个java版的： public class Print_1_To_NDigit { /** * Q65.输入数字n，按顺序输出从1最大的n位10进制数。比如输入3，则输出1、2、3一直到最大的3位数即999 * 1.使用字符串
Netty源码学习-ReplayingDecoder bylijinnan java netty
ReplayingDecoder是FrameDecoder的子类，不熟悉FrameDecoder的，可以先看看 http://bylijinnan.iteye.com/blog/1982618 API说，ReplayingDecoder简化了操作，比如： FrameDecoder在decode时，需要判断数据是否接收完全： public class IntegerH
js特殊字符过滤 cngolon js特殊字符 js特殊字符过滤
1.js中用正则表达式过滤特殊字符, 校验所有输入域是否含有特殊符号function stripscript(s) { var pattern = new RegExp("[`~!@#$^&*()=|{}':;',\\[\\].<>/?~！@#￥……&*（）——|{}【】‘；：”“'。，、？]"
hibernate使用sql查询 ctrain Hibernate
import java.util.Iterator; import java.util.List; import java.util.Map; import org.hibernate.Hibernate; import org.hibernate.SQLQuery; import org.hibernate.Session; import org.hibernate.Transa
linux shell脚本中切换用户执行命令方法 daizj linux shell 命令切换用户
经常在写shell脚本时，会碰到要以另外一个用户来执行相关命令，其方法简单记下： 1、执行单个命令：su - user -c "command" 如：下面命令是以test用户在/data目录下创建test123目录 [root@slave19 /data]# su - test -c "mkdir /data/test123"
好的代码里只要一个 return 语句 dcj3sjt126com return
别再这样写了：public boolean foo() { if (true) { return true; } else { return false;
Android动画效果学习 dcj3sjt126com android
1、透明动画效果方法一：代码实现 public View onCreateView(LayoutInflater inflater, ViewGroup container, Bundle savedInstanceState) { View rootView = inflater.inflate(R.layout.fragment_main, container, fals
linux复习笔记之bash shell (4)管道命令 eksliang linux管道命令汇总 linux管道命令 linux常用管道命令
转载请出自出处： http://eksliang.iteye.com/blog/2105461 bash命令执行的完毕以后，通常这个命令都会有返回结果，怎么对这个返回的结果做一些操作呢？那就得用管道命令‘|’。上面那段话，简单说了下管道命令的作用，那什么事管道命令呢？答：非常的经典的一句话，记住了，何为管
Android系统中自定义按键的短按、双击、长按事件 gqdy365 android
在项目中碰到这样的问题：由于系统中的按键在底层做了重新定义或者新增了按键，此时需要在APP层对按键事件（keyevent）做分解处理，模拟Android系统做法，把keyevent分解成： 1、单击事件：就是普通key的单击； 2、双击事件：500ms内同一按键单击两次； 3、长按事件：同一按键长按超过1000ms（系统中长按事件为500ms）； 4、组合按键：两个以上按键同时按住；
asp.net获取站点根目录下子目录的名称 hvt .net C#asp.net hovertree Web Forms
使用Visual Studio建立一个.aspx文件(Web Forms)，例如hovertree.aspx,在页面上加入一个ListBox代码如下： <asp:ListBox runat="server" ID="lbKeleyiFolder" /> 那么在页面上显示根目录子文件夹的代码如下： string[] m_sub
Eclipse程序员要掌握的常用快捷键 justjavac java eclipse 快捷键 ide
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。写道程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可
c++编程随记 lx.asymmetric C++笔记
为了字体更好看，改变了格式…… &&运算符： #include<iostream> using namespace std; int main(){ int a=-1,b=4,k; k=(++a<0)&&!(b--
linux标准IO缓冲机制研究音频数据 linux
一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中，操作系统会将I/O的数据缓存在文件系统的页缓存(page cache)中，也就是说，数据会先被拷贝到操作系统内核的缓冲区中，然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间。1.缓存I/O有以下优点:A.缓存I/O使用了操作系统内核缓冲区，
随想生活暗黑小菠萝生活
其实账户之前就申请了，但是决定要自己更新一些东西看也是最近。从毕业到现在已经一年了。没有进步是假的，但是有多大的进步可能只有我自己知道。毕业的时候班里12个女生，真正最后做到软件开发的只要两个包括我，PS：我不是说测试不好。当时因为考研完全放弃找工作，考研失败，我想这只是我的借口。那个时候才想到为什么大学的时候不能好好的学习技术，增强自己的实战能力，以至于后来找工作比较费劲。我
我认为POJO是一个错误的概念 windshome java POJO 编程 J2EE 设计
这篇内容其实没有经过太多的深思熟虑，只是个人一时的感觉。从个人风格上来讲，我倾向简单质朴的设计开发理念；从方法论上，我更加倾向自顶向下的设计；从做事情的目标上来看，我追求质量优先，更愿意使用较为保守和稳妥的理念和方法。 &