Eason.wxd

系统学习机器学习之神经网络（一）--MLP及局部模型,RBF综述

今天我们要谈的MLP其实是一种人工神经网络结构，属于非参数估计，可以用于解决分类和回归问题。我们先来了解下神经网络的背景，然后再来介绍下感知器。

神经网络

感知器

多层感知器

神经网络的应用

局部模型

一、神经网络

人工神经网络，顾名思义起源于模拟人脑，其目的是理解人脑功能，认知科学家和神经学家共同构建了神经网络模型，并开展了模拟研究。这项技术与工程结合之后，可以帮助我们建立更好的计算机系统。

Marr认为理解一个信息处理系统具有三个层面，总称为分析层面（levels of analysis），即：

计算理论：对应计算目标和任务的抽象定义；

表示和算法：关于输入/输出如何表示以及从输入-->输出的算法说明；

硬件实现：系统的实际物理实现；

这里需要注意的是，对于同一个计算理论，可以有多种表示和算法；而对于同一种表示和算法，可以有多种硬件实现。比如对于自然和人工飞行器，计算理论都是可以“飞行”，算法就是利用“空气动力学”，而实现方式一个是“拍打翅膀”，一个是“发动引擎”。

人脑可以看作是学习或模式识别的一种硬件实现。如果我们可以逆向分析，从这种实现中提取出人脑使用的表示和算法，并且进一步获得计算理论，那么我们就可以考虑使用另一种表示和算法，然后得到更适合我们掌握的计算机硬件的实现。

神经网络可以应用于并行处理。常见的并行架构有单指令多数据（SIMD）机和多指令多数据（MSMD）机，一种是所有的处理器执行相同的指令处理不同的数据；一种是不同的处理器执行不同的指令处理不同的数据。SIMD实现较为简单，但是应用意义小；MIMD实现复杂，但是现实中多数为此种情况。

神经网络提出了一种介于中间的模式，即引入了中间的少量局部存储器，使用处理器的指令在存储器上输入不同来实现不同的功能。其中每个处理器对应一个神经元，局部参数对应它的突出权重，而整个结构就是一个神经网络。所以，人工神经网络是一种我们可以实用当前技术构建的、利用并行硬件的方法。

二、感知器

感知器（Perception）是基本的处理元素，它具有输入、输出，每个输入关联一个连接权重（connection weight），然后输出是输入的加权和。

上图就是一个单层的感知器，输入分别是X0、X1、X2，输出Y是输入的加权和：

Y = W0X0 + W1X1 + W2X2

在实际的使用中，我们的主要任务就是通过数据训练确定参数权重。在训练神经网络时，如果未提供全部样本而是逐个提供实例，则我们通常使用在线学习，然后在每个实例学习之后立刻调整网络参数，以这种方式使得网络缓慢得及时调整。具体收敛可是使用梯度下降算法。更新= 学习因子 * （期望输出 - 实际输出） * 输入

感知器具有很强的表现力，比如布尔函数AND和OR都可以使用上面的单层感知器实现。但是对于XOR操作则不行，因为单层感知器只能模拟线性函数，对于XOR这种非线性函数，我们需要新型的感知器。

三、多层感知器

由前面介绍看到，单个感知器能够完成线性可分数据的分类问题，是一种最简单的可以“学习”的机器。但他无法解决非线性问题。比如下图中的XOR问题：即（1,1）（-1,-1）属于同一类，而（1,-1）（-1,1）属于第二类的问题，不能由单个感知器正确分类。

即在Minsky和Papert的专著《感知器》所分析的：感知器只能解决所谓一阶谓词逻辑问题：与（AND），或（OR）等，而不能解决异或（XOR）等高阶谓词罗辑问题。

用多个感知器实现非线性

单个感知器虽然无法解决异或问题，但却可以通过将多个感知器组合，实现复杂空间的分割。如下图：

将两层感知器按照一定的结构和系数进行组合，第一层感知器实现两个线性分类器，把特征空间分割，而在这两个感知器的输出之上再加一层感知器，就可以实现异或运算。

也就是，由多个感知器组合：

来实现非线性分类面，其中θ(·)表示阶跃函数或符号函数。

多层感知器（Multiayer perceptrons, MLP）可以实现非线性判别式，如果用于回归，可以逼近输入的非线性函数。其实MLP可以用于“普适近似”，即可以证明：具有连续输入和输出的任何函数都可以用MLP近似，已经证明，具有一个隐藏层（隐藏节点个数不限）的MLP可以学习输入的任意非线性函数。

实际上，上述模型就是多层感知器神经网络（Multi-layer perceptron neural networks，MLP neural netwoks）的基础模型。神经网络中每个节点为一个感知器，模型生物神经网络中神经元的基础功能：来自外界（环境或其他细胞）的电信号通过突触传递给神经元，当细胞收到的信号总和超过一定阈值后，细胞被激活，通过轴突向下一个细胞发送电信号，完成对外界信息的加工。

但是，感知器的学习算法并不能直接应用到多层感知器模型的参数学习上。因此，最初提出的学习方案是：除了最后一个神经元之外，事先固定其他所有神经元的权值，学习过程只是用感知器学习算法学习最后一个神经元的权系数。实际上，这相当于通过第一层神经元把原始的特征空间变换到一个新的特征空间，第一层的每个神经元构成新空间的一维，然后在新的特征空间用感知器学习算法构造一个线性分类器。显然，由于第一层的神经元权值需要人为给定，模型的性能很大程度取决于能否设计出恰当的第一层神经元模型，而这取决于对所面临的的问题和数据的了解，并没有针对任意问题求解第一层神经元参数的方法。其核心思想是梯度下降法，即以训练样本被错分的程度为目标函数，训练中每次出现错误时便使权系数朝着目标函数相对于权系数负梯度方向更新，知道目标中没有被错分的样本为止。

而多层感知器模型中，神经元传递函数是阶跃函数，输出端的只能对最后一个神经元系数求梯度，无法对其他权系数求梯度，所以无法利用梯度下降的方法学习其他的权值。Sigmoid函数

BP算法提出主要由于Sigmoid函数的出现，代替之前的阈值函数来构造神经元。

Sigmoid函数是单调递增的非线性函数，无限次可微。当且仅当权值较大时可以逼近阈值函数，当权值较小时逼线性函数。

Sigmoid函数通常写作如下形式：

取值范围是（-1,1），代替神经元阶跃函数可写作：

由于采用Sigmoid函数作为神经元传递函数，不管网络结构多么复杂，总可以通过计算梯度来考察各个参数。这就是多层感知器反向传播算法的基本思想。

反向传播（back-propagation，BP）

训练MLP常用的是向后传播（backpropagation），这主要是因为在我们收敛误差函数的时候，使用链接规则计算梯度：

BP算法就是通过迭代优化网络的权值使得输出与输入之间的实际映射关系与所期望的映射关系一致，采用梯度下降算法通过调整各层权值求目标函数最小化。网络在某个或所有训练样本上的预测输出和期望输出的误差平方和：

由输出层误差逐层反向计算各层各单元的误差，并基于梯度下降法修正各权值：

其中，δj(k)是第k层第j单元的局部梯度，或敏感度(sensitivity)。

已知的两类蚊子的数据如表1：

表1

规定目标为：当t(1)=0.9 时表示属于Apf类，t(2)=0.1表示属于Af类。

输入数据有15个，即 , p=1,…,15; j=1, 2; 对应15个输出。

即对应的（X,Y）对为：（[1.78,1.14],0.9），（[1.96,1.18],0.9）......([2.08,1.56],0.1)

由于此时的X有两个属性，故输入端为2个，建立神经网络如下：

设两个权重系数矩阵为：

分析如下：

为第一层的输出，同时作为第二层的输入。

在这里，a0(3)可以认为为常数

具体算法如下：

令p=0

（1）随机给出两个权矩阵的初值；例如用MATLAB软件时可以用以下语句：

(2) 根据输入数据利用公式算出网络的输出

(6) p=p+1，转（2）
注：仅计算一圈（p=1，2，…，15）是不够的，直到当各权重变化很小时停止，本例中，共计算了147圈，迭代了2205次。

最后结果是：

即网络模型的解为：

四、神经网络的应用

1.样本数据
    1.1 收集和整理分组
        采用BP神经网络方法建模的首要和前提条件是有足够多典型性好和精度高的样本。而且，为监控训练（学习）过程使之不发生“过拟合”和评价建立的网络模型的性能和泛化能力，必须将收集到的数据随机分成训练样本、检验样本（10%以上）和测试样本（10%以上）3部分。此外，数据分组时还应尽可能考虑样本模式间的平衡。
1.2 输入/输出变量的确定及其数据的预处理
       一般地，BP网络的输入变量即为待分析系统的内生变量（影响因子或自变量）数，一般根据专业知识确定。若输入变量较多，一般可通过主成份分析方法压减输入变量，也可根据剔除某一变量引起的系统误差与原系统误差的比值的大小来压减输入变量。输出变量即为系统待分析的外生变量（系统性能指标或因变量），可以是一个，也可以是多个。一般将一个具有多个输出的网络模型转化为多个具有一个输出的网络模型效果会更好，训练也更方便。

由于BP神经网络的隐层一般采用Sigmoid转换函数，为提高训练速度和灵敏性以及有效避开Sigmoid函数的饱和区，一般要求输入数据的值在0~1之间。因此，要对输入数据进行预处理。一般要求对不同变量分别进行预处理，也可以对类似性质的变量进行统一的预处理。如果输出层节点也采用Sigmoid转换函数，输出变量也必须作相应的预处理，否则，输出变量也可以不做预处理。
预处理的方法有多种多样，各文献采用的公式也不尽相同。但必须注意的是，预处理的数据训练完成后，网络输出的结果要进行反变换才能得到实际值。再者，为保证建立的模型具有一定的外推能力，最好使数据预处理后的值在0.2~0.8之间。

2.神经网络拓扑结构的确定
2.1 隐层数
一般认为，增加隐层数可以降低网络误差（也有文献认为不一定能有效降低），提高精度，但也使网络复杂化，从而增加了网络的训练时间和出现“过拟合”的倾向。Hornik等早已证明：若输入层和输出层采用线性转换函数，隐层采用Sigmoid转换函数，则含一个隐层的MLP网络能够以任意精度逼近任何有理函数。显然，这是一个存在性结论。在设计BP网络时可参考这一点，应优先考虑3层BP网络（即有1个隐层）。一般地，靠增加隐层节点数来获得较低的误差，其训练效果要比增加隐层数更容易实现。对于没有隐层的神经网络模型，实际上就是一个线性或非线性（取决于输出层采用线性或非线性转换函数型式）回归模型。因此，一般认为，应将不含隐层的网络模型归入回归分析中，技术已很成熟，没有必要在神经网络理论中再讨论之。

2.2 隐层节点数
在BP 网络中，隐层节点数的选择非常重要，它不仅对建立的神经网络模型的性能影响很大，而且是训练时出现“过拟合”的直接原因，但是目前理论上还没有一种科学的和普遍的确定方法。

目前多数文献中提出的确定隐层节点数的计算公式都是针对训练样本任意多的情况，而且多数是针对最不利的情况，一般工程实践中很难满足，不宜采用。事实上，各种计算公式得到的隐层节点数有时相差几倍甚至上百倍。为尽可能避免训练时出现“过拟合”现象，保证足够高的网络性能和泛化能力，确定隐层节点数的最基本原则是：在满足精度要求的前提下取尽可能紧凑的结构，即取尽可能少的隐层节点数。研究表明，隐层节点数不仅与输入/输出层的节点数有关，更与需解决的问题的复杂程度和转换函数的型式以及样本数据的特性等因素有关。
在确定隐层节点数时必须满足下列条件：
（1）隐层节点数必须小于N-1（其中N为训练样本数），否则，网络模型的系统误差与训练样本的特性无关而趋于零，即建立的网络模型没有泛化能力，也没有任何实用价值。同理可推得：输入层的节点数（变量数）必须小于N-1。
(2) 训练样本数必须多于网络模型的连接权数，一般为2~10倍，否则，样本必须分成几部分并采用“轮流训练”的方法才可能得到可靠的神经网络模型。

总之，若隐层节点数太少，网络可能根本不能训练或网络性能很差；若隐层节点数太多，虽然可使网络的系统误差减小，但一方面使网络训练时间延长，另一方面，训练容易陷入局部极小点而得不到最优点，也是训练时出现“过拟合”的内在原因。因此，合理隐层节点数应在综合考虑网络结构复杂程度和误差大小的情况下用节点删除法和扩张法确定。

3.神经网络的训练
3.1 训练
        BP网络的训练就是通过应用误差反传原理不断调整网络权值使网络模型输出值与已知的训练样本输出值之间的误差平方和达到最小或小于某一期望值。虽然理论上早已经证明：具有1个隐层（采用Sigmoid转换函数）的BP网络可实现对任意函数的任意逼近。但遗憾的是，迄今为止还没有构造性结论，即在给定有限个（训练）样本的情况下，如何设计一个合理的BP网络模型并通过向所给的有限个样本的学习（训练）来满意地逼近样本所蕴含的规律（函数关系，不仅仅是使训练样本的误差达到很小）的问题，目前在很大程度上还需要依靠经验知识和设计者的经验。因此，通过训练样本的学习（训练）建立合理的BP神经网络模型的过程，在国外被称为“艺术创造的过程”，是一个复杂而又十分烦琐和困难的过程。
由于BP网络采用误差反传算法，其实质是一个无约束的非线性最优化计算过程，在网络结构较大时不仅计算时间长，而且很容易限入局部极小点而得不到最优结果。目前虽已有改进BP法、遗传算法（GA）和模拟退火算法等多种优化方法用于BP网络的训练(这些方法从原理上讲可通过调整某些参数求得全局极小点)，但在应用中，这些参数的调整往往因问题不同而异，较难求得全局极小点。这些方法中应用最广的是增加了冲量（动量）项的改进BP算法。所谓动量，就是对当前和上一次更新，取滑动平均。
3.2 学习率和冲量系数
       学习率影响系统学习过程的稳定性。大的学习率可能使网络权值每一次的修正量过大，甚至会导致权值在修正过程中超出某个误差的极小值呈不规则跳跃而不收敛；但过小的学习率导致学习时间过长，不过能保证收敛于某个极小值。所以，一般倾向选取较小的学习率以保证学习过程的收敛性（稳定性），通常在0.01~0.8之间。
        增加冲量项的目的是为了避免网络训练陷于较浅的局部极小点。理论上其值大小应与权值修正量的大小有关，但实际应用中一般取常量。通常在0~1之间，而且一般比学习率要大。同时，也可以让学习速率自适应更新。

4 网络的初始连接权值
BP算法决定了误差函数一般存在（很）多个局部极小点，不同的网络初始权值直接决定了BP算法收敛于哪个局部极小点或是全局极小点。因此，要求计算程序（建议采用标准通用软件，如Statsoft公司出品的Statistica Neural Networks软件和Matlab 软件）必须能够自由改变网络初始连接权值。由于Sigmoid转换函数的特性，一般要求初始权值分布在-0.5~0.5之间比较有效。同时，以不同的初值，想相同的网络训练多次，并且计算沿着误差的平均值，以获得期望的误差。

5.过分训练

当训练时间过长时，由于随着训练周期的增加，训练集上的误差降低，但是超过某一点时，验证集上的误差开始增加，其实质是权重在不断训练中，开始离开0值，参与到训练过程中，随着训练进行，就像是增加了新的参数添加到系统中一样，增加了系统的复杂度，导致糟糕的泛化能力。学习结束的拐点应该通过交叉验证确定。

6.构造网络

我们可以利用输入的特征，如针对像素点的特性，有边等像素的组合特性，我们可以定义一个隐藏单元，它在输入空间上定义一个输入窗口，并且仅仅与输入的一个小的局部子集相连接。我们可以在相继层重复这一做法，直到输出层。即层次椎体。

7.权重共享

在我们寻找类似有向边这种特征时，他们可能出现在输入空间的不同部分，因此，可以替代定义独立的隐藏单元学习输入空间不同部分的不同特征，我们可以有考查输入空间不同部分的相同隐藏层的复制，在学习期间，我们取不同的输入计算梯度，然后对他们求平均值，并做单个更新。这意味着单个链接定义多个权重。

8.线索

与应用有关的任何类型的知识，都应该构建在网络结构中。如模式识别中，不变形线索，对象旋转，变化，缩放。

对线索可以有不同的使用方法：

8.1 用线索创建虚拟实例，产生不同尺度的多个复制，以相同的类标号将他们添加到训练集。

8.2 预处理，例如规范化和中心化

8.3 线索可以纳入到网络结构中，例如权重共享，局部结构

8.4 也可以通过修改误差函数，将线索纳入结构中。如惩罚，近似线索，正切支撑等

9. 网络规模调整

我们可以通过在学习网络中，增加结构自适应处理，实现最佳网络结构模型。如破坏性方法，建设性方法等。实际经验表明，训练后，多层感知器的权重都围绕0正态分布。

五、局部模型

5.1.竞争学习

这里，我们讨论用竞争方法用于在线聚类的神经网络方法，在线K-均值以及两种神经网络的扩展：ART和SOM。

实际上，在线k-均值与批处理k-均值的区别在于更新均值中心时，对批处理k-均值的m进行随机梯度下降法，得到每个实例的更新规则。而在竞争网络中，我们对输入层x与权值（即在线聚类的中心位置）做点积运算，选择最大的b，并将其设为1，其他的b设为0.

为了避免死中心，即存在却没有被实际利用的中心。我们可以采用如下方法：

1.ART模型，即使用领导者聚类算法，并逐个增加单元，总是将他们添加到需要他们的地方。

2.SOM，更新时不仅更新最近单元的中心，还会更新某些中心，如领域。

3.引入良心机制，当赢得当前竞争的单元有负罪感并允许其他单元获胜。

4.随机选择输入实例来初始化m，确保他们从有数据的地方开始。

5.2 径向基函数

RBF网络能够逼近任意的非线性函数，可以处理系统内的难以解析的规律性，具有良好的泛化能力，并有很快的学习收敛速度，已成功应用于非线性函数逼近、时间序列分析、数据分类、模式识别、信息处理、图像处理、系统建模、控制和故障诊断等。

简单说明一下为什么RBF网络学习收敛得比较快。当网络的一个或多个可调参数（权值或阈值）对任何一个输出都有影响时，这样的网络称为全局逼近网络。由于对于每次输入，网络上的每一个权值都要调整，从而导致全局逼近网络的学习速度很慢。BP网络就是一个典型的例子。

如果对于输入空间的某个局部区域只有少数几个连接权值影响输出，则该网络称为局部逼近网络。常见的局部逼近网络有RBF网络、小脑模型（CMAC）网络、B样条网络等。

径向基函数解决插值问题

完全内插法要求插值函数经过每个样本点，即。样本点总共有P个。

RBF的方法是要选择P个基函数，每个基函数对应一个训练数据，各基函数形式为，由于距离是径向同性的，因此称为径向基函数。||X-X^p||表示差向量的模，或者叫2范数。

基于为径向基函数的插值函数为：

输入X是个m维的向量，样本容量为P，P>m。可以看到输入数据点X^p是径向基函数φ_p的中心。

隐藏层的作用是把向量从低维m映射到高维P，低维线性不可分的情况到高维就线性可分了。

将插值条件代入：

写成向量的形式为，显然Φ是个规模这P对称矩阵，且与X的维度无关，当Φ可逆时，有。

对于一大类函数，当输入的X各不相同时，Φ就是可逆的。下面的几个函数就属于这“一大类”函数：

1）Gauss（高斯）函数

2）Reflected Sigmoidal（反常S型）函数

3）Inverse multiquadrics（拟多二次）函数

σ称为径向基函数的扩展常数，它反应了函数图像的宽度，σ越小，宽度越窄，函数越具有选择性。

完全内插存在一些问题：

1）插值曲面必须经过所有样本点，当样本中包含噪声时，神经网络将拟合出一个错误的曲面，从而使泛化能力下降。

由于输入样本中包含噪声，所以我们可以设计隐藏层大小为K，K

2）基函数个数等于训练样本数目，当训练样本数远远大于物理过程中固有的自由度时，问题就称为超定的，插值矩阵求逆时可能导致不稳定。

拟合函数F的重建问题满足以下3个条件时，称问题为适定的：

解的存在性
解的唯一性
解的连续性

不适定问题大量存在，为解决这个问题，就引入了正则化理论。

正则化理论

正则化的基本思想是通过加入一个含有解的先验知识的约束来控制映射函数的光滑性，这样相似的输入就对应着相似的输出。

寻找逼近函数F(x)通过最小化下面的目标函数来实现：

加式的第一项好理解，这是均方误差，寻找最优的逼近函数，自然要使均方误差最小。第二项是用来控制逼近函数光滑程度的，称为正则化项，λ是正则化参数，D是一个线性微分算子，代表了对F(x)的先验知识。曲率过大（光滑度过低）的F(x)通常具有较大的||DF||值，因此将受到较大的惩罚。

直接给出(1)式的解：

权向量********************************(2)

G(X,X^p)称为Green函数，G称为Green矩阵。Green函数与算子D的形式有关，当D具有旋转不变性和平移不变性时，。这类Green函数的一个重要例子是多元Gauss函数：

。

正则化RBF网络

输入样本有P个时，隐藏层神经元数目为P，且第p个神经元采用的变换函数为G(X,X^p)，它们相同的扩展常数σ。输出层神经元直接把净输入作为输出。输入层到隐藏层的权值全设为1,隐藏层到输出层的权值是需要训练得到的：逐一输入所有的样本，计算隐藏层上所有的Green函数，根据(2)式计算权值。

广义RBF网络

Cover定理指出：将复杂的模式分类问题非线性地映射到高维空间将比投影到低维空间更可能线性可分。

广义RBF网络：从输入层到隐藏层相当于是把低维空间的数据映射到高维空间，输入层细胞个数为样本的维度，所以隐藏层细胞个数一定要比输入层细胞个数多。从隐藏层到输出层是对高维空间的数据进行线性分类的过程，可以采用单层感知器常用的那些学习规则，参见神经网络基础和感知器。

注意广义RBF网络只要求隐藏层神经元个数大于输入层神经元个数，并没有要求等于输入样本个数，实际上它比样本数目要少得多。因为在标准RBF网络中，当样本数目很大时，就需要很多基函数，权值矩阵就会很大，计算复杂且容易产生病态问题。另外广RBF网与传统RBF网相比，还有以下不同：

径向基函数的中心不再限制在输入数据点上，而由训练算法确定。
各径向基函数的扩展常数不再统一，而由训练算法确定。
输出函数的线性变换中包含阈值参数，用于补偿基函数在样本集上的平均值与目标值之间的差别。

因此广义RBF网络的设计包括：

结构设计--隐藏层含有几个节点合适

参数设计--各基函数的数据中心及扩展常数、输出节点的权值。

下面给出计算数据中心的两种方法：

数据中心从样本中选取。样本密集的地方多采集一些。各基函数采用统一的偏扩展常数：

d_max是所选数据中心之间的最大距离，M是数据中心的个数。扩展常数这么计算是为了避免径向基函数太尖或太平。
自组织选择法，比如对样本进行聚类、梯度训练法、资源分配网络等。各聚类中心确定以后，根据各中心之间的距离确定对应径向基函数的扩展常数。

λ是重叠系数。

接下来求权值W时就不能再用了，因为对于广义RBF网络，其行数大于列数，此时可以求Φ伪逆。

数据中心的监督学习算法

最一般的情况，RBF函数中心、扩展常数、输出权值都应该采用监督学习算法进行训练，经历一个误差修正学习的过程，与BP网络的学习原理一样。同样采用梯度下降法，定义目标函数为

e_i为输入第i个样本时的误差信号。

上式的输出函数中忽略了阈值。

为使目标函数最小化，各参数的修正量应与其负梯度成正比，即

具体计算式为

上述目标函数是所有训练样本引起的误差总和，导出的参数修正公式是一种批处理式调整，即所有样本输入一轮后调整一次。目标函数也可以为瞬时值形式，即当前输入引起的误差

此时参数的修正值为：

下面我们就分别用本文最后提到的聚类的方法和数据中心的监督学习方法做一道练习题。

考虑Hermit多项式的逼近问题

训练样本这样产生：样本数P=100，x_i且服从[-4,4]上的均匀分布，样本输出为F(x_i)+e_i，e_i为添加的噪声，服从均值为0，标准差为0.1的正态分布。

（1）用聚类方法求数据中心和扩展常数，输出权值和阈值用伪逆法求解。隐藏节点数M=10，隐藏节点重叠系数λ=1，初始聚类中心取前10个训练样本。

 
             #include 
            
             #include 
            
             #include 
            
             #include 
            
             #include 
            
             #include 
            
             #include 
            
             #include 
            
             #include 
            
             #include"matrix.h" 
            
             using 
             namespace 
             std; 
            
             const 
             int 
             P=100;        
             //输入样本的数量 
            
             vector< 
             double 
             > X(P);  
             //输入样本 
            
             Matrix< 
             double 
             > Y(P,1);        
             //输入样本对应的期望输出 
            
             const 
             int 
             M=10;         
             //隐藏层节点数目 
            
             vector< 
             double 
             > center(M);       
             //M个Green函数的数据中心 
            
             vector< 
             double 
             > delta(M);        
             //M个Green函数的扩展常数 
            
             Matrix< 
             double 
             > Green(P,M);         
             //Green矩阵 
            
             Matrix< 
             double 
             > Weight(M,1);       
             //权值矩阵 
            
             /*Hermit多项式函数*/ 
            
             inline 
             double 
             Hermit( 
             double 
             x){ 
            
             return 
             1.1*(1-x+2*x*x)* 
             exp 
             (-1*x*x/2); 
            
             } 
            
             /*产生指定区间上均匀分布的随机数*/ 
            
             inline 
             double 
             uniform( 
             double 
             floor 
             , 
             double 
             ceil 
             ){ 
            
             return 
             floor 
             +1.0* 
             rand 
             ()/RAND_MAX*( 
             ceil 
             - 
             floor 
             ); 
            
             } 
            
             /*产生区间[floor,ceil]上服从正态分布N[mu,sigma]的随机数*/ 
            
             inline 
             double 
             RandomNorm( 
             double 
             mu, 
             double 
             sigma, 
             double 
             floor 
             , 
             double 
             ceil 
             ){ 
            
             double 
             x,prob,y; 
            
             do 
             { 
            
             x=uniform( 
             floor 
             , 
             ceil 
             ); 
            
             prob=1/ 
             sqrt 
             (2*M_PI*sigma)* 
             exp 
             (-1*(x-mu)*(x-mu)/(2*sigma*sigma)); 
            
             y=1.0* 
             rand 
             ()/RAND_MAX; 
            
             } 
             while 
             (y>prob); 
            
             return 
             x; 
            
             } 
            
             /*产生输入样本*/ 
            
             void 
             generateSample(){ 
            
             for 
             ( 
             int 
             i=0;i 
            
             double 
             in=uniform(-4,4); 
            
             X[i]=in; 
            
             Y.put(i,0,Hermit(in)+RandomNorm(0,0.1,-0.3,0.3)); 
            
             } 
            
             } 
            
             /*寻找样本离哪个中心最近*/ 
            
             int 
              nearest( 
             const 
              vector< 
             double 
             >& center, 
             double 
             sample){ 
            
             int 
             rect=-1; 
            
             double 
             dist=numeric_limits< 
             double 
             >::max(); 
            
             for 
             ( 
             int 
             i=0;i 
            
             if 
             ( 
             fabs 
             (sample-center[i]) 
            
             dist= 
             fabs 
             (sample-center[i]); 
            
             rect=i; 
            
             } 
            
             } 
            
             return 
             rect; 
            
             } 
            
             /*计算簇的质心*/ 
            
             double 
             calCenter( 
             const 
             vector< 
             double 
             > &g){ 
            
             int 
             len=g.size(); 
            
             double 
             sum=0.0; 
            
             for 
             ( 
             int 
             i=0;i 
            
             sum+=g[i]; 
            
             return 
             sum/len; 
            
             } 
            
             /*KMeans聚类法产生数据中心*/ 
            
             void 
             KMeans(){ 
            
             assert 
             (P%M==0); 
            
             vector 
             double 
             > > group(M);          
             //记录各个聚类中包含哪些样本 
            
             double 
             gap=0.001;       
             //聚类中心的改变量小于为个值时，迭代终止 
            
             for 
             ( 
             int 
             i=0;i 
             //从P个输入样本中随机选P个作为初始聚类中心 
            
             center[i]=X[10*i+3];     
             //输入是均匀分布的，所以我们均匀地选取 
            
             } 
            
             while 
             (1){ 
            
             for 
             ( 
             int 
             i=0;i 
            
             group[i].clear();   
             //先清空聚类信息 
            
             for 
             ( 
             int 
             i=0;i 
             //把所有输入样本归到对应的簇 
            
             int 
             c=nearest(center,X[i]); 
            
             group[c].push_back(X[i]); 
            
             } 
            
             vector< 
             double 
             > new_center(M);       
             //存储新的簇心 
            
             for 
             ( 
             int 
             i=0;i 
            
             vector< 
             double 
             > g=group[i]; 
            
             new_center[i]=calCenter(g); 
            
             } 
            
             bool 
             flag= 
             false 
             ; 
            
             for 
             ( 
             int 
             i=0;i 
             //检查前后两次质心的改变量是否都小于gap 
            
             if 
             ( 
             fabs 
             (new_center[i]-center[i])>gap){ 
            
             flag= 
             true 
             ; 
            
             break 
             ; 
            
             } 
            
             } 
            
             center=new_center; 
            
             if 
             (!flag) 
            
             break 
             ; 
            
             } 
            
             } 
            
             /*生成Green矩阵*/ 
            
             void 
             calGreen(){ 
            
             for 
             ( 
             int 
             i=0;i 
            
             for 
             ( 
             int 
             j=0;j 
            
             Green.put(i,j, 
             exp 
             (-1.0*(X[i]-center[j])*(X[i]-center[j])/(2*delta[j]*delta[j]))); 
            
             } 
            
             } 
            
             } 
            
             /*求一个矩阵的伪逆*/ 
            
             Matrix< 
             double 
             > getGereralizedInverse( 
             const 
             Matrix< 
             double 
             > &matrix){ 
            
             return 
             (matrix.getTranspose()*matrix).getInverse()*(matrix.getTranspose()); 
            
             } 
            
             /*利用已训练好的神经网络，由输入得到输出*/ 
            
             double 
             getOutput( 
             double 
             x){ 
            
             double 
             y=0.0; 
            
             for 
             ( 
             int 
             i=0;i 
            
             y+=Weight.get(i,0)* 
             exp 
             (-1.0*(x-center[i])*(x-center[i])/(2*delta[i]*delta[i])); 
            
             return 
             y; 
            
             } 
            
             int 
             main( 
             int 
             argc, 
             char 
             *argv[]){
　　 
             srand 
             ( 
             time 
             (0)); 
            
             generateSample();       
             //产生输入和对应的期望输出样本 
            
             KMeans();           
             //对输入进行聚类，产生聚类中心 
            
             sort(center.begin(),center.end());      
             //对聚类中心（一维数据）进行排序 
            
             //根据聚类中心间的距离，计算各扩展常数 
            
             delta[0]=center[1]-center[0];       
            
             delta[M-1]=center[M-1]-center[M-2]; 
            
             for 
             ( 
             int 
             i=1;i 
            
             double 
             d1=center[i]-center[i-1]; 
            
             double 
             d2=center[i+1]-center[i]; 
            
             delta[i]=d1 
            
             } 
            
             calGreen();     
             //计算Green矩阵 
            
             Weight=getGereralizedInverse(Green)*Y;      
             //计算权值矩阵 
            
             //根据已训练好的神经网络作几组测试 
            
             for 
             ( 
             int 
             x=-4;x<5;++x){ 
            
             cout< 
             "\t" 
             ; 
            
             cout< 
            
             cout< 
             //先输出我们预测的值，再输出真实值 
            
             } 
            
             return 
             0; 
            
             }

（2）用梯度下降法训练RBF网络，设η=0.001，M=10，初始权值为[-0.1,0.1]内的随机数，初始数据中心为[-4,4]内的随机数，初始扩展常数取[0.1,0.3]内的随机数，目标误差为0.9，最大训练次数为5000。

 
           #include 
          
           #include 
          
           #include 
          
           #include 
          
           #include 
          
           #include 
          
           #include 
          
           using 
           namespace 
           std; 
          
           const 
           int 
           P=100;        
           //输入样本的数量 
          
           vector< 
           double 
           > X(P);  
           //输入样本 
          
           vector< 
           double 
           > Y(P);      
           //输入样本对应的期望输出 
          
           const 
           int 
           M=10;         
           //隐藏层节点数目 
          
           vector< 
           double 
           > center(M);       
           //M个Green函数的数据中心 
          
           vector< 
           double 
           > delta(M);        
           //M个Green函数的扩展常数 
          
           double 
           Green[P][M];         
           //Green矩阵 
          
           vector< 
           double 
           > Weight(M);       
           //权值矩阵 
          
           const 
           double 
           eta=0.001;     
           //学习率 
          
           const 
           double 
           ERR=0.9;       
           //目标误差 
          
           const 
           int 
           ITERATION_CEIL=5000;      
           //最大训练次数 
          
           vector< 
           double 
           > error(P);  
           //单个样本引起的误差 
          
           /*Hermit多项式函数*/ 
          
           inline 
           double 
           Hermit( 
           double 
           x){ 
          
           return 
           1.1*(1-x+2*x*x)* 
           exp 
           (-1*x*x/2); 
          
           } 
          
           /*产生指定区间上均匀分布的随机数*/ 
          
           inline 
           double 
           uniform( 
           double 
           floor 
           , 
           double 
           ceil 
           ){ 
          
           return 
           floor 
           +1.0* 
           rand 
           ()/RAND_MAX*( 
           ceil 
           - 
           floor 
           ); 
          
           } 
          
           /*产生区间[floor,ceil]上服从正态分布N[mu,sigma]的随机数*/ 
          
           inline 
           double 
           RandomNorm( 
           double 
           mu, 
           double 
           sigma, 
           double 
           floor 
           , 
           double 
           ceil 
           ){ 
          
           double 
           x,prob,y; 
          
           do 
           { 
          
           x=uniform( 
           floor 
           , 
           ceil 
           ); 
          
           prob=1/ 
           sqrt 
           (2*M_PI*sigma)* 
           exp 
           (-1*(x-mu)*(x-mu)/(2*sigma*sigma)); 
          
           y=1.0* 
           rand 
           ()/RAND_MAX; 
          
           } 
           while 
           (y>prob); 
          
           return 
           x; 
          
           } 
          
           /*产生输入样本*/ 
          
           void 
           generateSample(){ 
          
           for 
           ( 
           int 
           i=0;i 
          
           double 
           in=uniform(-4,4); 
          
           X[i]=in; 
          
           Y[i]=Hermit(in)+RandomNorm(0,0.1,-0.3,0.3); 
          
           } 
          
           } 
          
           /*给向量赋予[floor,ceil]上的随机值*/ 
          
           void 
           initVector(vector< 
           double 
           > &vec, 
           double 
           floor 
           , 
           double 
           ceil 
           ){ 
          
           for 
           ( 
           int 
           i=0;i 
          
           vec[i]=uniform( 
           floor 
           , 
           ceil 
           ); 
          
           } 
          
           /*根据网络，由输入得到输出*/ 
          
           double 
           getOutput( 
           double 
           x){ 
          
           double 
           y=0.0; 
          
           for 
           ( 
           int 
           i=0;i 
          
           y+=Weight[i]* 
           exp 
           (-1.0*(x-center[i])*(x-center[i])/(2*delta[i]*delta[i])); 
          
           return 
           y; 
          
           } 
          
           /*计算单个样本引起的误差*/ 
          
           double 
           calSingleError( 
           int 
           index){ 
          
           double 
           output=getOutput(X[index]); 
          
           return 
           Y[index]-output; 
          
           } 
          
           /*计算所有训练样本引起的总误差*/ 
          
           double 
           calTotalError(){ 
          
           double 
           rect=0.0; 
          
           for 
           ( 
           int 
           i=0;i 
          
           error[i]=calSingleError(i); 
          
           rect+=error[i]*error[i]; 
          
           } 
          
           return 
           rect/2; 
          
           } 
          
           /*更新网络参数*/ 
          
           void 
           updateParam(){ 
          
           for 
           ( 
           int 
           j=0;j 
          
           double 
           delta_center=0.0,delta_delta=0.0,delta_weight=0.0; 
          
           double 
           sum1=0.0,sum2=0.0,sum3=0.0; 
          
           for 
           ( 
           int 
           i=0;i 
          
           sum1+=error[i]* 
           exp 
           (-1.0*(X[i]-center[j])*(X[i]-center[j])/(2*delta[j]*delta[j]))*(X[i]-center[j]); 
          
           sum2+=error[i]* 
           exp 
           (-1.0*(X[i]-center[j])*(X[i]-center[j])/(2*delta[j]*delta[j]))*(X[i]-center[j])*(X[i]-center[j]); 
          
           sum3+=error[i]* 
           exp 
           (-1.0*(X[i]-center[j])*(X[i]-center[j])/(2*delta[j]*delta[j])); 
          
           } 
          
           delta_center=eta*Weight[j]/(delta[j]*delta[j])*sum1; 
          
           delta_delta=eta*Weight[j]/ 
           pow 
           (delta[j],3)*sum2; 
          
           delta_weight=eta*sum3; 
          
           center[j]+=delta_center; 
          
           delta[j]+=delta_delta; 
          
           Weight[j]+=delta_weight; 
          
           } 
          
           } 
          
           int 
           main( 
           int 
           argc, 
           char 
           *argv[]){ 
          
           srand 
           ( 
           time 
           (0)); 
          
           /*初始化网络参数*/ 
          
           initVector(Weight,-0.1,0.1); 
          
           initVector(center,-4.0,4.0); 
          
           initVector(delta,0.1,0.3); 
          
           /*产生输入样本*/ 
          
           generateSample(); 
          
           /*开始迭代*/ 
          
           int 
           iteration=ITERATION_CEIL; 
          
           while 
           (iteration-->0){ 
          
           if 
           (calTotalError() 
           //误差已达到要求，可以退出迭代 
          
           break 
           ; 
          
           updateParam();      
           //更新网络参数 
          
           } 
          
           cout<< 
           "迭代次数:" 
           < 
          
           //根据已训练好的神经网络作几组测试 
          
           for 
           ( 
           int 
           x=-4;x<5;++x){ 
          
           cout< 
           "\t" 
           ; 
          
           cout< 
          
           cout< 
           //先输出我们预测的值，再输出真实值 
          
           } 
          
           return 
           0; 
          
           }

5.3 基于规则的知识

当然，我们也可以结合先验知识来初始化。如局部的规则提取等。实际上，这种方法与模糊逻辑有关，将模糊规则表示在RBF框架里，如约等于被高斯函数建模等。

5.4 规范化基函数

在某些应用中，我们可能有一个规范化的步骤，确保局部单元的和为1，从而确保任何输入，至少存在一个非零单元。

最后再给出一个BP及例子

用如下图1的神经网络结构(正向神经网络结构为2-4-4-2-1 )去逼近函数：

f(x1,x2) = (x1-1)^4 + 2×x2^2。

1）网络各神经元的激发函数为：s函数——F(x) = 1/(1+exp(-x)) ;

2）输入层的神经元不是真正的神经元，它们的输出等于输入。

3）取20个样本值作为训练用。

4）x1,x2的取值范围：0≤x1，x2≤1。

5）误差<0.0001

求解过程

1、对要逼近的函数f(x1,x2) = (x1-1)^4 + 2×x2^2 进行分析。x1,x2的取值范围：0≤x1，x2≤1。那么，输入不用归一化（若下x1,x2的值域不再0～1，那就要输入归一化了，因为我们可以从神经网络的激发函数可以看出，输入在0～1时，变化率是很大的，所以网络对输出很敏感）。求该函数的值域，很显然该函数的值域为：0～3，这就需要归一化了，因为神经网络输出的值只能在0～1之间。设Out_Exp[i]为第i个输入样本的期望值，那么归一化后的期望输出为：Out_Exp[i]/3,用这个值和网络的输出进行比较，来进行训练。最后在网络输出时要反归一化，即把网络的输出乘以3。

2、由于BP算法的步骤是一定的，我们只要把其思想转化为程序就行了，即把数学表达式转换为程序。我们知道在计算机中每一种算法都需要一定的数据结构去支持。由于算法已确定，那么我们只要分析和确定其数据结构即可。首先，我们考虑在如何计算机程序设计中表示权系数和阀值，在这里我们定义了3维数组W[Layer_Max][Node_Max][Node_Max+1]用来表示神经网络的全部权系数和阀值，我们约定W[i][j][k]存储网络的权系数，其中i表示为神经网络的第i层，j表示为第i层网络的第j个神经元，k表示为第i -1层的第j个神经网络。那么，W[i][j][k]表示为第i层的第j个神经元和第i －1层的第k个神经元的权系数。W[i][j][Layer[i-1]＋1]表示第i层第j个神经元的阀值。

注：1、Layer_Max表示网络结构的层数

2、Node_Max表示整个神经网络中各层中含有神经元的最大数目的个数

3、Layer[i]数组表示网络中第i层的神经元的个数

然后，我们定义网络输入的和期望输出数组。定义2维数组Input_Net[2][21]作为网络输入数组，在这里为了方便取了21样本作为，其中x1取值从0开始，已每次加0.05的步长作为下一个样本取值。而x2的取值则与之相反。那么，由于x1和x2各有21个值，由排列组合得出网络训练样本一共有21*21=421个样本。我们再定义一个2维数组Out_Exp[21][21]表示期望输出。定义二维数组Layer_Node[i][j]存储各层神经元的输出，表示为第i层的第j个神经元的输出。定义二维数组D[i][j]存储各层神经元的的误差微分，表示为第i层的第j个神经元的的误差微分。

3、代价函数为（NetOut(i ，j)-Out_Exp[i][j]）^2/2。其中：NetOut(i,j)表示输入x1的第i个值和x2的第j个值所组成的样本时，网络的实际输出。

4、确定BP算法的关键的子程序。

a) 、F( double x ) 该函数是该神经网络的唯一激发函数，它的数学表达：

F( x ) = 1/(1+exp(-x)) 。它的输入为样本值NetIn[i]。输出为一个在区间。

b）、Initialize（）该函数是网络初始化子程序，它初始化权系数和阀值，学习速率，误差精度等。

c)、 NetWorkOut( int i ，int j) 该函数的输入为表示输入x1的第i个值和x2的第j个值所组成的样本时，在计算网络输出的时候，同时计算各层神经元的输出，并保存在Layer_Node[][]数组里。输出为神经网络的实际输出。

d)、 AllLayer_D(int i , int j) 该函数的输入为输入x1的第i个值和x2的第j个值所组成的样本的数组下标，目的是计算各层神经元的误差微分，并把他们保存在D[][]数组里。

e)、 Change_W( ) 该函数是用于根据AllLayer_D( )计算出来的误差微分改变权系数，根据经典的BP算法可以写出改变权系数和阀值式子:

W[i][j][k] = W[i][j][k] – Study_Speed*D[i][j]* Layer_Node[i-1][k]

W[i][j][Layer[i-1]+1]=W[i][j][Layer[i-1]+1]+Study_Speed*D[i][j]*

Layer_Node[i-1][ [Layer[i-1]+1]

其中：Study_Speed为学习速率，取值在（0，1）之间，如果太大了，网络将会出现振荡，而不能收敛。

g)、 Train( ) 该函数是用于神经网络训练用的。它调用了上面几个函数来完成网络训练的。当训练完（即网络对于该问题是可以收敛的）时，网络就可以在特定的误差范内逼近函数。下面给出该函数的流程图：

//---------------------------------------------------------------------------------------//
// BP算法例子：用一个五层的神经网络去逼近函数 //
// f(x1,x2)=pow(x1-1,4)+2*pow(x2,2) //
// 作者：MaxMatrix //
// 2004.5.9调通运行于VC++6.0 //
//--------------------------------------------------------------------------------------//

#include
#include
#include
#include
#include
//---------------------------------------------------------------------
#define RANDOM rand()/32767.0 //0~1随机数生成函数

const int Layer_Max=5;//神经网络的层数

const double PI=3.1415927;//圆周率

const int Layer_number[Layer_Max]={2,4,4,2,1};//神经网络各层的神经元个数

const int Neural_Max=4;//神经网络各层最大神经元个数

const int InMax=21;//样本输入的个数

ofstream Out_W_File("All_W.txt",ios::out) ;
ofstream Out_Error("Error.txt",ios::out) ;

//定义类 BP
class BP
{
public:
BP(); //BP类的构造函数

void BP_Print();//打印权系数

double F(double x);//神经元的激发函数

double Y(double x1,double x2);//要逼近的函数
//
double NetWorkOut(int x1 , int x2);//网络输出，他的输入为
//第input个样本
void AllLayer_D(int x1 , int x2);//求所有神经元的输出误差微分

void Change_W(); //改变权系数

void Train(); //训练函数

void After_Train_Out(); //经过训练后，21样本的神经网络输出

double Cost(double out,double Exp);//代价函数

private:
double W[Layer_Max][Neural_Max][Neural_Max];//保存权系数
//规定W[i][j][k]表示网络第i层的第j个神经元连接到
//第i－1层第k个神经元的权系数
double Input_Net[2][InMax];//21个样本输入,约定Input_Net[0][i]
//表示第i个样本的输入x1
//而 Input_Net[1][i]表示第i个样本的输入x2
double Out_Exp[InMax][InMax];//期望输出

double Layer_Node[Layer_Max][Neural_Max];//保存各神经元的输出
//规定Layer_Node[i][j]表示第i层的第j个神经元的输出

double D[Layer_Max][Neural_Max];//保存各神经元的误差微分
//规定D[i][j]表示第i层第j个神经元的误差微分

double Study_Speed;//学习速度

double e;//误差
};

//构造函数,用来初始化权系数，输入，期望输出和学习速度
BP::BP()
{
srand(time(NULL));//播种，以便产生随即数
for(int i=1 ; i {
for(int j=0 ; j {
for(int k=0 ; k {
W[i][j][k] = RANDOM;//随机初始化权系数

}
// Q[i][j] = RANDOM ;//初始化各神经元的阀值
}
}
//输入归和输出归一化
for(int l=0 ; l {
Input_Net[0][l] = l * 0.05 ;//把0～1分成20等分,表示x1
Input_Net[1][l] = 1 - l * 0.05 ;//表示x2
}
for(i=0 ; i {
for(int j=0 ; j {
Out_Exp[i][j] = Y(Input_Net[0][i],Input_Net[1][j]) ;//期望输出
Out_Exp[i][j] = Out_Exp[i][j]/3.000000;//期望输出归一化
}
}

Study_Speed=0.5;//初始化学习速度

e=0.0001;//误差精度

}//end
//激发函数F()
double BP::F(double x)
{
return(1.0/(1+exp(-x)));
}//end

//要逼近的函数Y()
//输入：两个浮点数
//输出：一个浮点数
double BP::Y(double x1,double x2)
{
double temp;
temp = pow(x1-1,4) + 2 * pow(x2,2);
return temp;
}//end
//--------------------------------------------------------
//代价函数
double BP::Cost(double Out,double Exp)
{
return(pow(Out-Exp,2));
}//end

//网络输出函数
//输入为：第input个样本
double BP::NetWorkOut(int x1 , int x2)
{
int i,j,k;
double N_node[Layer_Max][Neural_Max];
//约定N_node[i][j]表示网络第i层的第j个神经元的总输入
//第0层的神经元为输入，不用权系数和阀值，即输进什么即输出什么
N_node[0][0] = Input_Net[0][x1] ;
Layer_Node[0][0] = Input_Net[0][x1] ;
N_node[0][1] = Input_Net[1][x2] ;
Layer_Node[0][1] = Input_Net[1][x2] ;

for(i=1 ; i {
for(j=0 ; j { //神经元个数
N_node[i][j] = 0.0;
for(k=0 ; k { //表示与第i层第j个神经元连接的上一层的
//神经元个数

//求上一层神经元对第i层第j个神经元的输入之和
N_node[i][j]+=Layer_Node[i-1][k] * W[i][j][k];

}
N_node[i][j] = N_node[i][j]-W[i][j][k];//减去阀值

//求Layer_Node[i][j]，即第i层第j个神经元的输出
Layer_Node[i][j] = F(N_node[i][j]);
}
}
return Layer_Node[Layer_Max-1][0];//最后一层的输出
}//end

//求所有神经元的输出误差微分函数
//输入为：第input个样本
//计算误差微分并保存在D[][]数组中
void BP::AllLayer_D(int x1 , int x2)
{
int i,j,k;
double temp;
D[Layer_Max-1][0] = Layer_Node[Layer_Max-1][0] *
(1-Layer_Node[Layer_Max-1][0])*
(Layer_Node[Layer_Max-1][0]-Out_Exp[x1][x2]);
for(i=Layer_Max-1 ; i>0 ; i--)
{
for(j=0 ; j {
temp = 0 ;
for(k=0 ; k {
temp = temp+W[i][k][j]*D[i][k] ;
}
D[i-1][j] = Layer_Node[i-1][j] * (1-Layer_Node[i-1][j])
*temp ;
}
}
}//end
//修改权系数和阀值
void BP::Change_W()
{
int i,j,k;
for(i=1 ; i {
for(j=0;j {
for(k=0;k {
//修改权系数
W[i][j][k]=W[i][j][k]-Study_Speed*
D[i][j]*Layer_Node[i-1][k];

}
W[i][j][k]=W[i][j][k]+Study_Speed*D[i][j];//修改阀值
}
}
}//end
//训练函数
void BP::Train()
{
int i,j;
int ok=0;
double Out;
long int count=0;
double err;
ofstream Out_count("Out_count.txt",ios::out) ;
//把其中的5个权系数的变化保存到文件里
ofstream outWFile1("W[2][0][0].txt",ios::out) ;
ofstream outWFile2("W[2][1][1].txt",ios::out) ;
ofstream outWFile3("W[1][0][0].txt",ios::out) ;
ofstream outWFile4("W[1][1][0].txt",ios::out) ;
ofstream outWFile5("W[3][0][1].txt",ios::out) ;

while(ok<441)
{
count++;
//20个样本输入
for(i=0,ok=0 ; i {
for(j=0 ; j {
Out = NetWorkOut(i,j);

AllLayer_D(i,j);

err = Cost(Out,Out_Exp[i][j]);//计算误差

if(err
else Change_W();//否修改权系数和阀值
}

}
if((count%1000)==0)//每1000次，保存权系数
{
cout< Out_count< Out_Error< outWFile1< outWFile2< outWFile3< outWFile4< outWFile5< for(int p=1 ; p {
for(int j=0 ; j {
for(int k=0 ; k {
Out_W_File<<'W'<<'['< << '['< << '['< << '='< }
}
}
Out_W_File<<'\n'<<'\n' ;
}

}
cout< }//end

//打印权系数
void BP::BP_Print()
{
//打印权系数
cout<<"训练后的权系数"< for(int i=1 ; i {
for(int j=0 ; j {
for(int k=0 ; k {
cout< }
cout< }
}
cout< }//end

//把结果保存到文件
void BP::After_Train_Out()
{
int i,j ;
ofstream Out_x1("Out_x1.txt",ios::out) ;

ofstream Out_x2("Out_x2.txt",ios::out) ;

ofstream Out_Net("Out_Net.txt",ios::out) ;

ofstream Out_Exp("Out_Exp.txt",ios::out) ;

ofstream W_End("W_End.txt",ios::out) ;

ofstream Q_End("Q_End.txt",ios::out) ;

ofstream Array("Array.txt",ios::out) ;

ofstream Out_x11("x1.txt",ios::out) ;

ofstream Out_x22("x2.txt",ios::out) ;

ofstream Result1("result1.txt",ios::out) ;

ofstream Out_x111("x11.txt",ios::out) ;

ofstream Out_x222("x22.txt",ios::out) ;

ofstream Result2("result2.txt",ios::out) ;

for( i=0 ; i {
for(j=0 ; j {
Out_x11< Out_x22< Result1<<3*NetWorkOut(i,j)<<"," ;
Out_x1<

Array<
Out_x2<

Array<

Out_Net<<3*NetWorkOut(i,j)<<"," ;

Array<

Out_Exp<

Array<<3*NetWorkOut(i,j)<<" " ;

Array<<'\n' ;
}
Out_x1<<'\n' ;
Out_x2<<'\n' ;
Out_x11<<'\n';
Out_x22<<'\n';
Result1<<'\n' ;

}
for(j=0 ; j {
for(i=0 ; i {
Out_x111< Out_x222< Result2<<3*NetWorkOut(i,j)<<"," ;
}
Out_x111<<'\n';
Out_x222<<'\n' ;
Result2<<'\n' ;
}

//把经过训练后的权系数和阀值保存到文件里
for(i=1 ; i {
for(int j=0 ; j {
for(int k=0 ; k {

W_End< }
}
}//end for

}//end

void main(void)
{
BP B;//生成一个BP类对象B
B.Train();//开始训练
B.BP_Print();//把结果打印出来
B.After_Train_Out();//把结果保存到文件

}//end

PHP 爬虫实战：爬取淘宝商品详情数据 EcomDataMiner php 爬虫开发语言
随着互联网技术的发展，数据爬取越来越成为了数据分析、机器学习等领域的重要前置技能。而在这其中，爬虫技术更是不可或缺。php作为一门广泛使用的后端编程语言，其在爬虫领域同样也有着广泛应用和优势。本文将以爬取斗鱼直播数据为例，介绍php爬虫的实战应用。准备工作在开始爬虫之前，我们需要做一些准备工作。首先，需要搭建一个本地服务器环境，推荐使用WAMP、XAMPP等集成化工具，方便部署PHP环境。其次，我
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
模拟退火算法：原理、应用与优化策略尹清雅算法
摘要模拟退火算法是一种基于物理退火过程的随机搜索算法，在解决复杂优化问题上表现出独特优势。本文详细阐述模拟退火算法的原理，深入分析其核心要素，通过案例展示在函数优化、旅行商问题中的应用，并探讨算法的优化策略与拓展方向，为解决复杂优化问题提供全面的理论与实践指导，助力该算法在多领域的高效应用与创新发展。一、引言在现代科学与工程领域，复杂优化问题无处不在，如资源分配、路径规划、机器学习模型参数调优等。
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
yum install locate出现Error: Unable to find match: locate解决方案爱编程的喵喵 Linux解决方案 linux locate yum 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了yuminstalllocate出现
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
【机器学习】建模流程 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能线性回归逻辑回归
1、数据获取1.1来源数据获取是机器学习建模的第一步，常见的数据来源包括数据库、API、网络爬虫等。数据库是企业内部常见的数据存储方式，例如：MySQL、Oracle等关系型数据库，以及MongoDB等非关系型数据库，它们能够存储大量的结构化和非结构化数据API（应用程序编程接口）提供了从外部获取数据的便捷方式，例如：社交媒体平台的API可以获取用户发布的内容和互动信息网络爬虫则适用于从网页中提取
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
【机器学习】模型拟合 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能欠拟合过拟合
1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
基于Python的智能决策支持系统：实现智能化决策的关键要素 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
文章目录基于Python的智能决策支持系统：实现智能化决策的关键要素11.背景介绍2.核心概念与联系数据收集与预处理模型构建与训练决策规则生成与优化决策结果评估与反馈3.核心算法原理具体操作步骤数据挖掘算法机器学习算法优化算法4.数学模型和公式详细讲解举例说明线性回归模型最小二乘法5.项目实践：代码实例和详细解释说明6.实际应用场景金融领域医疗领域供应链管理智能制造7.工具和资源推荐编程语言和开发
下一代模型技术演进与场景应用突破智能计算研究中心其他
内容概要当前模型技术正经历多维度的范式跃迁，可解释性模型与自动化机器学习（AutoML）成为突破传统黑箱困境的核心路径。在底层架构层面，边缘计算与量子计算的融合重构了算力分配模式，联邦学习技术则为跨域数据协作提供了安全可信的解决方案。主流框架如TensorFlow和PyTorch持续迭代优化能力，通过动态参数压缩与自适应超参数调优策略，显著提升模型部署效率。应用层创新呈现垂直化特征，医疗诊断模型通
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
人工智能之数学基础：线性子空间每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习线性代数线性子空间线性空间
本文重点在前面的课程中，我们学习了线性空间，本文我们我们在此基础上学习线性子空间。在应用中，线性子空间的概念被广泛应用于信号处理、机器学习、图像处理等领域。子空间的性质子空间是线性空间的一部分，它需要满足下面的性质：设V是数域F上的线性空间，W是V的一个非空子集。如果W对于V中的加法运算和数乘运算也构成F上的一个线性空间，则称W为V的线性子空间（或称向量子空间）。具体来说，设V是一个线性空间，W是
详解离线安装Python库爱编程的喵喵 Python基础课程 python 离线安装 requirements
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了详解离线安装Python库，希望能对
ESG证书：AI预测未来十年职场人的黄金入场券 ESG学习圈 pandas python django
当ChatGPT开始撰写ESG报告，当机器学习模型精准预测企业碳排放轨迹，一场由AI驱动的ESG革命正在颠覆传统可持续发展领域。根据彭博新能源财经预测，到2030年全球ESG资产管理规模将突破50万亿美元，而AI技术将成为撬动这个万亿级市场的核心杠杆。一、AI透视下的ESG黄金时代在微软开发的AI模型ESG-NOW系统中，通过分析全球4300家上市公司近十年的环境数据，成功预测2025年新能源行业
【Dive Into Stable Diffusion v3.5】1：开源项目正式发布——深入探索SDv3.5模型全参/LoRA/RLHF训练 Donvink 大模型 #AIGC stable diffusion AIGC 人工智能机器学习深度学习
目录1引言2项目简介3快速上手3.1下载代码3.2环境配置3.3项目结构3.4下载模型与数据集3.5运行指令3.6核心参数说明3.6.1通用参数3.6.2优化器/学习率3.6.3数据相关4结语1引言在人工智能和机器学习领域，生成模型的应用越来越广泛。StableDiffusion作为其中的佼佼者，因其强大的图像生成能力而备受关注。今天，我的开源项目DiveIntoStableDiffusionv3
知识库在意图识别中扮演着**数据支撑**和**语义理解辅助**的双重角色 PersistDZ 大数据与AI 人工智能
知识库在意图识别中扮演着数据支撑和语义理解辅助的双重角色，而训练智能客服的意图识别Agent需要结合知识库的结构化数据与机器学习技术。以下是详细解析：一、知识库在意图识别中的作用1.提供标注数据意图标签定义：知识库中存储了预先定义的意图分类体系（如“订单查询”“退换货”“投诉”等），为模型提供明确的训练目标。标注样本：知识库包含大量用户对话历史及其对应的意图标签，是训练监督学习模型的核心数据源。2
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
Hessian 矩阵是什么 ZhangJiQun&MXP 教学 2021 AI python 2024大模型以及算力矩阵线性代数算法人工智能机器学习
Hessian矩阵是什么目录Hessian矩阵是什么Hessian矩阵的性质及举例说明**1.对称性****2.正定性决定极值类型****特征值为2（正），因此原点(0,0)(0,0)(0,0)是极小值点。****3.牛顿法中的应用****4.特征值与曲率方向****5.机器学习中的实际意义**一、定义与公式二、实例分析Hessian矩阵是多元函数二阶偏导数构成的方阵，用于分析函数局部曲率、判断极
LoRA中黑塞矩阵、Fisher信息矩阵是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力矩阵机器学习人工智能 transformer 深度学习算法线性代数
LoRA中黑塞矩阵、Fisher信息矩阵是什么1.三者的核心概念黑塞矩阵（Hessian）二阶导数矩阵，用于优化问题中判断函数的凸性（如牛顿法），或计算参数更新方向（如拟牛顿法）。Fisher信息矩阵（FisherInformationMatrix,FIM）统计学中衡量参数估计的不确定性，反映数据中包含的关于参数的信息量。在机器学习中常用于自然梯度下降（NaturalGradientDescent
神经网络基础之正则化硬水果糖人工智能神经网络人工智能机器学习
引言：正则化（Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（PenaltyTerm），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&