Harvey_Hawk

论文要点总结：Gradient-Based Learning Applied to Document Recognition（一）

这篇Yann LeCun于1998年发表在Proceedings of the IEEE的论文是深度学习领域的一篇经典综述，主要内容是：以字符识别为例，证明使用基于梯度的反向传播训练的多层神经网络优于手动提取特征的识别算法。因全文较长，下面将对认为重要的内容进行总结。

GitHub实现：LeNet-5-TensorFlow

摘要

关键词

I. 介绍

A. 从数据中学习

B. 基于梯度的学习

C. 梯度反向传播

D. 在真实手写识别系统中的学习

E. 全局训练系统

II. 用于孤立字符检测的卷积神经网络

A. 卷积网络

B. LeNet-5

C. 损失函数

摘要

选定合适的网络结构，基于梯度的学习算法可以被用于形成一个复杂的决策面，只需最少的预处理即可对如手写数字等高维模式进行分类。

在字符识别中，一个新的学习范式GTN（图转移网络）能将多个任务（如字符区域提取、分割、识别以及语言建模等）使用基于梯度的最小化某个整体性能指标（损失函数）的方法来共同训练。

通过实验证明了全局训练方法的优势，以及图转移网络的灵活性。

关键词

卷积神经网络，文档识别，有限状态转移机，基于梯度的学习，图转移网络，机器学习，神经网络，光学字符识别（OCR）。

I. 介绍

本文的主旨是：通过更多地使用自动学习，而非手动设计的启发式方法，能建立更好的模式识别系统。

使用字符识别作为研究案例，我们揭示了手动特征提取可以被一种直接作用在像素图像上的学习算法很好地取代，这种统一的范式称之为GTN。

在模式识别的早期，人们已经发现自然数据（不论是语音、符号还是其他模式）的多变性和丰富性使得完全通过手动来建立一个准确的识别系统是几乎不可能的。因此，大多数模型识别系统的建立是通过将自动学习方法（可训练的分类器）与手动设计算法（特征提取器）相结合（如Fig.1）。

特征提取器将输入数据转化为低维向量或短字符串，使其：1、容易被匹配或比较；2、对（未发生本质变化的）输入数据的变化与畸变保持相对不变性。

这一方法最大的一个问题是：识别精度严重依赖于设计者找到一组合适特征的能力，这导致对每一个新问题都需要重新进行这一步骤。

从历史上看，对合适的特征提取器的需求是基于这一事实：用于分类器的学习方法被限制在容易分类的低维空间[1]。近几十年来，三个因素改变了这一点：1、具有快速运算单元的低成本机器允许依赖更多的蛮力“数值”方法，而不是算法的改进；2、对如手写识别等问题的大量数据的出现使得设计者能更多地依赖真实数据而非手动提取的特征来建立识别系统；3、（关键）当使用这些大量的数据集训练时，能处理高维输入的强大的机器学习算法可以生成复杂的决策函数。

尽管更多使用自动学习效果更好，没有一个学习算法可以在不使用（最少量的）任务的先验知识的情况下获得成功。对多层神经网络，一个结合先验知识的好办法是根据任务调整网络结构。在Section II中介绍的卷积神经网络是一种特殊的神经网络结构，通过使用局部连接模式与对权重施加限制的方式，将关于二维形状不变性的先验知识（与网络）结合起来[2]。

为了从识别单个字符扩展到识别文档中的单词或句子，在Section IV介绍将多个模型结合起来训练以减小总误差的方法。使用多模型系统识别如手写单词等变长对象的最好是使这些模型操作有向图。这在Section IV引入了可训练GTN的概念。

Section V介绍了一种现在的经典方法HOS（heuristic oversegmentation，启发式分割），用于识别单词或其他字符串。

无需手动划分单词并标注的、用于在单词级别训练识别器的、判别与非判别式的基于梯度的方法在Section VI介绍。

Section VII提出了一种空间位移神经网络，通过扫描一个在输入的所有可能方向的识别器，而不需要分割启发式方法。

Section VIII显示可训练的GTN可表述为基于一个通用的图构成算法生成的多个转换器。也介绍了GTN与常被用于语音识别的HMM（隐马尔科夫模型）的联系。

Section IX介绍了一个用于识别通过手写输入计算机的内容的全局训练GTN系统。这一问题称之为“在线”手写识别，因为计算机必须在用户书写时生成即时反馈。该系统的核心为一个卷积神经网络。结果清楚地证明了在单词级别训练识别器，而非在预先分割、手动标注的单独的字符上训练的优势。

Section X描述了一个完整的用于识别手写与打印的银行支票的基于GTN的系统，核心是称为LeNet-5（Section II）的卷积神经网络。

A. 从数据中学习

有许多自动机器学习方法，但近年来在神经网络社区最成功的方法之一，被称为“数值的”或基于梯度的学习。该方法学习一个函数 $Y^{p}=F(Z^{p},W)$ ，其中 $Z^{p}$ 为第p个输入模式，W代表系统中所有可学习的参数。输出 $Y^{p}$ 既可为 $Z^{p}$ 的类别，也可为每一类的得分或概率。损失函数 $E^{p}=D(D^{p},F(W,Z^{p}))$ 衡量 $Z^{p}$ 的期望输出 $D^{p}$ 与系统输出的差异。平均损失函数 $E_{train}(W)$ 为 $E^{p}$ 在整个训练集上的平均，学习问题即为寻找使得 $E_{train}(W)$ 最小的W。

实际中，并不要求在训练集上取得最低错误率，更重要的是在系统的实际使用环境中的表现，称之为测试集。许多理论与实验[3-5]证明了 $E_{test}$ （泛化误差）与 $E_{train}$ 的差异与训练样本个数的关系： $E_{test}-E_{train}=k(h/P)^{\alpha }$ ，其中P是训练样本个数，h衡量模型的“有限容量”或复杂度[6, 7]， $\alpha$ 是一个取值范围在[0.5, 1]的数，k是常数。因此，当h增加时，存在一个权衡：降低 $E_{train}$ 与提高 $E_{test}$ ，而最佳的h值对应取得最低的 $E_{test}$ 。

大多数学习算法致力于最小化 $E_{train}$ 与估计 $E_{test}$ 和 $E_{train}$ 之间的差异。其中的一个正式版本称为结构风险最小化[6, 7]，基于定义一系列模型容量不断增长的学习机，对应一系列参数空间子集，每一个子集都是之前所有子集的超集。实际条件中，结构风险最小化的对象是 $E_{train}+\beta H(W)$ ，其中H(W)称为正则函数， $\beta$ 是一个常数。H(W)被设计为对属于较大容量的参数空间子集的W取较大的数值。最小化H(W)实际上就是限制参数空间的容量（模型大小），控制最小化训练误差和最小化训练误差和测试误差之间的期望差距之间的权衡。

B. 基于梯度的学习

基于梯度的学习更容易最小化一个相对平滑、连续的函数，而非一个离散（组合）函数。损失函数的最小化可以通过衡量参数值的微小变化对损失函数的影响，即计算损失函数对这些参数的梯度。（原因是）梯度向量可以被解析计算，而非通过数值扰动。这是许多具有连续值参数的基于梯度的学习算法的基础。在本文中，W是实值向量，损失函数E(W)连续且几乎处处可微。最简单的最小化（损失函数）方法是梯度下降算法，如 $W_{k}=W_{k-1}-\epsilon\frac{\partial E(W)}{\partial W}$ 迭代调整W的值，其中 $\epsilon$ 为常数。更复杂的算法将 $\epsilon$ 设为变量，或用对角矩阵代替，或用逆Hessian矩阵代替（如牛顿/类牛顿法）。也可以使用共轭梯度法[8]。但是Appendix B表明，尽管在文献中有许多相反的说法，这些二阶方法对大型学习机的作用是非常有限的。

一个流行的最小化方法是随机梯度算法，也称为在线更新。该方法使用一个有噪声的近似平均梯度来更新参数向量。在这个过程中，参数向量在一个平均轨迹上下波动，但是在具有冗余样本的大型训练集上，它通常比普通梯度下降和二阶方法收敛得快得多(如语音或字符识别)。这一结论的原因在Appendix B中有提到。

C. 梯度反向传播

基于梯度的学习自20世纪50年代后期就开始使用，但大多局限于线性系统[1]。由于以下三个原因，这种简单的梯度下降算法对复杂机器学习算法的作用被广泛地认识到：1、在实际中，损失函数的局部极小值对非线性学习算法并不是一个主要问题[13, 14]；2、在多层非线性系统中能简单、有效地计算梯度的方法的流行，如反向传播算法[15]；3、反向传播算法被应用于带Sigmoid单元的多层神经网络，被证明可以解决复杂的学习任务。

关于反向传播，有一个基本的观点：从输出到输入使用反向传播，可以高效地计算梯度。有趣的是，在NN的上下文学习中，反向传播的早期版本并不使用梯度，而是在中间层单元使用“虚拟目标”[17, 18]，或使用最小扰动参数[19]。

局部极小值对多层神经网络似乎并不构成问题，这在理论上是一个玄学。据推测，如果网络的“尺寸”对任务而言足够大（这在实际中是大多数情况），那么参数空间的“额外维度”的存在就能降低（最小化损失函数时）无法到达某些区域的风险。直到现在，反向传播算法是神经网络学习算法（甚至是任何形式的学习算法）中使用最广泛的。

D. 在真实手写识别系统中的学习

对孤立的手写字符的识别是神经网络的早期成功应用之一[23-25]。在Section III中介绍了孤立手写数字识别的对比实验。实验显示，对相同的数据，使用基于梯度的学习方法训练的神经网络优于所有对比方法。其中最好的神经网络，即卷积神经网络，能学习到如何直接从像素图像中提取相关特征（Section II）。

然而在手写识别中，最困难的问题之一并不只有识别单个字符，而是如何从单词或句子中将邻近的各个字符分离出来（分割）。这一任务的“标准”方法称为启发式分割（HOS）。首先，使用启发式图像处理技术在字符间生成大量的可能划分（cuts），接着根据识别器对每个候选字符给出的分数来选择最佳的划分组合。要训练这样的识别器是十分困难的，因为难以生成一个误分割字符的标注数据库。

第一个解决方案（Section V），在字符串而非字符级别进行训练，最小化一个度量错误回答概率的全局损失函数。该节中探索了多种方式以确保可微，因此使用基于梯度的学习方法；还介绍了有向无环图（有向无环图的弧携带数字信息作为替代假设的一种方式）的使用以及GTN的概念。

第二个解决方案（Section VII），让识别器在输入图像上的每一个可能的位置扫描，这一方法依赖于识别器的正确识别输入区域中中心对齐的字符的能力[26, 27]。将如此得到的识别器输出序列输入到一个含语言学约束、最后提取出最可能翻译的GTN中。GTN类似于隐马尔科夫模型，使得该方法与经典的语音识别方法有相似之处[28, 29]。尽管这种技术在一般情况下相当昂贵，但卷积神经网络的使用可以显著地节省计算成本，因此具有特别的吸引力。

E. 全局训练系统

最初，大多数实用的模式识别系统都由多个模块组成。在大多数情况下，从一个模块传递到另一个模块的信息最好用带有附在弧上的数字信息的图来表示。例如，识别模型的输出可以表示为一个无向图：每条弧包含了一个可能字符的标签和得分，每条通道代表输入字符串的一种可能解释。这种多个模块组装而成的识别系统训练过程复杂、费时，分别优化的效果也常常不是最优的。

一个更好的办法是对整个系统进行训练，使用基于梯度的方法最小化一个（可微的）在文档级别衡量字符误分类概率的全局误差（损失函数）。但是，系统的尺寸以及复杂度使得这一过程是困难的。

为保证全局损失函数 $E^{P}(Z^{P}, W)$ 可微，整个系统是一个使用可微模块建立的前馈网络。每个模块实现的函数（非损失函数）必须对内部参数（如神经网络的权重）和输入处处连续且可微。这样的话，反向传播可以被用于对系统的所有参数高效地计算损失函数的梯度[22]。

例如，对一个通过多个模块级联建立的系统，各模块可表示为： $X_{n}=F_{n}(W_{n},X_{n-1})$ ，其中 $X_{n}$ 为该模块的输出向量， $W _{n}$ 为该模块的可调参数向量（W的子集）， $X_{n-1}$ 为该模块的输入向量（也是前一个模块的输出向量）。则若 $X_{n}$ 已知，损失函数 $E^{p}$ 对 $W _{n}$ 和 $X_{n-1}$ 的偏导数可计算为：

$\frac{\partial E^{p}}{\partial W_{n}}=\frac{\partial F}{\partial W}(W_{n},X_{n-1})\frac{\partial E^{p}}{\partial X_{n}}$

$\frac{\partial E^{p}}{\partial X_{n-1}}=\frac{\partial F}{\partial X}(W_{n},X_{n-1})\frac{\partial E^{p}}{\partial X_{n}}$ ，

其中 $\frac{\partial F}{\partial W}(W_{n},X_{n-1})$ 是F对W在 $(W_{n},X_{n-1})$ 处的雅可比矩阵， $\frac{\partial F}{\partial X}(W_{n},X_{n-1})$ 是F对X的雅可比矩阵。第一个公式计算 $E^{p}(W)$ 的梯度的一些项，第二个公式生成逆向递推，如同在神经网络的反向传播过程（中的计算）。我们可以对所有训练样本的梯度求平均来得到完整（训练样本）的梯度。

向量函数的雅可比矩阵是包含所有输出对所有输入的偏导数的矩阵。但有趣的是，不需要显式地计算雅可比矩阵。上式使用了雅可比矩阵与偏导数向量的乘积，直接计算这个乘积往往比较容易，不需要事先计算雅可比矩阵。

与普通的多层神经网络相似，除了最后一个模块外，其他模块都称为隐藏层，因为它们的输出从外部是不可观察的。在比上面描述的简单模块级联更复杂的情况下，偏导数表示变得模糊和笨拙。在更一般的情况下，可以用拉格朗日函数进行严格的推导[20-22]。

传统的多层神经网络是上述情况的一种特殊情况，其中状态信息 $X_{n}$ 用固定尺寸的向量表示，模块是交替出现的矩阵乘法的层（权重）与sigmoid函数（神经元）。然而，如前所述，在复杂识别系统中，状态信息最好表示方式是使用在弧上附带数值信息的图。在这种情况中，每个称为GT的模块接受一个或多个图作为输入，并生成一个图作为输出。由这些模块组成的网络称为GTN。

Section IV，VI和VIII发展了GTN的概念，并表明基于梯度的学习可以用来训练所有模块中的所有参数，从而最小化全局损失函数。当状态信息由本质上离散的对象（如图形）表示时可以计算梯度，这似乎有些矛盾，但后文中这一困难是可以绕过的。

II. 用于孤立字符检测的卷积神经网络

在传统的模式识别模型中，人工设计的特征提取器从输入中收集相关信息，并排除不相关的变量。然后，一个可训练的分类器将得到的特征向量分类。在该方案中，可以使用标准的全连接多层网络作为分类器。一个可能更有趣的方案是，尽可能依赖于特征提取器自身的学习。在字符识别中，可以向网络输入几乎原始的数据（如尺寸归一化的图像）。虽然对于字符识别这样的任务，普通的全连接前馈网络取得了一定的成功，但也存在一些问题。

首先，图像很大，通常有几百个变量（像素）。一个全连接的第一层有（例如）100个隐藏单元，就已经包含了数万个权重。如此大量的参数增加了系统的容量，因此需要更大的训练集。此外，存储如此多权重的内存需求可能会排除某些硬件实现。但用于图像或语音应用的非结构化网络的主要缺陷是，它们对于输入的变换或局部失真没有内在的不变性。字符图像或其他二维/一维信号在被送到神经网络的固定尺寸的输入层之前，必须在输入中进行近似大小的归一化和集中。不幸的是，没有一种预处理是完美的：手写通常是在单词级别标准化的，这可能会导致单个字符的尺寸、倾斜和位置变化。理论上，一个足够大的全连接网络可以学习产生相对于这些变化保持不变的输出。然而，学习这样一个任务可能会导致多个权重模式相似的单元被放置在输入（层）的不同位置，以便检测输入中出现的有辨别性的特征。（但）在卷积网络中，如下所述，通过强迫权重配置在空间中复制，自动获得（对特征的）位移不变性。

其次，全连接结构的一个缺陷是完全忽略了输入的拓扑结构。输入变量可以以任何（固定）顺序表示，而不影响训练的结果。相反，图像（或语音的时频表征）有很强的2-D局部结构：在空间或时间上相邻的变量（或像素）高度相关。局部相关性是在识别空间或时间对象之前，提取和结合局部特征的优势的原因，因为相邻变量的配置结构可以分为少量类别（如边缘、角等）。卷积网络（的结构）通过限制隐藏单元的感受野为局部，来强制提取局部特征。

A. 卷积网络

注：此节中，一个单元指特征图中的一个像素。

卷积网络结合了三个结构性思想，保证了一定程度的位移、尺度和失真不变性：1）局部感受野；2）共享权重(或权重复制)；3）空间或时间的下采样。

一个典型的用于识别字符的卷积网络LeNet-5如（Fig. 2）所示。输入层接收尺寸归一化和居中的字符图像。每一层中的每个单元都从位于前一层中一个小邻域内的一组单元接收输入。局部连接在视觉学习的神经模型中被多次使用[2, 18, 31-34]。通过局部感受野，神经元可以提取基本的视觉特征，如定向边缘、端点、角（或其他信号中的类似特征，如语音谱图）。这些特征然后被随后的层结合，以检测更高阶的特征。

一个层中的单元被组织在平面中，在平面中所有的单元共享相同的权重集合。在这样一个平面上的单元的输出集合称为特征图。特征图中的单元都被约束，以在图像的不同部分上执行相同的操作。一个完整的卷积层是由多个特征图组成的（用不同的权重向量），这样可以在每个位置提取多个特征，如LeNet-5的第一层。LeNet-5的第一个隐藏层中的单元被组织为六个平面，每个平面都是一个特征图。一个特征图中的一个单元有25个输入，连接到输入图像中的一个5*5的区域，称为该单元的感受野。每个单元有25个输入，因此有25个可训练系数（权重）加上一个可训练偏置。

如前所述，特征图中的所有单元共享同一组25个权重和相同的偏置，因此它们会在输入的所有可能位置检测到相同的特征。该层中的其他特征图使用不同的权重和偏置的集合，从而提取不同类型的局部特征。在LeNet-5中，在每个输入位置，六个单元在六个特征图的相同位置提取六个不同类型的特征。特征图的连续实现，将使用具有局部感受野的单个单元扫描输入图像，并将该单元的状态存储在特征图的相应位置。这个操作等价于卷积，然后加上一个附加的偏置和压缩函数（也称激活函数），因此被称为卷积网络。卷积的核是特征图中各单元所使用的连接权重集合。卷积层的一个有趣的特性是，如果对输入图像进行位移，则特征图输出也会被移动相同的位置，反之则保持不变。这一特性是卷积网络对输入的位移和失真具有鲁棒性的基础。

一旦一个特征被检测到，它的确切位置就不那么重要了。只有它相对于其他特征的近似位置是有意义的。这些特征的精确位置不仅与识别该特征无关，而且可能有害，因为这些位置可能因字符实例的不同而不同。降低特征图中特征位置编码精度的一种简单方法是降低特征的空间分辨率。这可以通过所谓的下采样层来实现，该层执行局部平均和下采样，从而降低特征图的分辨率，降低输出对位移和失真的敏感性。LeNet-5的第二个隐藏层是下采样层。这一层包含6个特征图，对应前一层中的每个特征图。每个单元的感受野为上一层对应的特征图中的一个2*2区域。每个单元计算它的四个输入的平均值，乘一个可训练系数，加上一个可训练偏置，然后将结果通过一个Sigmoid函数。相邻单元具有不重叠的相邻感受野。可训练系数和偏置控制了Sigmoid函数非线性的影响。如果系数很小，那么单元以准线性模式运行，下采样层仅仅是对输入进行模糊。如果系数较大，则下采样单位可视为执行一个“有噪声的或”或“有噪声的与”的函数，这取决于偏置的值。卷积和下采样层通常是连续交替进行的，结果是：在每一层，特征图的数量随着空间分辨率的降低而增加。Fig. 2中第三个隐藏层中的每个单元都可以具有来自前一层的多个特征图的输入连接。通过空间分辨率的逐步降低，可以很大程度地实现输入的几何变换不变性。空间分辨率的逐步降低由表示的丰富程度（即特征图的数量）的逐步增加来补偿。

权重共享有一个有趣的副作用，即减少自由参数的数量，从而减少机器的“容量”，并减少测试误差和训练误差之间的差距[34]。Fig. 2中的网络包含345308个连接，但由于权重共享，只有60000个可训练的自由参数。

在单一时间维度上共享权重的固定尺寸的卷积网络称为时延神经网络（TDNN）。TDNN已经被用于音素识别（不使用下采样）[40, 41]，口语识别（使用下采样）[42, 43]，孤立手写字符的在线识别[44]和签名验证[45]。

B. LeNet-5

本节将更详细地描述LeNet-5的结构，以及实验中使用的卷积神经网络。LeNet-5包含七层（不含输入层），每一层都有可训练的参数（权重）。输入为32*32像素图像。这比数据库中的最大字符大得多（最大为20*20，位于一个28*28的邻域中心）。其原因是希望潜在的显著特征如笔画端点或角，可以出现在最高阶的特征检测器的感受野的中心。在LeNet-5中，最后一个卷积层（C3，见下文）的感受野的中心，在32*32输入的中央形成一个20*20的区域。输入像素的值被归一化，以便背景（白色）对应-0.1的灰度值，前景（黑色）对应1.175的灰度值。这使得输入的平均值及方差大约为0，加速了学习[46]。

C1层包含156个可训练参数（(5*5+1)*6=156）以及122304个连接（156*28*28=122304）。

S2层包含12个可训练参数（(1+1)*6=12）以及5880个连接（(2*2+1)*6*14*14=5880）。

Table 1显示了组成每个C3特征图的S2特征图集合。之所以不将每个S2的特征图与每个C3特征图连接（如同输入层到C1层的操作），有两个原因：1）不完全的连接方案将连接的数量控制在合理的范围内；2）更重要的是，该连接方式破坏了网络的对称性，使得（C3中）不同的特征图提取不同的（希望是互补的）特征，因为它们得到的是不同的输入。该方案的原理如下：1）0-5的C3特征图从S2中的三个特征图的每个相邻子集中获取输入；2）6-11从四个特征图的每个相邻子集中获取输入；3）12-14从四个特征图的一些不相邻子集中获取输入；4）15从所有特征图中获取输入。C3层包含1516个可训练参数以及156000个连接。

S4层包含32个可训练参数和2000个连接（计算同S2层）。

C5层是一个包含120个特征图（1*1）的卷积层。C5的每个单元与S4的所有16个5*5特征图相连接（相当于S4到C5是全连接的）。C5之所以被标记为卷积层而非全连接层，是因为如果在其他条件不变的情况下让LeNet-5的输入变大（大于28*28），feature map的维数就会大于1*1。这一动态增加卷积网络大小的过程将在Section VII中描述。C5层包含48120个连接。

F6层包含84个单元（产生这个数字的原因来自于输出层的设计，将在下面解释），并且与C5层完全连接。F6层包含10164个可训练参数（(120+1)*84=10164）。

输出层由欧氏RBF（径向基函数）单元组成，每个类对应一个RBF单元以及84个输入。每个RBF单元的输入 $y_{i}$ 的计算公式为 $y_{i}=\sum(x_{j}-w_{ij})^{2}$ 。即每个RBF单元计算其输入向量与参数向量之间的欧式距离。在概率上，RBF输出可以解释为在F6层配置空间中的一个高斯分布的非标准化的负对数似然函数。这些RBF单元被设计成在一个7*12位图（因此F6层有84单元）上绘制对应字符类的程式化（stylized）图像。这样的表示对于识别孤立的数字并不是特别有用，但是对于识别从完全可打印的ASCII字符集中提取的字符串非常有用。原因是相似的字符会有相似的输出编码，因此容易混淆。如果该系统与能够纠正这种混淆的语言后处理器结合在一起，就会特别有用。因为易混淆类的编码是相似的，所以对于不明确的字符对应的RBF的输出将是相似的，而后处理器将能够选择正确的解释。Fig. 3给出了完整ASCII字符集的输出代码。

之所以使用这种分布式（distributed）编码（RBF）而不是非分布式编码作为输出，一个原因是，当有数十个类时非分布式编码表现很差。因为非分布式编码中的输出单元在大多数时候都必须关闭（为0），而这对Sigmoid单元这是很难做到的。

另一个原因是，分类器通常不仅用于识别字符，还用于拒绝非字符。带有分布式编码的RBF更适合这个目的，因为与Sigmoid不同，它们是在输入空间的一个边界明确的区域内被激活的，在这个区域之外，非典型的模式更有可能被抑制（fall）。

RBF的参数向量充当F6层的目标向量。值得指出的是，这些向量的分量是+1或-1，在F6层的Sigmoid函数值域范围内，因此可以防止这些Sigmoid函数饱和（会导致损失函数收敛缓慢或出现异常值）。事实上，+1和-1是Sigmoid函数的最大曲率点（极值点）。这迫使F6单元在他们的最大非线性范围内运行。

C. 损失函数

可用于上述网络的最简单的输出损失函数是最大似然估计，在我们的例子中，等价于最小均方误差（MSE）。一组训练样本的损失函数为 $E(W)=\frac{1}{P}\sum_{p=1}^{P}y_{D^{p}}(Z^{p},W)$ ，其中 $y_{D^{p}}$ 是第 $D^{p}$ 个RBF单元的输出，即与输入 $Z^{p}$ 的正确分类对应。虽然这种损失函数适用于大多数情况，但它也存在缺陷。

如果RBF参数参与训练，可能出现所有RBF参数向量相等、F6层的状态为常数且等于该参数向量的情况。这样的话对任何输入，RBF单元的输出都为0。

此外，还可能出现不同类之前没有竞争（competition）的情况。可以使用区分性更强的最大后验概率损失函数，类似于有时用于训练隐马尔科夫模型（HMM）的最大互信息损失函数[48-50]。即相当于最大化正确类 $D^{p}$ 的后验概率（或最小化正确类的概率的对数），假设输入图像可以来自其中一个类或来自背景“垃圾”类的标签。就惩罚而言，该损失函数除了像MSE一样可以减小正确类的惩罚之外，还可以增大错误类的惩罚： $E(W)=\frac{1}{P}\sum_{p=1}^{P}(y_{D^{p}}(Z^{p},W)+log(e^{-j}+\sum e^{-y_{i}(Z^{p},W)}))$ 。常数j是正的，可以防止当类的惩罚已经很大时，最终的值变得更大。垃圾类的后验概率为 $e^{-j}$ 与 $\sum e^{-y_{i}(Z^{p},W)})$ 的比值。因为该损失函数使RBF单元的中心彼此分开，所以可以出现所有RBF参数向量相等的情况。在Section VI中，我们为学习对输入中的多个对象进行分类的系统（如文档中单词的字符）提供了这一损失函数的一般化形式。

考虑到权重分享，标准的反向传播算法需要稍加修改。一个简单的实现方法是，首先计算损失函数对每个连接的偏导数，就好像网络是一个传统的没有权值共享的多层网络；接着将分享一个共同参数的所有连接的偏导数相加，形成对该参数的导数。

可以非常有效地训练一个这样的大型系统，但是需要使用附录中描述的一些技术。Appendix A描述了一些细节，比如使用特定的Sigmoid函数和权重初始化。Appendix B和C描述了所使用的最小化过程，它是Levenberg-Marquardt过程的对角近似的随机版本。

你可能感兴趣的:(深度学习)

大语言模型学习路线：从入门到实战大模型官方资料语言模型学习人工智能产品经理自然语言处理搜索引擎
大语言模型学习路线：从入门到实战在人工智能领域，大语言模型（LargeLanguageModels,LLMs）正迅速成为一个热点话题。本学习路线旨在为有基本Python编程和深度学习基础的学习者提供一个清晰、系统的大模型学习指南，帮助你在这一领域快速成长。本学习路线更新至2024年02月，后期部分内容或工具可能需要更新。适应人群已掌握Python基础具备基本的深度学习知识学习步骤本路线将通过四个核
深度学习与目标检测系列(六) 本文约(4.5万字) | 全面解读复现ResNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch 人工智能 ResNet 残差连接残差网络
文章目录解读Abstract—摘要翻译精读主要内容Introduction—介绍翻译精读背景RelatedWork—相关工作ResidualRepresentations—残差表达翻译精读主要内容ShortcutConnections—短路连接翻译精读主要内容DeepResidualLearning—深度残差学习ResidualLearning—残差学习翻译精读ResNet目的以前方法本文改进本质
深度学习与目标检测系列(三) 本文约(4万字) | 全面解读复现AlexNet | Pytorch | 小酒馆燃着灯深度学习目标检测 pytorch AlexNet 人工智能
文章目录解读Abstract-摘要翻译精读主要内容1.Introduction—前言翻译精读主要内容：本文主要贡献：2.TheDataset-数据集翻译精读主要内容：ImageNet简介：图像处理方法：3.TheArchitecture—网络结构3.1ReLUNonlinearity—非线性激活函数ReLU翻译精读传统方法及不足本文改进方法本文的改进结果3.2TrainingonMultipleG
计算机视觉技术探索：美颜SDK如何利用深度学习优化美颜、滤镜功能？美狐美颜sdk 美颜SDK 美颜API 直播美颜SDK 计算机视觉深度学习直播美颜SDK 美颜sdk 第三方美颜sdk 美颜api
时下，计算机视觉+深度学习正在重塑美颜技术，通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式，让美颜效果更加自然、精准、个性化。那么，美颜SDK如何结合深度学习来优化美颜和滤镜功能？本文将深入解析AI在美颜技术中的应用，并探讨其未来发展趋势。一、深度学习如何赋能美颜SDK？1.AI人脸检测与关键点识别：精准捕捉五官在美颜过程中，首先需要精准检测人脸位置和五官特征点，确保美颜效果不会失真。深度学
深度学习模型性能全景评估与优化指南 niuTaylor 深度学习人工智能
深度学习模型性能全景评估与优化指南一、算力性能指标体系1.核心算力指标对比指标计算方式适用场景硬件限制TOPS(TeraOperationsPerSecond)每秒万亿次整数运算量化模型推理NVIDIAJetsonNano仅支持FP16/FP32TFLOPS(TeraFLoating-pointOPerationsperSecond)TFLOPS=Cores×FLOPs/Cycle×Frequen
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析快撑死的鱼 Python算法精解 python 深度学习开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析在人工智能的众多应用领域中，手写数字识别是一项经典且具有重要实际应用价值的任务。随着深度学习技术的飞速发展，通过构建和训练神经网络模型，手写数字识别的精度已经可以达到99%以上。本文将以Python为主要编程语言，结合深度学习的核心技术，详细解析手写数字识别的实现过程，并探讨如何进一步优化模型以提高
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
腾讯云大模型知识引擎与DeepSeek：打造懒人专属的谷歌浏览器翻译插件大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 腾讯云云计算
摘要：随着人工智能技术的飞速发展，越来越多的前沿技术和工具已走入日常生活。翻译工具作为跨语言沟通的桥梁，一直处于技术创新的风口浪尖。本文探讨了腾讯云大模型知识引擎与DeepSeek结合谷歌浏览器插件的可能性，旨在为用户提供一种便捷、高效的翻译体验。通过应用深度学习、自然语言处理和知识图谱技术，该插件不仅能实时翻译网页内容，还能根据上下文进行智能推荐，实现精准的语境转换。本文将详细阐述其设计思路、技
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（二）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（二）5.跨模态检索系统应用场景5.1图文匹配系统的实际应用应用领域具体场景优势电子商务商品图像搜索、视觉购物用户可以上传图片查找相似商品或使用文本描述查找商品智能媒体内容推荐、图片库搜索通过内容的语义理解提供更精准的推荐和搜索社交网络基于内容的帖子推荐理解用户兴趣，提供更相关的内容推荐教育技术多模态教学资源检索教师和学生可以更
PyTorch深度学习框架60天进阶学习计划 - 第28天：多模态模型实践（一）凡人的AI工具箱深度学习 pytorch 学习 AI编程人工智能 python
PyTorch深度学习框架60天进阶学习计划-第28天：多模态模型实践（一）引言：跨越感知的边界欢迎来到我们的PyTorch学习旅程第28天！今天我们将步入AI世界中最激动人心的领域之一：多模态学习。想象一下，如果你的模型既能"看"又能"读"，并且能够理解图像与文字之间的联系，这将为我们打开怎样的可能性？今天我们将专注于构建图文匹配系统，学习如何使用CLIP（ContrastiveLanguage
10.2 如何解决从复杂 PDF 文件中提取数据的问题？墨染辉大语言模型 pdf
10.2如何解决从复杂PDF文件中提取数据的问题？解决方案：嵌入式表格检索解释：嵌入式表格检索是一种专门针对从复杂PDF文件中的表格提取数据的技术。它结合了表格识别、解析和语义理解，使得从复杂结构的表格中检索信息成为可能。具体步骤：表格检测和识别：目标：在PDF页面中准确地定位和识别表格区域。方法：使用计算机视觉和深度学习技术，如卷积神经网络（CNN）或其他先进的图像处理算法。效果：能够检测出页面
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
【深度学习】DeepSeek模型介绍与部署 Nerous_ 深度学习深度学习人工智能
原文链接：DeepSeek-V31.介绍DeepSeek-V3，一个强大的混合专家(MoE)语言模型，拥有671B总参数，其中每个token激活37B参数。为了实现高效推理和成本效益的训练，DeepSeek-V3采用了多头潜在注意力(MLA)和DeepSeekMoE架构，这些架构在DeepSeek-V2中得到了充分验证。此外，DeepSeek-V3首次提出了无辅助损失的负载平衡策略，并设置了多to
【深度学习】 PyTorch一文详解 Nerous_ 深度学习深度学习 pytorch 人工智能机器学习 python
“PyTorchisadeeplearningframeworkthatprioritizessimplicityandflexibility,makingitthego-tochoiceforbothresearchersanddevelopers.”—Anonymous1.PyTorch简介1.1PyTorch的背景与发展PyTorch是由Facebook人工智能研究院（FAIR）开发的一个开
【DNN量化工具】QKeras 工具简介 kanhao100 笔记 dnn 人工智能神经网络
QKeras工具简介QKeras是一个用于量化深度学习模型的Keras扩展库，旨在使深度学习模型的量化（即将模型的浮点权重转换为低精度格式）变得简单而高效。QKeras主要目标是优化模型的存储和推理速度，特别适用于需要在资源受限的设备（如移动设备和嵌入式系统）上运行深度学习模型的场景。QKeras的主要特点量化支持：QKeras提供了对不同类型量化的支持，包括权重量化和激活量化。用户可以根据需求选
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术 Mark White dnn 人工智能神经网络
Softmax温度调节与注意力缩放：深度神经网络中的平滑艺术在深度学习的精密机械中，有些细微的调整机制往往被视为理所当然，却实际上蕴含着深刻的数学洞察和巧妙的工程智慧。今天，我们将探讨两个看似独立却本质相通的机制：生成模型中的温度参数与Transformer注意力机制中的缩放因子。这两个设计都围绕着同一个核心概念——softmax分布的平滑控制。Softmax函数：概率分布的催化剂在深入讨论之前，
QKeras、Brevitas和QONNX量化工具对比 kanhao100 笔记深度学习边缘计算
QKeras、Brevitas和QONNX量化工具对比一、引言在深度学习模型部署领域，量化技术已成为提升模型执行效率的关键手段。通过将浮点权重转换为低精度表示，量化能显著减小模型体积、降低内存占用并加速推理过程。对于资源受限的设备（如移动设备、嵌入式系统和边缘计算设备），量化技术尤为重要。本文深入对比三款主流量化工具：QKeras、Brevitas和QONNX，从用户实际应用角度剖析它们的技术特点
Umi-OCR：解锁高效文字识别的新时代水熠芝Dark-Haired
Umi-OCR：解锁高效文字识别的新时代Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda项目介绍在数字化浪潮席卷全球的今天，文字识别技术已成为提升工作效率和生活质量的关键工具。Umi-OCR，作为一款基于深度学习技术的开源文字识别工具，凭借其强大的功能和高效的性能，迅速成为众多用户的首选。无
Umi-OCR：一款强大而高效的文字识别工具裘心国Trent
Umi-OCR：一款强大而高效的文字识别工具Umi-OCR一款强大而高效的文字识别工具项目地址:https://gitcode.com/Resource-Bundle-Collection/6adda介绍Umi-OCR是一款基于深度学习技术的开源文字识别工具，特别适合日常办公、学术研究及数据分析等场景。它能有效解决将图像中的文字快速转化为可编辑文本的需求，极大提升工作效率。此工具依托于先进的计算机
自动语音识别（ASR）：技术、应用与未来 ajie1117 语音识别人工智能
自动语音识别（ASR）：技术、应用与未来1.ASR简介自动语音识别（ASR，AutomaticSpeechRecognition）是一种将语音转换为文本的技术。它利用人工智能（AI）、深度学习和自然语言处理（NLP）技术来识别和理解人类的语言，使计算机能够与人类进行更自然的交互。2.ASR的工作原理ASR的核心流程通常包括以下几个步骤：语音信号采集：通过麦克风或其他设备获取音频数据。预处理：去除噪
关于误差平面小记文弱_书生乱七八糟平面算法神经网络机器学习
四维曲面的二维切片：误差平面详解在深度学习优化过程中，我们通常研究损失函数（LossFunction）的变化，试图找到权重的最优配置。由于神经网络的参数空间通常是高维的，我们需要使用低维可视化的方法来理解优化过程和误差平面（ErrorSurface）。在这里，我们讨论一个四维曲面的二维切片，其中：三个维度是网络的权重（w1,w2,w3w_1,w_2,w_3w1,w2,w3）。第四个维度是误差（损失
GraphCube、Spark和深度学习技术赋能快消行业关键运营环节 weixin_30777913 开发语言大数据深度学习人工智能 spark
在快消品（FMCG）行业，需求计划（DemandPlanning）、库存管理（InventoryManagement）和需求供应管理（DemandSupplyManagement）是影响企业整体效率和利润水平的关键运营环节。GraphCube图多维数据集技术、Spark大数据分析处理技术和深度学习技术的结合，为这些环节提供了智能化、动态化和实时化的解决方案，显著提升业务运营效率和企业利润。一、技术
Marker可以快速且准确地将PDF转换为markdown格式。星霜笔记开源关注简介免费源码 pdf
MarkerMarker可以快速且准确地将PDF转换为markdown格式。支持多种文档类型（针对书籍和科学论文进行了优化）支持所有语言移除页眉/页脚/其他杂质格式化表格和代码块提取并保存图像以及markdown将大多数方程转换为latex支持在GPU、CPU或MPS上运行工作原理Marker是一个由深度学习模型组成的管道：提取文本，必要时进行OCR处理（启发式算法，surya，tesseract
Hugging Face预训练GPT微调ChatGPT（微调入门！新手友好！） y江江江江机器学习大模型 gpt chatgpt
HuggingFace预训练GPT微调ChatGPT（微调入门！新手友好！）在实战中，⼤多数情况下都不需要从0开始训练模型，⽽是使⽤“⼤⼚”或者其他研究者开源的已经训练好的⼤模型。在各种⼤模型开源库中，最具代表性的就是HuggingFace。HuggingFace是⼀家专注于NLP领域的AI公司，开发了⼀个名为Transformers的开源库，该开源库拥有许多预训练后的深度学习模型，如BERT、G
Open-Sora - 为所有人实现高效的视频制作大众化小众AI AI开源音视频人工智能 AI编程
GitHub：https://github.com/hpcaitech/Open-Sora更多AI开源软件：发现分享好用的AI工具、AI开源软件、AI模型、AI变现-小众AI这是一款开源的SOTA（State-of-the-Art）视频生成模型，仅用20万美元（224张GPU）就能训练出商业级11B参数的视频生成大模型。它采用Python语言和PyTorch深度学习框架开发，具有生成速度快、资源消
Adam-mini：深度学习内存效率新突破 XianxinMao 人工智能深度学习人工智能
标题：Adam-mini：深度学习内存效率新突破文章信息摘要：Adam-mini优化器在深度学习领域展现出突破性潜力，尤其在内存效率和计算性能上表现卓越。相比AdamW，Adam-mini将内存效率提升了一倍，并通过减少学习率数量显著降低了内存消耗，同时保持了与AdamW相当甚至更好的性能。在训练十亿参数级别的大语言模型（LLM）时，Adam-mini实现了49.6%的吞吐量提升，并减少了33%的
Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
高性能计算:GPU加速与分布式训练 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的飞速发展，深度学习模型的规模和复杂度不断提升，对计算能力的需求也越来越高。传统的CPU架构已经难以满足深度学习模型训练的需求，因此，GPU加速和分布式训练成为了高性能计算领域的研究热点。1.1.深度学习与计算挑战深度学习模型通常包含数百万甚至数十亿个参数，训练过程需要进行大量的矩阵运算和梯度更新，对计算资源的需求非常高。传统的CPU架构虽然具有较强的通用性，但其并行计
java短路运算符和逻辑运算符的区别 3213213333332132 java基础
/* * 逻辑运算符——不论是什么条件都要执行左右两边代码 * 短路运算符——我认为在底层就是利用物理电路的“并联”和“串联”实现的 * 原理很简单，并联电路代表短路或（||），串联电路代表短路与（&&）。 * * 并联电路两个开关只要有一个开关闭合，电路就会通。 * 类似于短路或（||），只要有其中一个为true（开关闭合）是
Java异常那些不得不说的事白糖_ java exception
一、在finally块中做数据回收操作比如数据库连接都是很宝贵的，所以最好在finally中关闭连接。 JDBCAgent jdbc = new JDBCAgent(); try{ jdbc.excute("select * from ctp_log"); }catch(SQLException e){ ... }finally{ jdbc.close();
utf-8与utf-8(无BOM)的区别 dcj3sjt126com PHP
BOM——Byte Order Mark，就是字节序标记在UCS 编码中有一个叫做"ZERO WIDTH NO-BREAK SPACE"的字符，它的编码是FEFF。而FFFE在UCS中是不存在的字符，所以不应该出现在实际传输中。UCS规范建议我们在传输字节流前，先传输字符"ZERO WIDTH NO-BREAK SPACE"。这样如
JAVA Annotation之定义篇周凡杨 java 注解 annotation 入门注释
Annotation: 译为注释或注解 An annotation, in the Java computer programming language, is a form of syntactic metadata that can be added to Java source code. Classes, methods, variables, pa
tomcat的多域名、虚拟主机配置 g21121 tomcat
众所周知apache可以配置多域名和虚拟主机，而且配置起来比较简单，但是项目用到的是tomcat，配来配去总是不成功。查了些资料才总算可以，下面就跟大家分享下经验。很多朋友搜索的内容基本是告诉我们这么配置：在Engine标签下增面积Host标签，如下： <Host name="www.site1.com" appBase="webapps"
Linux SSH 错误解析（Capistrano 的cap 访问错误 Permission ） 510888780 linux capistrano
1.ssh -v [email protected] 出现 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password). 错误运行状况如下： OpenSSH_5.3p1, OpenSSL 1.0.1e-fips 11 Feb 2013 debug1: Reading configuratio
log4j的用法 Harry642 java log4j
一、前言： log4j 是一个开放源码项目，是广泛使用的以Java编写的日志记录包。由于log4j出色的表现，当时在log4j完成时，log4j开发组织曾建议sun在jdk1.4中用log4j取代jdk1.4 的日志工具类，但当时jdk1.4已接近完成，所以sun拒绝使用log4j，当在java开发中
mysql、sqlserver、oracle分页，java分页统一接口实现 aijuans oracle jave
定义：pageStart 起始页，pageEnd 终止页,pageSize页面容量 oracle分页：　　　　select * from ( select mytable.*,rownum num from (实际传的SQL) where rownum<=pageEnd) where num>=pageStart sqlServer分页：
Hessian 简单例子 antlove java Web service hessian
hello.hessian.MyCar.java package hessian.pojo; import java.io.Serializable; public class MyCar implements Serializable { private static final long serialVersionUID = 473690540190845543
数据库对象的同义词和序列百合不是茶 sql 序列同义词 ORACLE权限
回顾简单的数据库权限等命令; 解锁用户和锁定用户 alter user scott account lock/unlock; //system下查看系统中的用户 select * dba_users; //创建用户名和密码 create user wj identified by wj; identified by //授予连接权和建表权 grant connect to
使用Powermock和mockito测试静态方法 bijian1013 持续集成单元测试 mockito Powermock
实例： package com.bijian.study; import static org.junit.Assert.assertEquals; import java.io.IOException; import org.junit.Before; import org.junit.Test; import or
精通Oracle10编程SQL(6)访问ORACLE bijian1013 oracle 数据库 plsql
/* *访问ORACLE */ --检索单行数据 --使用标量变量接收数据 DECLARE v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; BEGIN select ename,sal into v_ename,v_sal from emp where empno=&no; dbms_output.pu
【Nginx四】Nginx作为HTTP负载均衡服务器 bit1129 nginx
Nginx的另一个常用的功能是作为负载均衡服务器。一个典型的web应用系统，通过负载均衡服务器，可以使得应用有多台后端服务器来响应客户端的请求。一个应用配置多台后端服务器，可以带来很多好处：负载均衡的好处增加可用资源增加吞吐量加快响应速度，降低延时出错的重试验机制 Nginx主要支持三种均衡算法： round-robin l
jquery-validation备忘白糖_ jquery css F#Firebug
留点学习jquery validation总结的代码： function checkForm(){ validator = $("#commentForm").validate({// #formId为需要进行验证的表单ID errorElement :"span",// 使用"div"标签标记错误，默认:&
solr限制admin界面访问（端口限制和http授权限制） ronin47 限定Ip访问
solr的管理界面可以帮助我们做很多事情，但是把solr程序放到公网之后就要限制对admin的访问了。可以通过tomcat的http基本授权来做限制，也可以通过iptables防火墙来限制。我们先看如何通过tomcat配置http授权限制。第一步：在tomcat的conf/tomcat-users.xml文件中添加管理用户，比如： <userusername="ad
多线程-用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 bylijinnan java 多线程
public class IncDecThread { private int j=10; /* * 题目:用JAVA写一个多线程程序，写四个线程，其中二个对一个变量加1，另外二个对一个变量减1 * 两个问题： * 1、线程同步--synchronized * 2、线程之间如何共享同一个j变量--内部类 */ public static
买房历程 cfyme
2015-06-21: 万科未来城，看房子 2015-06-26: 办理贷款手续，贷款73万，贷款利率5.65=5.3675 2015-06-27: 房子首付,签完合同 2015-06-28，央行宣布降息 0.25，就2天的时间差啊，没赶上。首付，老婆找他的小姐妹接了5万，另外几个朋友借了1-
[军事与科技]制造大型太空战舰的前奏 comsci 制造
天气热了........空调和电扇要准备好.......... 最近,世界形势日趋复杂化,战争的阴影开始覆盖全世界.......... 所以,我们不得不关
dateformat dai_lm DateFormat
"Symbol Meaning Presentation Ex." "------ ------- ------------ ----" "G era designator (Text) AD" "y year
Hadoop如何实现关联计算 datamachine mapreduce hadoop 关联计算
选择Hadoop，低成本和高扩展性是主要原因，但但它的开发效率实在无法让人满意。以关联计算为例。假设：HDFS上有2个文件，分别是客户信息和订单信息，customerID是它们之间的关联字段。如何进行关联计算，以便将客户名称添加到订单列表中？ &nbs
用户模型中修改用户信息时，密码是如何处理的 dcj3sjt126com yii
当我添加或修改用户记录的时候对于处理确认密码我遇到了一些麻烦，所有我想分享一下我是怎么处理的。场景是使用的基本的那些(系统自带)，你需要有一个数据表(user)并且表中有一个密码字段(password),它使用 sha1、md5或其他加密方式加密用户密码。面是它的工作流程: 当创建用户的时候密码需要加密并且保存，但当修改用户记录时如果使用同样的场景我们最终就会把用户加密过的密码再次加密，这
中文 iOS/Mac 开发博客列表 dcj3sjt126com Blog
本博客列表会不断更新维护，如果有推荐的博客，请到此处提交博客信息。本博客列表涉及的文章内容支持定制化Google搜索，特别感谢 JeOam 提供并帮助更新。本博客列表也提供同步更新的OPML文件（下载OPML文件），可供导入到例如feedly等第三方定阅工具中，特别感谢 lcepy 提供自动转换脚本。这里有导入教程。
js去除空格，去除左右两端的空格蕃薯耀去除左右两端的空格 js去掉所有空格 js去除空格
js去除空格，去除左右两端的空格 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>&g
SpringMVC4零配置--web.xml hanqunfeng springmvc4
servlet3.0+规范后，允许servlet，filter，listener不必声明在web.xml中，而是以硬编码的方式存在，实现容器的零配置。 ServletContainerInitializer：启动容器时负责加载相关配置 package javax.servlet; import java.util.Set; public interface ServletContainer
《开源框架那些事儿21》：巧借力与借巧力 j2eetop 框架 UI
同样做前端UI，为什么有人花了一点力气，就可以做好？而有的人费尽全力，仍然错误百出？我们可以先看看几个故事。故事1：巧借力，乌鸦也可以吃核桃有一个盛产核桃的村子，每年秋末冬初，成群的乌鸦总会来到这里，到果园里捡拾那些被果农们遗落的核桃。核桃仁虽然美味，但是外壳那么坚硬，乌鸦怎么才能吃到呢？原来乌鸦先把核桃叼起，然后飞到高高的树枝上，再将核桃摔下去，核桃落到坚硬的地面上，被撞破了，于是，
JQuery EasyUI 验证扩展可怜的猫 jquery easyui 验证
最近项目中用到了前端框架-- EasyUI，在做校验的时候会涉及到很多需要自定义的内容，现把常用的验证方式总结出来，留待后用。以下内容只需要在公用js中添加即可。使用类似于如下： <input class="easyui-textbox" name="mobile" id="mobile&
架构师之httpurlconnection----------读取和发送(流读取效率通用类) nannan408
1.前言. 如题. 2.代码. /* * Copyright (c) 2015, S.F. Express Inc. All rights reserved. */ package com.test.test.test.send; import java.io.IOException; import java.io.InputStream
Jquery性能优化 r361251 JavaScript jquery
一、注意定义jQuery变量的时候添加var关键字这个不仅仅是jQuery，所有javascript开发过程中，都需要注意，请一定不要定义成如下： $loading = $('#loading'); //这个是全局定义，不知道哪里位置倒霉引用了相同的变量名，就会郁闷至死的二、请使用一个var来定义变量如果你使用多个变量的话，请如下方式定义： . 代码如下: var page
在eclipse项目中使用maven管理依赖 tjj006 eclipse maven
概览: 如何导入maven项目至eclipse中建立自有Maven Java类库服务器建立符合maven代码库标准的自定义类库 Maven在管理Java类库方面有巨大的优势，像白衣所说就是非常“环保”。我们平时用IDE开发都是把所需要的类库一股脑的全丢到项目目录下，然后全部添加到ide的构建路径中，如果用了SVN/CVS，这样会很容易就把
中国天气网省市级联页面 x125858805 级联
1、页面及级联js <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> &l