刹那永恒HB

Pytorch学习笔记三深度神经网络DNN

Geoffrey Hinton提出了一种名为“深度信念网络”的神经网络，可以使用“贪婪逐层预训练”的策略有效地进行神经网络的训练。紧接着，这种方法在其他神经网络的训练上也取得了成功。在诸如图像识别、语音识别等领域，这些新型的神经网络取得了令人瞩目的成绩，标志着机器学习一个全新时代的到来。这些新型的神经网络统称为深度学习，因为这些神经网络的模型可以有多个隐含层。深度学习主要包括深度神经网络DNN、卷积神经网络CNN、循环神经网络RNN、LSTM以及强化学习等。

深度学习之所以能够成功，是因为解决了神经网络的训练问题，使得包含多个隐含层的神经网络模型变得可能。神经网络训练问题的解决，包括了四个方面的因素：
（1）硬件设备特别是高性能GPU的进步，极大地提高了数值运算和矩阵运算的速度，神经网络的训练时间明显减少。
（2）大规模得到标注的数据集（如CIFAR10和ImageNet等）可以避免神经网络因为参数过多而得不到充分训练的问题。
（3）新型神经网络的提出，包括深度信念网络、受限玻尔兹曼机、卷积神经网络CNN、循环神经网络RNN、LSTM等。
（4）优化算法上的进步，包括ReLU激活函数、Mini-Batch梯度下降算法、新型优化器、正则化、Batch Normalization以及Dropout等。

本章主要介绍深度神经网络、梯度下降算法、优化器及正则化等优化训练技巧。

1.深度神经网络

如果神经网络中前后层的所有结点都是相连的，那么这种网络结构称为全连接层网络结构。深度神经网络是最基础的神经网络之一，最显著的特征是其隐含层由全连接层构成。全连接层是一个经典的神经网络结构层。如下图所示，该深度神经网络主要包括1个输入层，3个隐含层和1个输出层。前后层的所有结点都是两两相连的。
深度神经网络是传统神经网络的扩展，看起来就是深度神经网络包含多个隐含层。不过，这个看似小小的飞跃的背后，经历了长达20年的艰辛探索。1986年基于后向传播的神经网络取得成功，人们期待神经网络一飞冲天，结果很快发现神经网络只能在有限的领域有效，同时还有严苛的训练技巧。直到2006年，Hilton提出“贪婪逐层训练”的策略进行神经网络训练，在图像识别和语音识别领域率先突破，才取得了令人瞩目的成绩。后续研究发现，这种逐层训练的技巧不是完全必要的，在训练数据和计算资源充足的情况下，使用ReLU激活函数、Mini-Batch梯度下降算法、新型优化器、正则化、Batch Normalization及Dropout等算法，就能训练得到比较满意的深度学习模型。那么传统的神经网络为什么难以训练呢？

1.神经网络为何难以训练

神经网络在层数较多的网络模型训练的时候很容易出问题。除了计算资源不足和带标注的训练数据因素引起的问题外，还表现出两个重大的问题：梯度消失问题和梯度爆炸问题。这两个问题在模型的层数增加时会变得更加明显。例如在上图所示的深度神经网络中，如果存在梯度消失问题，根据反向传播算法原理，接近输出的隐含层3的权值更新相对正常；在反方向上，权值更新越来越不明显，以此类推，接近输入层的隐含层1的权值更新几乎消失，导致经过很多次的训练后，仍然接近初始化的权值，这样导致隐含层1相当于只对输入层做了一个同一映射，那么整个神经网络相当于不包括隐含层1的神经网络。
这个问题是如何产生的呢？在神经网络的训练中，以反向传播算法为例（假设神经网络中一个隐含层，且对每个神经元都有
σ 表示Sigmoid激活函数），如下图所示：
根据链式法则可以推导如下：
而Sigmoid函数的公式为：
Sigmoid函数的导数σ′(x)的图像如下所示：

上面分析了神经网络训练中出现的两大问题：梯度消失和梯度爆炸。分析神经网络出现的问题，可以从分析损失函数错误平面开始。前面章节已经详细讨论了损失函数。从对损失函数错误平面的讨论引申出优化思路——梯度下降。同时，神经网络也出现泛化问题（欠拟合），深度学习模型在训练集上表现好，而在测试集上表现差。这时需要考虑新的思路，提高模型泛化的能力，需要正则化了。接下来就详细介绍梯度下降算法及其改进，还有模型正则化方法，它们是深度学习模型训练不可或缺的。

2.梯度下降

深度学习算法的训练都是以梯度下降算法及其改进算法为核心的。在深度学习中，训练的最终目的是使损失函数最小。如何使损失函数最小呢？从数学知识知道，对于连续可导函数，函数的最小值就是它导数为0的极值点，可以通过求导并令导数为0来找到极值点，或者可以采用逐步逼近的方法把极值点找出来。梯度，在数学上说是一个向量，指向函数值上升最快的方向。那么梯度的反方向就是函数值下降最快的方向。每次沿着梯度下降方向更新变量，就能找到函数最小值。对于深度学习的训练来说，同样采用梯度下降算法求解。

1.批量梯度下降

使用整个训练集的优化算法称为批量算法，因为它们会在一个大批量中同时处理所有样本。批量梯度下降算法每次学习都使用整个训练集，其优点在于每次更新都会朝着正确的方向进行，最终能保证收敛到全局最小值，这样收敛速度快，迭代次数少。但其缺点也很明显，就是每次梯度更新都要遍历整个数据集，需要大量的计算，内存消耗极多，特别是在数据集规模较大的时候，同时它还不利于分布式训练。

2.随机梯度下降

每次只使用单个样本的优化算法称为随机梯度下降。随机梯度下降算法每次只随机选择一个样本来更新模型参数，因此每次的学习是非常快速的。随机梯度下降算法最大的缺点在于有时不会按照梯度下降最快的方向进行，因此可能带来扰动。对于局部极小值点，扰动使得梯度下降方向从当前的局部极小值点跳到另一个局部极小值点，最后难以收敛。由于扰动，收敛速度会变慢，往往需要更多的迭代次数才能收敛。

3.Mini-Batch梯度下降

大多数用于深度学习的梯度下降算法介于批量梯度下降和随机梯度下降之间，使用一个以上但又不是全部的训练样本，称为小批量梯度下降算法（Mini-Batch Gradient Descent）。

小批量梯度下降算法需要样本随机抽取。计算梯度需要样本满足相互独立的条件，而现实中数据自然排列，前后样本之间具有一定的关联性。因此需要把样本顺序随机打乱，以便满足样本独立性的要求。小批量梯度下降综合了批量梯度下降和随机梯度下降，在更新速度和迭代次数中间取得一个平衡，每次更新从训练集中随机选择m个样本（m

相对于批量梯度下降，Mini-Batch梯度下降降低了收敛扰动性，即降低了参数更新的方差，使得更新更加稳定。相对于批量梯度下降，其提高了每次学习的速度，并且不用担心内存瓶颈，可以利用矩阵运算提高计算效率。一般而言，每次更新随机选择50~256个样本进行学习，但是也要根据具体问题而选择，实践中可以进行多次试验，选择一个更新速度和迭代次数都较合适的样本数。Mini-Batch梯度下降可以保证收敛性，又可以保证更新速度快，常用于神经网络的训练中。

目前，Mini-Batch梯度下降是深度学习中的主流方法。在深度学习实践中，批量梯度下降和随机梯度下降可以看做Mini-Batch梯度下降的特例，批量梯度下降看作是Mini-Batch的size大小是整个数据集，随机梯度下降可以看做是Mini-Batch的size为1的情况。因此只有一种MIni-Batch的方法就够了。在PyTorch中同样如此。Mini-Batch方法是作为数据加载函数torch.utils.data.DataLoader的一个参数batch_size出现的，如果值为1就是随机梯度下降，如果值是数据集大小就是批量梯度下降，如果值在二者之间就是Mini-Batch梯度下降。特别指出，DataLoader只涉及数据集的划分，并不涉及梯度下降算法本身。
用法示例：
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,batch_size=batch_size,shuffle=True)
在函数torch.utils.data.DataLoader中，实现数据加载功能，根据Mini-Batch方法和采样机制，对数据集进行划分，并在数据集上提供单进程或多进程迭代器，各个参数的意义如下：

dataset：加载的数据集
batch_size：Mini-Batch的尺寸，每个批次加载多少个样本（默认为1，即随机梯度下降）
shuffle：True表示每次迭代时打乱数据，在训练时必须设置为True
sampler：采样策略，如果指定该参数，则忽略shuffle参数
batch_sampler：批量采样策略，与batch_size，shuffle，sampler和drop_out互斥
num_workers：用多少个进程加载数据。默认为0，表示只在主进程中加载数据
collate_fn：合并样本列表形成Mini-Batch
pin_memory：True表示使用固定的内存缓冲区，主机到GPU的复制速度要快很多
drop_last：是否删除最后一个不完整的batch，默认为False

3.优化器

对梯度下降算法可以进行多方面的优化，可以加速梯度下降，可以改进学习率。在PyTorch中，有一个优化器Optimizer的概念，具体的包名叫做torch.optim。其中包含的具体的优化算法有SGD、Momentum、RMSProp、AdaGrad和Adam。其中，Momentum是加速梯度下降，其他三种方法是改进学习率。下面将逐一介绍这些优化算法的原理和使用。

1.SGD

在深度学习和PyTorch中，SGD就是Mini-Batch梯度下降算法，随机梯度下降方法及其变种是深度学习中应用最多的优化方法。SGD方法流程如下：
2.Momentum
SGD方法是常用的优化方法，但其收敛过程会很慢，Momentum方法可以加速收敛。Momentum方法顾名思义，类似物理上的动量。设想一下，从山顶滚下一个铁球，铁球在滚下山的过程中，速度越来越快，动量不断增加，加速冲向终点。基于动量的梯度下降算法是如何表现的呢？算法在更新模型参数时，对于那些当前的梯度方向与上一次梯度方向相同的参数进行加强，即这些方向上更快了；对于那些当前的梯度方向与上一次梯度方向不同的参数进行削减，即这些方向上减缓了。因此Momentum方法可以获得更快的收敛速度和减少扰动。使用了动量的SGD算法流程如下：
在PyTorch中，Momentum方法调用函数是torch.optim.SGD，注意SGD和Momentum方法都是调用同一个函数，靠设置参数momentum进行区分：
class torch.optim.SGD(params,lr=,momentum=0,dempening=0,weight_decay=0,nesterov=False)
参数含义：
3.AdaGrad
学习率是SGD的一个关键参数，但是它是比较难以设置的参数之一，因为它对神经网络模型有很大的影响。如何自适应地设置模型参数的学习率是深度学习的研究方向之一。AdaGrad算法，根据每个参数所有梯度历史平方和的平方根，成比例的缩放参数，能独立地适应调整所有模型参数的学习率。损失最大的参数相应地有一个快速下降的学习率，损失较小偏导的参数在学习率上的下降幅度相对较小。在参数空间中更为平缓的倾斜方向会取得更大的进步。AdaGrad算法具有一些令人满意的理论性质。然而，实践中发现，在训练神经网络时，从训练开始时积累的梯度平方会导致有效学习率过早和过量减小。AdaGrad只在某些深度学习模型上效果不错。AdaGrad算法流程如下：
在PyTorch中，AdaGrad方法调用函数torch.optim.Adagrad：
class torch.optim.Adagrad(params,lr=0.001,lr_decay=0,weight_decay=0)
参数含义：
4.RMSProp
AdaGrad在凸函数中能够快速收敛，但实际神经网络的损失函数难以满足这个条件。Hilton修改AdaGrad的计算梯度平方累加为对应的指数衰减平均，这就是RMSProp方法。AdaGrad根据平方梯度的整个历史收缩学习率，使得学习率过早和过快的衰减。RMSProp使用指数衰减平均以丢弃遥远过去的历史，可以避免学习率下降过快的问题。在实践中，RMSProp已被证明是一种有效且实用的深度神经网络优化算法。目前它是深度学习从业者经常采用的优化方法之一。RMSProp算法流程如下：
在PyTorch中，RMSProp方法调用函数torch.optim.RMSProp：
class torch.optim.RMSProp(params,lr=0.001,alpha=0.99,eps=1e-8,weight_decay=0,momentum=0,centered=False)
参数含义：
5.Adam
Adam是另一种学习率自适应的优化算法，被看作RMSProp方法和动量方法的结合。首先，在Adam中，动量直接并入了梯度一阶矩的估计。将动量加入RMSProp最直观的方法是将动量应用于收缩后的梯度。其次，Adam包括偏置修正，修正从原点初始化的一阶矩和二阶矩的估计。Adam方法的优点在于经过偏置校正后，每一次迭代学习率都有一个确定的范围，从而使得参数比较平稳。Adam方法通常被认为是优秀的优化方法。Adam算法流程如下：
在PyTorch中，Adam方法调用函数torch.optim.Adam：
class torch.optim.Adam(params,lr=0.001,betas=(0.9,0.99),eps=1e-8,weight_decay=0)
参数含义：
6.选择正确的优化算法
前面讨论了一系列算法，通过自适应每个模型参数的学习率以解决优化深度模型中的难题。此时，一个自然的问题是：应该选择哪种算法呢？遗憾的是，目前在这一点上没有达成共识。chaul et al. (2014)展示了许多优化算法在大量学习任务上极具价值的比较。结果表明，具有自适应学习率（以RMSProp和AdaDelta为代表）的算法族表现得相当健壮，性能差不多，但是没有哪个算法脱颖而出。

目前，最流行并且使用很高的优化算法包括SGD、具有动量的SGD、RMSProp、AdaDelta和Adam。如果你的数据是稀疏的，那么最好使用自适应学习率SGD优化方法（AdaGrad、AdaDelta、RMSProp和Adam），因为不需要在迭代过程中对学习率进行人工调整。RMSProp是AdaGrad的一种扩展，与AdaDelta类似，但是改进版的AdaDelta使用RMS取自动更新学习率，并且不需要设置初始学习率。Adam是在RMSProp基础上使用动量与偏差修正。RMSProp、AdaDelta与Adam在类似的情形下表现的差不多。得益于偏差修正，Adam略优于RMSProp，因为其在接近收敛时梯度变得更加稀疏。因此，Adam可能是目前最好的SGD优化方法。

有趣的是，最近很多论文都是使用原始的SGD梯度下降算法，并且使用简单的学习速率退火调整（无动量项）。现有的实验已经表明：SGD能够收敛于最小值点，但是相对于其他的SGD，它可能花费的时间更长，并且依赖于健壮的初始值及学习速率退火调整策略，并且很容易陷入局部极小值点，甚至鞍点。因此如果你在意收敛速度或者训练一个更深或者更复杂的网络，应该选择一个自适应学习速率的SGD。

为了使得学习过程无偏，应该在每次迭代中随机打乱训练集中的样本。在验证集上如果连续的多次迭代过程中损失函数不再显著地降低，那么应该提前结束训练。对梯度增加随机噪声会增加模型的健壮性，即使初始参数值选择的不好，并适合对特别深层次的网络进行训练。其原因在于增加随机噪声有更多的可能性跳过局部极值点并去寻找一个更好的局部极值点，这种可能性在深层次的网络中更常见

4.正则化

前面介绍的是深度学习的优化方法，是为了让训练过程更加高效。此外，我们要求模型不仅在训练集上表现良好，而且也要在测试集上表现良好。同时满足这两个条件的能力称为模型的泛化能力。如果一个模型在训练集表现良好，但是在测试集表现很差，则称为模型过拟合。如果一个模型在训练集和测试集都表现很差，则称为模型欠拟合。如下图所示：
要在欠拟合和过拟合中间取得平衡，一个常用的方法是正则化（Regularization）。正则化的思想就是在目标函数中引入额外的信息来惩罚过大的权重参数。假设神经网络模型在训练过程中使用的目标函数是J(θ)，那么在优化时不是直接优化J(θ)，而是优化J(θ)+λR(W)其中λλ称为正则项系数，λR(W)称为正则项，λ∈[0,∞]，λλ等于0表示不使用正则化，λλ越大表示正则化惩罚越大。需要说明的是，在深度学习中，参数包括每一层神经网络的权重W和偏置b通常只对权重做正则化惩罚而不对偏置做正则化惩罚。
1.参数规范惩罚
参数规范惩罚包括L2参数正则化和L1参数正则化。
（1）L2参数正则化

在深度学习中，L2正则化又称为权值衰减。L2正则化通常的做法是只针对权重W，而不针对偏置b。对模型参数W的L2正则化被定义为：
L2正则化能让权重W变小，这也是权值衰减的由来。过拟合的时候，在某些小区间内，函数值的变化比较剧烈，由于函数在某些小区间里的导数值比较大，而自变量可大可小，要使得导数比较大，这意味着权值W的值比较大。正则化约束参数的范数使其不能太大，可以在一定程度上减少过拟合的情况。
2）L1参数正则化
对模型参数W的L1正则化被定义为：
相比L2正则化，L1正则化会产生更稀疏的解。L1正则化的稀疏性已经广泛应用于特征选择机制。

通常来讲，正则化的神经网络要比未正则化的神经网络的泛化能力更好。

在PyTorch中，只实现有L2正则化，没有实现L1正则化。在torch.optim.SGD和其他torch.optim优化算法中，weight_decay就是L2正则化。
2.Batch Normalization
在机器学习中，如果训练数据和测试数据都符合相同的状态分布，那么训练的模型能够较好地预测测试数据集上的数据；反之，训练的模型在测试数据集上的表现就会很差。在训练神经网络模型时，可以事先将特征去相关，并使得它们满足一个比较好的分布，比如标准正态分布，这样模型的第一层网络一般都会有一个比较好的输入特征。但是随着模型层次的加深，网络的非线性变换使得每一层的结果变得相关了，并且不再满足标准正态分布。更糟糕的是，可能这些隐含层的特征分布已经发生了偏移。为了解决这个问题，研究人员提出在层与层之间加入BN层（Batch Normalization，批量标准化层）。训练时，BN层会利用隐含层输出结果的均值与方差标准化每一层特征的分布，并且维护所有Mini-Batch数据的均值和方差，最后把样本的均值和方差的无偏估计量用于测试时使用。

鉴于在某些情况下非标准化分布的层的特征可能是最优的，标准化每一层的输出特征反而会使得网络的表达能力变得不好，BN层加上了两个可学习的缩放参数和偏移参数以便使模型自适应地调整层的特征分布。

Batch Normalization是一种非常简单而又实用的加速收敛的技术。其作用有：

使得模型训练收敛速度更快
模型隐含层输出特征分布更稳定，更利于模型的学习
在PyTorch中，有封装好的Batch Normalization层，相应的类定义如下，可以直接使用：
class torch.nn.BatchNorm1d(num_features,eps=1e-5,momentum=0.1,affine=True)
class torch.nn.BatchNorm2d(num_features,eps=1e-5,momentum=0.1,affine=True)
class torch.nn.BatchNorm3d(num_features,eps=1e-5,momentum=0.1,affine=True)
对于小批量（Mini-Batch）的2d或3d输入进行批量标准化（Batch Normalization）操作，在每一个小批量数据中，计算输入各个维度的均值和标准差。gamma和beta是可学习的、大小为C的参数向量（C为输入大小）。在训练时，该层计算每次输入的均值和方差，并进行移动平均。移动平均默认的动量值为0.1。

在测试时，训练求得的均值和方差将用来标准化测试数据。

参数含义：

使用示例：
带有可学习的参数
m = nn.BatchNorm1d(100)
不带有可学习的参数
m = nn.BatchNorm1d(100,affine=False)
input = autograd.Variable(torch.randn(20,100))
output = m(input)

3.Dropout

Dropout是指在深度神经网络的训练过程中，对于某些神经元，按照一定的概率将其暂时从网络中丢弃，这样可以让模型更加健壮，因为它不会太依赖某些局部的特征（因为局部特征有可能被丢弃）。注意是暂时，对于随机梯度下降来说，由于是随机丢弃，故而每一个小批量都是在训练不同的网络。

左图是一个标准的全连接的神经网络，右图是对左图应用了dropout的结果，会以一定的概率随机的丢弃一些神经元。在实践中通过把神经元的输出置为0来“关闭”神经元。具体步骤如下：

（1）建立一个维度和本层神经元相同的矩阵D
（2）根据概率（keep_prop）将D中的元素置为0，置为0的神经元表示该神经元失效，不参与后续计算
（3）将本层激活函数的输出与D相乘作为新的输出
（4）新的输出将除以keep_prop，以保证训练和测试满足同一分布，这样在测试中Dropout就可以参与计算了。

在PyTorch中，Dropout有专门的Dropout层，包括两个类：
class torch.nn.Dropout(p=0.5,inplace=False)
class torch.nn.Dropout2d(p=0.5,inplace=False)
Dropout在训练中根据伯努利分布随机将输入张量中的部分元素（概率p）置为0。对于每次前向调用，被置为0的元素都是随机的。参数含义如下：
p：将元素置为0的概率，默认为0.5
inplace：若设置True，则对input进行直接处理。默认为False
其中，Dropout2d的输入来自conv2d模块。

在训练中，Dropout的输出需要乘以1/(1-p)，这样训练和测试将满足同一分布。
示例如下：
import torch
torch.manual_seed(1)
m = torch.nn.Dropout(p=0.5)
input = torch.autograd.Variable(torch.randn(5,5))
output = m(input)
print(input)
print(output)
变量input是
tensor([[-1.5256, -0.7502, -0.6540, -1.6095, -0.1002],
[-0.6092, -0.9798, -1.6091, -0.7121, 1.1712],
[ 1.7674, -0.0954, 0.1394, -1.5785, -0.3206],
[-0.2993, 1.8793, 0.3357, 0.2753, 1.7163],
[-0.0561, 0.9107, -1.3924, 2.6891, -0.1110]])
变量output是：
tensor([[-3.0512, -0.0000, -0.0000, -0.0000, -0.0000],
[-1.2184, -1.9595, -0.0000, -1.4243, 0.0000],
[ 3.5349, -0.1907, 0.2787, -0.0000, -0.0000],
[-0.5987, 3.7587, 0.6715, 0.5507, 3.4326],
[-0.0000, 0.0000, -0.0000, 5.3782, -0.2220]])
7.优化器的使用示例
import torch
import torch.utils.data as Data
import torch.nn.functional as F
from torch.autograd import Variable
import matplotlib.pyplot as plt
import numpy as np

torch.manual_seed(1) # 确定随机种子，保证结果可重复

LR = 0.01
BATCH_SIZE = 20
EPOCH = 10

生成数据

x = torch.unsqueeze(torch.linspace(-1,1,1500),dim=1)
y = x.pow(3) + 0.1 * torch.normal(torch.zeros(*x.size()))

数据画图

plt.scatter(x.numpy(),y.numpy())
plt.show()

把数据转换为torch需要的类型

torch_dataset = Data.TensorDataset(x,y)
loader = Data.DataLoader(dataset=torch_dataset,batch_size=BATCH_SIZE,shuffle=True,num_workers=2)

定义模型

class Net(torch.nn.Module):
def init(self):
super(Net, self).init()
self.hidden = torch.nn.Linear(1, 20)
self.predict = torch.nn.Linear(20, 1)

def forward(self, x):
    x = F.relu(self.hidden(x))
    x = self.predict(x)
    return x

不同的模型

net_SGD = Net()
net_Momentum = Net()
net_RMSprop = Net()
net_AdaGrad = Net()
net_Adam = Net()

nets = [net_SGD, net_Momentum, net_AdaGrad, net_RMSprop, net_Adam]

不同的优化器

opt_SGD = torch.optim.SGD(net_SGD.parameters(), lr=LR)
opt_Momentum = torch.optim.SGD(net_Momentum.parameters(), lr=LR, momentum=0.8)
opt_AdaGrad = torch.optim.Adagrad(net_AdaGrad.parameters(), lr=LR)
opt_RMSprop = torch.optim.RMSprop(net_RMSprop.parameters(), lr=LR, alpha=0.9)
opt_Adam = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99))

optimizers = [opt_SGD, opt_Momentum, opt_AdaGrad, opt_RMSprop, opt_Adam]

loss_func = torch.nn.MSELoss()
losses_his = [[], [], [], [], []]

训练模型

for epoch in range(EPOCH):
print('Epoch: ', epoch)
for step, (batch_x, batch_y) in enumerate(loader):
b_x = Variable(batch_x)
b_y = Variable(batch_y)

    for net, opt, l_his in zip(nets, optimizers, losses_his):
        output = net(b_x)
        loss = loss_func(output, b_y)
        opt.zero_grad()
        loss.backward()
        opt.step()
        l_his.append(loss.item())

labels = [‘SGD’, ‘Momentum’, ‘AdaGrad’, ‘RMSprop’, ‘Adam’]
for i, l_his in enumerate(losses_his):
plt.plot(l_his, label=labels[i])

plt.legend(loc=‘best’)
plt.xlabel(‘Steps’)
plt.ylabel(‘Loss’)
plt.ylim((0, 0.2))
plt.show()

5.PyTorch示例：深度神经网络实现

本节介绍如何使用PyTorch实现一个简单的深度神经网络（手写数字识别程序），对手写数字数据集MNIST进行学习和预测，预期可以达到98%左右的准确率。该神经网络由1个输入层、1个全连接层结构的隐含层和1个输出层构成。我们通过这个例子可以掌握设计深度神经网络的特征及参数的配置。

1.配置库和配置参数

import torch
import torch.nn as nn
import torchvision.datasets as dsets
import torchvision.transforms as transforms
from torch.autograd import Variable

torch.manual_seed(1) # 设置人工种子，保证结果可重复
input_size = 784 # 图片为28*28=784个特征，输入层大小：m * 784
hidden_size = 500 # 隐含层大小：784 * 500
num_classes = 10 # 输出层大小：500 * 10
num_epochs = 5 # 训练5轮
batch_size = 100 # 每个批次100个样本，60000个训练样本要分成600个批次进行
learning_rate = 0.001 # 学习率0.001

2.加载MNIST数据集

#加载训练数据（可以手动下载数据放到./data目录）
train_dataset = dsets.MNIST(root=’./data’,
train=True,
transform=transforms.ToTensor(),
download=True)
加载测试数据
test_dataset = dsets.MNIST(root=’./data’,
train=False,
transform=transforms.ToTensor()
)

3.数据的批处理

#训练集的shuffle必须为True，表示每次从60000训练样本中随机选择100个作为一个批次
train_loader = torch.utils.data.DataLoader(dataset=train_dataset,
batch_size=batch_size,
shuffle=True)
#测试集的shuffle要为False，即要保证10000个测试样本都只被预测一遍
test_loader = torch.utils.data.DataLoader(dataset=test_dataset,
batch_size=batch_size,
shuffle=False)

4.创建DNN模型

class Net(nn.Module):
def init(self,input_size,hidden_size,num_classes):
super(Net,self).init()
self.fc1 = nn.Linear(input_size,hidden_size) # 线性变换，即：m * 784 --> 784 * 500
self.relu = nn.ReLU() # 激活函数
self.fc2 = nn.Linear(hidden_size,num_classes) # 线性变换，即：784 * 500 --> 500 * 10

def forward(self,x):
    out = self.fc1(x)
    out = self.relu(out)
    out = self.fc2(out)
    return out

net = Net(input_size,hidden_size,num_classes)
print(net)

使用交叉熵损失函数：CrossEntropyLoss

criterion = nn.CrossEntropyLoss()

使用Adam优化器

optimizer = torch.optim.Adam(net.parameters(),lr=learning_rate)

训练5轮

for epoch in range(num_epochs):
# 每次从60000训练样本中随机选择100个作为一个批次，所以共重复600次
for i,(images,labels) in enumerate(train_loader):
images = Variable(images.view(-1,28*28)) # images大小：100 * 784
labels = Variable(labels) # labels大小：100 * 1
optimizer.zero_grad() # 梯度清零
outputs = net(images) # 输入网络，前向传播
loss = criterion(outputs,labels) # 计算损失
loss.backward() # 损失后向传播
optimizer.step() # 更新梯度
# 每隔100个批次打印一次信息
if (i+1)%100 == 0:
print(‘Epoch [%d/%d], Step[%d/%d], Loss: %.4f’ % (epoch+1,num_epochs,i+1,len(train_dataset)//batch_size,loss.item()))

correct = 0 # 记录预测正确的个数
total = 0 # 记录预测的总个数（一般就是测试集大小）

测试集大小10000，每个批次大小100个，共100个批次

for images,labels in test_loader:
images = Variable(images.view(-1,28*28)) # images大小：100 * 784
outputs = net(images) # 使用训练好的网络进行计算
_,predicted = torch.max(outputs.data,1) # 数字识别共10分类，会得到10个概率值，以最大概率的类别为预测类别
total += labels.size(0) # 累加预测总个数
correct += (predicted==labels).sum() # 累加预测正确总个数

打印全部测试集上的正确率

print(‘Accuracy of the network on the 10000 test images: %d %%’ % (100*correct/total))

Accuracy of the network on the 10000 test images: 98 %

你可能感兴趣的:(计算机科学,神经网络)

误差的回响：反向传播算法与神经网络的惊天逆转田园Coder 人工智能科普人工智能科普
当专家系统在20世纪80年代初期大放异彩，成为人工智能实用化的耀眼明星时，另一股曾经被宣判“死刑”的力量——连接主义（神经网络）——正在寒冬的冻土下悄然涌动，孕育着一场惊天动地的复苏。马文·明斯基和西摩·帕尔特在1969年《感知机》专著中那精准而冷酷的理论批判，如同沉重的封印，将多层神经网络的研究禁锢了近二十年。他们指出的核心死结——缺乏有效算法来训练具有隐藏层的网络——仿佛一道无法逾越的天堑。单
C++高精度除以高精度洛谷题真多算法 c++算法
高精度除以高精度的问题，‌在计算机科学中是一个常见的挑战，‌特别是在处理非常大的数字时，‌这些数字超出了标准数据类型（‌如int或longlong）‌的范围。‌这里，‌我们将详细解释一种常见的方法来解决这个问题：‌模拟手工除法。‌基本思路模拟手工除法的过程，‌即将一个高精度数（‌被除数）‌除以另一个高精度数（‌除数）‌，‌并逐位计算商和余数。‌步骤详解初始化：‌设定被除数A和除数B（‌均为高精度数
虚拟空间中的AI协作与任务 AI天才研究院 ChatGPT AI大模型企业级应用开发实战 AI人工智能与大数据大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
虚拟空间与AI概述在当今信息化和数字化的时代，虚拟空间（VirtualSpace）已成为人们生活和工作的重要一部分。虚拟空间是一种通过计算机技术构建的虚拟环境，它能够模拟和增强现实世界中的各种交互和体验。而人工智能（AI）作为计算机科学的一个分支，通过模拟人类的认知能力来实现自动化和智能化的决策。虚拟空间与AI的结合，不仅为人类带来了全新的交互方式，也为各行业的发展注入了强大的动力。虚拟空间的定义
如何制作一份E-R图菜汪本汪数据库
ER模型，全称为实体联系模型、实体关系模型或实体联系模式图（ERD）（英语：Entity-relationshipmodel）由美籍华裔计算机科学家陈品山发明，是概念数据模型中高层描述所使用的数据模型或模式图。ER模型常用于信息系统设计中。比如，在概念结构设计阶段，ER模型用来描述信息需求和/或要存储在数据库中的信息类型，但是数据建模技术可以用来描述特定论域（感兴趣的区域）的任何本体（对使用的术语
MATLAB实现WOA-BP鲸鱼优化算法优化BP神经网络多输入单输出回归预测（含模型描述及示例代码） nantangyuxi MATLAB 含模型描述及示例代码算法 matlab 神经网络大数据人工智能深度学习机器学习
目录MATLAB实现WOA-BP鲸鱼优化算法优化BP神经网络多输入单输出回归预测（多指标，多图）1项目背景介绍...1项目目标与意义...2项目挑战...3项目特点与创新...5<
量子机器学习前沿：量子神经网络与混合量子-经典算法软考和人工智能学堂人工智能 #深度学习 Python开发经验量子计算
1.量子计算基础1.1量子比特与量子门importnumpyasnpfromqiskitimportQuantumCircuit,Aer,executefromqiskit.visualizationimportplot_histogram#单量子比特操作演示defsingle_qubit_demo():qc=QuantumCircuit(1)qc.h(0)#Hadamard门创建叠加态qc.rz
【机器学习】数学基础——张量（傻瓜篇）一叶千舟深度学习【理论】机器学习人工智能
目录前言一、张量的定义1.标量（0维张量）2.向量（1维张量）3.矩阵（2维张量）4.高阶张量（≥3维张量）二、张量的数学表示2.1张量表示法示例三、张量的运算3.1常见张量运算四、张量在深度学习中的应用4.1PyTorch示例：张量在神经网络中的运用五、总结：张量的多维世界延伸阅读前言在机器学习、深度学习以及物理学中，张量是一个至关重要的概念。无论是在人工智能领域的神经网络中，还是在高等数学、物
【机器学习实战】Datawhale夏令营2：深度学习回顾城主_全栈开发机器学习机器学习深度学习人工智能
#DataWhale夏令营#ai夏令营文章目录1.深度学习的定义1.1深度学习＆图神经网络1.2机器学习和深度学习的关系2.深度学习的训练流程2.1数学基础2.1.1梯度下降法基本原理数学表达步骤学习率α梯度下降的变体2.1.2神经网络与矩阵网络结构表示前向传播激活函数反向传播批处理卷积操作参数更新优化算法正则化初始化2.2激活函数Sigmoid函数:Tanh函数:ReLU函数(Rectified
RNN笔记 sjtu_哈基坤 LLM随笔 rnn 笔记人工智能
来源见此处概述RNN(RecurrentNeuralNetwork)RNN之所以称为循环神经网络,是因为一个序列的当前的输出与前面的输出也有关.具体表现是网络会对前面的信息进行记忆并且应用于当前输出的计算中.即隐藏层之间的节点也是有连接的.并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出.理论上RNN能对任何长度的序列进行处理,但是在实践中,为了降低复杂性,往往假设当前状态只与前面几
从0开始学习计算机视觉--Day04--线性分类 Chef_Chen 学习计算机视觉分类
从宏观来看，卷积网络可以看做是由一个个不同的神经网络组件组合而成，就像积木一样通过不同类型的组件搭建形成，其中线性分类器是一个很重要的组件，在很多卷积网络中都有用到，所以了解清楚它的工作原理对我们后续的学习会有很大的帮助。线性分类器是参数模型中最简单，最基础的例子，下面我们用输入图片输出图片分类的模型的例子来更进一步地了解它。首先，我们输入一张图片到模型中，输入后我们就会得到f(x,W)，x指的是
如何设计和训练大模型（神经网络）：从入门到精通！
“学习一门技术，先找一套工具和理论研究下去；千万不要反复横跳，什么都想学”大模型作为未来重要的发展方向，很多人想学习大模型技术，但又苦于无从下手；而本公众号前前后后也写过一些怎么学习大模型技术的方法论；但大部分都是从应用的角度作为切入点。但是，有一个问题就是，如果你是一个技术从业者，想学习和设计一款属于自己的大模型，应该怎么做？设计一个自己的大模型大模型作为一门快速发展的新型技术，其理论与实现也是
VLLM：虚拟大型语言模型（Virtual Large Language Model）大霸王龙语言模型人工智能自然语言处理
VLLM：虚拟大型语言模型（VirtualLargeLanguageModel）VLLM指的是一种基于云计算的大型语言模型的虚拟实现。它通常是指那些由多个服务器组成的分布式计算环境中的复杂机器学习模型，这些模型能够处理和理解大量的文本数据。VLLM的核心是“大型语言模型”，这是一种通过深度神经网络训练的算法，能够在理解和生成人类语言方面表现出极高的能力。解释：虚拟：意味着这个模型不是在单个物理设备
Day7 神经网络的矩阵基础
神经网络的矩阵基础一、矩阵的基本概念1.矩阵的定义与类型矩阵是一个按照长方阵列排列的复数或实数集合。在神经网络中，矩阵是表示和操作数据的基本结构。常见的矩阵类型包括：方阵：行数和列数相等的矩阵，记作n×nn×nn×n矩阵。行向量：只有一行的矩阵，可以看作是一个n×1n×1n×1的矩阵。列向量：只有一列的矩阵，可以看作是一个1×n1×n1×n的矩阵。单位矩阵：主对角线上的元素为1，其余元素为0的方阵
【软件系统架构】系列四：嵌入式软件-NPU（神经网络处理器）系统及模板
目录一、什么是NPU？二、NPU与CPU/GPU/DSP对比三、NPU的工作原理核心结构：数据流架构：四、NPU芯片架构（简化图）五、NPU的优势六、NPU应用场景视觉识别语音识别自动驾驶智能监控AIoT设备七、主流NPU芯片/架构实例八、开发者工具生态（通用）九、NPU集成建议（嵌入式开发场景）十、NPU芯片选型对比+模型部署流程+嵌入式工程模板1.主流NPU芯片选型对比表2.模型部署流程（以T
DAY 33 简单的神经网络 2401_84854050 python打卡神经网络深度学习人工智能
1.数据预处理（0）准备数据、划分数据#仍然用4特征，3分类的鸢尾花数据集作为我们今天的数据集fromsklearn.datasetsimportload_irisfromsklearn.model_selectionimporttrain_test_splitimportnumpyasnp#加载鸢尾花数据集iris=load_iris()X=iris.data#特征数据y=iris.target
代数几何：自然曲线的数学研究 AI天才研究院 ChatGPT 计算 AI人工智能与大数据 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
代数几何：自然曲线的数学研究关键词：代数几何、自然曲线、数学研究、算法、应用摘要：本文深入探讨了代数几何在自然曲线研究中的应用，从基础概念到复杂算法，再到实际项目实战，全面揭示了代数几何在数学研究中的核心地位和深远影响。本文旨在为读者提供一份系统、完整、易于理解的技术指南，帮助深入理解自然曲线的数学本质及其在计算机科学中的广泛应用。目录大纲设计思路为了设计出《代数几何：自然曲线的数学研究》这本书的
4、理解线性代数的核心概念与应用 rice5 线性代数第五版深度解析线性代数向量空间子空间
理解线性代数的核心概念与应用1引言线性代数是现代数学的重要分支之一，广泛应用于科学、工程、计算机科学等领域。理解线性代数的基本概念和原理不仅有助于学术研究，还能够提升解决实际问题的能力。本文将深入探讨线性代数中的核心概念，帮助读者建立坚实的理论基础，并掌握实际应用技巧。2向量空间向量空间是线性代数的基础概念之一。一个向量空间(V)是指一个集合，其元素称为向量，并且这些向量之间可以进行加法运算和标量
入选 ICML 2025！哈佛医学院等推出全球首个 HIE 领域临床思维图谱模型，神经认知结果预测任务上性能提升 15% hyperai
在人工智能技术突飞猛进的当下，大型视觉-语言模型（LVLMs）正以惊人的速度重塑多个领域的认知边界。在自然图像与视频分析领域，这类模型依托先进的神经网络架构、海量标注数据集与强大算力支持，已能精准完成物体识别、场景解析等高阶任务。而在自然语言处理领域，LVLMs通过对TB级文本语料的学习，在机器翻译、文本摘要、情感分析等任务上达到专业级水准，其生成的学术摘要甚至能精准提炼医学文献的核心结论。然而当
第2篇：路由基础——Gin的核心功能 GO兔 gin golang 后端
引言：为什么路由是Web框架的"神经网络"路由是Web应用的骨架，它决定了客户端请求如何被服务器处理和响应。想象一个没有路由的Web应用——就像一座没有路标和门牌的城市，用户根本无法找到目的地。Gin框架的高性能很大程度上归功于其基于RadixTree（基数树）实现的路由引擎，这使得路由匹配速度达到了O(logn)的时间复杂度。对于初中级工程师来说，掌握路由设计不仅是实现API的基础，更是写出高性
【深度学习解惑】训练RNN时如何解决梯度消失或梯度爆炸？
训练RNN时如何解决梯度消失或梯度爆炸？1.引言与背景介绍循环神经网络（RNN）是处理序列数据的核心模型，但在训练过程中面临两大挑战：梯度消失（GradientVanishing）和梯度爆炸（GradientExplosion）。梯度消失导致长距离依赖难以学习（如文本中相距50个词的关联），而梯度爆炸会造成参数剧烈震荡甚至数值溢出（NaN值）。本文系统分析问题根源并提供工程级解决方案。2.原理解释
深入理解AI人工智能深度学习的原理架构 AI学长带你学AI 人工智能深度学习 ai
深入理解AI人工智能深度学习的原理架构关键词：人工智能、深度学习、原理架构、神经网络、数学模型摘要：本文旨在深入剖析AI人工智能深度学习的原理架构。首先介绍了深度学习的背景，包括其目的、预期读者、文档结构和相关术语。接着阐述了深度学习的核心概念，如神经网络、激活函数等，并通过示意图和流程图进行直观展示。详细讲解了核心算法原理，如反向传播算法，并给出Python代码示例。同时，介绍了深度学习中的数学
【大模型】【机器学习】【面试宝典】曾小文机器学习面试人工智能
面试热点科普：BatchNorm和LayerNorm有什么区别？在深度学习面试中，经常会被问到模型训练稳定性相关的问题。其中两个关键词BatchNorm和LayerNorm绝对是高频词！今天就带大家快速梳理两者的核心区别，用最通俗的方式掌握它们的原理和应用场景，面试不再含糊！1.什么是归一化（Normalization）？归一化是神经网络训练过程中的一项重要技巧，目的是：缓解梯度爆炸/消失加快收敛
武汉大学计算机科学：操作系统实习与实践报告闲书郎
本文还有配套的精品资源，点击获取简介：本资料集包括操作系统实习答案和上机报告，展示了武汉大学计算机科学课程中学生或教师的操作系统实践成果和经验总结。学习者通过深入接触进程管理、内存管理、文件系统、设备管理和调度算法等关键概念，并通过编写内核模块、模拟调度算法、实现文件系统和设计内存管理系统的实验，来加深对操作系统的理论理解，并提升实践编程技能。同时，也涵盖了操作系统安全与保护措施的基本知识。1.进
OpenCV边缘填充方式详解慕婉0307 opencv基础 opencv 计算机视觉人工智能
一、边缘填充概述在图像处理中，边缘填充（BorderPadding）是一项基础而重要的技术，特别是在进行卷积操作（如滤波、边缘检测等）时，处理图像边缘像素需要用到周围的像素值。由于图像边缘的像素没有完整的邻域，因此需要通过某种方式对图像边界进行扩展。边缘填充的主要应用场景包括：图像滤波（如高斯滤波、中值滤波等）卷积神经网络（CNN）中的卷积层形态学操作（如膨胀、腐蚀）图像特征提取二、OpenCV中
用 PyTorch 构建液态神经网络(LNN)：下一代动态深度学习模型点我头像干啥 AI 深度学习 pytorch 神经网络
引言在深度学习领域，研究人员不断探索更接近生物神经系统工作方式的模型。液态神经网络(LiquidNeuralNetworks,LNN)正是这样一种受生物神经元动态特性启发的创新架构。本文将带你了解LNN的核心概念，并展示如何使用PyTorch实现这种前沿模型。一、什么是液态神经网络？液态神经网络是由MIT研究人员提出的一种新型神经网络架构，它模仿了生物神经系统的几个关键特性：动态连接：神经元之间的
Day41 Python打卡训练营
知识回顾1.数据增强2.卷积神经网络定义的写法3.batch归一化：调整一个批次的分布，常用与图像数据4.特征图：只有卷积操作输出的才叫特征图5.调度器：直接修改基础学习率卷积操作常见流程如下：1.输入→卷积层→Batch归一化层（可选）→池化层→激活函数→下一层2.Flatten->Dense(withDropout，可选)->Dense(Output)importtorchimporttorc
什么是注意力机制？注意力机制的核心组件（Query、 Key、 Value）大模型本地部署_ 人工智能 AI大模型大模型入门 LLM 大模型 AI 注意力机制
注意力机制注意力机制是深度学习中一种模仿人类视觉注意力机制的模型设计，它允许神经网络在处理输入信息时‌有选择地关注最重要的部分，而忽略次要信息。其核心思想是：‌不是所有输入信息都同等重要。想象你在一个嘈杂的咖啡馆里和朋友聊天。即使环境中充满噪音（其他顾客交谈、咖啡机声、音乐），你也能自动‌“聚焦”朋友的声音，而‌“抑制”背景噪音。你的大脑给朋友的声音赋予了很高的“权重”，给其他声音赋予了很低的“权
深度学习在人脸识别中的应用及Python实现 loop_syntax648 机器学习-深度学习
人脸识别是一种通过计算机技术识别和验证人脸的方法，近年来深度学习在人脸识别领域取得了显著的进展。深度学习模型能够学习和提取人脸图像中的高级特征，从而实现准确的人脸识别。本文将介绍深度学习在人脸识别中的应用，并提供Python实现的源代码。深度学习模型通常基于卷积神经网络（ConvolutionalNeuralNetwork，CNN）进行人脸识别。CNN是一种专门用于处理图像和视觉数据的神经网络模型
TensorFlow深度学习模型训练：掌握神经网络的构建与优化瞎了眼的枸杞深度学习 tensorflow 神经网络
引言深度学习是人工智能领域的重要分支，它通过模拟人脑的神经网络结构来解决复杂的数据表示和学习问题。TensorFlow作为目前最受欢迎的深度学习框架之一，为开发者提供了强大的工具和丰富的资源。本文将带你了解如何使用TensorFlow进行深度学习模型的训练和优化。TensorFlow的核心概念什么是TensorFlow？定义：TensorFlow是一个用于数值计算的开源库，特别适合于大规模的机器学
大模型·知识蒸馏·学习笔记小先生00101 笔记人工智能神经网络机器学习自然语言处理深度学习语言模型
第一部分：核心概念入门1.1什么是知识蒸馏？核心问题:深度学习模型（如大型神经网络）虽然性能强大，但其巨大的参数量和计算需求使其难以部署到手机、嵌入式设备等资源受限的平台。核心思想:知识蒸馏是一种模型压缩和优化的技术，其灵感来源于“教师-学生”范式。我们先训练一个复杂但性能强大的“教师模型”，然后利用这个教师模型来指导一个轻量级的“学生模型”进行学习。生动的比喻(Hinton,2015):这个过程
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方