AI浩

剪枝算法：通过网络瘦身学习高效卷积网络

摘要

原文链接：https://arxiv.org/abs/1708.06519

深度卷积神经网络(CNNs)在现实世界中的应用很大程度上受到其高计算成本的阻碍。在本文中，我们提出了一种新的cnn学习方案，以同时减小模型的尺寸;2)减少运行时内存占用;3)在不影响精度的前提下，降低计算操作的数量。这是通过在网络中以一种简单但有效的方式强制通道级稀疏性来实现的。与许多现有的方法不同，所提出的方法直接适用于现代CNN体系结构，为训练过程引入了最小的开销，并且对生成的模型不需要特殊的软件/硬件加速器。我们称这种方法为网络瘦身，它以宽而大的网络作为输入模型，但在训练过程中自动识别和修剪不重要的通道，得到具有相当精度的薄而紧凑的模型。我们通过几个最先进的CNN模型，包括VGGNet、ResNet和DenseNet，在不同的图像分类数据集上，实证证明了我们方法的有效性。对于VGGNet，多通道版本的网络瘦化使模型尺寸减小了20倍，计算操作减少了5倍。

1. 简介

近年来，卷积神经网络(CNNs)已成为各种计算机视觉任务的主要方法，如图像分类[22]，目标检测[8]，语义分割[26]。大规模的数据集，高端的现代图形处理器和新的网络架构允许开发前所未有的大型CNN模型。例如，从AlexNet [22]， VGGNet[31]和GoogleNet[34]到ResNets [14]， ImageNet分类挑战赛的获胜者模型已经从8层发展到100多层。

然而，较大的cnn虽然具有更强的表示能力，但对资源的需求更大。例如，一个152层的ResNet[14]有超过6000万个参数，在推断分辨率为224×224的图像时需要超过20千万亿浮点运算(FLOPs)。这在资源受限的平台(如移动设备、可穿戴设备或物联网设备)上不太可能负担得起。

在现实世界的应用中，cnn的部署大多受到：
1)模型大小的限制:cnn强大的表示能力来自其数百万个可训练参数。这些参数以及网络结构信息需要存储在磁盘上，并在推理期间加载到内存中。例如，存储一个在ImageNet上训练的典型CNN需要超过300MB的空间，这对嵌入式设备来说是一个很大的资源负担。
2)运行时内存:在推理期间，即使批处理大小为1,cnn的中间激活/响应甚至可能比存储模型参数占用更多的内存空间。这对高端gpu来说不是问题，但对于许多计算能力较低的应用程序来说却负担不起。
3)计算运算次数:卷积运算在高分辨率图像上计算量大。一个大型CNN在移动设备上处理一张图像可能需要几分钟，这使得它无法应用于实际应用。

许多工作被提出压缩大型CNN或直接学习更有效的CNN模型来快速推断。其中包括低秩逼近[7]，网络量化[3,12]和二值化[28,6]，权重修剪[12]，动态推理[16]等。然而，大多数这些方法只能解决上面提到的一到两个挑战。此外，有些技术需要专门设计的软件/硬件加速器来提高执行速度[28,6,12]。

减少大型cnn资源消耗的另一个方向是网络稀疏化。稀疏性可以施加在不同层次的结构上[2,37,35,29,25]，这可以产生相当大的模型大小压缩和推断速度。然而，这些方法通常需要特殊的软件/硬件加速器来获取内存增益或节省的时间，尽管它比[12]中的非结构化稀疏权重矩阵更容易。

在本文中，我们提出了一种简单而有效的网络训练方案——网络瘦身，解决了在资源有限的情况下部署大型cnn时所面临的所有挑战。我们的方法在批处理规范化(BN)层的缩放因子上施加L1正则化，因此很容易实现，而不需要对现有的CNN体系结构进行任何更改。通过L1正则化将BN标度因子的值推至零，使我们能够识别不重要的通道(或神经元)，因为每个标度因子对应一个特定的卷积通道(或全连接层中的一个神经元)。这有助于在接下来的步骤中进行通道级修剪。额外的正则化术语很少会损害性能。事实上，在某些情况下，它会导致更高的泛化精度。修剪不重要的通道有时可能会暂时降低性能，但这种影响可以通过随后对修剪后的网络进行微调来补偿。经过修剪后，得到的窄网络在模型大小、运行时内存和计算操作方面比最初的宽网络紧凑得多。上述过程可以重复几次，产生一个多通道网络瘦身方案，从而导致更紧凑的网络。

在几个基准数据集和不同网络架构上的实验表明，我们可以获得与原始模型相比高达20倍的模式大小压缩和5倍的计算操作减少的CNN模型，同时实现相同甚至更高的精度。此外，我们的方法通过传统硬件和深度学习软件包实现了模型压缩和推理加速，因为生成的更窄模型不包含任何稀疏存储格式或计算操作。

2. 相关工作

本节从五个方面论述相关工作。
低秩分解 利用奇异值分解(SVD)[7]等技术，将神经网络中的权重矩阵近似为低秩矩阵。这种方法在全连接层上工作得特别好，产生了约3倍模型大小的压缩，但没有显著的速度加速，因为CNN的计算操作主要来自卷积层。

权重量化。 HashNet[3]提出量化网络权重。在训练之前，网络权重被散列到不同的组中，并且在每个组中共享权重值。这样只需要存储共享的权值和哈希索引，可以节省大量的存储空间。[12]在深度压缩管道中使用了改进的量化技术，在AlexNet和VGGNet上实现了35到49倍的压缩率。然而，这些技术既不能节省运行时内存也不能节省推理时间，因为在推理期间共享权值需要恢复到它们的原始位置。

[28,6]将实值权重量化为二进制/三元权重(权重值限制为{−1,1}或{−1,0,1}。这将节省大量的模型大小，并且在给定位操作库的情况下还可以获得显著的加速。然而，这种激进的低位近似方法通常会带来适度的精度损失。

权重修剪/稀疏。 [12]提出在训练过的神经网络中，用小权值修剪不重要的连接。得到的网络的权值大多为零，因此可以通过以稀疏格式存储模型来减少存储空间。然而，这些方法只能通过专用的稀疏矩阵运算库和/或硬件实现加速。运行时内存节省也非常有限，因为大部分内存空间是由激活映射(仍然很密集)消耗的，而不是权值。

在[12]中，训练期间没有关于稀疏性的指导。[32]通过显式地对每个带有附加门变量的权重施加稀疏约束来克服这一限制，并通过删除门值为零的连接来实现高压缩率。该方法获得了比[12]更好的压缩率，但也有同样的缺点。

结构化修剪/稀疏化。 最近，[23]提出在训练过的cnn中修剪传入权值较小的信道，然后对网络进行微调以恢复精度。[2]在训练前通过在卷积层中随机取消输入输出通道连接引入稀疏性，这也产生了较小的精度损失适中的网络。与这些工作相比，我们在训练时在优化目标中明确地施加信道稀疏性，使得信道修剪过程更加平滑，精度损失很小。

[37]在训练过程中施加了神经元水平的稀疏性，因此一些神经元可以被修剪以获得紧凑的网络。[35]提出了一种结构化稀疏学习(SSL)方法来稀疏cnn中不同级别的结构(例如过滤器、通道或层)。这两种方法都在训练过程中利用群稀疏正则化来获得结构化稀疏性。我们的方法不是在卷积权值上诉诸群稀疏性，而是在通道相关的缩放因子上施加简单的L1稀疏性，因此优化目标简单得多。

由于这些方法是修剪或稀疏网络结构的一部分(例如，神经元，通道)，而不是单独的权重，它们通常需要较少的专用库(例如，稀疏计算操作)来实现推理加速和运行时内存节省。我们的网络瘦身也属于这一类，完全不需要特殊的库来获得好处。

神经结构学习。 虽然最先进的cnn通常是由专家设计的[22,31,14]，但也有一些关于自动学习网络架构的探索。[20]引入子模块/超模块优化，在给定资源预算的情况下进行网络架构搜索。最近的一些研究[38,1]提出使用强化学习自动学习神经结构。这些方法的搜索空间非常大，因此需要训练数百个模型来区分好的和坏的。网络精简也可以被视为体系结构学习的一种方法，尽管选择仅限于每个层的宽度。但是，与上述方法相比，网络瘦身只通过一个单一的训练过程来学习网络架构，这符合我们追求效率的目标。

3.网络瘦身

我们的目标是提供一个简单的方案来实现深度cnn的通道级稀疏性。在本节中，我们首先讨论通道级稀疏性的优点和挑战，并介绍如何在批处理规范化中利用伸缩层来有效地识别和删除网络中不重要的通道。

通道级稀疏性的优点。 正如之前的工作[35,23,11]所讨论的，稀疏性可以在不同的级别上实现，例如权值级、内核级、通道级或层级。细粒度级(例如，权重级)稀疏性提供了最高的灵活性，而通用性导致了更高的压缩率，但它通常需要特殊的软件或硬件加速器对稀疏模型[11]进行快速推断。相反，最粗糙的层级稀疏性不需要特殊的包来获取推断加速，但它的灵活性较差，因为一些完整的层需要修剪。事实上，只有当深度足够大时，例如超过50层时，删除层才有效[35,18]。相比之下，通道级稀疏性在灵活性和实现的简易性之间提供了很好的折衷。它可以应用于任何典型的CNN或全连接网络(将每个神经元视为一个通道)，得到的网络本质上是未修剪网络的“减薄”版本，可以在传统CNN平台上高效推断。

挑战。 实现通道级稀疏性需要修剪与通道关联的所有传入和传出连接。这使得在预训练的模型上直接修剪权值的方法无效，因为不太可能通道输入或输出端的所有权值都接近零。正如[23]中报道的那样，在预训练的ResNets上修剪通道只能导致参数数量减少约10%，而不会损失准确性。[35]通过在训练目标中强制稀疏正则化来解决这个问题。具体来说，他们采用组LASSO，在训练过程中同时将同一信道对应的所有滤波器权值推入零。然而，这种方法需要计算附加正则化项相对于所有过滤器权值的梯度，这是非平凡的。我们介绍一个简单的想法来解决上述挑战，详细内容如下。

尺度因子与稀疏性惩罚。 我们的想法是为每个通道引入一个缩放因子 $\gamma$ ，它乘以该通道的输出。然后我们联合训练网络权重和这些比例因子，对后者进行稀疏正则化。最后用小因子对这些通道进行修剪，并对修剪后的网络进行微调。具体来说，我们方法的训练目标是由
$L=\sum_{(x, y)} l(f(x, W), y)+\lambda \sum_{\gamma \in \Gamma} g(\gamma) \tag{1}$

在(x,y)表示训练输入和目标，W表示可训练权重，第一个和项对应于CNN的正常训练损失，g(·)是缩放因子上的稀疏诱导惩罚， $\gamma$ 平衡了这两个项。在我们的实验中，我们选择 $g (s) = ∣ s ∣$ ，它被称为L1范数，广泛用于实现稀疏性。采用次梯度下降法对非平滑L1惩罚项进行优化。另一种选择是将L1惩罚替换为平滑-L1惩罚[30]，以避免在非平滑点使用次梯度。

由于修剪一个通道本质上对应于删除该通道的所有传入和传出连接，我们可以直接获得一个狭窄的网络(见图1)，而不求助于任何特殊的稀疏计算包。比例因子是渠道选择的代理因子。由于它们与网络权重共同优化，网络可以自动识别不重要的通道，可以安全地去除这些通道，而不会对泛化性能造成很大影响。

利用BN层中的缩放因子。批归一化[19]已被大多数现代cnn作为标准方法来实现快速收敛和更好的泛化性能。BN将激活归一化的方式促使我们设计了一种简单而有效的方法来合并信道相关的缩放因子。特别地，BN层使用小批统计数据规范内部激活。设 $z_{i n}$ 和 $z_{iout}$ 是一个BN层的输入输出，B表示当前的小批，BN层进行以下转换:
$\hat{z}=\frac{z_{i n}-\mu_{\mathcal{B}}}{\sqrt{\sigma_{\mathcal{B}}^{2}+\epsilon}} ; \quad z_{\text {out }}=\gamma \hat{z}+\beta \tag{2}$

其中， $\mu_{\mathcal{B}}$ 和 $\sigma_{\mathcal{B}}$ 是输入激活比B的均值和标准差， $\gamma$ 和 $\beta$ 是可训练的仿射变换参数(尺度和位移)，这提供了将归一化激活线性变换回任何尺度的可能性。

通常的做法是在卷积层之后插入BN层，使用通道缩放/移动参数。因此，我们可以直接利用BN层中的γ参数作为网络瘦身所需的缩放因子。它的最大优点是不给网络带来任何开销。事实上，这可能也是我们学习有意义的频道修剪比例因子的最有效的方法。1)，如果在没有BN层的CNN上添加缩放层，缩放因子的值对于评估信道的重要性没有意义，因为卷积层和缩放层都是线性变换。通过减小缩放因子值，同时放大卷积层中的权值，可以得到相同的结果。2)，如果在BN层之前插入一个标度层，标度层的标度效应将被BN中的归一化过程完全抵消。3)，如果在BN层之后插入缩放层，每个通道有两个连续的缩放因子。

频道修剪与微调。 在信道级稀疏诱导正则化下进行训练后，我们得到了一个许多尺度因子接近零的模型(见图1)。然后我们可以通过去除所有的入出站连接和相应的权值，来修剪尺度因子接近零的信道。我们使用跨所有层的全局阈值来修剪通道，该阈值被定义为所有缩放因子值的某个百分比。例如，我们通过选择百分比阈值为70%来修剪70%具有较低比例因子的渠道。通过这样做，我们获得了一个更紧凑的网络，具有更少的参数和运行时内存，以及更少的计算操作。

当剪枝率较高时，剪枝可能会暂时导致一定的精度损失。但这在很大程度上可以通过后续的裁剪网络微调过程来弥补。在我们的实验中，经过微调的窄网络在很多情况下甚至可以达到比原始的未修剪网络更高的精度。

多路方案。 我们还可以将所提出的方法从单通道学习方案(稀疏正则化、修剪和微调训练)扩展到多通道学习方案。具体来说，一个网络瘦身过程会导致一个狭窄的网络，在这个网络上我们可以再次应用整个训练过程来学习一个更紧凑的模型。图2中的虚线说明了这一点。实验结果表明，该多通道方案在压缩率方面可以取得更好的效果。

处理跨层连接和预激活结构。 上面介绍的网络瘦身过程可以直接应用于大多数普通的CNN架构，如AlexNet[22]和VGGNet[31]。而当它应用于具有跨层连接和预激活设计的现代网络如ResNet[15]和DenseNet[17]时，需要进行一些调整。对于这些网络，一层的输出可以被视为多个后续层的输入，其中一个BN层放在卷积层之前。在这种情况下，稀疏性是在一层的传入端实现的，也就是说，该层有选择地使用它接收到的通道的子集。为了在测试时获得参数和计算节省，我们需要放置一个通道选择层来屏蔽我们已经识别的不重要的通道。

4.实验

我们在几个基准数据集上实证证明了网络瘦身的有效性。我们在[10]之前基于ResNets的公开可用Torch[5]实现实现了我们的方法。该代码位于https://github.com/liuzhuang13/slimming。

4.1. 数据集

CIFAR。 两个CIFAR数据集[21]由分辨率32×32的自然图像组成。CIFAR-10从10个类中抽取，CIFAR-100从100个类中抽取。列车和测试集分别包含5万和1万张图像。在CIFAR-10上，从训练集中分离出5000张图像的验证集，用于在每个模型上搜索λ(在公式1中)。在对所有训练图像进行训练或微调后，我们报告最终的测试错误。采用标准的数据增强方案(移位/镜像)[14,18,24]。使用通道均值和标准差对输入数据进行规范化处理。我们还将我们的方法与CIFAR数据集上的[23]进行了比较。

SVHN。 街景门牌号(SVHN)数据集[27]由32x32的彩色数字图像组成。按照惯例[9,18,24]，我们使用所有604,388张训练图像，从中我们将6000张图像的验证集分离出来，用于训练期间的模型选择。测试集包含26032张图像。在训练过程中，我们选择验证误差最小的模型作为要修剪的模型(或基线模型)。我们还报告了在微调过程中验证误差最小的模型的测试误差。

ImageNet。 ImageNet数据集包含120万张训练图像和5000张1000个类的验证图像。我们采用[10]中的数据增强方案。我们报告了最终模型的单中心裁剪验证误差。

4.2. 网络模型

在CIFAR和SVHN数据集上，我们在VGGNet[31]、ResNet[14]和DenseNet[17]三个流行的网络架构上评估了我们的方法。VGGNet最初是为ImageNet分类而设计的。对于我们的实验，CIFAR数据集的原始VGGNet的一个变体取自[36]。对于ResNet，采用了164层瓶颈结构的预激活ResNet (ResNet-164)[15]。对于DenseNet，我们使用生长速率为12的40层DenseNet (DenseNet-40)。

在ImageNet数据集上，我们采用11层(8-conv + 3 FC)“VGG-A”网络[31]模型，从[4]批量归一化。我们删除了dropout层，因为我们使用了相对繁重的数据增强。为了修剪完全连接层中的神经元，我们将其视为空间大小为1×1的卷积通道。

在MNIST数据集上，我们在与[35]相同的3层全连接网络上评估我们的方法

4.3.训练、修剪和微调

正常训练。 我们通常从零开始训练所有网络作为基线。所有网络都使用SGD进行训练。在CIFAR和SVHN数据集上，我们分别使用小批量大小64训练160和20个时期。初始学习率设置为0.1，并在训练epochs总数的50%和75%时除以10。在ImageNet和MNIST数据集上，我们分别为60和30个epochs训练我们的模型，批量大小为256，初始学习率为0.1，在训练epochs的1/3和2/3之后除以10。我们使用 $10^{-4}$ 的权重衰减，Nesterov动量[33]为0.9，无阻尼。采用[13]引入的权重初始化。我们的优化设置严格遵循[10]中的原始实现。在我们的所有实验中，我们将所有信道缩放因子初始化为0.5，因为与[10]中的默认设置（全部初始化为1）相比，这为基线模型提供了更高的精度。

稀疏训练。 对于CIFAR和SVHN数据集，当使用信道稀疏正则化进行训练时，超参数λ(控制经验损失和稀疏性之间的权衡)由CIFAR-10验证集上 $10^{−3},10^{−4},10^{−5}$ 的网格搜索决定。对于VGGNet，我们选择λ= $10^{−4}$ ，对于ResNet和DenseNet，我们选择λ= $10^{−5}$ 。对于VGG-A在ImageNet上，我们设置λ= $10^{−5}$ 。所有其他设置保持与正常训练相同。

修剪。 当我们修剪稀疏训练的模型通道时，需要确定尺度因子的修剪阈值。在[23]中，不同的层按不同的比率修剪，为了简单起见，我们使用全局修剪阈值。修剪阈值由所有缩放因子中的一个百分位决定，例如，40%或60%的通道被修剪。修剪过程是通过建立一个新的更窄的模型，并从用稀疏性训练的模型复制相应的权重来实现的。

微调。 在修剪之后，我们得到一个更窄更紧凑的模型，然后对其进行微调。在CIFAR、SVHN和MNIST数据集上，微调使用与训练中相同的优化设置。对于ImageNet数据集，由于时间限制，我们对裁剪后的VGG-A进行了微调，仅在5个epochs内以 $10^{−3}$ 的学习率进行了微调。

4.4. 结果

CIFAR和SVHN的结果如表1所示。我们用黑体字标出一个模型的所有最低测试误差。

参数和触发器减少。 网络瘦身的目的是减少所需的计算资源。每个模型的最后一行都有≥60%的通道修剪，同时仍然保持与基线相似的精度。参数节省可达10×。触发器的减少通常在50%左右。为了突出显示网络瘦身的效率，我们在图3中绘制了节省的资源。可以观察到，VGGNet有大量的冗余参数，可以进行修剪。在ResNet-164上，参数和触发器的节省相对来说是微不足道的，我们推测这是由于它的“瓶颈”结构已经起了选择通道的作用。另外，在CIFAR-100上，减少率通常略低于CIFAR-10和SVHN，这可能是由于CIFAR-100包含更多的类。

正则化的效果。 从表1中我们可以观察到，在ResNet和DenseNet上，通常当修剪40%的通道时，经过微调的网络可以实现比原始模型更低的测试误差。例如，经过40%通道修剪的DenseNet-40在CIFAR-10上的测试误差为5.19%，比原始模型降低了近1%。我们假设这是由于L1稀疏性对通道的正则化效应，这自然提供了网络中间层的特征选择。我们将在下一节中分析这种影响。

ImageNet。 ImageNet数据集的结果如表2所示。当修剪50%通道时，参数节省超过5×，而触发器节省仅为30.4%。这是因为所有计算密集的卷积层中只有378个(2752个)通道被修剪，而参数密集的全连接层中有5094个神经元(8192个)被修剪。值得注意的是，我们的方法可以在1000类ImageNet数据集上实现节省而不损失精度，而其他高效cnn的方法[2,23,35,28]大多呈现精度损失。

MNIST。 在MNIST数据集上，我们将我们的方法与表3中的结构化稀疏学习(SSL)方法[35]进行比较。尽管我们的方法主要是设计来修剪卷积层中的通道，但它也可以很好地修剪全连接层中的神经元。在这个实验中，我们观察到使用全局阈值的修剪有时会完全删除一个层，因此我们在两个中间层中分别修剪80%的神经元。我们的方法的性能略优于[35]，因为在修剪更多参数的同时实现了略低的测试误差。

我们在补充材料中提供了一些额外的实验结果，包括:(1)CIFAR-10上的紧凑VGGNet的详细结构;(2)在实践中节省挂钟时间和运行时内存。(3)与之前的信道修剪方法[23]进行比较;

4.5. 多通道方案的结果

我们使用VGGNet对CIFAR数据集采用多通道方案。因为没有跳跃式连接，修剪掉整个层将完全破坏模型。因此，除了设置百分比阈值为50%之外，我们还设置了一个约束，即在每一层中，最多可以修剪50%的通道。

各迭代模型的测试误差如表4所示。随着修剪过程的进行，我们得到越来越紧凑的模型。在CIFAR-10上，训练过的模型在迭代5中达到了最低的测试误差。该模型实现了20×参数减少和5×触发器减少，同时仍然实现了较低的测试误差。在CIFAR-100上，迭代3之后，测试误差开始增加。这可能是由于它包含的类比CIFAR-10更多，因此过于激进地裁减通道将不可避免地损害性能。然而，我们仍然可以修剪近90%的参数和近70%的FLOPs，而没有显著的精度损失。

5. 分析

在网络瘦化中有两个关键的超参数，剪枝百分比t和稀疏正则化项λ的系数(见等式1)。在本节中，我们将更详细地分析它们的影响。

修剪率的影响。 一旦我们获得了一个经过稀疏正则化训练的模型，我们需要决定从模型中删除多少百分比的通道。如果我们修剪的频道太少，节省的资源就会非常有限。但是，如果我们修剪过多的通道，可能对模型是破坏性的，通过微调可能无法恢复精度。我们在cifr -10上训练一个λ=10−5的DenseNet-40模型，以显示修剪不同百分比的通道的效果。图5总结了结果。

从图5可以看出，只有当修剪比超过阈值时，裁剪或微调模型的分类性能才会下降。微调过程通常可以补偿修剪可能造成的精度损失。只有当阈值大于80%时，微调模型的测试误差才会落后于基线模型。值得注意的是，当使用稀疏性训练时，即使没有微调，模型也比原始模型表现得更好。这可能是由于L1稀疏性对信道标度因子的正则化效应。

通道稀疏正则化。 L1稀疏项的目的是迫使许多比例因子接近零。方程1中的参数λ控制了它与正常训练损失相比的显著性。在图4中，我们绘制了不同λ值下整个网络的比例因子分布。在这个实验中，我们使用了在CIFAR-10数据集上训练的VGGNet。

可以观察到，随着λ的增加，缩放因子越来越集中在零附近。当λ=0时，即没有稀疏正则化时，分布相对平坦。当λ=10−4时，几乎所有的比例因子都落在接近零的一个小区域。这一过程可以看作是发生在深度网络中间层的特征选择，其中只选择具有不可忽略比例因子的通道。我们通过热图进一步可视化这一过程。图6显示了VGGNet中一个层的缩放因子的大小，以及训练过程。每个通道开始时权重相等;随着训练的进行，一些通道的缩放因子变大(亮)，而另一些通道的缩放因子变小(暗)。

6. 结论

为了学习更紧凑的cnn，我们提出了网络瘦身技术。它直接对批处理归一化层中的尺度因子进行稀疏诱导正则化，从而在训练过程中自动识别不重要的通道并进行修剪。在多个数据集上，我们已经证明了所提出的方法能够显著降低最先进网络的计算成本(高达20×)，且没有精度损失。更重要的是，该方法同时减少了模型的大小、运行时内存和计算操作，同时为训练过程引入了最小的开销，得到的模型不需要特殊的库/硬件来进行有效的推断。

AI大模型训练教程 Small踢倒coffee_氕氘氚 python自学经验分享笔记
1.引言随着人工智能技术的快速发展，大模型（如GPT-3、BERT等）在自然语言处理、计算机视觉等领域取得了显著的成果。训练一个大模型需要大量的计算资源、数据和专业知识。本教程将带你了解如何从零开始训练一个AI大模型。2.准备工作2.1硬件要求GPU：推荐使用NVIDIA的高性能GPU，如A100、V100等。内存：至少64GBRAM。存储：SSD存储，至少1TB。#2.2软件环境操作系统：Lin
使用Jupyter Notebook进行深度学习编程 - 深度学习教程 shandianfk_com ChatGPT AI jupyter 深度学习 ide
大家好，今天我们要聊聊如何使用JupyterNotebook进行深度学习编程。深度学习是人工智能领域中的一项重要技术，通过模仿人脑神经网络的方式进行学习和分析。JupyterNotebook作为一个强大的工具，可以帮助我们轻松地进行深度学习编程，尤其适合初学者和研究人员。本文将带领大家一步步了解如何在JupyterNotebook中开展深度学习项目。一、什么是JupyterNotebook？Jup
英伟达常用GPU参数速查表，含B300..... Ai17316391579 深度学习服务器人工智能机器学习服务器电脑计算机视觉深度学习神经网络
英伟达常用GPU参数速查表，收藏备用：含RTX5090、RTX4090D、L40、L20、A100、A800、H100、H800、H20、H200、B200、B300、GB300.....专注于高性能计算人工智能细分领域kyfwq001#5090##4090##英伟达“新核弹”B200发布##英伟达##英伟达B300##GPU##服务器##显卡##英伟达H800/A800芯片将禁售#
深度学习 Deep Learning 第8章深度学习优化 odoo中国 AI编程人工智能深度学习人工智能优化
深度学习第8章深度学习的优化章节概述本章深入探讨了深度学习中的优化技术，旨在解决模型训练过程中面临的各种挑战。优化是深度学习的核心环节，直接关系到模型的训练效率和最终性能。本章首先介绍了优化在深度学习中的特殊性，然后详细讨论了多种优化算法，包括随机梯度下降（SGD）、动量法、Nesterov动量法、AdaGrad、RMSProp和Adam等。此外，还探讨了参数初始化策略、自适应学习率方法以及二阶优
景联文科技提供高质量文本标注服务，驱动AI技术发展景联文科技科技人工智能
文本标注是指在原始文本数据上添加标签的过程，这些标签可以用来指示特定的实体、关系、事件等信息，以帮助计算机理解和处理这些数据。文本标注是自然语言处理（NLP）领域的一个重要环节，它通过为文本的不同部分提供具体的含义和上下文信息，增强机器学习和深度学习模型对文本内容的理解能力。标注类型情感分析情感极性：确定文本表达的情感倾向，如正面、负面或中立。强度评估：衡量情感的强烈程度，从轻微到极端不等。命名实
打造金融数据新引擎，看永洪科技助力头部农信社搭建一站式分析平台永洪科技金融数据可视化 BI 数据分析大数据
在数字化转型的浪潮中，金融行业作为经济发展的核心引擎，正加速探索数字化、智能化的新路径。永洪科技，近日成功助力某省农村信用社联合社（简称：Z企业）完成了其数字化转型的重要一步，通过部署先进的商业智能解决方案，为Z企业的业务升级与效能提升注入了强劲动力。随着智能金融时代的来临，以大数据、人工智能、移动互联等新兴技术为核心的金融科技持续赋能银行金融业务数字化、智能化、开放化的发展，为金融机构营销体系的
景联文科技：以高质量数据标注推动人工智能领域创新与发展景联文科技科技人工智能数据标注
在当今这个由数据驱动的时代，高质量的数据标注对于推动机器学习、自然语言处理（NLP）、计算机视觉等领域的发展具有不可替代的重要性。数据标注过程涉及对原始数据进行加工，通过标注特定对象的特征来生成能够被机器学习模型识别和使用的编码格式，从而使数据更具有意义和可解读性。数据标注的主要类型包括：图像标注：指在图片中标识出目标物体的位置、形状或类别等信息，如自动驾驶技术中的行人、车辆及交通标志的识别。文本
人工智能与网络信息技术的深度融合鸭鸭鸭进京赶烤学术会议人工智能 AI编程 ai 机器人计算机视觉网络计算机网络
在当今时代，人工智能（AI）和网络信息技术正以前所未有的速度推动着社会变革。从通用人工智能（AGI）到具身智能的普及，AI不仅实现了技术上的飞跃，也在各个行业展现出巨大的应用潜力。随着技术的不断迭代，我们迎来了许多创新应用，例如AI在电子信息技术中的应用，通过算法优化与升级，显著提高了处理效率和准确性。网络信息技术同样在飞速发展。面向2030年的未来网络发展趋势表明，网络将支撑万亿级、人机物、全时
深度学习篇---对角矩阵&矩阵的秩&奇异矩阵 Ronin-Lotus 程序代码篇深度学习篇深度学习矩阵人工智能线性代数
文章目录前言一、对角矩阵（DiagonalMatrix）1.1定义1.2特性行列式运算简化1.3应用领域深度学习信号处理量子力学经济学二、矩阵的秩（RankofaMatrix）2.1定义2.2特性满秩降秩影响2.3应用领域深度学习图像压缩推荐系统控制理论三、奇异矩阵（SingularMatrix）3.1定义3.2特性秩不足行列式为零3.3应用领域深度学习正则化损失函数结构工程统计学数值计算四、跨领
DeepSeek、Grok 与 ChatGPT 三巨头：技术架构与应用场景的全方位解析云策量化 Deepseek chatgpt deepseek grok
前言在当今人工智能领域，DeepSeek、Grok和ChatGPT作为语言模型的三巨头，各自凭借独特的技术架构和广泛的应用场景，在自然语言处理领域占据着重要地位。本文将对这三款模型的技术架构和应用场景进行全方位解析，以期为读者提供深入的了解和有价值的参考。一、技术架构（一）DeepSeekDeepSeek是由DeepSeek团队开发的一款大型语言模型，其技术架构基于深度学习中的Transforme
探索AI模型的巅峰之战：ChatGPT、DeepSeek与Grok 3，谁才是最强？温暖阳光阿斌人工智能 chatgpt
近年来，人工智能领域正处于一场高速迭代的革命中。大型语言模型（LLMs）如ChatGPT、DeepSeek和Grok3纷纷亮相，各展所长，为人们带来了前所未有的体验。在这场"谁是最强"的竞争中，每一方都展现出了令人惊叹的能力和独特的优势。然而，这些模型之间的差异和特点，究竟是什么？它们各自的优势在哪里？又有哪些隐藏的短板？本文将带您深入了解这三位AI巨头的亮点与争议，共同探讨它们在AI领域的位置，
OpenCV 4.2.0与扩展模块安装与应用指南土城三富
本文还有配套的精品资源，点击获取简介：OpenCV4.2.0是一个先进的计算机视觉库，包含了图像处理、计算机视觉和机器学习算法。本压缩包包含OpenCV核心库和扩展模块（opencv_contrib），版本均为4.2.0。该版本引入了性能增强、API优化以及对深度学习框架和硬件加速技术的更新支持。扩展模块提供了额外的实验性算法和功能，有助于研究和开发新算法。指南详细介绍了如何安装和配置这些库，并提
YOLOV11|YOLO12改进系列指南魔鬼面具 YOLO
基于Ultralytics的YOLO11|YOLO12改进目前自带的一些改进方案(持续更新)为了感谢各位对本项目的支持,本项目的赠品是yolov5-PAGCP通道剪枝算法.具体使用教程专栏改进汇总YOLO11系列二次创新系列ultralytics/cfg/models/11/yolo11-RevCol.yaml使用(ICLR2023)ReversibleColumnNetworks对yolo11主
介于YOLOv5的裂缝识别系统程序员～小强 YOLO
介于YOLOv5的裂缝识别系统在现代工业中，裂缝监测是的保障设施安全的重要环节。我们公司的新项目——基于YOLOv5的裂缝识别系统，将为您提供高效、精准的解决方案，助力各类工程项目的质量管理。系统优势我们的裂缝识别系统借助YOLOv5进行深度学习，经过精心训练，拥有强大的图像识别能力。只需简单的步骤，您就能将复杂的裂缝检测转化为轻松的操作，让分析变得更加简单、高效。核心功能图片上传与场景选择用户可
使用DeepSeek R1大模型编写迅投 QMT 的量化交易 Python 代码 wtsolutions qmt量化交易 python qmt deepseek 量化交易代码生成
随着人工智能技术的迅猛发展，利用AI工具提升工作效率已成为现代开发者的重要手段。在使用deepseek官方网页生成迅投QMT代码的时候，deepseek给出的代码是xtquant代码，也就是miniqmt代码，并不是我们传统意义上说的大QMT可用的代码。因此，我们需要自建一个知识库，让deepseek根据我的知识库里面的知识，去帮我生成大QMT可用的交易代码。一、建立迅投QMT的知识库建立迅投QM
GPU架构分类大明者省架构
一、NVIDIA的GPU架构NVIDIA是全球领先的GPU生产商，其GPU架构在图形渲染、高性能计算和人工智能等领域具有广泛应用。NVIDIA的GPU架构经历了多次迭代，以下是一些重要的架构：1.Tesla（特斯拉）架构（2006年发布）特点：NVIDIA推出的首个通用GPU计算架构，支持使用C语言进行GPU编程，标志着GPU开始从专用图形处理器转变为通用数据并行处理器。性能：具有128个流处理器
芯片的未来发展趋势 iccnewer
2024年，该行业将专注于AI/ML、RISC-V、量子、安全等发展趋势。今年年初，大多数人从未听说过生成式人工智能。现在整个世界都在竞相利用它，而这仅仅是个开始。量子计算、6G、智能基础设施等新市场领域专用处理正在加速对更快、更高效、更多数据的需求。与每隔几年等待下一个工艺节点的日子相比，未来几年的事件将与电话或汽车的引入一样重要。但可能不会只有一种创新技术，将会有很多技术一起以一种将让科技界惊
Python程序设计（入门） xyyykx python 开发语言
目录一丶Python概述二丶Python数据类型三丶常用的进制四丶字符串型五丶程序控制结构六丶组合数据类型一丶Python概述Python是一种高级编程语言，由GuidovanRossum于1991年开发并发布。它具有简洁、易读、易学的语法特点，被广泛应用于多个领域，包括软件开发、数据科学、人工智能、网络编程等。以下是Python的一些主要特点和优势：简单易学：Python的语法简洁明了，易于理解
LLM：软件测试的颠覆性力量 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
LLM：软件测试的颠覆性力量关键词：大语言模型（LLM）、软件测试、人工智能、测试自动化、测试效率、质量保证、测试革新1.背景介绍在当今快速发展的软件行业中，测试一直是确保产品质量的关键环节。随着人工智能技术的飞速进步，特别是大语言模型（LargeLanguageModels，简称LLM）的出现，软件测试领域正经历着前所未有的变革。LLM凭借其强大的自然语言处理能力和广泛的知识储备，正在重塑我们对
使用Dall-E生成图像：文本到图像的魔力 shuoac 计算机视觉人工智能 python
使用Dall-E生成图像：文本到图像的魔力技术背景介绍Dall-E是OpenAI开发的一个强大的文本到图像生成模型，它能够根据自然语言描述创造出全新的数字图像。这一技术基于深度学习的方法，使得创意与AI图像生成的结合更具可能性。本文将介绍如何调用Dall-EAPI来生成图像，从而使开发者能够将这一技术应用到自己的项目中。核心原理解析Dall-E利用大型语言模型（LLM）从用户提供的文本描述中提取详
深入了解盘古大模型：技术、应用与未来 Hardess-god Literature review 人工智能
随着人工智能技术的迅猛发展，预训练大模型已成为AI领域最前沿、最热门的研究方向之一。近年来，中国自主研发的大模型之一——盘古模型（PanGuModel）逐渐进入公众视野，凭借其强大的性能和广泛的应用前景，引发了行业内外的广泛关注。什么是盘古大模型？盘古大模型是华为公司联合多家科研机构共同研发的超大规模预训练语言模型。该模型以中文数据为主进行训练，旨在推动中文自然语言处理（NLP）以及跨模态应用的技
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。 985小水博一枚呀深度学习人工智能
【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。文章目录【深度学习|地学应用】滑坡灾害早期隐患的概念、特征及识别方法，同时解释其与人工边坡、滑坡易发性之间的联系与区别。1.滑坡灾害早期隐患的概念与特征概念主要特征2.通过光学
【人工智能之大模型】阐述生成式语言模型的工作机理...（二） 985小水博一枚呀大大大模型知识点人工智能语言模型自然语言处理机器学习神经网络
【人工智能之大模型】阐述生成式语言模型的工作机理…（二）【人工智能之大模型】阐述生成式语言模型的工作机理…（二）文章目录【人工智能之大模型】阐述生成式语言模型的工作机理...（二）前言4.代码逐行解释TransformerBlock类初始化前向传播GenerativeLM类初始化前向传播推理示例测试生成5.总结欢迎宝子们点赞、关注、收藏！欢迎宝子们批评指正！祝所有的硕博生都能遇到好的导师！好的审稿
人工智能 - 通用 AI Agent 之 LangManus、Manus、OpenManus 和 OWL 技术选型天机️灵韵具身智能人工智能人工智能具身智能智能体
一、核心项目概览1.Manus（闭源通用AIAgent）定位：全球首个全流程自动化通用AIAgent，GAIA基准测试SOTA水平。核心能力：全流程自动化：从任务规划（如撰写报告）到执行（代码生成、表格制作）的端到端处理。智能纠错机制：基于沙箱环境的实时错误反思与调整（类似CodeAct技术）。云端依赖：需联网运行，集成浏览器操作、信息检索等工具。局限性：闭源且采用邀请制，二手市场邀请码溢价至数万
知识图谱中NLP新技术魔王阿卡纳兹知识图谱入门大数据治理与分析知识图谱自然语言处理人工智能
知识图谱与自然语言处理（NLP）的结合是当前人工智能领域的前沿方向，其技术发展呈现多维度融合与场景深化的特点。以下从核心技术突破、应用场景创新及未来趋势三个层面，系统梳理知识图谱中NLP的最新进展：一、核心技术突破基于预训练模型的图谱构建与增强预训练语言模型与知识嵌入融合：以BERT、KEPLER为代表的模型通过联合优化知识嵌入（KE）和语言建模目标，将知识图谱中的结构化知识融入预训练过程，显著提
掌握ChatGPT写代码的秘诀：开发者的完整指南酷酷的崽798 机器学习 chatgpt
文章目录前言：如何利用ChatGPT来写代码：一个深度指南1.ChatGPT的基本功能概述2.利用ChatGPT辅助代码编写的好处3.ChatGPT支持的编程语言4.如何向ChatGPT提问以获取最佳结果5.实际应用案例6.ChatGPT的局限性及其解决方法7.关于隐私和安全性的注意事项8.未来展望结论前言：如何利用ChatGPT来写代码：一个深度指南近年来，人工智能技术取得了飞跃性的进展，尤其是
给普通人看的深度学习说明书：用快递系统理解AI如何思考嵌入式Jerry Python AI 人工智能深度学习
第一章：理解AI的思维方式（快递版）1.1快递分拣站的故事假设你管理一个快递分拣站：传统方法：手动制定规则（比如根据邮编分拣）机器学习：观察老员工的分拣记录，总结规律深度学习：搭建自动分拣流水线，自主发现隐藏规则1.2神经网络就像智能分拣机传送带（输入层）：接收包裹信息（图片像素/文字等）#就像扫描快递单input_data=[0.2,0.7,0.1]#归一化后的特征数据分拣工人（隐藏层）：每个工
解析大模型归一化：提升训练稳定性和性能的关键技术秋声studio 口语化解析深度学习人工智能大模型归一化
引言在深度学习领域，特别是在处理大型神经网络模型时，归一化（Normalization）是一项至关重要的技术。它可以提高模型的训练稳定性和性能，在加速收敛方面发挥了重要作用。本文将深入探讨大模型归一化的原理、常见方法及其应用场景，并结合实际案例和代码示例进行说明。一、归一化的作用与理论基础归一化的主要目的是为了提高模型的训练稳定性和性能。具体来说，归一化有以下几个关键作用：提高训练稳定性：在神经网
C++基础系列【26】排序和查找算法程序喵大人 C++基础系列 c语言算法开发语言 c++
博主介绍：程序喵大人35-资深C/C++/Rust/Android/iOS客户端开发10年大厂工作经验嵌入式/人工智能/自动驾驶/音视频/游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章，首发gzh，见文末记得订阅专栏，以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++训练营排序与查找算法的重要性不用过多介绍了吧，面试也经常考察。
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践古月居GYH 深度学习人工智能
一、引言：模型泛化能力的核心挑战在深度学习模型开发中，欠拟合与过拟合是影响泛化能力的两个核心矛盾。据GoogleBrain研究统计，工业级深度学习项目中有63%的失败案例与这两个问题直接相关。本文将从基础概念到工程实践，系统解析其本质特征、诊断方法及解决方案，并辅以可复现的代码案例。二、核心概念与通熟易懂解释简单而言，欠拟合是指模型不能在训练集上获得足够低的误差。换句换说，就是模型复杂度低，模型在
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&