乌拉拉喵喵

【论文阅读】RepVGG: Making VGG-style ConvNets Great Again翻译

RepVGG: Making VGG-style ConvNets Great Again论文翻译-CVPR2021

论文地址：https://arxiv.org/abs/2101.03697
代码地址：https://github.com/DingXiaoH/RepVGG

摘要

我们提出了一个简单但功能强大的卷积神经网络体系结构，它有一个推理阶段的VGG-like型主体，只有一个由3*3卷积和ReLU组成的堆栈，而训练时间模型具有多分支拓扑。这种训练时间和推理时间体系结构的解耦是通过一种结构重参数化技术实现的，因此该模型被命名为RepVGG。在ImageNet上，据我们所知，RepVGG作为普通模型第一次达到了80%以上的top-1精度。在NVIDIA 1080Ti GPU上，RepVGG模型的运行速度比ResNet-50快83%，比ResNet-101快101%，且具有更高的精度，与最先进的模型如EfficientNet和RegNet相比，显示出良好的精度-速度平衡。代码和训练模型在https://github.com/megvii-model/RepVGG。

Introduction

卷积神经网络(ConvNets)已经成为许多任务的主流解决方案。VGG[30]通过由conv、ReLU、pooling组成的简单架构，在图像识别方面取得了巨大的成功。随着Inception [32,33,31,17]， ResNet[10]和DenseNet[15]的出现，大量的研究兴趣转向了良好设计的架构，使得模型越来越复杂。最近一些强大的架构是通过自动[43,28,22]或手动[27]架构搜索，或在基本架构[34]上搜索复合缩放策略获得的。
尽管许多复杂的卷积神经网络比简单的卷积神经网络具有更高的精度，但缺点也很明显。1)复杂的多分支设计(如ResNet中的剩余添加和Inception中的分支连接)使模型难以实现和自定义，降低了推理速度，降低了内存利用率。2)一些组件(例如，Xception[2]和MobileNets[14, 29]中的深度卷积和ShuffleNets中的信道搅乱[23, 40])增加内存访问成本，缺乏各种设备的支持。由于影响推断速度的因素有很多，浮点操作(FLOPs)的数量并不能准确地反映实际速度。虽然一些新的模型比之前的诸如VGG和resnet -18/34/ 50[10]有更低的FLOPs，但它们运行起来可能不会更快(表4)。因此，VGG和ResNets的原始版本仍然在学术界和工业界的现实应用中大量使用。

图1：ImageNet上的最高精度与实际速度。左图:轻量级和中量级RepVGG和120个时代训练的基线。右图:重量级模型训练了200个时代。该速度在相同的1080Ti上进行测试，批量尺寸为128，全精度(fp32)，单批，以示例/秒进行测量。effentnet - b3[34]的输入分辨率为300，其余[34]的输入分辨率为224。

图2：RepVGG基础框架。RepVGG有5个阶段，在阶段开始时通过stride-2卷积进行下行采样。这里我们只展示第一个特定阶段的4个层次。受ResNet[10]的启发，我们也使用identity和1*1分支，但只用于训练。

在本文中，我们提出了RepVGG，一个vgg风格的架构，它优于许多复杂的模型(图1).。RepVGG具有以下优势:

该模型具有VGG-like的平面(也称为前馈)拓扑结构没有任何分支。也就是说，每一层都将其上一层的输出作为输入，并将输出输入到下一层。
模型的主体只使用3*3 卷积和ReLU激励函数。
具体的架构(包括特定的深度和层宽)实例化时不需要自动搜索[43]、手动细化[27]、复合缩放[34]，或者其他繁重的设计。

普通模型要达到与多分支架构相当的性能水平是很有挑战性的。一种解释是多分支拓扑结构，例如ResNet，使模型成为众多浅模型[35]的隐式集合，因此训练一个多分支模型可以避免梯度消失的问题。
由于多分支体系结构的优点都是用于训练，而缺点则不是用于推理，因此我们提出通过结构重参数化将训练时间的多分支体系结构和推理时间的普通体系结构解耦，这意味着通过转换其参数将体系结构从一个转换为另一个。具体来说，一个网络结构是与一组参数耦合的，例如，一个卷积层用一个四阶核张量来表示。如果将某一结构的参数转换成另一结构耦合的另一组参数，我们就可以将前者等效为后者，从而改变整个网络结构。
具体来说，我们使用identity和1*1的分支构建训练时的RepVGG，这是受到ResNet的启发，但以不同的方式，可以通过结构重参数化删除分支(图2、4)。训练后,我们用简单代数来执行转换,一个identity分支可以被视为一个退化的1*1 卷积,而后者可以进一步被视为退化的3*3卷积，这样我们可以构造一个简单的3*3内核与原有的训练参数3*3内核、identity、1*1分支和批处理规范化(BN)[17]层。因此，转换后的模型有一堆3*3的卷积层，这些层被保存起来用于测试和部署。
值得注意的是，推理时间的RepVGG只涉及一种类型的操作:33的卷积和ReLU，这使得RepVGG在gpu等通用计算设备上运行速度很快。更好的是，RepVGG允许专用硬件实现更高的速度，因为考虑到芯片大小和功耗，我们需要的操作类型越少，我们可以集成到芯片上的计算单元就越多。也就是说，专门用于RepVGG的推理芯片可以拥有大量的33-ReLU单元和更少的内存单元(因为简单拓扑是内存经济的，如图3所示)。我们的贡献总结如下。

我们提出了RepVGG，一种简单的架构，与最先进的技术相比，具有良好的速度-精度平衡。
我们提出使用结构重参数化来解耦训练时间多分支拓扑和推理时间简单结构。
我们已经证明了RepVGG在图像分类和语义分割方面的有效性，以及实现的效率和易用性。

2. Related Work

2.1. From Single-path to Multi-branch（从单路径到多分支）

在VGG[30]将ImageNet分类的top-1准确率提高到70%以上之后，在使ConvNets变得复杂以达到高性能方面有很多创新，如当代的google[32]及以后的版本Inception模型[33,31,17]采用了精心设计的多分支架构，ResNet[10]提出了简化的双分支架构，DenseNet[15]通过将低层和大量的高层连接起来，使得拓扑结构更加复杂。神经结构搜索(Neural architecture search, NAS)[43,28,22,34]和人工设计空间设计[27]可以生成性能更高的卷积网络，但代价是大量的计算资源或人力。nas生成模型的一些大型版本甚至不能在普通gpu上训练，因此限制了应用程序。除了实现上的不便之外，复杂的模型可能会降低[23]的并行度，从而降低推理的速度。

2.2. Effective Training of Single-path Models（有效的单路径训练模型）

已经有人尝试训练没有分支的ConvNets。然而，前人的工作主要是寻求非常深入的模型以合理的精度收敛，并没有达到比复杂模型更好的性能。因此，所建立的方法和模型既不简单也不实用。例如，提出了一种初始化方法[36]来训练极深简单的ConvNets。使用基于平均场理论的方案，10000层网络在MNIST上训练的准确率超过99%，在CIFAR-10上训练的准确率达到82%。虽然模型不实用(甚至LeNet-5[19]在MNIST上的准确率达到99.3%，VGG-16在CIFAR- 10上的准确率达到93%以上)，但理论贡献是很有见地的。最近的工作[24]结合了几种技术，包括Leaky ReLU、max-norm和仔细的初始化。在ImageNet上，参数量为147M的简单ConvNet准确率可以达到74.6%的top-1精度，比之前的基线(ResNet-101, 76.6%，45M参数)低2%。
值得注意的是，本文不仅仅是一个简单模型可以很好地收敛的演示，而且并不打算训练像ResNets这样极其深度的ConvNets。相反，我们的目标是建立一个简单的模型，具有合理的深度和良好的精度-速度平衡，可以简单地用最常见的分量(如正则conv和BN)和简单的代数来实现。

2.3. Model Re-parameterization（模型重参数化）

DiracNet[38]是一种与我们相关的重参数化方法。它通过将卷积层的核编码为^W = diag(a)I + diag(b)Wnorm来构建深平面模型，其中^W是用于卷积的最终权值(一个被视为矩阵的四阶张量)，a和b是学习向量，Wnorm是规范化的可学习核。与同等参数量的ResNets相比，CIFAR- 100上DiracNet的top-1准确率降低了2.29% (78.46% vs. 80.75%)， ImageNet上降低了0.62% (DiracNet-34的72.21% vs. ResNet-34的72.83%)。Dirac- Net与我们的方法的不同之处是:1)我们的结构重参数化是通过一个具体的结构来实现的，这个具体的结构后来可以转换成另一个，而DiracNet仅仅使用了另一个conv核的数学表达式，以方便优化。即，一个结构上重新参数化的普通模型是一个真正的训练时间多分支模型，但DiracNet不是。2) DiracNet模型的性能高于一般参数化的简单模型，但低于可比的ResNet模型，而RepVGG模型的性能则大大优于ResNets模型。Asym Conv Block(ACB)[9]采用不对称卷积加强常规卷积的骨架,它可以被视为另一种形式的结构性重参数化,它训练块转换成卷积。我们的方法相比,不同之处在于,ACB是专为组件级的改进和用作卷积层替代在任何体系结构中,当我们的结构性重参数化训练简单ConvNets至关重要,如4.2部分所示。

2.4.Winograd Convolution（Winograd卷积）

RepVGG只使用了3*3卷积，因为它在GPU和CPU上被一些现代的计算库如NVIDIA cuDNN[1]和Intel MKL[16]高度优化。表1显示了在1080Ti GPU上用cuDNN 7.5.0测试的理论FLOPs、实际运行时间和计算密度(以每秒Tera浮点运算次数衡量，TFLOPS) 。结果表明，3*3卷积的理论计算密度和其他算法一样都在4左右，这表明在不同的体系结构中，理论总失败数并不能代表实际速度。加速3*3卷积的经典算法是winograd算法[18]（仅当stride为1时)，它已经被库如cuDNN和MKL很好的支持(并默认启用)。例如，用标准F(2*2，3*3）Winograd，一个3*3卷积的乘法(MULs)减少到原来的4/9。自比增加乘法更耗时,我们计算MULs测量计算成本与Winograd支持(用Wino MULs表。4、5)。注意,具体计算库和硬件确定为每个运算使用Winograd因为小规模的卷积可能不是加速由于内存开销。

3. Building RepVGG via Structural Re-param（通过结构重参数化构建RepVGG）

3.1. Simple is Fast, Memory-economical,Flexible（简单就是快速，节省内存，灵活的）

使用简单的convnet至少有三个原因:它们快速、节省内存和灵活。
快速许多最近的多分支架构的理论故障比VGG要低，但运行起来可能不会更快。例如，VGG-16作为EfficientNet-B3[34]的FLOPs是8:4，但在1080Ti上运行速度要快1:8(表4)，这意味着前者的计算密度是后者的15倍。除了Winograd卷积带来的加速外，内存访问开销(MAC)和并行度[23]是影响速度的两个重要因素，但内存访问开销并没有被计算在内。例如，虽然需要的分支加法或连接的计算是微不足道的，但mac是重要的。此外，MAC在分组卷积中占据了很大一部分时间。另一方面，在相同的失败情况下，具有高并行度的模型可能比另一个具有低并行度的模型要快得多。由于多分支拓扑在初始化和自动生成的体系结构中被广泛采用，因此使用了多个小的运算符而不是几个大的运算符。之前的工作[23]显示,片段式的运算符的数量(即个别的卷积或池操作的数量在一个构建块)在NASNET-A[42]是13,这是不友好的设备与强大的并行计算能力GPU和内核启动和同步等,引入了额外的开销。相比之下，这个数字在ResNets中是2或3，我们将其设为1:单个卷积。

Memory-economical 多分支拓扑是内存效率低下的，因为每个分支的结果都需要保留到添加或连接时，这大大提高了内存占用的峰值。如图3所示，剩余块的输入需要保持到加法为止。假设块保持特征图的大小，则内存占用的峰值为2作为输入。相比之下，普通拓扑允许特定层的输入所占用的内存在操作完成后立即释放。在设计专门的硬件时，普通的ConvNet允许深度内存优化并降低内存单元的成本，以便我们可以在芯片上集成更多的计算单元。

灵活性 多分支拓扑对体系结构规范施加了约束。例如，ResNet要求将卷积层组织为剩余块，这限制了灵活性，因为每个剩余块的最后一个卷积层必须产生相同形状的张量，否则快捷添加将没有意义。更糟糕的是，多分支拓扑限制了通道剪枝的应用[20,12]。通道剪枝是一种去除一些不重要通道的实用技术，有些方法可以通过自动发现每一层[7]的合适宽度来优化模型结构。然而，多分支模型使修剪变得棘手，并导致显著的性能退化或较低的加速比[6,20,8]。相比之下，普通架构允许我们根据需求自由配置每个卷积层，并进行修剪，以获得更好的性能-效率平衡。

3.2. Training-time Multi-branch Architecture（训练时间多分支结构）

简单的卷积网络有很多优点，但有一个致命的缺点:性能差。例如，使用BN[17]等现代组件，VGG-16可以在ImageNet上达到72%的top-1精度，这似乎过时了。我们的结构重新参数化方法受到了ResNet的启发，该方法明确地构建了一个快捷分支，将信息流建模为y = x + f(x)，并使用一个剩余块学习f。当x和f(x)的维数不匹配时，就变成y = g(x) + f(x)，其中g(x)是一个卷积捷径，通过一个1*1的卷积实现。Renets成功的一个解释是，这样的多分支架构使模型成为众多较浅模型[35]的隐含集成。具体来说，有n个块，模型可以解释为2n个模型的集合，因为每个块将流分成两条路径。
由于多分支拓扑在推理方面存在缺陷，但分支似乎有利于[35]的训练，因此我们使用多个分支对多个模型进行单独的训练时间集成。为了使大多数成员更浅或更简单，我们使用类似resnet的特性(仅当维度匹配时)和1*1分支，以便构建块的训练时间信息流为y = x + g(x) + f(x)。我们只是简单地堆叠几个这样的块来构建训练时间模型。从与[35]相同的角度来看，模型是由3n个成员和n个这样的块组成的集合。训练后，将其等价转换为y = h(x)，其中h由一个单独的卷积层实现，其参数由训练后的参数通过一系列代数推导而来。

3.3. Re-param for Plain Inference-time Model（重新指定简单推理时间模型的参数）

在本小节中，我们将描述如何将一个经过训练的块转换为一个单独的3*3卷积层进行推理。注意，我们在加法之前的每个分支中都使用了BN(图4)。形式上，我们用
表示具有C1输入通道和C2输出通道的3*3卷积层的核，用
表示1*1分支的核。我们使用
作为1个简单的3*3卷积后BN层的累积均值、标准差、学习缩放因子和偏差，
为1*1卷积后BN层，
为恒等分支。设

,
分别为输入和输出，*为卷积算子。如果
，我们有

否则，我们只是不使用单位分支，因此上述方程只有前两项。这里bn是推理时间bn函数，

我们首先将每一个BN及其前面的卷积层转换成一个带有偏置向量的卷积。让
是从
转换而来的内核和偏误，我们有

验证起来很容易得

上述变换也适用于单位分支，因为单位映射可以看作是一个带有单位矩阵的1*1卷积的核。经过这样的变换，我们将得到一个3*3核，两个1*1核，和三个偏置向量。
然后我们获得最终的偏差通过添加了三个偏差向量,最后3*3内核通过在3*3内核的中心点上添加1*1内核,可以很容易地实现先补零的两个1*1内核成为3*3和添加三个内核,如图4所示。需要注意的是，此类转换的等效性要求3*3层和1*1层具有相同的步幅，而1*1层的填充配置应比3*3层少一个像素。例如，对于一个3*3层填充一个像素的输入，这是最常见的情况，1*1层应该有填充（padding）= 0。

3.4. Architectural Specification

表2显示了RepVGG的规格，包括深度和宽度。RepVGG是VGG-style的，它采用简单的拓扑结构，大量使用3*3卷积，但它不像VGG那样使用最大池化，因为我们希望主体只有一种类型的操作。我们将3*3层排列为5个阶段，一个阶段的第一层以stride = 2的方式下采样。对于图像分类，我们使用全局平均池化，然后使用全连接层作为head。对于其他任务，特定于任务的head可以用于任何层产生的特性。
我们根据三个简单的原则来决定每个阶段的层数。1)第一阶段的操作分辨率较大，耗时较长，因此我们只使用一层以降低延迟。2)最后一个阶段应该有更多的通道，所以我们只使用一层来保存参数。3)我们将大部分图层放入最后的第二阶段(ImageNet输出分辨率为14*14)，紧接着是ResNet及其最新版本[10,27,37]（例如，ResNet-101在其14*14分辨率阶段使用了69层）。我们让这五个阶段分别有1、2、4、14、1层来构建一个名为RepVGG-A的实例。我们还构建了一个更深层的RepVGG-B，在阶段2、3和4中有更多的层。我们使用RepVGG-A与其他轻量级和中量级模型（包括ResNet-18/34/50)竞争，使用RepVGG-B与高性能模型竞争。

我们通过统一缩放[64,128，256，512]的经典宽度设置来确定层宽度(例如VGG和ResNets)。我们使用乘数a来衡量前四个阶段，最后一个阶段使用乘数b，通常设置b>a因为我们希望最后一层为分类或其他下游任务具有更丰富的特性。由于RepVGG在最后阶段只有一层，所以较大的b并不会显著增加延迟和参数的数量。具体来说，阶段2、3、4、5的宽度分别为[64a;128a;256a;512b]。为了避免在大的特征地图上进行大的卷积，我们对stage1进行了缩小，如果a<1，但不要扩大它，使阶段1的宽度是最小的(64;64a)。
为了进一步减少参数和计算，我们可以选择使用密集的3*3卷积层来交换精度和效率。具体来说，我们将第3、5、7、…，第21层RepVGG-A和另外23、25、27层RepVGG-B设为组g。为了简单起见，我们对这类层全局设置g为1、2或4，而不进行分层调优。我们不使用相邻的逐群卷积层，因为这将禁用通道间信息交换，并带来一个副作用[40]:特定通道的输出将仅来自一小部分输入通道。注意，1*1分支应具有与3*3 conv相同的g值。

4. Experiments

在本节中，我们比较了RepVGG与ImageNet上的基线的性能，通过一系列的消融研究和比较，论证了结构重参数化的意义，并验证了RepVGG在语义分割[41]上的泛化性能。

4.1. RepVGG for ImageNet Classification

我们比较了RepVGG与经典和最先进的模型，包括VGG-16[30]、ResNet[10]、ResNeXt[37]、EfficientNet[34]和RegNet[27]在ImageNet- 1K[5]上，其中包含128万高分辨率图像用于训练和50K用于验证，来自1000个类。我们分别以EfficientNet-B0/B3和RegNet-3.2GF/12GF作为中量级模型和重量级模型的代表。我们改变乘数a和b，生成一系列RepVGG模型，以与基线进行比较。如表3所示。

我们首先比较RepVGG和ResNets[10]，这是最常用的基准。与ResNet-18比较，对于RepVGG-A0,设a = 0.75， b = 2.5。对于ResNet-34，我们使用更宽的RepVGG-A1。为了使RepVGG的参数略少于ResNet-50，我们构建了a = 1.5，b = 2.75的RepVGG- a2。为了与更大的模型进行比较，我们构造了深度更大的RepVGGB0/B1/B2/B3，并增加了宽度。对于那些具有交叉分组层的RepVGG模型，我们在模型名后面加上g2/g4作为后缀。
为了训练轻量级和中量级模型，我们只使用简单的数据增强管道，包括随机裁剪和左右反转，遵循正式的PyTorch示例[26]。我们在8个gpu上使用256全局批处理大小，初始学习率为0.1，余弦退火120个时期，标准SGD动量系数为0.9，在卷积层和全连接层的核上重量衰减为10^-4。对于RegNetX-12GF、EfficientNet-B3和RepVGG-B3重量级模型，我们采用了5轮预热、200轮余弦学习率退火、标签平滑[33]和混合算法[39]（在[11]之后)，以及自动增强[4]的数据增强pipline、随机剪切和反转。RepVGG-B2及其g2/g4变种都在这两种设置下进行了训练。我们在1080Ti GPU 4上测试了128批的每个模型的速度，首先输入50批对硬件进行预热，然后记录50批的时间使用情况。为了公平比较，我们在同一个GPU上测试所有模型，所有基线的conv-BN序列也转换为带有偏置的卷积 (Eq. 3)。
如表4和图1所示，RepVGG显示了良好的精度-速度平衡。例如，RepVGG-A0的精度和速度分别比ResNet-18高1.25%和33%，RepVGG-A1比ResNet-34高0.29%/64%，RepVGG-A2比ResNet-50高0.17%/83%。采用分组分层(g2/g4)，进一步加速了RepVGG模型的建立，并合理降低了模型的精度。例如，RepVGG-B1g4比ResNet-101好0.37%/101%，RepVGG-B1g2在相同精度下比ResNet-152快2.66。尽管参数的数量不是我们主要关心的问题，但是上面所有的RepVGG模型都比ResNets更有效地使用参数。与经典的VGG-16相比，RepVGGB2只有58%的参数，运行速度快10%，精度高6.57%。与我们所知的精度最高(74.5%)的基于修剪的良好设计的训练方法RePr[25]训练的VGG模型相比，RepVGG-B2的准确率也高出4.28%。
与最先进的基线相比，RepVGG也表现出良好的性能，从简单性上看，RepVGG-a2比EfficientNet-B0高出1.37%/59%，RepVGG-b1比RegNetX-3.2GF高出0.39%，运行速度略快。
值得注意的是，RepVGG模型在200个epochs时达到了80%以上的精度(表5)，这是我们所知的普通模型第一次赶上最先进的水平。与RegNetX-12GF相比，RepVGGB3的运行速度快了31%，考虑到RepVGG不需要像RegNet[27]那样大量的人力来完善设计空间，而且架构超参数的设置也很随意，这一点令人印象深刻。
作为计算复杂度的两个指标，我们计算2.4节中描述的理论失败和Wino MULs。例如，我们发现，在EfficientNet-B0/B3中，Winograd算法没有加速任何conv。表4显示Wino MULs在GPU上是一个更好的代理，例如，ResNet-152运行速度比VGG-16慢，理论上的失败次数更低，但Wino MULs更高。当然，实际速度应该永远是黄金标准。

4.2. Structural Re-parameterization is the Key（结构重参数化是关键）

在本小节中，我们验证了我们的结构重参数化技术的重要性(表6)。所有的模型都是用上面描述的相同的简单训练设置从零开始训练120个epochs。首先，我们通过移除RepVGG-B0每个区块的身份和/或1*1分支进行消融研究。剔除两个分支后，训练时间模型退化为原始普通模型，准确率仅为72.39%。在1*1和74.79%的情况下，准确率分别提高到73.15%和74.79%。完整的RepVGG-B0模型的精度为75.14%，比原始普通模型的精度高2.75%。

然后我们构建了一系列的变量和基线用于比较RepVGG-B0(表7)。所有的模型都是在120个epochs从零开始训练的。

统一w/o BN层 删除标识分支中的BN。
Post-addition BN 删除三个分支中的BN层，并在添加后附加BN层。即BN的位置由加前变为加后。
+ReLU in branches 将ReLU插入到每个分支中(BN之后，add之前)。由于这样的块不能转换成一个单独的卷积层，因此没有实际用途，我们只是想看看更多的非线性是否会带来更高的性能。
DiracNet [38]采用了在2.2节中介绍的精心设计的卷积核的重参数化。我们使用它的官方PyTorch代码来构建层，以取代原来的3*3卷积。
Trivial Re-param 是对卷积核的一种更简单的重参数化，直接在3*3核中添加一个单位核，可以看作DiracNet的退化版本(^W = I +W[38])。
Asymmetric Conv Block (ACB) [9]可以看作是结构重参数化的另一种形式。我们与ACB进行比较，看看我们的结构重新参数化的改进是否是由于组件级的过度参数化(即，额外的参数使每个3*3卷积变得更强)。
Residual Reorg 构建每个阶段，通过重新组织它在一个类似resnet的方式(2层每个块)。具体来说，合成模型在第一阶段和最后阶段有一个3*3层，在第二阶段、第三阶段、第四阶段有2、3、8个剩余块，并使用像ResNet-18/34这样的捷径。

我们认为结构重参数相对于DiractNet和普通重参数的优势在于前者依赖于通过具有非线性行为(BN)的具体结构的实际数据流，而后者仅使用另一种卷积核的数学表达式。例如，前者的re-param是指使用一个结构的参数来参数化另一个结构，而后者是指先用另一组参数计算参数，然后再使用它们进行其他计算。对于训练时间BN这样的非线性分量，前者不能用后者近似。作为证据，通过去除BN降低了精度，通过添加ReLU提高了精度。换句话说，虽然一个RepVGG块可以等效地转换成一个单独的卷积来进行推理，但推理时间等价并不意味着训练时间等价，因为我们不能构造一个卷积层来具有与RepVGG块相同的训练时间行为。
与ACB的比较表明，RepVGG的成功不应该简单地归因于每个组件的过度参数化的影响，因为ACB使用了更多的参数，但不能像RepVGG那样提高性能。为了进一步确认，我们将ResNet-50的每个3*3卷积的替换为RepVGG块，并从头开始训练120个epochs。精度为76.34%，仅比ResNet- 50基线高0.03%，表明RepVGG-style结构重参数化不是一种通用的过度参数化技术，而是一种训练强大的普通卷积神经网络的关键方法论。

与Residual Reorg（具有相同3*3卷积数量以及用于训练和推理的其他快捷方式的真实残差网络）相比，RepVGG的表现高出0.58％，这并不奇怪，因为RepVGG有更多的分支。例如，分支使得RepVGG的stage4是2*3¹⁵ = 2.8*10⁷模型[35]的集合，而剩余Reorg的数量是2⁸ = 256。

4.3. Semantic Segmentation（语义分割）

我们验证了imagenet预训练的RepVGG在城市景观[3]上的泛化性能，该图像包含5K个精细标注的图像和19个类别。我们使用PSPNet[41]框架，一个基为0.01，幂为0.9，权重衰减为10^-4，全局批处理规模为16的多聚学习速率策略，在8个gpu上运行40个epochs。为了公平比较，我们只将ResNet-50/101骨干更改为RepVGG-B1g2/B2，其他设置保持一致。

在PSPNet-50/101[41]正式实施后，在ResNet-50/101的最后两个阶段使用了扩张的卷积，我们也对RepVGG-B1g2/B2的最后两个阶段的所有3*3卷积层进行了扩张。由于目前3*3扩张卷积的低效实现(尽管FLOPs与3*3常规卷积相同)，这样的修改减缓了推理。为便于比较,我们建立两个PSPNets(在表8中用fast表示)膨胀只有在最后5层(例如,最后4层stage4和唯一的stage5层),所以PSPNets运行略高于ResNet-50/101骨干。结果表明，RepVGG骨干的平均IoU比ResNet-50和ResNet-101分别高出1.71%和1.01%。令人印象深刻的是，RepVGG-B1g2-fast在mIoU中的性能比ResNet- 101骨干高出0.37，运行速度快62%。有趣的是，与RepVGG-B1g2-fast模型相比，扩大的卷积层似乎对更大的模型更有效，但扩大后的RepVGG-B2的mIoU提高了1.05%，并有合理的放缓。

4.4. Limitations（局限性）

RepVGG模型是快速、简单和实用的卷积网络，为GPU和专用硬件上的最大速度而设计，较少考虑参数数量或理论故障。尽管RepVGG模型比ResNets更具参数效率，但在低功耗设备上，它们可能不如MobileNets[14,29,13]和ShuffleNets[40,23]等移动管理模型受欢迎。

5. Conclusion（总结）

我们提出了RepVGG，一个由3*3卷积和ReLU组成的简单架构，特别适合于GPU和专业推理芯片。通过我们的结构重参数化方法，这种简单的ConvNet在ImageNet上达到了80%以上的top-1精度，与最先进的复杂模型相比，在速度-精度方面表现出了良好的权衡。

Gemini vs DeepSeek：Transformer 架构下的技术路线差异与企业级选择 charles666666 transformer 架构深度学习语言模型产品经理人工智能
一、引言：从商业价值切入Gemini和DeepSeek都基于Transformer架构，但在技术路线和应用场景上各有侧重。本文将解密同源Transformer下的技术分野，帮助企业做出更明智的大模型选型决策。二、Transformer核心机制精要Transformer架构是现代大语言模型的基础，其核心机制包括自注意力机制和前馈神经网络。自注意力机制使模型能够捕捉序列中元素的全局依赖关系，但也是GP
脑电分析入门指南：信号处理、特征提取与机器学习 Ao000000 信号处理机器学习人工智能
脑电分析入门指南一、为什么要研究脑电1.课题目标（解决什么问题）2.输入与输出二、脑电分析的整体流程三、每一步详解1.数据采集2.预处理3.特征提取4.特征选择/降维5.分类与识别四、研究过程中遇到的挑战与解决方法五、学习感受一、为什么要研究脑电1.课题目标（解决什么问题）本课题旨在通过对脑电（EEG）的采集与分析，提取有用的神经信息，实现对某类脑状或行为的识别/预测/评估。例如：情绪识别、疾病诊
【动手学深度学习】4.10 实战Kaggle比赛：预测房价 XiaoJ1234567 《动手学深度学习》深度学习人工智能
目录4.10实战Kaggle比赛：预测房价1）数据预处理2）模型定义与训练3）模型评估与预测4）模型训练与预测提交5）示例超参数（可调）4.10实战Kaggle比赛：预测房价数据来源：Kaggle房价预测比赛.1）数据预处理读取数据importpandasaspdtrain_data=pd.read_csv('../data/kaggle_house_pred_train.csv')test_da
【机器学习-08】参数调优宝典：网格搜索与贝叶斯搜索等攻略云天徽上机器学习机器学习人工智能
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
NLP-D7-李宏毅机器学习---X-Attention&&GAN&BERT&GPT 甄小胖机器学习自然语言处理机器学习 bert
—0521今天4:30就起床了！真的是迫不及待想看新的课程！！！昨天做人脸识别系统的demo查资料的时候，发现一个北理的大四做cv的同学，差距好大！！！我也要努力呀！！不是比较，只是别人可以做到这个程度，我也一定可以！！！要向他学习！！！开始看课程啦！-----0753看完了各种attention，由于attention自己计算的限制，当N很大的时候会产生计算速度问题，从各种不同角度（人工知识输入
PyTorch 在 Python 自然语言处理中的运用 Python编程之道 Python编程之道 python pytorch 自然语言处理 ai
PyTorch在Python自然语言处理中的运用关键词：PyTorch，Python，自然语言处理，深度学习，文本分类，情感分析摘要：本文全面探讨了PyTorch在Python自然语言处理（NLP）领域的运用。首先介绍了相关背景知识，包括目的范围、预期读者等内容。接着详细阐述了核心概念，如词嵌入、循环神经网络等，并给出了相应的原理示意图和流程图。深入讲解了核心算法原理，结合Python代码进行详细
板凳-------Mysql cookbook学习（十一--------4)
唐宇迪机器学习实战课程笔记https://blog.csdn.net/weixin_54338498/article/details/128818007?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7ECtr-1-12881
AAAI—24—Main—paper（关于Multi—Modal的全部文章摘要）
我们生活在一个由多种模态（Multimodal）信息构成的世界，包括视觉信息、听觉信息、文本信息、嗅觉信息等等，当研究的问题或者数据集包含多种这样的模态信息时我们称之为多模态学习多模态机器学习旨在处理学习（视觉，听觉，语言等）不同模态融合交织的信息。下游任务（1）视觉问答1.视觉问答(visualquestionanswering,VQA).给予视觉输入(图像或视频),VQA代表了正确提供一个问题
VIT视觉妄想成为master opencv 目标检测机器学习数据挖掘语音识别人工智能计算机视觉
VisionTransformer视觉和语言(Vision-Language)NLPrompt:Noise-LabelPromptLearningforVision-LanguageModelsPaper:https://arxiv.org/abs/2412.01256Code:GitHub-qunovo/NLPromptPhysVLM:EnablingVisualLanguageModelsto
神经网络初步学习3——数据与损失 X Y O 神经网络学习人工智能
一、传统机器学习与神经网络前言：该部分需要一定的机器学习与数学基础（很浅的基础），如果有不理解的地方可以自行查阅。（1）区别这里不妨以图像识别为例子：（1）在传统的机器学习视角中：我们需要人工手动去设置并提取我们的特征量，例如常见的SIFT、SURF和HOG等，随后需要我们选择合适的分类器（例如：SVM、KNN等分类器）,接着把我们的参数训练出来。（2）而在神经网络的视角中：我们只需要把图片喂给它
异物检测的计算机视觉算法技术路线思绪漂移计算机视觉算法人工智能
异物检测的计算机视觉算法技术路线在现代智能监测系统中，异物检测有着其必要性和运维重要性，通过计算机视觉算法，可以实时识别各种异常物体，为设备安全运行提供有力保障。本文将介绍异物检测的主要技术路线。一、分类识别适应场景分类识别技术主要适用于已知目标类别的异物检测场景。在运维环境中，这类场景包括：固定区域内的障碍物监测（如轨道区域的石块、工具、动物等）关键部件的异物附着检测（如固定装置上的杂物）安全通
量化价值投资中的深度学习技术：TensorFlow实战
量化价值投资中的深度学习技术：TensorFlow实战关键词：量化价值投资,深度学习,TensorFlow,股票预测,因子模型,LSTM神经网络,量化策略摘要：本文将带你走进"量化价值投资"与"深度学习"的交叉地带，用小学生都能听懂的语言解释复杂概念，再通过手把手的TensorFlow实战案例，教你如何用AI技术挖掘股票市场中的价值宝藏。我们会从传统价值投资的痛点出发，揭示深度学习如何像"超级分析
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
ResNet：深度卷积神经网络的里程碑心想事“程” 小知识点 cnn 人工智能神经网络
一、引言在深度学习的发展历程中，深度卷积神经网络（CNN）不断演进，旨在提升对图像等数据的特征提取与分类能力。然而，随着网络层数的增加，传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题，训练变得愈发困难。2015年，由微软研究院提出的ResNet（ResidualNetworks，残差网络）横空出世，它以独特的残差学习思想，成功攻克了这些难题，在ImageNet竞赛中大放异彩，开创了深度神经网
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
卷积神经网络架构的演进：从AlexNet到EfficientNet t0_54manong 大数据与人工智能 cnn 架构人工智能个人开发
在过去的8.5年里，深度学习取得了飞速的进步。回溯到2012年，AlexNet在ImageNet上的Top-1准确率仅为63.3%，而如今，借助EfficientNet架构和师生训练法，我们已经能达到超过90%的准确率。本文将聚焦于卷积神经网络（CNN）架构的演变，深入探究其背后的基本原理。一些关键术语在深入了解各种架构之前，我们需要明确几个关键术语。更宽的网络意味着卷积层中有更多的特征图（滤波器
【AI大模型】PyTorch Lightning 简化工具我爱一条柴ya 学习AI记录人工智能 pytorch python ai AI编程
PyTorchLightning是一个轻量级的PyTorch封装库，它通过抽象训练循环的工程细节，让研究人员可以专注于模型设计和实验。以下是PyTorchLightning的核心概念和实战指南。核心优势基础使用：三步搭建训练流程1.定义LightningModuleimporttorchimporttorch.nnasnnimportpytorch_lightningasplfromtorchme
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
一文搞懂 Cursor 内部工作原理~ zz_jesse
介绍了Cursor，一个结合了AI技术的代码编辑器，它通过深度学习和语义索引的方式，提升了开发者的工作效率。Cursor通过与VSCode相似的界面和功能，以及自己的AI特性，实现了代码的智能化编辑和错误检查。译文从这开始～～你可能已经看到新闻：OpenAI正以高达30亿美元的价格收购Windsurf！与此同时，Cursor的母公司Anysphere也正在以90亿美元估值融资9亿美元！这对于代码生
开源人工神经网络库（OpenANN） deepdata_cn 人工智能神经网络
OpenANN（OpenANN，OpenArtificialNeuralNetworkLibrary）是一个开源的人工神经网络库，基于C++编写，依赖Eigen3库进行高效的矩阵运算，使用CMake进行项目构建，支持多种神经网络架构，包括前馈神经网络、卷积神经网络和循环神经网络等，适用于图像识别、自然语言处理、时间序列预测等多种场景。提供数据预处理、模型保存和加载、超参数优化等功能。支持GPU加速
如何让AI真正理解你的意图（自适应Prompt实战指南） nine是个工程师大语言模型人工智能 prompt
目前的LLM模型，在理解用户意图方面，正在使用自适应Prompt技术，来提升模型的理解能力。目前使用deepseek推理模型能明显看到自适应的一个过程。前言：为什么你的AI总是"答非所问"？相信很多人都遇到过这样的情况：你问：“帮我写一个Python爬虫”AI答：给你一堆理论知识和完整教程（你只想要简单代码）你问：“推荐一部电影”AI答：推荐了《教父》（你想看轻松喜剧）你问：“解释一下机器学习”A
AI人工智能与机器学习的大数据融合应用 AI智能探索者人工智能机器学习大数据 ai
AI人工智能与机器学习的大数据融合应用关键词：AI人工智能、机器学习、大数据、融合应用、数据挖掘摘要：本文深入探讨了AI人工智能与机器学习在大数据融合应用方面的相关内容。首先介绍了研究的背景、目的、预期读者和文档结构，对核心术语进行了清晰定义。接着阐述了AI、机器学习和大数据的核心概念及相互联系，给出了形象的文本示意图和Mermaid流程图。详细讲解了核心算法原理，并通过Python源代码进行说明
目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究（续）林聪木目标检测 YOLO 深度学习
目录基于双蓝图卷积的轻量化自动驾驶目标检测算法5.1引言5.2DarkNet53网络冗余性分析5.3双蓝图卷积网络5.4实验结果及分析基于深度学习的自动驾驶目标检测算法研究与应用传统的目标检测算法目标检测基线算法性能对比与选择相关理论和算法基础2.1引言2.2人工神经网络2.3FCOS目标检测算法2.4复杂交通场景下的目标检测难点与FCOS改进方案基于FCOS的目标检测算法改进3.1引言3.2Re
AI人工智能遇上TensorFlow：技术融合新趋势 AI大模型应用之禅人工智能 tensorflow python ai
AI人工智能遇上TensorFlow：技术融合新趋势关键词：人工智能、TensorFlow、深度学习、神经网络、机器学习、技术融合、AI开发摘要：本文深入探讨了人工智能技术与TensorFlow框架的融合发展趋势。我们将从基础概念出发，详细分析TensorFlow在AI领域的核心优势，包括其架构设计、算法实现和实际应用。文章包含丰富的技术细节，如神经网络原理、TensorFlow核心算法实现、数学
OpenCvSharp 实现环形文字识别OCR实例（C#） XisVisual_Basic ocr c#计算机视觉 C#
近年来，随着计算机视觉和图像处理的不断发展，光学字符识别（OCR）技术也变得愈发成熟。OCR技术可以将图像中的文字转换为可编辑和可搜索的文本，为人们带来了极大的便利。在本篇文章中，我们将介绍如何使用OpenCvSharp库来实现环形文字的识别。首先，在使用OpenCvSharp之前，我们需要确保已经在项目中引用了该库，并添加相应的命名空间。usingOpenCvSharp;接下来，我们需要准备一张
Python|OpenCV-实现识别弧形文字(17) 写python的鑫哥 OpenCV入门与进阶 python opencv 人工智能计算机视觉弧形文字环形文字识别
前言本文是该专栏的第19篇，后面将持续分享OpenCV计算机视觉的干货知识，记得关注。我们知道，OCR可以识别文字方面的需求，但是如果遇到那些目标文字是“弧形文字”，需要怎么去识别呢？遇到想要识别“弧形文字”的需求，这个时候你可以借助于Opencv+OCR技术来实现。而本文，笔者将针对上述问题需求，利用OpenCV结合OCR来实现“弧形文字”的识别。废话不多说，具体的细节部分以及详细的解决方案，跟
深度学习核心知识简介和模型调参研术工坊深度学习知识和技巧深度学习人工智能 python
深度学习模型调优就像调制一道复杂的菜肴，需要掌握多种"调料"的用法。本文将为您详解这些关键"调料"，帮助您烹饪出高性能的模型。###核心参数及其影响####1️⃣Loss（损失函数）**基本介绍**：衡量模型预测与真实值差距的指标，是模型优化的指南针。**生活类比**：想象你在教小孩认识动物：-**完美情况**：小孩看到猫说"猫"，看到狗说"狗"→Loss=0-**有错误**：小孩看到猫说"狗"→
【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线
一、什么是计算机视觉？计算机视觉，其实就是教机器怎么像我们人一样，用摄像头看看周围的世界，然后理解它。比如说，它能认出这是个苹果，或者那边有辆车。除此之外，还能把拍到的照片或者视频转换成有用的信息，帮我们做决定。整个过程就是为了让机器能看懂图像，然后根据这些图像来做出聪明的选择。二、计算机视觉实现起来难吗？人类依赖视觉，找辆汽车轻而易举，毕竟汽车那么大，一眼就能看出来，所以常误以为计算机视觉简单，
2025年跑深度学习电脑配置-深度学习显卡推荐 OpenCV图像识别人工智能深度学习智能电视人工智能
2025年跑深度学习任务，电脑配置需从处理器、内存、显卡、存储、散热与电源、扩展性、网络连接等多方面综合考量，以下是具体分析：处理器（CPU）多核高性能：深度学习涉及大量并行计算任务，需要处理器具备强大的多核处理能力。英特尔至强Scalable处理器（SapphireRapids或后续架构）和AMDEPYC处理器（Genoa或后续架构）是不错的选择。英特尔至强Scalable处理器提供卓越的单核性
计算机视觉：Transformer的轻量化与加速策略 xcLeigh 计算机视觉CV 计算机视觉 transformer 人工智能 AI 策略
计算机视觉：Transformer的轻量化与加速策略一、前言二、Transformer基础概念回顾2.1Transformer架构概述2.2自注意力机制原理三、Transformer轻量化策略3.1模型结构优化3.1.1减少层数和头数3.1.2优化Patch大小3.2参数共享与剪枝3.2.1参数共享3.2.2剪枝3.3知识蒸馏四、Transformer加速策略4.1模型量化4.2.2TPU加速4.
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio