云雨无欢丶

（论文翻译）THE LOTTERY TICKET HYPOTHESIS: FINDING SPARSE, TRAINABLE NEURAL NETWORKS《彩票假说：寻找稀疏、可训练的神经网络》

公式不清楚的地方请对照英文原文进行查看：原论文链接

ABSTRACT

神经网络修剪技术可以将训练网络的参数计数减少90%以上，降低存储需求并提高推理的计算性能，而不影响准确性。然而，当代的经验是，通过修剪产生的稀疏架构从一开始就难以训练，这将类似地提高训练性能。我们发现，一个标准的修剪技术自然地发现子网络，其初始化使他们能够有效地训练。基于这些结果，我们阐明了彩票假说：密集的、随机初始化的、前馈网络包含子网络（中奖票），这些子网络在孤立地训练时，在类似数量的迭代中达到与原始网络相当的测试精度。我们发现的中奖彩票赢得了初始化彩票：它们的连接具有使训练特别有效的初始权重。我们提出了一个算法来识别中奖彩票和一系列的实验，支持彩票的假设和这些偶然的初始化的重要性。我们不断发现中奖彩票的大小小于MNIST和CIFAR 10的几个全连接和卷积前馈架构的10-20%。超过这个大小，我们发现的中奖彩票比原始网络学习得更快，并达到更高的测试精度。

1 INTRODUCTION 引言

用于从神经网络中消除不必要的权重的技术（修剪）（LeCun等人，Hassibi & Stork，1993; Han等人，2015; Li等人，2016）可以减少参数计数超过90%，而不会影响精度。这样做减小了尺寸（Han等人，2015;欣顿等人，2015）或能量消耗（Yang等人，2017; Molchanov等人，2016; Luo等人，2017），使推理更有效。然而，如果网络的大小可以减小，为什么我们不训练这个更小的架构，而不是为了使训练更有效呢？当代的经验是，通过修剪发现的架构从一开始就很难训练，达到的准确性低于原始网络。（1“从头开始训练修剪模型比重新训练修剪模型的性能更差，这可能表明训练容量较小的网络的难度。”(Li例如，2016年）“在重新训练期间，最好是保留初始训练阶段的权重，用于幸存的修剪连接，而不是重新初始化修剪的层…梯度下降能够在网络初始训练时找到一个好的解决方案，但在重新初始化一些层并重新训练它们之后就不能了。(Han例如，2015年））

考虑一个例子。在图1中，我们从MNIST的全连接网络和CIFAR10的卷积网络中随机采样和训练子网络。随机抽样模型的非结构化修剪LeCun等人使用的效果。（1990）和Han et al.（2015年）。在不同的稀疏度水平上，虚线跟踪最小验证损失（作为网络学习速度的代理，我们使用提前停止标准结束训练的迭代。我们在本文中采用的特定早期停止标准是训练期间最小验证损失的迭代。有关此选项的更多详细信息，请参见附录C。）的迭代和该迭代的测试准确度。网络越稀疏，学习速度越慢，最终的测试精度。

图1：在以各种规模开始训练时，MNIST的Lenet架构和CIFAR 10的Conv-2、Conv-4和Conv-6架构（参见图2）的迭代（左）和该迭代（右）的测试精度。虚线是随机采样的稀疏网络（十次试验的平均值）。实线表示中奖票（平均五次试训）。

在本文中，我们证明了始终存在较小的子网络，这些子网络从一开始就进行训练，并且在达到类似测试精度的同时，学习速度至少与较大的子网络一样快。图1中的实线显示了我们发现的网络。基于这些结果，我们陈述彩票假说。

彩票假说 一个随机初始化的密集神经网络包含一个子网络，该子网络被初始化，使得在孤立训练时，它可以在训练最多相同次数的迭代后匹配原始网络的测试精度。

更正式地，考虑密集前馈神经网络f（x;初始参数θ = θ0 Dθ。当在训练集上使用随机梯度下降（SGD）进行优化时，f在迭代j处达到最小验证损失l，测试精度为a。此外，考虑训练f（x; m θ），其中掩码m ∈ {0，1}| θ角|其初始化为m θ0。当在相同的训练集上使用SGD进行优化时（m固定），f在迭代j时达到最小验证损失l，测试精度为a。彩票假说预测，其中j ≤ j（相称训练时间），a ≥ a（相称准确度），且m 0| θ角|（参数较少）。

我们发现，一个标准的修剪技术自动从全连接和卷积前馈网络中发现这样的可训练子网络。我们将这些可训练的子网络f（x; m θ0），因为我们找到的那些已经赢得了具有权重和能够学习的连接的组合的初始化彩票。当它们的参数被随机地重新初始化（f（x; m θ 0），其中θ 0 Dθ），我们的中奖票不再与原始网络的性能相匹配，这证明了这些较小的网络除非进行适当的初始化，否则无法有效地训练。

识别中奖彩票 我们通过训练网络并修剪其最小量级的权重来识别中奖彩票。剩下的未修剪的连接构成了中奖彩票的体系结构。在我们的工作中，每个未修剪的连接的值在训练之前从原始网络重置为初始值。这构成了我们的中心实验：

随机初始化一个神经网络f（x; θ0）（其中θ0 Dθ）。
训练网络进行j次迭代，得到参数θj。
修剪θj中的参数的p%，创建掩码m。
将其余参数重置为它们在θ0中的值，创建中奖票f（x; m θ0）。

如上所述，这种修剪方法是一次性的：网络被训练一次，修剪p%的权重，并且重置幸存的权重。然而，在本文中，我们关注的是迭代修剪，即在n轮中重复训练、修剪和重置网络;每一轮修剪在前一轮中幸存的权重的p ~ 1 n %。我们的研究结果表明，迭代修剪找到的中奖票，匹配的准确性，在较小的尺寸比一杆修剪的原始网络。

结果。 我们在MNIST的全连接架构和CIFAR10的卷积架构中，通过几种优化策略（SGD，动量和Adam），使用dropout，weight decay，batchnorm和residual connections等技术确定了获胜门票。我们使用非结构化修剪技术，因此这些中奖彩票是稀疏的。在更深层的网络中，我们基于修剪的中奖彩票搜索策略对学习率很敏感：它需要预热来以较高的学习率找到中奖票。我们发现的中奖彩票是原来大小的网络（规模较小）的10-20%（或更少）。在这个规模下，它们在最多相同数量的迭代（相称的训练时间）中达到或超过原始网络的测试准确度（相称的准确度）。当随机重新初始化时，中奖彩票的表现要差得多，这意味着结构本身不能解释中奖彩票的成功。

图2：本文中测试的架构。卷积是3x 3。Lenet来自LeCun et al.（1998）。Conv-2/4/6是VGG的变体（Simonyan & Zisserman，2014）。Resnet-18来自He et al.（2016年）。CIFAR 10的VGG-19改编自Liu et al.（2019年）。初始化是Gaussian Glorot（Glorot & Bengio，2010）。括号表示层周围的剩余连接。

彩票猜想回到我们的激励问题 我们将我们的假设扩展到一个未经测试的猜想，即SGD寻找并训练一个初始化良好的权重子集。随机初始化的密集网络比修剪产生的稀疏网络更容易训练，因为有更多可能的子网络，训练可能会从中恢复中奖彩票。

Contributions.

我们证明，修剪揭示可训练的子网络，达到测试精度相媲美的原始网络，他们在一个相当数量的迭代。
我们发现，修剪找到了学习速度比原始网络更快的中奖彩票，同时达到了更高的测试准确率和更好的泛化能力。
我们提出彩票假说作为神经网络组成的新视角来解释这些发现。

暗示。 本文对彩票假说进行了实证研究。现在我们已经证明了中奖彩票的存在，我们希望利用这一知识：

提高培训绩效。由于中奖彩票可以从一开始就孤立地训练，因此希望我们可以设计出搜索中奖彩票并尽早修剪的训练方案。

设计更好的网络。获胜的门票揭示了稀疏架构和初始化的组合，特别擅长学习。我们可以从中奖中获得灵感，设计出具有相同属性的新架构和初始化方案，这些都有利于学习。我们甚至可以将为一个任务发现的中奖彩票转移到许多其他任务。

提高我们对神经网络的理论理解。我们可以研究为什么随机初始化的前馈网络似乎包含中奖票和对优化的理论研究的潜在影响（Du等人，2019）和泛化（Zhou等人，2018; Arora等人，2018年）。

2 WINNING TICKETS IN FULLY-CONNECTED NETWORKS在全连接网络中赢取门票

在本节中，我们将评估彩票假设应用于在MNIST上训练的全连接网络。我们使用Lenet-300-100架构（LeCun等人，1998），如图2所示。我们遵循第1节的大纲：在随机初始化和训练网络之后，我们修剪网络并将剩余的连接重置为它们的原始初始化。我们使用一个简单的逐层剪枝启发式算法：移除每一层内具有最低量值的权重的百分比（如在Han等人中）。（2015））。到输出的连接以网络其余部分的速率的一半被修剪。我们在附录G中探索了其他超参数，包括学习率，优化策略（SGD，动量），初始化方案和网络大小。

图3：随着训练的进行，在Lenet上测试准确性（迭代修剪）。每条曲线是五次试验的平均值。标签是Pm-修剪后网络中剩余的权重的分数。误差线是任何试验的最小值和最大值。

注意 Pm = m 0| θ角|是掩模m的稀疏性，例如，当修剪75%的权重时，Pm = 25%。

迭代修剪。我们发现的中奖彩票比原始网络学习得更快。图3绘制了当训练迭代修剪到各种程度的获胜票据时的平均测试准确度。误差线是五次运行的最小值和最大值。对于第一轮修剪，网络学习得更快，并且修剪得越多，测试精度就越高（图3中的左图）。包括来自原始网络的权重的51.3%的中奖票（即，Pm = 51.3%）比原始网络更快地达到更高的测试精度，但比Pm = 21.1%时慢。当Pm <21.1%时，学习减慢（中间图）。当Pm = 3.6%时，获胜票回归到原始网络的性能。类似的模式在本文中反复出现。

图4a总结了在每次迭代迭代修剪20%时所有修剪级别的这种行为（蓝色）。左边是每个网络达到最小验证损失的迭代（即，当早期停止标准将停止训练时）与修剪后剩余权重的百分比的关系;中间是该迭代的测试精度。我们使用满足早期停止标准的迭代作为网络学习速度的代理。

当Pm从100%下降到21%时，获胜的票学习得更快，此时提前停止比原始网络早38%。进一步的修剪导致学习变慢，返回到Pm = 3.6%时原始网络的早期停止性能。检验精度随剪枝的增加而提高，当Pm = 13.5%时，检验精度提高了0.3个百分点以上;在这一点之后，精度降低，返回到原始网络的水平，当Pm = 3.6%时。

在早期停止时，训练准确性（图4a，右）以类似于测试准确性的模式随着修剪而增加，似乎意味着中奖彩票更有效地优化，但不会更好地推广。然而，在迭代50，000次时（图4b），迭代修剪的获胜门票仍然可以看到高达0.35个百分点的测试准确度提高，尽管几乎所有网络的训练准确度都达到了100%（附录D，图12）。这意味着训练准确度和测试准确度之间的差距对于赢得门票来说更小，这表明泛化能力有所提高。

随机重新初始化。为了测量获胜票据的初始化的重要性，我们保留获胜票据的结构（即，掩模m），但随机采样新的初始化θ 0 Dθ。我们随机将每张中奖彩票重新初始化三次，在图4中，每个点总共初始化15次。我们发现，初始化是至关重要的一张中奖票的功效。图3中的右图显示了迭代修剪的实验。除了原始网络和中奖彩票在Pm = 51%和21%时进行随机重新初始化实验。当中奖彩票被修剪时，它们学习得更快，当随机重新初始化时，它们学习得越来越慢。

该实验的更广泛结果是图4a中的橙子线。与中奖不同的是，重新初始化的网络比原始网络学习得更慢，并且在很少修剪之后就失去了测试准确性。当Pm = 21.1%时，平均重新初始化的迭代中奖票据的测试准确度从原始准确度下降，相比之下，中奖票据的测试准确度为2.9%。当Pm = 21%时，获胜票据达到最小验证损失的速度比重新初始化时快2.51倍，并且准确率高半个百分点。当Pm ≥ 5%时，所有网络的训练准确率均达到100%;因此，图4b示出了获胜票的推广比随机重新初始化时好得多。这个实验支持彩票假说对初始化的强调：原始初始化经受住修剪并从中受益，而随机重新初始化的性能立即受到损害并稳定地降低。

图4：在一次和迭代修剪下Lenet的早期停止迭代和准确性。五次试验的平均值;最小值和最大值的误差条。在迭代50，000次时，对于迭代获胜票，Pm ≥ 2%的训练准确率≈ 100%（参见附录D，图12）。

一次性修剪。虽然迭代修剪提取较小的中奖彩票，但重复训练意味着找到它们的成本很高。一次性修剪使得可以在没有这种重复训练的情况下识别中奖彩票。图4c示出了单次修剪（绿色）和随机重新初始化（红色）的结果;一次修剪确实能找到中奖票。当67.5% ≥ Pm ≥ 17.6%时，平均中奖票比原始网络更早达到最小验证精度。当95.0% ≥ Pm ≥ 5.17%时，测试精度高于原网络。然而，迭代修剪的中奖票学习更快，并在较小的网络规模下达到更高的测试精度。图4c中的绿色线和红线再现在图4a的对数轴上，使得该性能差距清楚。由于我们的目标是确定最小的可能中奖彩票，我们专注于迭代修剪在整个论文的其余部分。

3 WINNING TICKETS IN CONVOLUTIONAL NETWORKS卷积网络中的中奖票
在这里，我们将彩票假设应用于CIFAR 10上的卷积网络，增加了学习问题的复杂性和网络的大小。我们考虑图2中的Conv-2，Conv-4和Conv-6架构，它们是VGG（Simonyan & Zisserman，2014）家族的缩小变体。该网络具有两个、四个或六个卷积层，然后是两个全连接层;最大池化发生在每两个卷积层之后。这些网络覆盖了从几乎完全连接到传统卷积网络的范围，在Conv-2中卷积层中的参数不到1%，在Conv-6.3中接近三分之二。

寻找中奖彩票 图5中的实线（顶部）示出了在来自图2的每层修剪率下对Conv-2（蓝色）、Conv-4（橙子）和Conv-6（绿色）的迭代彩票实验。第2节中Lenet的模式重复：当网络被修剪时，与原始网络相比，它学习得更快，并且测试精度提高。在这种情况下，结果更加明显。对于Conv-2（Pm = 8.8%），中奖彩票证达到最小验证损失的速度最多为3.5倍，对于Conv-4（Pm = 9.2%）为3.5倍，对于Conv-6（Pm = 15.1%）为2.5倍。Conv-2（Pm = 4.6%）、Conv-4（Pm = 11.1%）和Conv-6（Pm = 26.4%）的测试准确度最多提高3.4个百分点。当Pm > 2%时，所有三个网络都保持高于其原始平均测试准确度。

图5：当迭代修剪和随机重新初始化时，Conv-2/4/6架构的早期停止迭代以及测试和训练精度。每条实线是五次试验的平均值;每条虚线是十五次重新初始化（每次试验三次）的平均值。右下图绘制了在与原始网络的最后一次训练迭代相对应的迭代处的中奖票的测试准确度（Conv-2为20，000，Conv-4为25，000，Conv-6为30，000）;在此迭代中，对于获胜彩票，Pm ≥ 2%的训练准确率≈ 100%（参见附录D）。

与第2节一样，早期停止迭代的训练精度随着测试精度的提高而提高。然而，在Conv-2的迭代20，000次，Conv-4的迭代25，000次，Conv-6的迭代30，000次（迭代对应于原始网络的最终训练迭代），当Pm ≥ 2%时，所有网络的训练准确度达到100%（附录D，图13），并且获胜门票仍然保持较高的测试准确度（图5右下角）。这意味着测试和训练准确率之间的差距对于赢得门票来说更小，表明它们的泛化能力更好。

随机重新初始化。我们重复第2节中的随机重新初始化实验，如图5中的虚线所示。这些网络在继续修剪时再次花费越来越长的时间来学习。正如Lenet在MNIST上的情况一样（第2节），随机重新初始化实验的测试精度下降得更快。然而，不像Lenet，测试精度在早期停止时间最初保持稳定，甚至提高了Conv-2和Conv-4，这表明，在中等水平的修剪结构的中奖门票可能会导致更好的准确性。

丢弃。Dropout（Srivastava等人，2014;欣顿等人，2012）通过随机禁用一部分单元（即，随机采样子网络）。Baldi & Sadowski（2013）将dropout描述为同时训练所有子网络的集合。由于彩票假说表明，这些子网络中的一个包含中奖彩票，因此很自然地会问，dropout和我们寻找中奖彩票的策略是否相互作用。

图6示出了训练Conv-2、Conv-4和Conv-6的结果，其中丢失率为0.5。虚线是没有dropout的网络性能（图5中的实线）。4我们在dropout训练时继续发现中奖彩票。Dropout提高了初始测试准确率（Conv-2、Conv-4和Conv-6的平均准确率分别为2.1、3.0和2.4个百分点），迭代修剪进一步提高了准确率（平均分别增加了2.3、4.6和4.7个百分点）。学习变得更快，与以前一样，迭代修剪，但在Conv-2的情况下不太明显。
图6：Conv-2/4/6在迭代修剪和使用dropout进行训练时的早停止迭代和测试精度。虚线是没有丢失训练的相同网络（图5中的实线）。Conv-2的学习率为0.0003，Conv-4和Conv-6的学习率为0.0002。

图7：迭代修剪时VGG-19的测试精度（在30 K、60 K和112 K迭代下）。

这些改进表明，我们的迭代修剪策略以互补的方式与dropout相互作用。Srivastava等人（2014）观察到dropout在最终网络中诱导稀疏激活;丢失引起的稀疏性可能使网络准备好被修剪。如果是这样，则可以使用以权重为目标的丢弃技术（Wan et al.2013）或学习每权重丢弃概率（Molchanov等人，2017; Louizos等人，2018）可以使中奖门票更容易找到。

4 VGG AND RESNET FOR CIFAR10 CIFAR10的VGG和RESNET

在这里，我们研究的彩票假设网络唤起的架构和技术在实践中使用。具体来说，我们考虑VGG风格的深度卷积网络（CIFAR 10上的VGG-19-Simonyan & Zisserman（2014））和残差网络（CIFAR 10上的Resnet-18-He et al.（2016））。5这些网络使用batchnorm，权重衰减，降低学习率计划和增强训练数据进行训练。我们继续为所有这些架构找到中奖彩票;然而，我们用于找到它们的方法，迭代修剪，对所使用的特定学习率敏感。在这些实验中，我们没有测量提前停止时间（对于这些较大的网络，这与学习率计划有关），而是在训练过程中的几个时刻绘制准确度，以说明准确度提高的相对速度。

全局修剪。在Lenet和Conv-2/4/6上，我们以相同的速率分别修剪每个层。对于Resnet-18和VGG-19，我们稍微修改了这个策略：我们在全局范围内修剪这些更深的网络，在所有卷积层中共同删除最低幅度的权重。在附录I.1中，我们发现全局修剪为Resnet-18和VGG-19识别出较小的中奖彩票。我们对这种行为的推测解释如下：对于这些更深层次的网络，某些层的参数远远多于其他层。例如，VGG-19的前两个卷积层有1728和36864个参数，而最后一个有235万个参数。当所有层都以相同的速率修剪时，这些较小的层成为瓶颈，阻止我们识别最小的可能中奖彩票。全局修剪可以避免这个陷阱。

VGG-19 我们研究了由Liu等人改编为CIFAR 10的变体VGG-19。（2019）;我们使用相同的训练机制和超参数：160个历元（112，480次迭代），SGD动量（0.9），并在80和120个时期将学习率降低10倍。这个网络有两千万个参数。图7显示了在两个初始学习速率下对VGG-19进行迭代修剪和随机重新初始化的结果：0.1（用于Liu et al.（2019））和0.01。在较高的学习率，迭代修剪没有找到中奖的门票，性能并不比修剪网络随机重新初始化。然而，在较低的学习率下，通常的模式重新出现，当Pm ≥ 3.5%时，子网络保持在原始准确率的1个百分点以内。(They没有中奖的彩票，因为它们与原始的准确性不匹配。）当随机重新初始化时，子网络失去准确性，因为它们以与本文中其他实验相同的方式被修剪。尽管这些子网络在训练早期比未修剪的网络学习得更快（图7左），但由于初始学习率较低，这种准确性优势在训练后期会受到侵蚀。然而，这些子网络仍然比重新初始化时学习得更快。

为了弥补较低学习率的彩票行为与较高学习率的准确性优势之间的差距，我们探索了从0到初始学习率的线性学习率预热在k次迭代中的效果。在学习率为0.1的情况下，使用预热（k = 10000，绿色线）训练VGG-19将未修剪网络的测试准确度提高了约一个百分点。预热使得可以找到中奖彩票，当Pm ≥ 1.5%时超过该初始精度。

Resnet-18. Resnet-18（He等人，2016）是一个20层卷积网络，具有为CIFAR 10设计的剩余连接。它有271，000个参数。我们使用SGD和动量（0.9）训练网络30，000次迭代，在20，000和25，000次迭代时将学习率降低10倍。图8示出了在学习速率0.1下的迭代修剪和随机重新初始化的结果（在He等人中使用）。（2016））和0.01。这些结果在很大程度上反映了VGG的结果：迭代修剪在较低的学习速率而不是较高的学习速率找到获胜的票。在较低学习率下的最佳中奖票的准确率（当41.7% ≥ Pm ≥ 21.9%时为89.5%）福尔斯原始网络在较高学习率下的准确率（90.5%）。在较低的学习速率下，获胜的彩票最初学习得更快（图8的左图），但在训练后期以较高的学习速率福尔斯于未修剪的网络（右图）。用预热训练的获胜门票在较高的学习率下缩小了与未修剪网络的准确性差距，在Pm = 27.1%时，学习率为0.03（预热，k = 20000），达到90.5%的测试准确性。对于这些超参数，当Pm ≥ 11.8%时，我们仍然可以找到中奖彩票。然而，即使进行了热身，我们也无法找到超参数，从而可以在原始学习率0.1下识别中奖彩票。

图8：迭代修剪时Resnet-18的测试精度（在10 K，20 K和30 K迭代时）。

5 DISCUSSION讨论

关于神经网络修剪的现有工作（例如，Han et al.（2015））证明了神经网络学习的函数通常可以用更少的参数来表示。修剪通常通过训练原始网络、移除连接和进一步微调来进行。实际上，初始训练初始化修剪网络的权重，以便它可以在微调期间孤立地学习。我们试图确定类似的稀疏网络是否可以从一开始就学习。我们发现，本文研究的架构可靠地包含这样的可训练的子网络，彩票假设提出，这种属性一般适用。我们的实证研究的存在和性质的中奖彩票邀请一些后续问题。

中奖票初始化的重要性。当随机重新初始化时，获胜的票学习得更慢，并且实现更低的测试准确性，这表明初始化对其成功很重要。这种行为的一个可能的解释是这些初始权重接近它们的最终值在最极端的情况下，它们已经被训练。然而，附录F中的实验显示了相反的情况，即中奖彩票的权重比其他权重移动得更远。这表明初始化的好处与优化算法、数据集和模型有关。例如，中奖彩票初始化可能落在损失景观的区域中，该区域特别适合于由所选择的优化算法进行优化。

Liu et al.（2019）发现，修剪后的网络在随机重新初始化时确实是可训练的，这似乎与传统观点和我们的随机重新初始化实验相矛盾。例如，在VGG-19（我们共享相同的设置）上，他们发现修剪高达80%并随机重新初始化的网络与原始网络的准确性相匹配。我们在图7中的实验证实了在该稀疏水平下的这些发现（低于Liu et al.不提供数据）。然而，在进一步修剪之后，初始化很重要：当VGG-19被修剪高达98.5%时，我们发现中奖彩票;当重新初始化时，这些票据达到低得多的准确度。我们假设-达到一定程度的稀疏性-高度过参数化的网络可以被成功地修剪、重新初始化和重新训练;然而，超过这一点，极度修剪的、不太严重的过参数化网络仅在偶然初始化的情况下保持准确性。

彩票结构的重要性。产生中奖票的初始化被安排在特定的稀疏架构中。由于我们通过大量使用训练数据来发现中奖彩票，因此我们假设中奖彩票的结构编码了一种针对手头学习任务定制的归纳偏差。Cohen & Shashua（2016）表明，嵌入深度网络结构中的归纳偏差决定了它可以比浅层网络更有效地分离参数的数据种类;尽管Cohen & Shashua（2016）专注于卷积网络的池化几何，但类似的效果可能与中奖彩票的结构有关，即使在严重修剪时也能学习。

改进的中奖彩票的推广。我们可靠地找到了泛化能力更好的中奖彩票，超过了原始网络的测试精度，同时匹配了其训练精度。测试精度随着我们的修剪而增加，然后降低，形成奥卡姆山（Rasmussen & Ghahramani，2001），其中原始的，过度参数化的模型具有太多的复杂性（可能是过度拟合），而极度修剪的模型太少。关于压缩和推广之间关系的传统观点是，紧凑的假设可以更好地推广（Rissanen，1986）。最近的理论工作显示了神经网络的类似联系，证明了可以进一步压缩的网络的更严格的泛化边界（Zhou et al.（2018）进行修剪/量化和Arora et al.（2018）的噪声鲁棒性）。彩票假说为这种关系提供了一个补充的视角，即更大的网络可能明确地包含更简单的表示。

神经网络优化的含义。中奖的彩票可以达到与原始的、未修剪的网络相当的精度，但参数要少得多。这一观察结果与最近关于过度参数化在神经网络训练中的作用的研究有关。例如，Du等人。（2019）证明了用SGD训练的充分过参数化的双层relu网络（具有固定大小的第二层）收敛到全局最优值。因此，一个关键问题是，中奖彩票的存在是否是SGD将神经网络优化到特定测试精度的必要条件或充分条件。我们推测（但没有经验表明），SGD寻找并训练一个初始化良好的子网络。按照这种逻辑，超参数化网络更容易训练，因为它们有更多的子网络组合，这些组合是潜在的中奖彩票。

6 LIMITATIONS AND FUTURE WORK局限性和未来工作

我们只考虑较小数据集（MNIST，CIFAR10）上以视觉为中心的分类任务。我们不研究更大的数据集（即Imagenet（Russakovsky et al.迭代修剪是计算密集型的，需要连续训练网络15次或更多次以进行多次试验。在未来的工作中，我们打算探索更有效的方法来寻找中奖彩票，这将使人们有可能在更多的资源密集型环境中研究彩票假说。

稀疏修剪是我们找到中奖彩票的唯一方法。尽管我们减少了参数计数，但由此产生的架构并没有针对现代库或硬件进行优化。在未来的工作中，我们打算从广泛的当代文献中研究其他修剪方法，如结构化修剪（这将产生针对当代硬件优化的网络）和非幅度修剪方法（这可以产生更小的中奖彩票或更早地找到它们）。

我们发现的中奖彩票具有初始化，允许它们在尺寸太小的情况下匹配未修剪网络的性能，而随机初始化的网络无法做到这一点。在未来的工作中，我们打算研究这些初始化的属性，与修剪网络架构的归纳偏差相一致，使这些网络特别擅长学习。

在更深层的网络（Resnet-18和VGG-19）上，迭代修剪无法找到中奖彩票，除非我们用学习率预热来训练网络。在未来的工作中，我们计划探索为什么预热是必要的，以及对我们识别中奖彩票的方案的其他改进是否可以避免这些超参数修改的需要。

7 RELATED WORK相关工作

在实践中，神经网络往往会被过度参数化。蒸馏（Ba & Caruana，2014;欣顿等人，2015）和修剪（LeCun等人，1990; Han等人，2015）依赖于可以在保持准确性的同时减少参数的事实。即使有足够的容量来记忆训练数据，网络也会自然地学习更简单的函数（Zhang et al.2016; Neyshabur等人，2014; Arpit等人，2017年）。当代经验（Bengio等人，2006;欣顿等人，2015; Zhang等人，2016）和图1表明，过参数化网络更容易训练。我们表明，密集的网络包含稀疏的子网络能够学习自己从原来的初始化。其他几个研究方向旨在训练小型或稀疏网络。

在训练之前。Squeezenet（Iandola等人，2016）和MobileNets（霍华德等人，2017）是专门设计的图像识别网络，比标准架构小一个数量级。Denil等人（2013）将权重矩阵表示为较低秩因子的乘积。Li等人（2018）将优化限制在参数空间的一个小的随机采样子空间（这意味着所有参数仍然可以更新）;它们成功地在该限制下训练网络。我们表明，一个甚至不需要更新所有参数来优化网络，我们发现中奖票通过一个原则性的搜索过程，涉及修剪。我们对这类方法的贡献是证明稀疏的，可训练的网络存在于更大的网络中。

训练结束后。蒸馏（Ba & Caruana，2014;欣顿等人，2015）训练小型网络来模仿大型网络的行为;较小的网络更容易在此范例中训练。最近的修剪工作压缩大型模型以利用有限的资源（例如，在移动的设备上）。虽然修剪是我们实验的核心，但我们研究了为什么训练需要使修剪成为可能的过参数化网络。LeCun等.（1990）和Hassibi & Stork（1993）首先探索了基于二阶导数的剪枝。最近，Han et al.（2015）表明，基于每个权重幅度的修剪大大减少了图像识别网络的大小。Guo et al.（2016）恢复修剪的连接，因为它们再次变得相关。Han et al.（2017）和Jin et al.（2016）在修剪小权重并微调幸存权重后，恢复修剪的连接以增加网络容量。其他提出的修剪试探法包括基于激活的修剪（Hu等人，2016），冗余（Mariet & Sra，2016; Srinivas和Babu，2015 a）、每层二阶导数（Dong等人，2017）和能量/计算效率（Yang等人，2017）（例如，修剪卷积滤波器（Li等人，2016; Molchanov等人，2016; Luo等人，2017）或通道（He等人，2017））。Cohen等人（2016）观察到卷积滤波器对初始化敏感（“滤波器彩票”）;在整个训练过程中，他们随机重新初始化不重要的过滤器

在训练的时候。Bellec等人（2018）使用稀疏网络进行训练，并使用新的随机连接替换达到零的权重。Srinivas等人（2017）和Louizos等人（2018）学习最小化非零参数数量的门控变量。Narang等人（2017）将基于幅度的修剪集成到训练中。Gal & Ghahramani（2016）表明，dropout近似于高斯过程中的贝叶斯推断。关于训练期间辍学学习辍学概率的贝叶斯观点（Gal等人，2017; Kingma等人，2015; Srinivas & Babu，2016）。学习按权重、按单位（Srinivas & Babu，2016）或自然结构化丢弃概率（Molchanov等人，2016）的技术。2017; Neklyudov等人，2017）或明确地（Louizos等人，2017; Srinivas & Babu，2015 b）在训练期间修剪和稀疏网络，因为某些权重的丢弃概率达到1。相比之下，我们至少训练网络一次以找到中奖彩票。这些技术也可能找到中奖彩票，或者通过引入稀疏性，可能与我们的方法有益地相互作用。

你可能感兴趣的:(轻量化网络,神经网络,人工智能,深度学习)

图生视频技术的发展与展望：从技术突破到未来图景 Liudef06 Stable Diffusion 音视频人工智能深度学习 stable diffusion
一、技术发展现状图生视频（Image-to-VideoGeneration）是生成式人工智能（AIGC）的重要分支，其核心是通过单张或多张静态图像生成动态视频序列。近年来，随着深度学习、多模态融合和计算硬件的进步，图生视频技术经历了从基础研究到商业落地的快速演进。早期探索与GAN的奠基早期图生视频技术主要基于生成对抗网络（GAN），通过对抗训练生成低分辨率的视频片段。例如，DeepMind的DVD
批量请求微信小程序封禁状态的C++代码示例安丨微信小程序 c++小程序
概述：此C++代码示例将展示如何批量请求指定API接口，检查微信小程序是否被封禁。根据返回的code值，我们可以判断小程序是否被封禁，code为0时表示小程序被封禁，code为1表示正常。代码介绍：目标：通过C++编写批量请求的代码，检查多个小程序的封禁状态。使用的库：使用libcurl库来发送HTTP请求。libcurl是一个强大的库，广泛用于在C++中进行网络请求。API接口：https://
IOT物联网平台简单介绍可乐加.糖 IOT物联网物联网 iot 智慧城市
物联网平台简单介绍文章目录物联网平台简单介绍1、什么是物联网平台2、物联网平台的网络模型3、国内常见的物联网平台4、物联网平台南向北向南向接口北向接口5、物联网平台的意义物联网的意义主要体现在以下几个方面：6、物联网平台的应用智能家居智能城市工业自动化医疗保健农业零售物流等其他行业1、什么是物联网平台物联网平台（TheInternetofThings，简称IOT）物联网平台是指用于连接、管理和控制
【SoC基础】单片机之寄存器解析望闻问嵌 #SoC 单片机嵌入式硬件
：如果你也对机器人、人工智能感兴趣，看来我们志同道合✨：不妨浏览一下我的博客主页【https://blog.csdn.net/weixin_51244852】：文章若有幸对你有帮助，可点赞收藏⭐不迷路：内容若有错误，敬请留言指正！原创文，转载注明出处文章目录1、寄存器位置2、寄存器种类2.1通用用途寄存器2.2CPU执行相关寄存器2.3外设控制寄存器3.寄存器在CPU访问外设过程中起到的作用1、寄
大模型时代的知识焦虑机载软件与适航机器学习-建模算法-代理模型人工智能大数据
引言：浪潮之巅，焦虑暗涌大模型时代已经浩荡而来，如同奔腾的浪潮，以令人惊叹的速度重塑着世界的面貌。从智能客服的温声细语，到AI绘画的妙笔生花，再到自动驾驶的日趋成熟，大型语言模型、图像模型等人工智能技术以前所未有的姿态，渗透进我们生活的方方面面。信息获取前所未有的便捷，知识创造空前高效，人机交互焕然一新，一个充满无限可能的智能化未来似乎触手可及。然而，在这令人眼花缭乱的技术盛景之下，一股无形的焦虑
PCDN如何优化移动设备的网络体验 yczykjyxgs pcdn 服务器
在移动互联网时代，用户对网络体验的要求不断提升，PCDN（P2PCDN）技术为优化移动设备网络体验提供了创新解决方案。这项技术通过重构传统内容分发模式，有效解决了移动网络环境下的带宽瓶颈和传输延迟问题。PCDN技术的核心在于构建了一个去中心化的内容分发网络。移动设备不再仅仅作为内容消费者，而是同时承担了内容分发节点的角色。这种设计充分利用了移动设备的闲置带宽和存储资源，形成了一个动态的内容共享网络
## PCDN中的网络拥塞控制技术探讨 yczykjyxgs pcdn 网络智能路由器
随着互联网视频流量的爆发式增长，传统CDN面临着成本高、扩展性差等挑战。P2PCDN（PCDN）作为一种新兴的内容分发网络架构，通过利用边缘节点的闲置带宽和存储资源，有效降低了内容分发成本，并提升了网络扩展性。然而，PCDN中节点动态性强、网络环境复杂，传统的网络拥塞控制技术难以直接适用，因此需要针对PCDN的特点设计新的拥塞控制机制。PCDN网络拥塞控制面临的挑战1.节点异构性:PCDN节点性能
近期计算机领域的热点技术 0dayNu1L 云计算量子计算人工智能
随着科技的飞速发展，计算机领域的新技术、新趋势层出不穷。本文将探讨近期计算机领域的几个热点技术趋势，并对它们进行简要的分析和展望。一、人工智能与机器学习人工智能（AI）和机器学习（ML）是近年来计算机领域最为热门的话题之一。AI和ML技术已经广泛应用于图像识别、自然语言处理、智能推荐等领域，并取得了显著的成果。随着技术的不断进步，AI和ML将更深入地渗透到各个行业，为人类社会带来更多便利和效益。在
某智慧医养服务平台Uploads存在任意文件上传漏洞(DVB-2025-8968) Byp0ss403 漏洞复现集合文件上传 web安全
免责声明本文所描述的漏洞及其复现步骤仅供网络安全研究与教育目的使用。任何人不得将本文提供的信息用于非法目的或未经授权的系统测试。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权，请及时与我们联系，我们将尽快处理并删除相关内容。0x01产品介绍广西金中软件集团有限公司前身成立于1999年，隶属于广西电信下的三产公司金中信息产业有限公司，是一家集软件开发、网站建设、网络工程、系统
谷歌准备斥资 230 亿收购网络安全初创公司 Wiz 网络研究观网络研究观谷歌
Alphabet正在就收购Wiz进行深入谈判，这将显著增强其安全能力。这将是谷歌母公司有史以来最大规模的收购。这是路透社根据匿名消息来源撰写的内容。目标收购金额为230亿美元，即211亿欧元。Wiz拥有实时检测和响应网络威胁的技术。通过实施人工智能，Wiz能够在短时间内吸引许多公司作为客户。Alphabet的收购目标定于2020年初。到2023年，Wiz的收入将达到3.5亿美元。当时，全球40%的
使用 Python 的 pyttsx3 库进行文本转语音 Bingjia_Hu python 开发语言 pyttsx3
1.什么是pyttsx3？1.1pyttsx3是一个Python库，它可以将文本转换为语音。与其他文本转语音库（如gTTS）不同，pyttsx3不依赖于网络服务，它使用本地的TTS（Text-to-Speech）引擎，这使得它在离线状态下也能正常工作1.2pyttsx3支持多平台（Windows、Linux和macOS），且可以对语音的音量、语速以及语音类型等进行控制2.安装pyttsx3要使用p
【从零开始学习计算机科学】信息安全（十三）区块链贫苦游商学习区块链 hash 公有链私有链信息安全网络安全
【从零开始学习计算机科学】信息安全（十三）区块链区块链区块链概述区块链的主要特性开放，共识交易透明，双方匿名不可篡改，可追溯区块链的主要类别公有链私有链联盟链区块链核心技术Hash指针Merkle（梅根）树SPV交易验证过程区块链网络分叉解决机制51%攻击问题基于比特币的区块链的优势与不足常用的区块链区块链区块链概述能否在互联网环境（开放环境）下，创造一种技术，使得在无法保证人们相互信任的前提下，
数学领域的跨时代进化与升级：从公理化到智能化的破茧之路夏末之花算法
作者：夏末之花|发布时间：2025-03-16|阅读量：10万+|点赞数：5.6万引言：数学的“破茧时刻”与文明跃迁人类历史上，数学的每一次重大突破都像一次“破茧时刻”，推动文明跨越式发展。从古希腊的几何公理化到牛顿的微积分，再到20世纪的计算机理论，数学始终是科学革命的基石。而在21世纪的今天，随着量子计算、人工智能、生物信息等技术的爆发，数学正迎来新一轮的进化与升级——从纯粹的逻辑工具，演变为
谷歌母公司Alphabet拟斥资230亿美元收购网络安全公司Wiz leijianping_ce
雷递网乐天7月15日据知情人士透露，谷歌母公司Alphabet正在就收购网络安全初创公司Wiz进行谈判。此次交易总额可能高达230亿美元。这将使其成为Alphabet迄今为止最大的一笔收购。双方尚未达成协议，谈判仍有可能以失败告终。近期，Alphabet搁置收购客户关系管理公司HubSpotInc.的努力，随后进行此次谈判。与HubSpot交易一样，对于像Alphabet这样的大型科技公司来说，收
精准测试：软件开发中的高效质量保障利器霍格沃兹软件测试开发精准化测试测试用例安全性测试测试覆盖率模块测试 selenium 测试工具压力测试
全面解析软件测试开发：人工智能测试、自动化测试、性能测试、测试左移、测试右移到DevOps如何驱动持续交付在现代软件开发中，测试效率与测试质量直接影响产品竞争力。精准测试作为一项兼具效率与精度的创新测试方法，已经成为众多企业提升软件质量的重要手段。本篇文章围绕精准测试的落地实施、对质量指标的提升、数据统计与效果评估方法以及如何提高投入产出比进行全面解读，帮助企业掌握精准测试的价值与实践路径。精准测
提升敏感力，“工具人”破圈的唯一解！技能咖 GAI认证生成式人工智能认证人工智能
在当今这个日新月异的数字化时代，个人与组织面临着前所未有的挑战与机遇。随着科技的飞速发展，尤其是生成式人工智能（GenerativeAI）的兴起，职场生态正在发生深刻变革。如何在这场变革中提升敏感力，实现从“工具人”到行业佼佼者的跨越，成为了众多职场人士关注的焦点。本文将探讨提升敏感力的重要性，并引入生成式人工智能认证（GAI认证），为您揭示“工具人”破圈的唯一解。提升敏感力：职场竞争的关键什么是
Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
新浪财经App喜娜AI助手通过大模型登记，已上线AI摘要和个股公告AI解读量子位
3月14日，官方发布的信息显示，新浪财经App喜娜AI助手近日已通过北京市生成式人工智能服务登记。目前，喜娜AI助手已上线两项创新功能：喜娜AI摘要和个股公告AI解读。这两项功能旨在通过先进的人工智能技术，提升用户对财经资讯和上市公司公告的理解与分析效率，这标志着AI技术在信息服务领域的又一重大突破。喜娜AI摘要：快速提炼财经资讯核心要点AI时代，资讯信息迎来爆炸性增长，用户每天都要面对海量资讯，
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
模型微调：让AI更懂你的魔法棒带上一无所知的我 pytorch 人工智能 python
模型微调：让AI更懂你的魔法棒✨在人工智能的世界里，模型微调（Fine-tuning）就像是一位魔法师用魔法棒对预训练模型进行“个性化改造”，让它更适应特定的任务。今天，我们就来深入探讨模型微调的技术细节，让你也能像魔法师一样，轻松驾驭AI模型！什么是模型微调？模型微调是指在预训练模型的基础上，通过少量的特定任务数据进行训练，使模型更好地适应新任务的技术。预训练模型通常是基于大规模数据集（如Ima
从 DeepSeek 到 AI 工具箱：Websoft9 应用托管平台赋能高校教学与科研人工智能deepseek
从DeepSeek到AI工具箱：Websoft9应用托管平台赋能高校教学与科研人工智能技术的快速发展正在重塑高校的教学与科研生态。从智能教学辅助到跨学科研究，AI工具的应用场景不断扩展，而技术落地的复杂性也带来新的挑战。在这一背景下，如何将大模型能力与多样化AI工具无缝整合，构建安全、易用的科研教学环境，成为高校数字化转型的关键命题。一、高校智能化转型的三大痛点技术门槛高•AI工具部署依赖专业运维
Websoft9 开源多应用平台：培养学生数字化能力的实战工具开源实践
引言数字化教育转型的核心在于将技术工具与教学场景深度融合，但传统模式常因环境配置复杂、工具链割裂等问题阻碍实践教学效率。Websoft9开源多应用平台以标准化部署、多工具集成、轻量化运维为核心能力，为教育场景提供了一种技术门槛更低、协作效率更高的解决方案。本文基于实际教学需求与技术验证，探讨如何通过该平台构建数字化能力培养体系。一、技术特性与教育场景的适配性开源生态覆盖全技术栈，缩短教学准备周期平
聊聊关于Python与人工智能那些事小G-biu- python 人工智能 tensorflow
Python与人工智能：介绍Python在人工智能方面的应用Python是一种广泛使用的编程语言，也是人工智能领域中最受欢迎的语言之一。Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。OpenAIOpenAI是一个非营利组织，旨在推动人工智能的发展并促进其对人类的利益。OpenAI通过开发人工智能技术、研究人工智能的影
Ubuntu下编译OpenWrt的详细教程艾丽丝的爱情 ubuntu linux 运维编程
OpenWrt是一个基于Linux的嵌入式操作系统，常用于路由器等网络设备。本文将为您提供在Ubuntu操作系统下编译OpenWrt的完整教程。步骤1：安装必要的软件包首先，我们需要安装一些必要的软件包来支持OpenWrt的编译过程。在终端中运行以下命令来安装这些软件包：sudoaptupdatesudoaptinstallbuild-essentiallibncurses5-devzlib1g-
当现代教育技术遇上仓颉---探秘华为仓颉编程语言与未来教育技术的接轨想成为高手499 华为服务器 php
引言随着人工智能、物联网、区块链等新兴技术的发展，编程语言的需求也在不断演化。据市场研究机构发布的数据显示，全球编程语言市场规模预计在未来五年内将以每年10%的速度增长。此外，越来越多的企业和高校正在积极推动基于分布式系统和硬件优化的新型语言开发，这进一步表明对高性能编程语言的需求日益旺盛。近年来，华为推出了自研编程语言“仓颉”，以其高效的语法设计、灵活的语义表达能力和强大的跨平台适配性能引发了编
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法天天酷科研工艺参数优化 matlab 神经网络工艺参数优化
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法一、方法原理与框架BP神经网络的作用BP神经网络通过建立工艺参数与目标性能（如翘曲变形、收缩率、硬度等）之间的非线性映射关系，作为代理模型替代复杂的物理仿真或实验。其优势在于：能够处理多输入-多输出的复杂非线性关系，例如激光功率、扫描速度与熔覆层性能的关联。在注塑成型中，预测体积收缩率和翘曲变形的相对误差可控制在5%以内。通过正交
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
nginx性能优化有哪些方式？企鹅侠客 linux 面试 nginx 性能优化 php
0.运维干货分享软考高级系统架构设计师备考学习资料软考高级网络规划设计师备考学习资料KubernetesCKA认证学习资料分享信息安全管理体系（ISMS）制度模板分享免费文档翻译工具(支持word、pdf、ppt、excel)PuTTY中文版安装包MobaXterm中文版安装包pinginfoview网络诊断工具中文版Nginx是一个高性能的HTTP服务器和反向代理服务器，但在高并发场景下，仍然有
使用 TensorFlow 进行图像处理：深度解析卷积神经网络（CNN）一碗黄焖鸡三碗米饭人工智能前沿与实践 tensorflow 图像处理 cnn 人工智能机器学习 python ai
目录使用TensorFlow进行图像处理：深度解析卷积神经网络（CNN）1.什么是卷积神经网络（CNN）？CNN的基本结构为什么CNN适合图像处理？2.使用TensorFlow构建CNN2.1环境准备2.2加载并预处理MNIST数据集2.3构建CNN模型2.4编译和训练模型2.5评估模型3.CNN的优化与改进3.1使用数据增强3.2调整网络结构4.CNN在其他图像处理任务中的应用5.总结参考文献在
多功能电子医药盒设计方案（含有源码）妄北y 竞赛项目研究实战汇集 xcode macos ide
一、设计背景与目的随着科技的迅速发展，数字化和智能化已经成为现代社会的主流趋势。计算机和网络技术的广泛应用正在改变人们的生活方式，尤其是在老龄化社会中，智能化设备的需求日益增长。多功能电子医药盒的设计旨在提高人们的生活效率，尤其是为老年人和忙碌的年轻人提供便利的用药提醒和管理系统。1.设计目的本设计的目标是开发一种多功能语音电子医药盒，能够根据用户的语音指令进行操作，提高用户的用药安全和便捷性。该
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">