weixin_50862344

【论文翻译】【剪枝】Filter Pruning via Geometric Medianfor Deep Convolutional Neural Networks Acceleration

摘要

1.介绍

2.相关工作

3. 方法

3.1 前置内容

3.2. 基于规范的准则分析

3.3. 真实场景中的Norm统计

3.4 通过几何中值进行过滤修剪

3.5. 理论和现实加速

3.5.1理论加速

3.5.2 实际加速

4.实验

4.1实验设置

4.2.单分支网络修剪

4.3.多分支网络修剪

4.4.消融研究

4.5.特征图可视化

5.结论和未来工作

摘要

以往的工作利用“小范数-不重要”准则修剪卷积神经网络中的小范数滤波器。在本文中，我们分析了这个基于范数的准则，并指出它的有效性取决于两个条件，而这两个条件并不总是被满足:(1)滤波器的范数偏差应该很大;(2)滤波器的最小范数应较小。为了解决这个问题，我们提出了一种新的滤波器剪枝方法，即几何中值滤波剪枝(FPGM)，不考虑这两个要求来压缩模型。与以前的方法不同，FPGM通过修剪冗余过滤器来压缩CNN模型，而不是那些“相对不那么重要”的过滤器。当应用于两个图像分类基准时，我们的方法验证了其有效性和优势。值得注意的是，在CIFAR-10上，FPGM在ResNet-110上降低了52%以上的FLOPs，相对精度提高了2.69%。此外，在ILSVRC2012上，FPGM在ResNet101上降低了42%以上的FLOPs，精度没有前5位的下降，这是先进的技术。代码可以在GitHub上公开获取:https://github.com/he-y/filter-pruning-geometric-median

1.介绍

图1。(a)基于范数的方法的剪枝准则和提出的方法的说明;(b)基于范数的滤波器剪枝准则要求。在(a)中，绿色方框表示网络的过滤器，其中较深的颜色表示滤波器的较大范数。对于基于范数的准则，只有范数最大的滤波器被保留，这是基于“小范数滤波器不那么重要”的假设。相比之下，该方法对网络中含有冗余信息的滤波器进行修剪。通过这种方式，可以保留由不同绿色强度表示的不同规范的过滤器。(b)中，蓝色曲线表示网络的理想范数分布，v1和v2分别为范数分布的最小值和最大值。要选择合适的阈值T(红色阴影)，需要达到两个要求，即范数偏差要大，范数的最小值要任意小。

深度cnn的更深和更宽的架构带来了计算机视觉任务的卓越性能[6,26,45]。然而，它们也会导致高昂的计算成本，并使模型在移动设备上部署变得困难。即使是最新的高效架构，如残差连接[12]或inception 模块[34]，也有数百万个参数，需要数十亿个浮点运算[15]。因此，有必要获得计算成本相对较低但精度较高的深度CNN模型。

最近关于剪枝的研究进展可以分为两类，即权重剪枝[11,1]和滤波剪枝[21,39]。权重修剪直接删除过滤器中的权重值，这可能会导致非结构化稀疏。这种不规则的结构使得利用高效的基本线性代数子程序(BLAS)库[25]变得很困难。相比之下，滤波修剪直接丢弃整个选择的过滤器，留下一个具有规则结构的模型。因此，滤波剪枝是加速网络和减小模型规模的首选方法。

目前的实践[21,38,15]通过遵循“小范数-不重要”的标准来进行滤波器修剪，该标准认为具有较小范数的滤波器由于其重要性较低，可以安全地修剪。如图1(a)的右上方所示，在计算模型中滤波器的范数后，利用预先设定的阈值来选择范数小于的滤波器。

然而，如图1(b)所示，要使用这个“小规范-不重要”的标准，有两个先决条件。首先，滤波规范的偏差要显著。这一要求使得阈值的搜索空间足够宽，因此分离需要修剪的过滤器将是一项简单的任务。其次，可以修剪的滤波器的范数应该任意小，即接近于零;换句话说，对网络而言，具有较小规范的滤波器对网络的贡献绝对较小，而不是相对较小但具有较大的贡献的。当恰好满足这两个要求时，理想的范数分布如图1中的蓝色曲线所示。不幸的是，根据我们的分析和实验观察，这并不总是正确的。

为了解决上述问题，我们提出了一种新的滤波器剪枝方法，称为几何中值滤波剪枝(FPGM)。与以往的方法不同，FPGM选择的是贡献相对较小的滤波器。具体来说，我们计算同一层内滤波器的几何中值(GM)[8]。根据GM的特性，它附近的滤波器F可以用剩下的滤波器表示。因此，修剪这些滤波器不会对模型性能产生实质性的负面影响。注意，FPGM不使用基于范数的准则来选择要修剪的过滤器，这意味着即使不能满足基于范数的准则的要求，其性能也不会下降。

贡献。我们有三个贡献:

1)分析了以往工作中采用的基于范数的准则，剔除了相对不重要的滤波器。我们详细阐述了导致其局限性的两个基本要求;

(2)我们提出FPGM去修剪包含冗余信息的最可替换的滤波器，当基于范数的准则失效时，该滤波器仍能取得良好的性能;

(3)在两个基准上的大量实验证明了FPGM的有效性和效率。

2.相关工作

以往大多数关于加速cnn的工作大致可以分为四类，即矩阵分解[42,35]、低精度权值[44,43,32]、知识蒸馏[17,19]和剪枝。基于剪枝的方法旨在去除神经网络中不必要的连接[11,21,24]。从本质上讲，权重剪枝总是导致非结构化的模型，这使得难以部署高效的BLAS库，而滤波器剪枝不仅减少了设备上的存储占用，还减少了计算成本，从而加速推理。根据是否使用训练数据来确定剪枝滤波器，我们可以将滤波器剪枝方法大致分为两类，即数据依赖滤波器剪枝和数据独立滤波器剪枝。由于训练数据的使用需要大量的计算量，与数据无关的方法比数据相关的方法效率更高。

权重剪枝。最近的许多工作[11,10,9,36,1,15,41,4]都专注于修剪滤波器的细粒度权重。例如，[11]提出了一种迭代方法来丢弃值低于预定义阈值的小权重。[1]将修剪定义为一个优化问题，即在满足修剪成本条件的同时，找到使损失最小化的权重。

数据依赖滤波器剪枝。一些滤波器剪枝方法[23,25,16,27,7,33,39,37,46,14,18,22]需要利用训练数据来确定剪枝滤波器。[25]使用下一层的统计信息来指导筛选器的选择。[7]的目的是通过最小化训练集样本激活的重构误差来获得一个分解。[33]提出了一种固有的数据驱动方法，使用主成分分析(PCA)来指定应保留的能量的比例。[37]将子空间聚类应用于特征映射，以消除卷积滤波器中的冗余。

数据独立滤波器剪枝。与我们的工作同时，一些数据无关的过滤器修剪策略[21,15,38,47]已经被探索。[21]使用' 1范数标准修剪不重要的过滤器。[15]提出用' 2范数准则选择滤波器，并以软方式修剪这些滤波器。[38]提出通过对批归一化层的缩放参数强制稀疏性来修剪模型。[47]使用滤波器上的光谱聚类来选择不重要的。

讨论。据我们所知，以前只有一项工作重新考虑了更小的标准-更不重要的标准[38，Rethinking the
smaller-norm-less-informative assumption in channel pruning of convolution layers]。与此方法相比，我们想强调的优点如下:(1)[38]更注重批量归一化算子中缩放参数的稀疏性，这对没有批量归一化的结构并不友好。相反，我们的方法不受这种限制。(2)选择剪枝通道后，[38]需要进行微调以减少性能下降。然而，我们的方法将剪枝操作与正常的训练程序结合起来。因此，没有必要进行额外的微调。(3)[38]需要计算比例因子梯度;因此，大量的计算成本是不可避免的，而我们的方法可以在不计算比例因子梯度的情况下加速神经网络。

3. 方法

3.1 前置内容

在本小节中，我们正式介绍符号和符号。我们假设神经网络有L层。我们用和 $N_{i+1}$ 分别表示第i个卷积层的输入通道数和输出通道数。 $F_{i,j}$ 表示第i层的第j个滤波器，则滤波器 $F_{i,j}$ 的维数为 $R^{N_i \times K \times K }$ ，其中K为网络的核大小。网络W(i)的第i层可以用 $\left \{ F_{i,j} , 1\leq j\leq N_{i+1} \right \}$ 表示。深度CNN网络的连接张量可参数化为 $\left \{ W^{i}\in \mathbb{R}^{N_{i+1} \times N_{i} \times K \times K},1\leq i\leq L \right \}$ 。

3.2. 基于规范的准则分析

图1说明了成功利用基于规范的标准的两个需求。然而，这些要求可能并不总是成立，并且可能会导致意想不到的结果。具体如图2所示，其中蓝色虚线曲线和绿色实线曲线分别表示理想情况和实际情况下的正态分布。

图2。基于范数的准则的理想与现实:(a)小范数偏差和(b)大最小范数。蓝色虚线曲线表示理想的正态分布，绿色实线曲线表示真实情况下可能出现的正态分布。

(1)范数偏差小。如图2(a)所示，滤波器范数分布的偏差可能太小，这意味着范数集中在一个很小的区间内。范数偏差小导致搜索空间小，很难找到合适的阈值来选择要修剪的滤波器。

(2)大最小范数。具有最小范数的滤波器不能任意小，如图2(b)， $v_1'' >> v_1\rightarrow 0$ 。在这种情况下，那些被认为是最不重要的过滤器仍然对网络有很大的贡献，这意味着每个过滤器都具有很高的信息量。因此，用最小范数修剪这些滤波器会对网络产生负面影响。

3.3. 真实场景中的Norm统计

在图3中，从CIFAR-10上预训练的ResNet-110和ILSVRC-2012上预训练的ResNet18收集的统计信息验证了之前的分析。小的绿色垂直线表示该正态分布中的每个观测值，蓝色曲线表示核分布估计(KDE)[30]，这是一种估计随机变量概率密度函数的非参数方法。画出了两种结构的第一层和最后一层的范数分布。此外，为了清楚地说明范数点之间的关系，提出了两种不同的x尺度，即线性x尺度和对数x尺度。

（1）网络中的小范数偏差。对于ResNet-110的第一卷积层，如图3（b）所示，有大量的滤波器，其范数集中在 $10^{-6}$ .对于ResNet-110的最后一个卷积层，如图3（c）所示，范数值的间隔跨度大约为0.3，这比第一层范数的间隔跨度（1.7）小得多。对于ResNet-18的最后一卷积层，正如图3（g）所示的，大多数滤波器范数都在间隔[0.8，1.0]之间。在所有这些情况下，滤波器分布得太密集，这使得难以选择适当的阈值来将重要滤波器与其他滤波器区分开来。

（2）网络中的大最小范数。对于ResNet-18的最后一个卷积层，如图3（g）所示，这些滤波器的最小范数约为0.8，与第一个卷积层中的滤波器相比，这是很大的（图3（e））。对于ResNet-110的最后一个卷积层，如图3（c）所示，只有一个滤波器是任意小的，而其他滤波器不是。在这些情况下，尽管根据基于规范的标准，具有最小规范的过滤器相对不那么重要，但仍然在网络中做出了重要贡献。

图3。CIFAR-10上ResNet-110和ILSVRC-2012上ResNet-18不同层滤波器的标准分布。小的绿色垂直线和蓝色曲线分别表示范数分布的每个范数和核分布估计（KDE）。

3.4 通过几何中值进行过滤修剪

为了消除基于范数的准则中的约束，我们提出了一种新的基于几何中值的滤波器修剪方法。几何中值[8]的中心思想如下：给定一组n个点 $a^{(1)}$ ，.....， $a^{(n)}$ 对于每个 $a^{(i)}$ ∈ $\mathbb{R}^{d}$ ，找到一个点 $x^{\ast } \in \mathbb{R}^{d}$ ，使到它们的欧几里得距离之和最小化：

由于几何中值是欧几里得空间中数据中心性的经典稳健估计[8]，我们使用几何中值 $F_i^{GM}$ 来获得单个第i层中所有滤波器的公共信息：

在第i层中，如果某些过滤器具有与该层中的几何中值相同或相似的值，即：

那么这些滤波器 $F_{i,j^\ast }$ , 可以由同一层中的其他滤波器表示，因此，修剪它们对网络性能几乎没有负面影响。

由于几何中值在计算几何中是一个非常重要的问题，因此计算 $(1+\varepsilon )$ -近似几何中值为 $\widetilde{O}(dn^{4/3} \cdot \varepsilon^{-8/3} )$ 通过[2]中的方法， $O(ndlog^3(n/\varepsilon ))$ 通过[3]中的方法。在我们的情况下，作为最终结果 $F_{i,j^\ast }$ 是一个已知点列表，即层中的候选过滤器，我们可以将上述问题简单化。

我们假设

从而实现方程4。则上述等式2变为

注意，即使需要修剪滤波器， $F_{i,j^\ast }$ , 不包括在公式中几何中值的计算公式6中，我们也可以获得相同的结果。在此设置中，我们要查找滤波器

通过上面的等式6和等式8，我们可以得到：

然后我们可以

对于等式10右侧的第二个分量，当x= $F_{i,j^\ast }$ , 我们可以得到：

由于几何中值是欧几里得空间中数据中心性的经典稳健估计[8]，因此选择的滤波器 $F_{i,j^\ast }$ , 左边的共享最常见的信息。这表示滤波器 $F_{i,j^\ast }$ 的信息可以由其他代替。微调后，网络可以很容易地恢复其原始性能，因为修剪后的过滤器的信息可以由剩余的过滤器表示。因此，滤波器 $F_{i,j^\ast }$ 对神经网络的最终结果的影响可以忽略不计。FPGM总结在算法1中。

3.5. 理论和现实加速

3.5.1理论加速

假设输入张量 $I\in N_i \times H_i \times W_i$ 和输出张量 $O \in N_{i+1} \times H_{i+1} \times W_{i+1}$ 的形状。将第i层的过滤器修剪率设置为，则应修剪 $N_{i+1}\times P_i$ 过滤器。滤波器修剪后，第i层的输入和输出特征图的维数分别变为 $I'\in[N_i \times (1-P_i)] \times H_i \times W_i$ 和I'\in[N_i \times (1-P_i)] \times H_i \times W_i $O'\in[N_{i+1} \times (1-P_i)] \times H_{i+1} \times W_{i+1}$ 。

如果将第（i+1）层的修剪率设置为 $P_{i+1}$ ，则只需要原始计算的 $(1-P_{i+1})\times(1-P_{i})$ 。最后，将会获得一个紧凑的模型 $\left \{ W^{\ast (i)} \in \mathbb{R} ^{N_{i+1} \times N_i(1-P_{i-1})\times K \times K }\right \}$ 。

3.5.2 实际加速

在上述分析中，仅考虑了用于计算复杂性比较的卷积运算的FLOP，这在先前的工作中是常见的[21，15]。这是因为与卷积运算相比，诸如批处理归一化（BN）和池化等其他运算无关紧要。

然而，非张量层（例如BN和池化层）也需要GPU上的推理时间[25]，并影响真实加速度。此外，理论和实际加速之间的巨大差距也可能受到IO延迟、缓冲区切换和BLAS库效率的限制。我们比较了表5中的理论加速度和实际加速度。

4.实验

我们在两个基准上评估了单分支网络（VGGNet[31]）和多分支网络（ResNet）的FPGM：CIFAR-10[20]和ILSVRC-2012[29]3。CIFAR-10[20]数据集包含10个不同类别的60000张32×32彩色图像，其中包括50000张训练图像和10000张测试图像。ILSVRC2012[29]是一个大型数据集，包含128万张训练图像和1000个类别的50k张验证图像。

4.1实验设置

训练设置。在CIFAR-10上，参数设置与[13]相同，训练计划与[40]相同。在ILSVRC-2012实验中，我们使用与[12，13]相同的默认参数设置。ILSVRC-2012的数据论证策略与PyTorch[28]的官方示例相同。我们分析了从头开始和预训练模型之间的差异。为了从头开始修剪模型，我们使用正常的训练计划，而无需额外的微调过程。为了修剪预先训练的模型，我们将学习率降低到原始学习率的十分之一。为了从头开始修剪模型和预训练模型进行公平比较，我们使用相同的训练时期来训练/微调网络。之前的工作[21]可能使用较少的时间段来微调修剪模型，但它收敛得太早，即使使用较多的时间段，其精度也无法提高，如第4.2节所示。

修剪设置。在过滤器修剪步骤中，我们简单地以相同的修剪速率同时修剪所有加权层，这与[15]相同。因此，只需要一个超参数Pi=P来平衡加速度和精度。修剪操作在每个训练阶段的结束。与之前的工作不同[21]，灵敏度分析在FPGM中不是实现良好性能的关键，这将在后面的章节中进行演示。

除了FPGM唯一标准外，我们还使用了FPGM和先前基于规范的方法[15]的混合物，以表明FPGM可以作为先前方法的补充。仅FPGM的标准表示为“仅FPGM”，将FPGM和基于规范的标准结合起来的标准表示“FPGM混合”。“仅FPGM 40%”表示仅使用FPGM选择该层的40%过滤器，而“FPGM混合40%”表示使用FPGM选定该层的30%过滤器，其余10%过滤器使用基于规范的标准[15]。我们将FPGM与先前的加速算法进行了比较，例如MIL[5]、PFEC[21]、CP[16]、ThiNet[25]、SFP[15]、NISP[39]、重新思考[38]。毫不奇怪，我们的FPGM方法达到了最先进的结果。

4.2.单分支网络修剪

CIFAR-10上的VGGNet。由于[21]没有公开的训练设置，我们重新实施了修剪程序，并获得了与原始论文类似的结果。修剪预训练和划痕模型的结果分别显示在表3和表4中。毫不奇怪，FPGM在两种设置中都取得了比[21]更好的性能。

4.3.多分支网络修剪

CIFAR-10上的ResNet。对于CIFAR-10数据集，我们在ResNet-20、32、56和110上测试了FPGM，使用两种不同的修剪率：30%和40%。

如表1所示，我们的FPGM达到了最先进的性能。例如，MIL[5]在没有微调的情况下使ResNet-32加速了31.2%的加速比，精度下降了1.59%，但我们的FPGM在没有微调情况下实现了53.2%的加速率，精度甚至提高了0.19%。与SFP[15]相比，当修剪ResNet-56的52.6%FLOP时，我们的FPGM只有0.66%的精度下降，这远远小于SFP[15]（1.33%）。对于修剪预训练的ResNet-110，我们的方法实现了更高（52.3%vs.38.6%）的加速比，性能提高了0.16%，而PFEC[21]以更低的加速比损害了性能。这些结果表明，FPGM可以产生具有可比甚至更好性能的更压缩的模型。

ILSVRC-2012上的ResNet。对于ILSVRC-2012数据集，我们在ResNet-18、34、50和101上测试了FPGM，修剪率分别为30%和40%。与[15]相同，我们不会为了简化而删减投影快捷方式。

表2显示，FPGM在ILSVRC-2012数据集上再次优于先前的方法。对于ResNet-18，没有微调的纯FPGM实现了与[15]相同的推理速度，但其精度超过了0.68%。仅进行微调的FPGM甚至可以比仅进行微调时的FPGM获得0.60%的改进，因此超过[15]1.28%。对于ResNet-50，微调后的FPGM比CP实现了更高的推理速度[16]，但我们的修剪模型在精度上超过了他们的模型0.85%。此外，对于修剪预训练的ResNet-101，FPGM减少了模型40%以上的FLOP，而没有前5位的精度损失，只有可忽略的（0.05%）前1位精度损失。相比之下，重新思考的性能下降了2.10%[38]。与基于范数的准则相比，几何中值（GM）明确地利用了滤波器之间的关系，这是其优越性能的主要原因

为了比较理论和实际加速度，我们在一个GTX1080 GPU上测量了批处理大小为64的修剪模型的前进时间。结果4如表5所示。如上一节所述，理论模型和现实模型之间的差距可能来自于IO延迟、缓冲区切换和BLAS库效率的限制。

4.4.消融研究

修剪间隔的影响在我们的实验设置中，修剪间隔等于1，即，我们在每个训练阶段结束时进行修剪操作。为了探讨修剪间隔的影响，我们将修剪间隔从一个时期更改为十个时期。我们使用修剪率为40%的ResNet-110作为基线，如图4（a）所示。不同修剪间隔的精度波动小于0.3%，这意味着修剪性能对该参数不敏感。请注意，微调此参数甚至可以获得更好的性能。

改变修剪的FLOP我们改变ResNet-110的修剪FLOP的比率，以全面了解FPGM，如图4（b）所示。当修剪的FLOP为18%和40%时，修剪模型的性能甚至超过了没有修剪的基线模型，这表明FPGM可能对神经网络具有正则化效果。

距离类型的影响我们使用“1-范数和余弦距离”代替方程3中的距离函数。我们使用修剪率为40%的ResNet-110作为基线，修剪模型的准确度为93.73±0.23%。基于“1范数”和“余弦距离”的精度分别为93.87±0.22%和93.56±0.13。使用“1-范数”作为滤波器的距离会带来稍好的结果，但余弦距离作为距离会稍微损害网络的性能。

将FPGM与基于规范的准则相结合我们分析了FPGM与先前基于规范的标准相结合的效果。对于CIFAR-10上的ResNet-110，FPGMmix仅略优于FPGM。对于ILSVRC-2012上的ResNet-18，仅FPGM和混合FPGM的性能几乎相同。看来，标准化标准和FPGM一起可以提高CIFAR-10的性能，但不能提高ILSVRC-2012的性能。我们认为，这是因为基于规范的标准的两个要求在CIFAR-10预训练网络的某些层上得到满足，但在ILSVRC-2012预训练网络上没有得到满足，如图3所示。

4.5.特征图可视化

我们可视化ResNet-50的第一块的第一层的特征图。当将修剪率设置为10%时，带有红色标题的特征图（7、23、27、46、56、58）对应于选定的过滤器激活。这些选定的特征图包含竹子和熊猫头部和身体的轮廓，可由其他特征图代替：（5,12,16,18,22等）包含竹子的轮廓，（0,4,33,34,47等）包含熊猫的轮廓。

5.结论和未来工作

在本文中，我们阐述了基于范数的滤波器修剪准则的基本要求，并指出了它们的局限性。为了解决这个问题，我们提出了一种新的基于几何中值的滤波器修剪策略，称为FPGM，以加速深度神经网络。与之前的标准不同，FPGM明确考虑了过滤器之间的相互关系。得益于此，FPGM在多个基准测试中取得了最先进的性能。未来，我们计划研究如何将FPGM与其他加速算法（例如矩阵分解和低精度权重）相结合，以将性能推向更高的阶段。

盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
目标检测中的NMS算法详解
好的，我们来详细解释一下目标检测中非极大值抑制（Non-MaximumSuppression,NMS）的相关概念和计算过程。1.为什么需要NMS？问题：目标检测模型（如FasterR-CNN,YOLO,SSD等）在推理时，对于同一个目标物体，通常会预测出多个重叠的、不同置信度（confidencescore）的候选边界框（BoundingBoxes）。直接输出所有这些框会导致：结果冗余：同一个物体
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
Python OpenCV教程从入门到精通的全面指南【文末送书】一键难忘 python opencv 开发语言
文章目录PythonOpenCV从入门到精通1.安装OpenCV2.基本操作2.1读取和显示图像2.2图像基本操作3.图像处理3.1图像转换3.2图像阈值处理3.3图像平滑4.边缘检测和轮廓4.1Canny边缘检测4.2轮廓检测5.高级操作5.1特征检测5.2目标跟踪5.3深度学习与OpenCVPythonOpenCV从入门到精通【文末送书】PythonOpenCV从入门到精通OpenCV(Ope
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
第八周 tensorflow实现猫狗识别降花绘 365天深度学习 tensorflow系列 tensorflow 深度学习人工智能
本文为365天深度学习训练营内部限免文章（版权归K同学啊所有）**参考文章地址：[TensorFlow入门实战｜365天深度学习训练营-第8周：猫狗识别（训练营内部成员可读）]**作者：K同学啊文章目录一、本周学习内容:1、自己搭建VGG16网络2、了解model.train_on_batch（）3、了解tqdm，并使用tqdm实现可视化进度条二、前言三、电脑环境四、前期准备1、导入相关依赖项2、
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路
AI在垂直领域的深度应用：医疗、金融与自动驾驶的革新之路一、医疗领域：AI驱动的精准诊疗与效率提升1.医学影像诊断AI算法通过深度学习技术，已实现对X光、CT、MRI等影像的快速分析，辅助医生检测癌症、骨折等疾病。例如，GoogleDeepMind的AI系统在乳腺癌筛查中，误检率比人类专家低9.4%；中国的推想医疗AI系统可在20秒内完成肺部CT扫描分析，为急诊救治争取黄金时间。2.药物研发传统药
目前主流图像分类模型的详细对比分析 @comefly 闲聊 linux 运维服务器
以下是目前主流图像分类模型的详细对比分析，结合性能、架构特点及应用场景进行整理：一、主流模型架构分类与定量对比模型名称架构类型核心特点ImageNetTop-1准确率参数量（百万）计算效率典型应用场景ResNetCNN残差连接解决梯度消失，支持超深网络（如ResNet-152）76.1%25.6中等通用分类、目标检测ViTTransformer将图像分割为patches，用标准Transforme
专题：2025云计算与AI技术研究趋势报告|附200+份报告PDF、原数据表汇总下载
原文链接：https://tecdat.cn/?p=42935关键词：2025,云计算，AI技术，市场趋势，深度学习，公有云，研究报告云计算和AI技术正以肉眼可见的速度重塑商业世界。过去十年，全球云服务收入激增8倍，中国云计算市场规模突破6000亿元，而深度学习算法的应用量更是暴涨400倍。这些数字背后，是企业从“自建机房”到“云原生开发”的转型，是AI从“实验室”走向“产业级应用”的跨越。本报告
【深度学习解惑】在实践中如何发现和修正RNN训练过程中的数值不稳定？云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习 rnn 人工智能 tensorflow pytorch 神经网络机器学习
在实践中发现和修正RNN训练过程中的数值不稳定目录引言与背景介绍原理解释代码说明与实现应用场景与案例分析实验设计与结果分析性能分析与技术对比常见问题与解决方案创新性与差异性说明局限性与挑战未来建议和进一步研究扩展阅读与资源推荐图示与交互性内容语言风格与通俗化表达互动交流1.引言与背景介绍循环神经网络(RNN)在处理序列数据时表现出色，但训练过程中常面临梯度消失和梯度爆炸问题，导致数值不稳定。当网络
【深度学习实战】当前三个最佳图像分类模型的代码详解云博士的AI课堂大模型技术开发与实践哈佛博后带你玩转机器学习深度学习深度学习人工智能分类模型机器学习 Transformer EfficientNet ConvNeXt
下面给出三个在当前图像分类任务中精度表现突出的模型示例，分别基于SwinTransformer、EfficientNet与ConvNeXt。每个模型均包含：训练代码（使用PyTorch）从预训练权重开始微调（也可注释掉预训练选项，从头训练）数据集目录结构：└──dataset_root├──buy#第一类图像└──nobuy#第二类图像随机拆分：80%训练，20%验证每个Epoch输出一次loss
第35周—————糖尿病预测模型优化探索
目录目录前言1.检查GPU2.查看数据编辑3.划分数据集4.创建模型与编译训练5.编译及训练模型6.结果可视化7.总结前言本文为365天深度学习训练营中的学习记录博客原作者：K同学啊1.检查GPUimporttorch.nnasnnimporttorch.nn.functionalasFimporttorchvision,torch#设置硬件设备，如果有GPU则使用，没有则使用cpudevice=
python——struct模块稚与 Python python 数据分析
文章目录structmodule简介常用函数常见format解析MINSTstructmodule最近在学CNN，想找一个合适的数据集，就想到了MINST。但是官网中挂出的文件是train-images-idx3-ubyte.gz等解压后为idx3-ubyte后缀文件。后缀名中idx3表示3维的数据。简介struct模块用于二进制和常用数据类型之间的互相转化，此模块中大部分函数接受一个实现了Buf
街道垃圾识别难？陌讯视觉算法实测准确率突破95% 2501_92487900 算法边缘计算目标检测视觉检测计算机视觉
开篇痛点：街道垃圾识别的技术挑战在智慧城市和环保监管场景中，街道垃圾的实时检测一直是个难题。传统视觉算法（如YOLOv5、FasterR-CNN）在复杂街道场景下表现不佳，主要面临以下问题：光照干扰：早晚光线变化导致误检（如阴影被识别为垃圾）小目标漏检：饮料瓶、烟头等小物体在640x640输入下仅占10x10像素遮挡问题：垃圾桶周边堆积物造成特征混淆某环保科技公司实测数据显示，开源模型在真实场景中
深度学习预备知识 AmazingMQ 深度学习人工智能
1.Tensor张量定义：张量（tensor）表示一个由数值组成的数组，这个数组可能有多个维度（轴）。具有一个轴的张量对应数学上的向量，具有两个轴的张量对应数学上的矩阵，具有两个以上轴的张量目前没有特定的数学名称。importtorch#arange创建一个行向量x，这个行向量包含以0开始的前12个整数。x=torch.arange(12)print("x=",x)#x=tensor([0,1,2
FasterRCNN源码解析（一）-——跑通代码_霹雳巴拉wz的代码看不懂 2401_84140023 2024年程序员学习运维 linux 面试
为了做好运维面试路上的助攻手，特整理了上百道【运维技术栈面试题集锦】，让你面试不慌心不跳，高薪offer怀里抱！这次整理的面试题，小到shell、MySQL，大到K8s等云原生技术栈，不仅适合运维新人入行面试需要，还适用于想提升进阶跳槽加薪的运维朋友。本份面试集锦涵盖了174道运维工程师面试题128道k8s面试题108道shell脚本面试题200道Linux面试题51道docker面试题35道Je
根茎式装配体（RA）作为下一代协同智能范式的理论、架构与应用由数入道人工智能思维框架软件工程智能体
一、引言——范式危机与新大陆的召唤1.1表征主义的黄昏：当前AI协同范式的认知天花板自艾伦·图灵在《计算机器与智能》中播下思想的种子以来，人工智能的漫长征途始终被一个强大而内隐的哲学范式所笼罩——我们称之为“表征主义”（Representationism）。这一范式，无论其外在形态如何演变，从早期的符号逻辑、专家系统，到如今风靡全球的深度学习神经网络，其核心信念从未动摇：智能的核心，在于构建一个关
【零基础学AI】第31讲：目标检测 - YOLO算法 1989 0基础学AI 人工智能目标检测 YOLO rnn lstm tensorflow
本节课你将学到YOLO算法的核心思想和工作原理如何使用YOLO进行物体检测构建一个简单的物体检测系统开始之前环境要求Python3.8+需要安装的包：opencv-python,numpy,matplotlib硬件要求：推荐使用GPU（非必须）前置知识基本Python编程能力了解卷积神经网络（CNN）的基本概念（第24讲内容）核心概念什么是目标检测？目标检测就像教计算机"看"图片中的物体。它不仅要
Manus AI与多语言手写识别
ManusAI与多语言手写识别背景与概述手写识别技术的发展现状与挑战ManusAI的核心技术与应用场景多语言手写识别的市场需求与难点ManusAI的技术架构深度学习在手写识别中的应用多语言支持的模型设计数据预处理与特征提取方法多语言手写识别的关键挑战不同语言字符的多样性处理上下文语义与书写风格适应性低资源语言的训练数据获取解决方案与优化策略迁移学习在多语言任务中的应用端到端模型的优化与轻量化用户反
基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python 全代码）全流程解析（二）
基于LIDC-IDRI肺结节肺癌数据集的人工智能深度学习分类良性和恶性肺癌（Python全代码）全流程解析（二）1环境配置和数据集预处理1.1环境配置1.1数据集预处理2深度学习模型训练和评估2.1深度学习模型训练2.1深度学习模型评估笑话一则开心一下喽完整代码如下：模型文件如下深度学习模型讲解---待续第一部分内容的传送门第三部分传送门1环境配置和数据集预处理1.1环境配置环境配置建议使用ana
深度学习交互式图像分割技术演进与突破 wang1776866571 深度学习交互式分割深度学习人工智能交互式分割
说明本文为作者读研期间基于交互式图像分割领域公开文献的系统梳理与个人理解总结，所有内容均为原创撰写（ai辅助创作），未直接复制或抄袭他人成果。文中涉及的算法、模型及实验结论均参考自领域内公开发表的学术论文（具体文献见文末参考文献列表）。本文旨在为交互式图像分割领域的学习者提供一份结构化的综述参考，内容涵盖技术演进、核心方法、关键技术优化及应用前景，希望能为相关研究提供启发。摘要：本文系统综述了基于
矩阵求逆（JAVA）利用伴随矩阵 qiuwanchi 利用伴随矩阵求逆矩阵
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(利用伴随矩阵) * @author 邱万迟
单例（Singleton）模式 aoyouzi 单例模式 Singleton
3.1 概述如果要保证系统里一个类最多只能存在一个实例时，我们就需要单例模式。这种情况在我们应用中经常碰到，例如缓存池，数据库连接池，线程池，一些应用服务实例等。在多线程环境中，为了保证实例的唯一性其实并不简单，这章将和读者一起探讨如何实现单例模式。 3.2
[开源与自主研发]就算可以轻易获得外部技术支持,自己也必须研发 comsci 开源
现在国内有大量的信息技术产品，都是通过盗版，免费下载，开源，附送等方式从国外的开发者那里获得的。。。。。。虽然这种情况带来了国内信息产业的短暂繁荣，也促进了电子商务和互联网产业的快速发展，但是实际上，我们应该清醒的看到，这些产业的核心力量是被国外的
页面有两个frame,怎样点击一个的链接改变另一个的内容 Array_06 UI XHTML
<a src="地址" targets="这里写你要操作的Frame的名字" />搜索然后你点击连接以后你的新页面就会显示在你设置的Frame名字的框那里 targerts="",就是你要填写目标的显示页面位置 ===================== 例如： <frame src=&
Struts2实现单个/多个文件上传和下载 oloz 文件上传 struts
struts2单文件上传：步骤01:jsp页面  　　<form action="fileUplo
推荐10个在线logo设计网站 362217990 logo
在线设计Logo网站。 1、http://flickr.nosv.org（这个太简单） 2、http://www.logomaker.com/?source=1.5770.1 3、http://www.simwebsol.com/ImageTool 4、http://www.logogenerator.com/logo.php?nal=1&tpl_catlist[]=2 5、ht
jsp上传文件香水浓 jsp fileupload
1. jsp上传 Notice： 1. form表单 method 属性必须设置为 POST 方法，不能使用 GET 方法 2. form表单 enctype 属性需要设置为 multipart/form-data 3. form表单 action 属性需要设置为提交到后台处理文件上传的jsp文件地址或者servlet地址。例如 uploadFile.jsp 程序文件用来处理上传的文
我的架构经验系列文章 - 前端架构 agevs JavaScript Web 框架 UI jQuer
框架层面：近几年前端发展很快，前端之所以叫前端因为前端是已经可以独立成为一种职业了，js也不再是十年前的玩具了，以前富客户端RIA的应用可能会用flash/flex或是silverlight，现在可以使用js来完成大部分的功能，因此js作为一门前端的支撑语言也不仅仅是进行的简单的编码，越来越多框架性的东西出现了。越来越多的开发模式转变为后端只是吐json的数据源，而前端做所有UI的事情。MVCMV
android ksoap2 中把XML(DataSet) 当做参数传递 aijuans android
我的android app中需要发送webservice ，于是我使用了 ksop2 进行发送，在测试过程中不是很顺利,不能正常工作.我的web service 请求格式如下 [html] view plain copy <Envelope xmlns="http://schemas.
使用Spring进行统一日志管理 + 统一异常管理 baalwolf spring
统一日志和异常管理配置好后，SSH项目中，代码以往散落的log.info() 和 try..catch..finally 再也不见踪影！统一日志异常实现类： [java] view plain copy package com.pilelot.web.util; impor
Android SDK 国内镜像 BigBird2012 android sdk
一、镜像地址： 1、东软信息学院的 Android SDK 镜像，比配置代理下载快多了。配置地址， http://mirrors.neusoft.edu.cn/configurations.we#android 2、北京化工大学的： IPV4:ubuntu.buct.edu.cn IPV4:ubuntu.buct.cn IPV6:ubuntu.buct6.edu.cn
HTML无害化和Sanitize模块 bijian1013 JavaScript AngularJS Linky Sanitize
一.ng-bind-html、ng-bind-html-unsafe AngularJS非常注重安全方面的问题，它会尽一切可能把大多数攻击手段最小化。其中一个攻击手段是向你的web页面里注入不安全的HTML，然后利用它触发跨站攻击或者注入攻击。考虑这样一个例子，假设我们有一个变量存
[Maven学习笔记二]Maven命令 bit1129 maven
mvn compile compile编译命令将src/main/java和src/main/resources中的代码和配置文件编译到target/classes中，不会对src/test/java中的测试类进行编译 MVN编译使用 maven-resources-plugin:2.6:resources maven-compiler-plugin:2.5.1:compile &nbs
【Java命令二】jhat bit1129 Java命令
jhat用于分析使用jmap dump的文件，，可以将堆中的对象以html的形式显示出来，包括对象的数量，大小等等，并支持对象查询语言。 jhat默认开启监听端口7000的HTTP服务，jhat是Java Heap Analysis Tool的缩写 1. 用法： [hadoop@hadoop bin]$ jhat -help Usage: jhat [-stack <bool&g
JBoss 5.1.0 GA:Error installing to Instantiated: name=AttachmentStore state=Desc ronin47
进到类似目录 server/default/conf/bootstrap，打开文件 profile.xml找到： Xml代码<bean name="AttachmentStore" class="org.jboss.system.server.profileservice.repository.AbstractAtta
写给初学者的6条网页设计安全配色指南 brotherlamp UI ui自学 ui视频 ui教程 ui资料
网页设计中最基本的原则之一是，不管你花多长时间创造一个华丽的设计，其最终的角色都是这场秀中真正的明星——内容的衬托我仍然清楚地记得我最早的一次美术课，那时我还是一个小小的、对凡事都充满渴望的孩子，我摆放出一大堆漂亮的彩色颜料。我仍然记得当我第一次看到原色与另一种颜色混合变成第二种颜色时的那种兴奋，并且我想，既然两种颜色能创造出一种全新的美丽色彩，那所有颜色
有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。写一个函数实现。复杂度是什么。 bylijinnan java 算法面试
import java.util.Random; import java.util.Set; import java.util.TreeSet; /** * http://weibo.com/1915548291/z7HtOF4sx * #面试题#有一个数组，每次从中间随机取一个，然后放回去，当所有的元素都被取过，返回总共的取的次数。 * 写一个函数实现。复杂度是什么
struts2获得request、session、application方式 chiangfai application
1、与Servlet API解耦的访问方式。 a.Struts2对HttpServletRequest、HttpSession、ServletContext进行了封装，构造了三个Map对象来替代这三种对象要获取这三个Map对象，使用ActionContext类。 -----> package pro.action; import java.util.Map; imp
改变python的默认语言设置 chenchao051 python
import sys sys.getdefaultencoding() 可以测试出默认语言，要改变的话，需要在python lib的site-packages文件夹下新建： sitecustomize.py，这个文件比较特殊，会在python启动时来加载，所以就可以在里面写上： import sys sys.setdefaultencoding('utf-8') &n
mysql导入数据load data infile用法 daizj mysql 导入数据
我们常常导入数据！mysql有一个高效导入方法，那就是load data infile 下面来看案例说明基本语法： load data [low_priority] [local] infile 'file_name txt' [replace | ignore] into table tbl_name [fields [terminated by't'] [OPTI
phpexcel导入excel表到数据库简单入门示例 dcj3sjt126com PHP Excel
跟导出相对应的，同一个数据表，也是将phpexcel类放在class目录下，将Excel表格中的内容读取出来放到数据库中 <?php error_reporting(E_ALL); set_time_limit(0); ?> <html> <head> <meta http-equiv="Content-Type"
22岁到72岁的男人对女人的要求 dcj3sjt126com
22岁男人对女人的要求是：一，美丽，二，性感，三，有份具品味的职业，四，极有耐性，善解人意，五，该聪明的时候聪明，六，作小鸟依人状时尽量自然，七，怎样穿都好看，八，懂得适当地撒娇，九，虽作惊喜反应，但看起来自然，十，上了床就是个无条件荡妇。 32岁的男人对女人的要求，略作修定，是：一，入得厨房，进得睡房，二，不必服侍皇太后，三，不介意浪漫蜡烛配盒饭，四，听多过说，五，不再傻笑，六，懂得独
Spring和HIbernate对DDM设计的支持 e200702084 DAO 设计模式 spring Hibernate 领域模型
A：数据访问对象 DAO和资源库在领域驱动设计中都很重要。DAO是关系型数据库和应用之间的契约。它封装了Web应用中的数据库CRUD操作细节。另一方面，资源库是一个独立的抽象，它与DAO进行交互，并提供到领域模型的“业务接口”。资源库使用领域的通用语言，处理所有必要的DAO，并使用领域理解的语言提供对领域模型的数据访问服务。
NoSql 数据库的特性比较 geeksun NoSQL
Redis 是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库，并提供多种语言的API。目前由VMware主持开发工作。 1. 数据模型作为Key-value型数据库，Redis也提供了键（Key）和值（Value）的映射关系。除了常规的数值或字符串，Redis的键值还可以是以下形式之一： Lists （列表） Sets
使用 Nginx Upload Module 实现上传文件功能 hongtoushizi nginx
转载自： http://www.tuicool.com/wx/aUrAzm 普通网站在实现文件上传功能的时候，一般是使用Python，Java等后端程序实现，比较麻烦。Nginx有一个Upload模块，可以非常简单的实现文件上传功能。此模块的原理是先把用户上传的文件保存到临时文件，然后在交由后台页面处理，并且把文件的原名，上传后的名称，文件类型，文件大小set到页面。下
spring-boot-web-ui及thymeleaf基本使用 jishiweili spring thymeleaf
视图控制层代码demo如下： @Controller @RequestMapping("/") public class MessageController { private final MessageRepository messageRepository; @Autowired public MessageController(Mes
数据源架构模式之活动记录 home198979 PHP 架构活动记录数据映射
hello!架构一、概念活动记录（Active Record）：一个对象，它包装数据库表或视图中某一行，封装数据库访问，并在这些数据上增加了领域逻辑。对象既有数据又有行为。活动记录使用直截了当的方法，把数据访问逻辑置于领域对象中。二、实现简单活动记录活动记录在php许多框架中都有应用，如cakephp。 <?php /** * 行数据入口类 *
Linux Shell脚本之自动修改IP pda158 linux centos Debian 脚本
作为一名 Linux SA，日常运维中很多地方都会用到脚本，而服务器的ip一般采用静态ip或者MAC绑定，当然后者比较操作起来相对繁琐，而前者我们可以设置主机名、ip信息、网关等配置。修改成特定的主机名在维护和管理方面也比较方便。如下脚本用途为：修改ip和主机名等相关信息，可以根据实际需求修改，举一反三！ #!/bin/sh #auto Change ip netmask ga
开发环境搭建独浮云 eclipse jdk tomcat
最近在开发过程中，经常出现MyEclipse内存溢出等错误，需要重启的情况，好麻烦。对于一般的JAVA+TOMCAT项目开发，其实没有必要使用重量级的MyEclipse，使用eclipse就足够了。尤其是开发机器硬件配置一般的人。 &n

【论文翻译】【剪枝】Filter Pruning via Geometric Medianfor Deep Convolutional Neural Networks Acceleration

摘要

1.介绍

2.相关工作

3. 方法

3.1 前置内容

3.2. 基于规范的准则分析

3.3. 真实场景中的Norm统计

3.4 通过几何中值进行过滤修剪

3.5. 理论和现实加速

3.5.1理论加速

3.5.2 实际加速

4.实验

4.1实验设置

4.2.单分支网络修剪

4.3.多分支网络修剪

4.4.消融研究

4.5.特征图可视化

5.结论和未来工作

你可能感兴趣的:(#,剪枝,剪枝,深度学习,cnn)