花卷汤圆

（四十八：2021.09.09）《关于模型压缩和加速的调查【2017】》

《关于模型压缩和加速的调查（A Survey of Model Compression and Acceleration for Deep Neural Networks）》

讲在前面
摘要
一、介绍
二、参数修剪和量化
- A. 量化和二值化
- B.网络裁剪
- C.设计结构矩阵
三、低秩近似和稀疏性
四、传递/紧凑卷积滤波器
五、知识蒸馏
六、其他方法
七、基准、评估和数据库
八、挑战和未来的工作
- A.一般性建议
- B.技术挑战
- C.未来可能的方向
致谢

讲在前面

一. 真的太糟心了，不断被别人问到会不会模型的压缩和剪枝？？？我现在不会你怎么知道我过一周会不会呢？所以你会不会什么东西本就是一个毫无意义的问题，整的这个东西多高端多难一样，非要激起我内心的学习热情，现在，爷要把这个东西完整的玩一遍。；
二. 当你从零开始接触一个东西的时候，第一步就是做一个survey，而survey的第一步就是看survey的论文；
三. 我设计了几种字体颜色用于更加醒目地表现关键的思想和主题：
- 红色表示尚未理解透彻的一些概念
- 蓝色表示对原来的理解做的一些修改或补充
- 绿色表示此处需要参考的论文其他部分
- 橙色表示本文的重要关键字
- 紫色表示后续更新的内容
- ~~我会用删除线将自己曾经不到位的理解进行删除~~
四.查询论文索引请根据原论文：https://arxiv.org/abs/1710.09282

摘要

深度神经网络 (DNN) 最近在许多视觉识别任务中取得了巨大成功。然而，现有的深度神经网络模型计算成本高且内存密集，阻碍了它们在内存资源低的设备或具有严格延迟要求的应用程序中的部署。因此，一个自然的想法是在不显着降低模型性能的情况下在深度网络中进行模型压缩和加速。过去五年，该领域取得了巨大进展。在本文中，我们回顾了最近用于压缩和加速 DNN 模型的技术。一般来说，这些技术分为四类：参数修剪和量化、低秩分解、转移/压缩卷积滤波器和知识蒸馏。首先介绍参数修剪和量化的方法，然后介绍其他技术。对于每个类别，我们还提供有关性能、相关应用程序、优缺点的深入分析。然后我们介绍一些最近成功的方法，例如动态容量网络和随机深度网络。之后，我们调查了评估矩阵、用于评估模型性能的主要数据集和最近的基准测试工作。最后，我们总结了本文，讨论剩余的挑战和未来工作的可能方向。

一、介绍

近年来，深度神经网络最近受到了很多关注，被应用于不同的应用程序，并在许多任务中取得了显着的精度提升。这些工作依赖于具有数百万甚至数十亿参数的深度网络，而具有非常高计算能力的 GPU 的可用性对其成功起着关键作用。例如，Krizhevsky 等人的工作【1】在 2012 年 ImageNet 挑战赛中取得突破性成果，该网络包含 6000 万个参数，具有五个卷积层和三个全连接层。通常，使用 NVIDIA K40 机器在 ImagetNet 数据集上训练整个模型需要两到三天的时间。另一个例子是LFW 数据集的顶面验证结果是通过包含数亿个参数的网络获得的，使用卷积、局部连接和完全连接层的混合【2】，【3】。这样同样花费时间，在仅依赖于全连接层的架构中，参数数量可以增长到数十亿【4】。
随着考虑具有更多层和节点的更大的神经网络，降低它们的存储和计算成本变得至关重要，尤其是对于一些实时应用，例如在线学习和增量学习。此外，近年来虚拟现实、增强现实和智能可穿戴设备取得了重大进展，为研究人员解决将深度学习系统部署到资源有限（例如内存、CPU、能量、带宽）。高效的深度学习方法可以对分布式系统、嵌入式设备和人工智能 FPGA 产生重大影响。例如，具有 50 个卷积层的 ResNet-50在处理图像时需要超过 95MB 的内存用于存储和超过 38 亿次浮点乘法。丢弃一些冗余权重后，网络仍然照常工作，但节省了 75% 以上的参数和 50% 的计算时间。对于手机、FPGA等只有几兆资源的设备，如何压缩它们上使用的模型也很重要。
实现这些目标需要来自多个学科的联合解决方案，包括但不限于机器学习、优化、计算机架构、信号处理和硬件设计。在本文中，我们回顾了最近在压缩和加速深度神经网络方面的工作，这些工作引起了深度学习社区的大量关注，并且在过去几年中已经取得了很多进展。根据它们的特性，我们将这些方法分为四类：参数修剪和量化、低秩分解、转移/压缩卷积滤波器和知识蒸馏。
基于参数修剪和量化的方法探索模型参数中的冗余，并尝试去除冗余和不重要的参数。基于低秩分解的技术使用矩阵/张量分解来估计 DNN 的信息参数。基于转移/紧凑卷积滤波器的方法设计特殊结构的卷积滤波器以减少参数空间并节省存储/计算。基于知识蒸馏的方法学习蒸馏模型并训练更紧凑的神经网络以重现更大网络的输出。
在表1中，我们简短的摘要了这些方法的类型。参数修剪和量化、低秩分解和知识蒸馏方法可以部署在具有卷积层和全连接层的 DNN 模型中，实现不错的性能。另一方面，使用转移/压缩滤波器的方法仅适用于卷积层。基于低秩分解和转移/压缩过滤器的方法提供了端到端的管道，并且可以在 CPU/GPU 环境中轻松实现。参数修剪和量化使用不同的策略，例如二进制编码和稀疏约束来执行任务。
考虑到训练协议，基于参数剪枝/量化和低秩分解的模型可以从预先训练的模型中提取或从头开始训练。而转移/压缩过滤器和知识蒸馏模型只能支持从头开始的训练。这些方法中的大多数都是独立设计的，并且相互补充。例如，传输层和参数修剪和量化可以一起部署。另一个例子是，模型量化和二值化可以与低秩近似一起使用，以实现进一步的压缩/加速。我们将在以下各节中详细描述它们的特性，并分析其优缺点。
表1：

二、参数修剪和量化

早期的工作表明，网络修剪和量化在降低网络复杂性和解决过拟合问题方面是有效的【6】。在发现剪枝可以为神经网络带来正则化从而提高泛化能力后，压缩 DNN 得到了广泛的研究。这些技术可以进一步映射为三个子类别：量化和二值化、网络剪枝和结构矩阵。

A. 量化和二值化

网络量化通过减少表示每个权重所需的位数来压缩原始网络。龚等人【6】和吴等人【7】将 k-means标量量化应用于参数值。万豪克等人【8】表明，参数的 8 位量化可以显着提高速度，同时将精度损失降至最低。【9】中的工作在基于随机舍入的 CNN 训练中使用 16 位定点表示，这显着减少了内存使用和浮点运算，而分类精度损失很小。
【10】中提出的方法使用权重共享对链路权重进行量化，然后将霍夫曼编码应用于量化的权重以及码本以进一步降低速率。如图1所示，它首先通过正常的网络训练学习连接，然后修剪小权重连接。最后，重新训练网络以学习剩余稀疏连接的最终权重。这项工作在所有基于量化的方法中取得了最先进的性能。在【11】中，表明 Hessian 权重可用于衡量网络参数的重要性，并提出将 Hessian 加权量化误差平均到聚类参数的平均值最小化。量化是一种非常有效的模型压缩和加速方式。
图1：

在每个权重的 1 位表示的极端情况下，即二进制权重神经网络。主要思想是在模型训练期间直接学习二进制权重或激活。有几项工作直接使用二进制权重训练 CNN，例如 BinaryConnect【12】、BinaryNet【13】和 XNOR【14】。【15】中的一项系统研究表明，经过反向传播训练的网络可以对特定的权重失真（包括二进制权重）具有弹性。
讨论：在处理 GoogleNet 等大型 CNN 时，二进制网络的准确性显着降低。这种二元网络的另一个缺点是现有的二值化方案基于简单的矩阵近似，而忽略了二值化对精度损失的影响。为了解决这个问题.【16】中的工作提出了一种具有对角 Hessian 近似的近端牛顿算法，即直接最小化与二元权重相关的损失。【17】中的工作通过随机二值化权重并将隐藏状态计算中的乘法转换为显着变化，减少了训练阶段浮点乘法的时间。赵等人【18】提出半波高斯量化来学习低精度网络，取得了可喜的结果。

B.网络裁剪

早期的修剪方法是偏置权重衰减【19】。 Optimal Brain Damage【20】和 Optimal Brain Surgeon【21】方法基于损失函数的 Hessian 减少了连接数。他们的工作表明，这种剪枝比基于幅度的剪枝（例如权重衰减方法）具有更高的准确性。
这个方向的后续趋势是在预训练的 DNN 模型中修剪冗余的、无信息的权重。例如，Srinivas 和 Babu【22】探索了神经元之间的冗余，并提出了一种无数据修剪方法来去除冗余神经元。韩等人【23】提出减少整个网络中参数和操作的总数。陈等人【24】提出了一种 HashedNets 模型，该模型使用低成本哈希函数将权重分组到哈希桶中以进行参数共享。【25】中的深度压缩方法去除冗余连接并量化权重，然后使用霍夫曼编码对量化的权重进行编码。在【26】中，提出了一种基于软权重共享的简单正则化方法，它在一个简单的训练过程（重新训练或者微调）中包括量化和剪枝。上述修剪方案通常会在 DNN 中产生连接修剪。
人们对训练具有稀疏约束的紧凑型 DNN 也越来越感兴趣。这些稀疏约束通常在优化问题中作为 L0 或 L1 范数正则化器引入。【26】中的工作对卷积滤波器施加了组稀疏约束以实现结构化脑损伤，即以组方式修剪卷积核的条目。在【27】中，在训练阶段引入了神经元上的群稀疏正则化器，以学习具有减少滤波器的紧凑型 CNN。温等人。【28】在每一层上添加了一个结构化的稀疏正则化器，以减少琐碎的过滤器、通道甚至层。在过滤器级修剪中，上述所有工作都使用了 L1 或 L2 范数正则化器。【29】中的工作使用 L1正则来选择和修剪不重要的过滤器。
讨论：使用网络修剪存在一些问题。首先，使用 L1 或 L2 正则化进行剪枝需要比一般方法更多的迭代来收敛。此外，所有修剪标准都需要手动设置层的灵敏度，这需要对参数进行微调，并且对于某些应用程序来说可能很麻烦。最后，网络剪枝通常能够减少模型大小但不能提高效率（训练或推理时间）。

C.设计结构矩阵

在包含全连接层的架构中，探索全连接层中参数的这种冗余至关重要，这通常是因存消耗的瓶颈。这些网络层使用非线性变换 $f (x, M) = σ (M x)$ ，其中 $σ (\cdot)$ 是元素级非线性算子， $x$ 是输入向量， $M$ 是 $m \times n$ 参数矩阵【30】。当 M 是一个大的一般稠密矩阵时，在 $O (m n)$ 时间内存储 $m n$ 个参数和计算矩阵向量乘积的成本。因此，修剪参数的一种直观方法是将 $x$ 作为参数化结构矩阵强加。可以使用比 $m n$ 少得多的参数来描述的 $m \times n$ 矩阵称为结构化矩阵。通常，该结构不仅应该降低内存成本，而且还应通过快速矩阵向量乘法和梯度计算显着加速推理和训练阶段。
沿着上面所说的方向，【31】、【32】的工作提出了一种基于循环预测的简单而有效的方法，同时保持有竞争力的错误率。给出一个向量 $r$ :
$r = (r_0, r_1,..., r_{d-1})$
和一个 $R\in{R^{d\times{d}}}$ 循环矩阵:

因此内存成本变为 $O (d)$ 而不是 $O (d 2)$ 。这种循环结构还可以使用快速傅立叶变换 (FFT) 来加速计算。给定一个 $d$ 维向量 $r$ ，方程中的上述（1）中的1 层循环神经网络的时间复杂度为 $O (d * l o g d)$ 。
在【33】中，引入了新颖的自适应快餐变换来重新参数化完全连接层的矩阵向量乘法。自适应快餐变换矩阵 $R ∈R_{n×d}$ 被定义为:
$R = S H G Π H B$
其中 $S$ 、 $G$ 和 $B$ 是随机对角矩阵。 $Π ∈ {(0,1)}^{d×d}$ 是随机置换矩阵， $H$ 表示 Walsh-Hadamard 矩阵。使用自适应快餐变换重新参数化具有 d 个输入和 n 个输出的完全连接层，分别把存储和计算成本从 O(nd) 减少到 O(n) 和从 O(nd) 减少到 O(nlog d) 。
【30】中的工作显示了结构矩阵理论中简约新概念的有效性。他们提出的方法可以扩展到各种其他结构化矩阵类，包括与多维卷积【35】相关的块和多级 Toeplitz-like 【34】矩阵。遵循这个想法，【36】为 CNN 提出了一个通用的结构化高效线性层。
缺点：这种方法的一个问题是结构约束通常会损害性能，因为约束可能会给模型带来偏差。另一方面，如何找到合适的结构矩阵是困难的。没有理论上的方法可以推导出来。

三、低秩近似和稀疏性

卷积操作贡献了深度 DNN 中的大部分计算，那么减少了卷积层将提高压缩率以及整体加速。卷积核可以看作是一个 3D 张量。基于张量分解的思想是由直觉上推导出来的，即 3D 张量中存在结构空间。关于全连接层，可以将其视为 2D 矩阵（或 3D 张量），低秩也可以提供帮助。
使用低秩滤波器来加速卷积由来已久，例如高维 DCT（离散余弦变换）和使用张量积的小波系统分别由一维 DCT 变换和一维小波构建。 Rigamonti 等人介绍了学习可分离的一维滤波器。【37】使用字典学习方法。对于一些简单的 DNN 模型，【38】中提出了一些卷积核的低秩逼近和聚类方案。他们在单个卷积层上实现了 2 倍的加速，而分类准确度下降了 1%。【39】中的工作建议使用不同的张量分解方案，报告了 4.5 倍的加速，而文本识别的准确度下降了 1%。
低秩近似是逐层完成的。一层的参数完成后固定，上面的层根据重构误差准则进行微调。这些是用于压缩 3D 卷积层的典型低阶方法，如 图 2 所示。按照这个方向，在【40】中为内核张量提出了典型的 Polyadic (CP) 分解。他们的工作使用非线性最小二乘法来计算 CP 分解。在【41】中，提出了一种计算低秩张量分解的新算法，用于从头开始训练低秩约束CNN。它使用批量归一化 (BN) 来转换内部隐藏单元的激活。一般来说，【41】（BN Low-rank）中的CP和BN分解方案都可以用来从头开始训练CNN。但是，它们之间几乎没有区别。例如，在 CP 分解中找到最好的低秩近似是一个病态问题，有时可能不存在最好的 rank-K（K 是秩数）近似。而对于BN方案，分解总是存在的。我们对表2 中显示的两种方法进行了简单的比较。实际加速和压缩率用于衡量它们的性能。
表2:

正如我们之前提到的，全连接层可以被视为一个 2D 矩阵，因此上述方法也可以应用于那里。有几个关于在全连接层中利用低秩的经典著作。例如，Misha 等人【42】使用低秩方法减少了深度模型中动态参数的数量。【43】探索了用于声学建模的 DNN 中最终权重层的低秩矩阵分解。在【3】中，Lu 等人采用截断的 SVD（奇异值分解）来分解全连接层，以设计紧凑的多任务深度学习架构。
**讨论：**基于低秩近似的方法对于模型压缩和加速很简单。然而，实现并不容易，因为它涉及分解操作，这在计算上是昂贵的。另一个问题是当前的方法逐层执行低秩逼近，因此无法执行全局参数压缩，这很重要，因为不同层持有不同的信息。最后，与原始模型相比，分解需要大量的模型重新训练才能实现收敛。

四、传递/紧凑卷积滤波器

依据特征表达对输入图像的平移不变性这个特性，CNN 被证明是参数有效的，这是成功训练非常深的模型而不会出现严重过拟合的关键。尽管目前缺乏强有力的理论，但大量经验证据支持了平移不变性和卷积权重共享对于良好的性能预测都很重要这个观点。使用传递卷积滤波器来压缩 CNN 模型的想法受到【44】中最近工作的启发，该工作引入了等变群论。设 $x$ 为输入， $Φ (\cdot)$ 为网络或层， $T (\cdot)$ 为变换矩阵。等价的概念定义为：

表明通过变换 $T (\cdot)$ 变换输入 $x$ 然后将其传递到网络或层 $Φ (\cdot)$ 应该给出与首先通过网络映射 x 然后变换表示相同的结果。请注意，在方程式(10)中，变换 $T (\cdot)$ 和 $T^{'} (\cdot)$ 不一定相同，因为它们对不同的对象进行操作。根据这个理论，对层或滤波器 $Φ (\cdot)$ 应用变换来压缩整个网络模型是合理的。根据经验观察，深度 CNN 还可以通过将特定变换 $T (\cdot)$ 应用于一小组基础滤波器来使用大量卷积滤波器，因为它可以充当模型的正则化器。
遵循这个方向，最近提出了许多重新设计以从一组基础构建卷积层过滤器【44】–【47】。它们的共同点是变换 $T (\cdot)$ 属于仅在卷积滤波器的空间域中操作的函数族。例如，【46】中的工作发现 CNN 的较低卷积层学习了冗余滤波器来提取输入信号的正负相位信息，并将 $T (\cdot)$ 定义为简单的否定函数：

其中 $W_x$ 是基础卷积滤波器， $W^{−}_x$ 是由激活与 $W_x$ 的激活相反并在最大池化操作后选择的移位组成的滤波器。通过这样做，【46】中的工作可以轻松地在所有卷积层上实现 2 倍的压缩率。还表明，否定变换充当强正则化器以提高分类精度。直觉是，具有成对正负约束的学习算法可以产生有用的卷积滤波器而不是冗余滤波器。在【47】中，观察到来自卷积核的响应幅度在网络中具有广泛多样的模式表示，用单一阈值丢弃较弱的信号是不合适的。因此，提出了一种多偏置非线性激活函数，以低计算成本在特征空间中生成更多模式。变换 $T (\cdot)$ 定义为：

其中 $δ$ 是多偏差因子。【48】中的工作考虑了 90° 的倍数旋转和水平/垂直翻转的组合：

其中 $W^{T_θ}$ 是将原始滤波器旋转角度θ∈{90,180,270}的变换矩阵。在【44】中，变换被推广到从数据中学习到的任何角度，θ直接从数据中获得。作品【48】和【44】都可以达到很好的分类性能。
【45】中的工作将 $T (\cdot)$ 定义为应用于 2D 滤波器的一组平移函数：

其中 $T (\cdot, x, y)$ 表示 $(x, y)$ 沿其空间维度对第一个操作数的平移，并在边界处进行适当的零填充以保持形状。所提出的框架可用于:

作为 maxout 网络的正则化版本提高分类精度；
通过灵活地改变其架构来压缩网络来实现参数效率。

表3 使用 VGGNet（16 层）作为基线模型，简要比较了不同方法与迁移卷积滤波器的性能。结果报告在 CIFAR-10 和 CIFAR-100 数据集上，错误率为 Top-5。据观察，它们可以减少参数，而分类精度几乎没有下降或完全没有下降。
表3：

讨论：对于将变换约束应用于卷积滤波器的方法，有几个问题需要解决。首先，这些方法可以在宽/扁平架构（例如，VGGNet、AlexNet）上实现有竞争力的性能但不是薄/深的（例如，ResNet）。其次，迁移假设有时太强而无法指导学习，导致某些情况下结果不稳定。
使用紧凑滤波器进行卷积可以直接降低计算成本。关键思想是用紧凑块替换松散和过参数的过滤器以提高速度。在【49】中使用了将3×3卷积分解为两个1×1卷积，取得了显着的加速。 SqueezeNet 【50】被提议用 1 × 1 卷积代替 3 × 3 卷积，这创建了一个具有约 50 个参数的紧凑型神经网络。 MobileNets 【51】中也采用了类似的技术。

五、知识蒸馏

据我们所知，利用知识转移（KT）来压缩模型是由 Caruana 等人首先提出的【52】。他们训练了一个带有标记伪数据的强分类器的压缩/集成模型，并重现了原始更大网络的输出。但这项工作仅限于浅层模型。这个想法最近在【53】中被用作知识蒸馏 (KD)，以将深层和广泛的网络压缩成较浅的网络，其中压缩模型模仿了复杂模型学习的功能。基于 KD 的方法的主要思想是通过softmax 学习类分布输出，将知识从大型教师模型转变为小型教师模型。
【54】中的工作引入了 KD 压缩框架，该框架通过遵循学生-教师范式来简化深度网络的训练，其中学生根据教师输出的软化版本受到惩罚。该框架将一组教师网络压缩成一个具有相似深度的学生网络。学生接受了预测输出和分类标签的训练。尽管它很简单，但 KD 在各种图像分类任务中表现出令人鼓舞的结果。【55】中的工作旨在通过利用深度神经网络来解决网络压缩问题。它提出了一种训练细而深的网络的方法，称为 FitNets，以压缩宽而浅（但仍然深）的网络。该方法扩展了思想，以允许更薄和更深的学生模型。为了从教师网络的中间表示中学习，FitNet 让学生模仿教师的完整特征图。然而，这种假设过于严格，因为教师和学生的能力可能相差很大。
上述所有方法都在 MNIST、CIFAR-10、CIFAR-100、SVHN 和 AFLW 基准数据集上进行了验证，实验结果表明这些方法匹配或优于教师的表现，同时需要明显更少的参数和乘法。
沿着这个提炼知识的方向有几个扩展。【56】中的工作训练了一个参数化学生模型来近似蒙特卡罗老师。所提出的框架使用在线训练，并使用深度神经网络作为学生模型。与之前使用软化标签概率表示知识的工作不同，【57】使用更高隐藏层中的神经元表示知识，它保留了与标签概率一样多的信息，但更紧凑。【58】中的工作通过将知识从以前的网络即时转移到每个新的更深或更广的网络来加速实验过程。这些技术基于神经网络规范之间的功能保留转换的概念。扎戈鲁伊科等。【59】提出了注意力转移（AT）来放松 FitNet 的假设。他们转移了作为完整激活摘要的注意力图。
讨论：基于 KD 的方法可以使更深的模型更浅，并有助于显着降低计算成本。但是，也有一些缺点。其中之一是 KD 只能应用于具有 softmax 损失函数的任务，这阻碍了它的使用。另一个缺点是，与其他类型的方法相比，基于 KD 的方法通常获得的性能较低。

六、其他方法

我们首先总结了利用类注意力机制【60】的工作，该机制可以通过学习选择性地关注或“关注”几个与任务相关的输入区域来显着减少计算。在【61】中，引入了动态深度神经网络 (D2NN)，这是一种前馈深度神经网络，它根据输入选择并执行 D2NN 神经元的子集。动态容量网络 (DCN) 【62】结合了低容量的小子网和高容量的大子网。注意力机制用于引导高容量子网络关注与任务相关的区域。通过这样做，模型的大小已经显着减小。按照这个方向，【63】中的工作引入了条件计算的思想，它只通过一个稀疏门控的专家混合层（MoE）计算一些重要神经元的梯度。
还有其他尝试通过用全局平均池化【45】、【64】替换全连接层来减少神经网络的参数数量。通过采用这种思想，诸如 GoogleNet 或 Network in Network 之类的网络架构可以在多个基准测试中获得最先进的结果。然而，这些架构并未充分优化网络内部计算资源的利用率。 Szegedy 等人【64】注意到了这个问题。激励他们增加网络的深度和宽度，同时保持计算预算不变。
【65】中的工作针对具有空间变化计算时间的基于残差网络的模型，称为随机深度，这使看似矛盾的设置能够训练浅层网络并在测试时使用深度网络。它从非常深的网络开始，而在训练期间，对于每个小批量，随机丢弃一个层子集并使用身份函数绕过它们。按照这个方向，【66】中的工作提出了一个具有随机深度的金字塔残差网络。在【67】中，吴等人。提出了一种方法，可以学习在推理过程中动态选择要执行的深层网络的哪些层，以最好地减少总计算量。维特等人。利用具有自适应推理图的卷积网络以根据输入图像自适应地定义其网络拓扑【68】。
其他减少卷积开销的方法包括使用基于 FFT 的卷积【69】和使用 Winograd 算法【70】的快速卷积。翟等人【71】提出了一种称为随机空间采样池化的策略，它通过更通用的随机版本加速池化操作。赛丹等人基于逆双边滤波器【72】的思想，提出了一种新的卷积神经网络池化层，称为细节保留池化（DPP）。这些工作只是为了加速计算而不是减少内存存储。 MobileNetV2 【73】提出了新颖的反向残差结构。

七、基准、评估和数据库

在过去的几年中，深度学习社区在基准测试方面做出了巨大的努力。用于 CNN 压缩和加速的最著名模型之一是 Alexnet【1】，它偶尔被用于评估压缩性能。其他流行的标准模型包括 LeNets 【74】、All-CNN-nets 【75】和许多其他模型。 LeNet-300-100 是一个全连接网络，有两个隐藏层，每个隐藏层有 300 和 100 个神经元。 LeNet-5 是一个卷积网络，具有两个卷积层和两个全连接层。最近，越来越多的最先进的架构被用作许多工作的基线模型，包括网络中的网络 (NIN) 【76】、VGG 网络【77】和残差网络 (ResNet) 【78】。表4总结了几种典型压缩方法中常用的基线模型。
表4：

衡量模型压缩和加速质量的标准标准是压缩率和加速率。假设 $a 是$ 原始模型 $M$ 的参数个数， $a^∗$ 是压缩模型 $M^∗$ 的参数个数，则 $M^∗$ 对 $M$ 的压缩率 $α (M, M *)$ 为：

另一个广泛使用的衡量标准是多篇论文【31】、【36】中定义的索引空间节省，如：

其中 $β(M,M^∗)$ 是定义的空间节省率。
类似地，给定 $M$ 的运行时间 $s$ 和 $M^∗$ 的 $s^∗$ ，加速率 $δ(M,M^∗)$ 定义为:

大多数工作使用每个 epoch 的平均训练时间来衡量运行时间，而在【31】、【36】中，使用平均测试时间。通常，压缩率和加速率高度相关，因为较小的模型通常会导致训练和测试阶段的计算速度更快。
一个好的压缩方法有望以更小的参数和更少的计算时间实现与原始模型几乎相同的性能。然而，对于具有不同 CNN 设计的不同应用，参数大小和计算时间之间的关系可能会有所不同。例如，观察到对于具有全连接层的深度CNN，大部分参数都在全连接层中；而对于图像分类任务，浮点运算主要在前几个卷积层，因为每个过滤器都与整个图像进行卷积，通常在开始时非常大。因此，网络的压缩和加速应该针对不同的应用程序关注不同类型的层。

八、挑战和未来的工作

我们总结了最近在压缩和加速深度神经网络 (DNN) 方面的努力。在这里，我们将讨论有关如何选择不同压缩方法、技术挑战和未来工作可能的解决方案的更多细节。

A.一般性建议

没有黄金标准来衡量哪种方法最好。如何选择合适的方法实际上取决于应用程序和要求。以下是我们可以提供的一些一般性建议：

1.如果应用程序需要来自预训练深度网络的压缩模型，您可以选择修剪和量化或基于低秩分解的方法。如果您的问题需要端到端的解决方案，则应考虑使用低秩和转移卷积滤波器方法。
2.在特定领域（例如医学图像）中的应用，具有人类先验的方法（例如转移的卷积滤波器、结构矩阵）有时会有好处。例如，在进行医学图像分类时，迁移卷积滤波器可以很好地工作，因为医学图像（如器官）确实具有旋转变换属性。
3.修剪和量化的方法通常会给出合理的压缩率，同时不会损害准确性。因此对于需要稳定模型性能的应用程序，最好利用剪枝和量化。
4.如果您的应用涉及中小型数据集或需要显着提高效率，您可以尝试知识蒸馏方法。压缩的学生模型可以利用从教师模型转移知识的好处，在数据集不大时实现稳健的性能。
5.正如我们之前提到的，这些上述技术是正交的。将其中的两个或三个组合以最大化增益是合理的。对于一些特定的应用，比如物体检测，它需要卷积层和全连接层，你可以用基于低秩的方法压缩卷积层，用修剪技术压缩全连接层。

B.技术挑战

我们简单摘要了面临的挑战：

1.大多数当前最先进的方法都建立在精心设计的 CNN 模型上，这些模型改变配置（例如，网络架构、超参数）的自由度有限。为了处理更复杂的任务，未来的工作应该提供更合理的方式来配置压缩模型。
2.各种小型平台（例如，移动、机器人、自动驾驶汽车）中的硬件限制仍然是阻碍深度 CNN 扩展的主要问题。如何充分利用有限的计算资源，以及如何为此类平台设计特殊的压缩方法，仍然是需要解决的挑战。
3.修剪是压缩和加速 CNN 的有效方法。当前的修剪技术主要是为了消除神经元之间的连接。另一方面，剪枝通道可以直接减小特征图宽度，将模型缩小为更薄的模型。它是有效的，但也具有挑战性，因为移除通道可能会显着改变下一层的输入。
4.正如我们之前提到的，结构矩阵和迁移卷积滤波器的方法将先验人类知识强加给模型，这可能会显着影响性能和稳定性。研究如何控制这些先验知识的影响至关重要。
5.知识蒸馏的方法提供了许多好处，例如无需特殊硬件或实现即可直接加速模型。仍然值得开发基于 KD 的方法并探索如何提高它们的性能。
6.尽管这些压缩方法取得了巨大的成就，但黑盒机制仍然是采用的主要障碍。例如，为什么一些神经元/连接被修剪并不清楚。探索知识的可解释性仍是一项重要挑战。

C.未来可能的方向

为了解决超参数配置问题，我们可以依靠最近的神经架构搜索策略【79】, 【80】。该框架提供了一种机制，允许算法自动学习如何在感兴趣的问题中利用结构。在【81】中已经尝试利用强化学习来有效地对设计空间进行采样并改善模型压缩。
关于CNNs在不同硬件平台上的使用，提出一些硬件感知的方法是一个方向。王等人【82】提出了硬件感知自动量化 (HAQ)，以在设计循环中获取硬件加速器的反馈。可以应用类似的想法使 CNN 更适用于不同的平台。【83】中的工作直接学习大规模目标任务的架构和基于目标硬件的性能。
通道修剪在 CPU 和 GPU 上都提供了效率优势，因为不需要特殊的实现。但处理输入配置也具有挑战性。一种可能的解决方案是使用基于训练的通道修剪方法【84】，该方法侧重于在训练期间对权重施加稀疏约束。此外，对于深度 CNN 而言，从头开始训练此类方法的成本很高。在【85】中，作者提供了一种迭代的两步算法来有效地修剪每一层中的通道。【86】中的工作将缩放因子与每个通道相关联，并在训练期间对这些缩放因子进行正则化以自动识别不重要的通道。刘等人【87】表明，修剪过的架构本身更为重要，修剪可以用作架构搜索范式。
在教师模型中探索新类型的知识并将其转移到学生模型对于知识蒸馏 (KD) 方法很有用。与直接减少和传递参数不同，传递神经元的选择性知识可能会有所帮助。一种选择是推导出一种方法来选择与任务相关的基本神经元【88】、【89】。最近，在【90】中尝试了对比损失而不是 KL 散度进行蒸馏。对于具有卷积滤波器和结构矩阵的方法，我们可以得出结论，变换位于仅对空间维度进行运算的函数族中。因此，为了解决强加的先验问题，一个解决方案是在两个方面提供上述方法的概括：

与其将变换限制为属于一组预定义的变换，不如让它成为应用于 2D 过滤器或矩阵
与所有模型参数共同学习转换。

除了图像分类任务，人们也在其他任务中调整压缩模型【73】、【91】、【92】。还有一些关于深度自然语言模型的工作【93】、【94】。我们希望看到更多针对具有更大深度网络的应用程序（例如，视频和图像帧【95】、【96】、视觉 + 语言【97】和 GANs 【98】、【99】）的工作。

致谢

作者要感谢审稿人和更广泛的社区对本次调查的反馈。特别感谢清华大学自动化系赵虹对论文修改的帮助。

你可能感兴趣的:(模型压缩和量化,深度学习,神经网络)

你不该在一个封闭的世界麻木独处卓夫文暄
今天你又一次让自己陷入死穴人生的停滞和翻篇都在于自己你己经没有出任何差错的资本和代价出门一把锁进门一盏灯塑造自己的过程很疼但最终你能收获一个更好的自己时刻警记出门时的钥匙随身物品自身安全按时吃饭营养均衡保持清醒健康的头脑只有尊重自己的生命克制自己的欲望才能让你自己的生命更安全更有质量你不该在一个封闭的世界麻木独处你要自律自强自爱自我警醒的方式去演绎自我的人生时光
记录决策理由
作者：蒂莫西·海伊（TimothyHigh）在软件开发社区，对于文档尤其是关于软件自身设计的文档的价值，争论颇多。分歧一般集中于两处，一处是“详细的前期设计（bigupformdesign）”的有效价值，另一处则是使设计文档和不断变化的代码库保持同步的难易程度。记录软件架构决策理由的文档，长期有用，又无须为之付出过多维护精力，具有很高的投资回报价值。正如马克·理查兹（MarkRichards）在《
七里香不较劲的智慧
有些诗，曾以为读懂了，多年后才知当年终究是错了。还记得当年读余光中先生的《乡愁》时，总觉得虽然文字够美，但“乡愁是一方矮矮的坟墓，我在外头，母亲在里头”却未免太伤感了。直到自己也经历过了，才明白乡愁正是这般的苦楚。和余光中先生的《乡愁》一样，《七里香》同样是思乡诗的代表作，它的作者是席慕蓉。在很多人眼里，席慕蓉是一个爱情诗的高手，她的情诗《一棵开花的树》、《莲的心事》等都是现代诗中的精品。但事实上
生如山歌 06 山毛读书
我慢慢地适应了这里的工作，原来一直只会讲四川话的我，也开始讲起普通话来。只是这里和学校大山是完全不一样的两个世界，我再也不能像以前那样自由自在，想说什么就说什么，想哭想闹就随我自己了。原本想说的话，等转换成普通话就不想说出口了，原本成天笑嘻嘻和周边的人打着招呼的，变成现在只是略为点点头，那个没心没肺大胆无畏的我呀，留在了学校，留在了大山里。来到桂林这里的，是一个笑和说话都不自在的自己。每天的工作没
计算机毕业设计——springboot的准妈妈孕期交流平台
**欢迎来到琛哥的技术世界！**博主小档案：琛哥，一名来自世界500强的资深程序猿，毕业于国内知名985高校。技术专长：琛哥在深度学习任务中展现出卓越的能力，包括但不限于java、python等技术。近年来，琛哥更是将触角延伸至AI领域，对于机器学习、自然语言处理、智能推荐等前沿技术都有独到的见解和实践经验。博客亮点：琛哥坚信“授人以渔胜于授人以鱼”，因此我的博客中，你不仅可以找到关于技术的深入解
从“百猴效应”说起神奇星辰
从“百猴效应”说起某日，在网上看到一篇文章，讲的是通过量子纠缠说明宇宙只是其实都早已存储于人类大脑之中，当人类知识水平到了那个阶段，已存在的知识自然就解锁了，这让我看了很是兴奋，原来高深的知识早就在我们的大脑中存储好了，只是等待你来开发而已。好吧，如何开发人类大脑和如何提高人类知识水平，尽快和宇宙接轨这种事，不是我所能弄明白和做得到的，通读文章像量子纠缠这类对于我来说很高大上的词汇我都没弄太明白，
LabVIEW水质在线监测系统 LabVIEW开发 LabVIEW开发案例 LabVIEW知识 LabVIEW开发案例网络
本系统基于LabVIEW和ZigBee技术构建，针对传统水质监测依赖人工采样、实时性差、成本高及易二次污染等问题，实现水温、pH值等参数的实时采集、无线传输、可视化监测及异常预警。系统通过传感器节点采集数据，经ZigBee网络传输至LabVIEW上位机，结合GSM模块实现手机远程预警，有效提升监测效率与及时性。应用场景适用于流域水体、城市饮用水源地、工业排污口及农业灌溉水源等场景。这些场景需长期、
Docker进阶 - 2. Dockerfile 常用保留字简介 Aaron_neil Linux #Docker docker 运维 linux 容器 DockerFile
目录1.FROM2.MAINTAINER3.RUN4.EXPOSE5.WORKDIR6.USER7.ENV8.VOLUME9.COPY10.ADD11.CMD12.ENTRYPOINT13.CMD和RUN命令的区别本篇文章的讲解截屏示例基于tomcat的Dockerfile：tomcat/9.0/jdk8/openjdk/Dockerfile1.FROM基础镜像，指当前镜像是基于哪个镜像，指定一个
集成灶哪个牌子好？哪个品牌性价比高质量好? 日常购物小技巧
大家好，我是花桃APP商品推荐官：美美，今天给各位朋友们说说集成灶哪个牌子好？哪个品牌性价比高质量好?集成灶十大品牌有亿田、帅丰、板川、火星人等品牌。这些品牌目前市场销售情况都非常不错。如果大家要选购一台质量好，性价比高的集成灶，不妨可以去线下专卖店看一下这几个品牌。我们知道集成灶最大的优势是可以缩短吸油烟距离，影响集成灶效果最重要的就是吸烟和排烟，既要避免油烟四散，又要防止油烟倒灌，说具体技术大
给史多多的第三百八十一封信七千22
你好，这里是七千每日文字输出的第464天。你好，史多多今天大年三十，农历2020年的最后一天了。多多昨晚给爸爸妈妈了一个难忘的夜晚，频繁醒来，妈妈喂多多的时候直接睡着了，然后早上多多还早早醒来。小坏蛋在20年最后一天还挺能折腾。今天多多不知道是不是也很兴奋，下午开始自己一直呜呜啊啊的发声，就好似在说话一样。哈哈爸爸妈妈还说是婴语，是我们已经退化了听不懂的婴语。下午多多一度和爸爸对视着近3分钟，多多
坚持党的群众路线 Tan明申呀
自建党以来，我们凝聚起全国亿万人民的智慧和力量，走出了一条让中华民族伟大复兴之路，取得了让世界瞩目的成就，根本原因就在于我们始终把群众路线作为党的生命线，坚定一切为了群众，一切依靠群众，从群众中来，到群众中去的群众路线。贯彻群众路线，根本的是为群众谋利益、办实事。这是我们一切工作的出发点和落脚点，本质上是群众立场问题。因此，我们想问题、做决策、干工作，都要从群众的视角去思考和谋划.要用群众眼光、群
苏晟传媒合法吗，讲讲我的体验糖葫芦不甜
在当今快速发展的传媒与直播行业中，苏晟传媒作为一个备受关注的品牌，其合法性及服务质量自然成为许多人关心的焦点。微：RGD179结合我的亲身体验，我将从几个方面来探讨苏晟传媒的合法性和服务体验。苏晟传媒作为一家传媒公司，其合法性是毋庸置疑的。该公司经过国家相关部门的批准设立，具备合法的经营资质和条件。在行业内，苏晟传媒以其专业的媒体代理业务、设计制作、媒体投放以及活动策划等多元化服务赢得了广泛好评。
Ubuntu locale命令介绍(查询和设置当前用户的语言、国家/地区以及字符编码等环境设置) Tipriest_ Ubuntu ubuntu locale
好的，我们来详细介绍一下locale命令。locale命令简介locale是一个在Linux和其他类Unix系统中非常重要的命令。它的核心作用是查询和设置当前用户的语言、国家/地区以及字符编码等环境设置。这些设置统称为“locale”（地域/本土化设置），它们会影响到程序的界面语言、日期的显示格式、数字的表示方式（例如小数点和千位分隔符）、货币符号以及字符的排序规则等。简单来说，locale决定了
TVP：用于高效二维时序视频定位的文本-视觉提示方法 AI专题精讲强化学习强化学习文本视觉人工智能
温馨提示：本篇文章已同步至"AI专题精讲"TVP：用于高效二维时序视频定位的文本-视觉提示方法摘要本文研究的是时序视频定位（TemporalVideoGrounding，TVG）问题，其目标是在一段未经剪辑的长视频中，根据一条文本描述预测对应事件片段的起始和结束时间点。近年来，得益于精细的三维视觉特征，TVG技术取得了显著进展。然而，三维卷积神经网络（3DCNN）计算复杂度高，使得密集的3D视觉特
2023-03-20 沫沫1823
青年守好“三心”做廉政好干部人无精神则不立，国无精神则不强。在新时代的壮阔征程中，闪耀着一个个熠熠生辉的精神坐标，一个个坚守的身影，一首首动人的故事，无不催人奋进，诠释着共产党员的初心和使命，凝聚着奋斗者的信心。青年兴则国家兴，青年强则国家强。作为新时代的青年，我们必须守住本心，有所作为，才能不负时代、不负韶华。坚守政治清明的“正”心。“修身齐家治国平天下”“其身正，不令而行”，历史的经验告诉我们
dify应用傻瓜教程二：dify升级
最近发现dify变化速度惊人，这对于dify的粉丝来说肯定是个好消息，说明dify正不断改善和优化自己，让自己变得越来越好用，但同时粉丝们也遇到个问题，就是如果确保自己在dify上已做过的产品或知识库不受影响的情况下升级到最新版本呢？下面我就以windows11系统中的dify1.4.0升级到1.6.0为例(前提是以源码部署方式），介绍大家如何升级：第一步：先右键点击桌面左下角类似分屏一样的图标，
【Python】dateutil库宅男很神经 python 开发语言
第一章：dateutil时间，在计算机系统中扮演着核心角色。从日志记录、事件调度到金融交易、科学模拟，无处不在。Python的标准库datetime模块提供了处理日期和时间的基本能力。然而，在面对真实世界的复杂性和多样性时，datetime的功能常常显得捉襟见肘。例如，它难以直接解析各种非标准格式的日期字符串，无法进行灵活的相对时间计算（如“下个月的第三个星期二”），也缺乏对循环事件的强大支持。正
迷茫的你，如何在职场快速晋升蜕变？水清亦有鱼
今天给大家分享的职场知识是关于个人的职场能力晋升，我发现其实有很多人上班会很茫然，只会老老实实的做“死事”。这样的话，个人能力和职场能力真的很难提升。有一个职场小故事：某一个公司的老员工辞职，去了新企业上班，新企业的老板问他有什么职场技能，该员工告诉老板，我有十年的工作经验。老板笑了笑，反问他：“你是有十年的工作经验，还是一年的工作经验，做了十年？”你们是属于前者？还是后者？如果我们将一年学习来的
独克宗人家户命名乳名的方式之九姑依滑雪
独克宗人家户命名乳名的方式之九对于生长在高原上的独克宗人而言，雪是常见的一种自然之物。雪的纯洁，雪的孤傲，雪的洁白诸如此类的特征，往往成为人们所期望和所祝祷的寓意。在独克宗人的乳名中，带上“雪”字往往也在乳名之中被赋予或寄予了人们的某种期望和祝祷。在独克宗人家户中，带“雪”字的女性乳名有，雪松，雪峰，雪冰，雪山，雪衫，雪川等等诸如此类的男性乳名，从这一类的乳名之中，我们不难看出其中所充满的人们的希
成长是为了让自己更好独一无二的刘婕
分享人:AS07刘婕读书能够提升我们的理解和思考能力持续精进122/365读书使人聪明，人生更多可能【今日行动】学业上✳️1.上午建筑设备和外国与设计✳️2.下午值班学习行动:外国建筑史需要不断地学习哦财务上1.日常开销；2.记账3.晚上吃面条健康上1.早起晨跑第20天啦，跑步2.3【注意保护自己，记得拉伸】30min昨天有进步，起的比之前早行动:明天第21天早起晨跑2.步数1w+✅成长上1.早起
从感知到决策：虚拟仿真系统与视觉算法融合下的多路RTSP视频接入技术探究
1️⃣背景概述随着国防信息化和智能化进程的不断加快，虚拟仿真系统与智能视觉算法平台正逐步成为现代化装备研发、测试验证与战术训练的重要技术支撑。相比传统的静态建模或离线推演，新一代作战仿真与智能系统更强调实时性、感知能力与动态交互，这对前端传感器接入、视频数据处理与系统集成提出了更高的要求。核心应用领域涵盖：装备级虚拟作战环境仿真构建高仿真的虚拟战场环境，接入真实或仿真的传感器数据，提升推演与训练的
京东内部优惠券软件叫什么?如何领取优惠券高省_飞智666600
美团作为中国领先的本地生活服务平台，为广大用户提供包括美食、外卖、酒店住宿等多种服务。其中，美团住宿优惠券为广大旅行者和商务人士提供了实惠的住宿选择。本文将为您详细介绍美团住宿优惠券的购买、使用和领取方法。二、美团住宿优惠券怎么买？1.打开美团App，点击“酒店”或“住宿”频道；2.在搜索框输入目的地和入住时间，点击搜索；3.在搜索结果页面，您可以查看酒店的折扣信息和可用优惠券；4.点击选择您需要
231篇觉察日志语宝妈
今晚到家后，孩子说自己做了泡面吃，那我就自己解决晚餐了。满足的吃完晚餐后，我习惯靠墙站五分钟。靠墙站其实挺累，斋站着等时间会觉得很漫长，所以打开英语听演讲，这样时间就过得快多了。远远叫我，妈妈，我需要你的帮助。我走过去，看到远远又拼出一个新的乐高模型，现在需要穿绳子，我帮远远穿绳子，一起找零件，我真欣赏儿子这种专注和投入，特别让我佩服，陪儿子做他热爱的，我感觉也很好。以前远远让我陪伴他做的“游戏”
萧何何淼淼《成全老婆和男闺蜜后，她却疯了》最新章节阅读_(成全老婆和男闺蜜后，她却疯了)全章节免费在线阅读_成全老婆和男闺蜜后，她却疯了(萧何何淼淼)最新章节在线阅读_(成全老婆和男闺蜜后，她却... 小说全文全本
萧何何淼淼《成全老婆和男闺蜜后，她却疯了》最新章节阅读_(成全老婆和男闺蜜后，她却疯了)全章节免费在线阅读_成全老婆和男闺蜜后，她却疯了(萧何何淼淼)最新章节在线阅读_(成全老婆和男闺蜜后，她却疯了)最新章节在线阅读_萧何何淼淼(成全老婆和男闺蜜后，她却疯了)全本免费在线阅读_萧何何淼淼全集在线阅读主角配角：萧何何淼淼简介：我转身就走，我真的要离婚了，实在是一次又一次挑战我的极限可何淼淼不同意，她
成功日记（Day825）狮子座的兔子姑娘
1、跟肖出诊。~4h。2、和g夙微信闲唠嗑。~0.5h。3、和c付丽闲唠嗑。~0.5h。4、和z鹤微信闲唠嗑。~0.5h。5、看电影《东方不败之风云再起》。~1.5h。6、简单整理笔记。~0.5h。心情：还可以吧！稍稍有一点郁闷，号个患者脉，没啥感觉。体会不够深刻。
Ansible + Shell 服务器巡检脚本 lovely_nn Linux 系统运维服务器运维
脚本概述这是一个用于服务器日常巡检的Shell脚本，主要功能包括：检查多台主机的网络连通性监控CPU、内存和磁盘使用率生成详细的巡检报告通过企业微信发送告警通知核心技术点1.主机批量管理使用Ansible工具远程执行命令和脚本通过主机清单文件(ip_file)管理所有待巡检主机2.资源监控技术CPU监控：通过top命令获取CPU总使用率内存监控：调用自定义脚本mem.sh获取内存使用率磁盘监控：调
儿童秩序敏感期 Mikha_e07f
儿童有一个对秩序敏感的时期，从出生第一年出现一直持续到第二年出生一个月：有了对秩序的敏感，当看到一个东西放在恰当的位置就会兴奋和敏感，在大多数情况下，儿童发脾气都是由于这样的敏感性例：主人公是一个出生大约6个月的小女孩，一天待在房间里，家里出现了客人，将伞放在了桌子上，于是这个女孩开始出现不安情绪，她之所以这样，不是因为客人，而是因为那把伞，小女孩对着那把伞看了好一会后开始哭起来，客人以为孩子看上
量感的培养策略学习江畔桃圓
这两天，在网上查找了很多关于量感的解读，以及培养策略，我发现，资料阅读的越多，对概念的理解越模糊！其根本是越想精细化的整理消化理解，但却越易迷失！好在今天晚上学习的贲友林工作室研究的关于量感培养策略，感觉简洁却有效！具体如下：一探测学生对量感的直觉感知，找准教学的起点。直觉即直观感觉，它是指未经充分逻辑推理的感性认识，是基于人类的职业、阅历、知识和本能而存在的一种思维形式，是一种本能反应。在案例中
这3件衣服如果你有的话快丢了吧，穿衣服穿出高级感，跟我学！ zx那么可爱
阴雨连绵的假期，虽然不喜欢下雨的潮湿感，但是很喜欢雨滴下落的声音！很多仙女都会吐槽，为什么橱柜里好看到爆的美衣，穿在自己身上后却一言难尽？！其实这是因为，你没有掌握正确的穿衣法则！今天，就来说说，那些千万不能犯的穿衣雷区，看看你犯了几条？！很多微胖的仙女，在穿衣打扮的时候，一味想着遮挡缺点和赘肉，选择过长、过大的单品，其实这样的搭配，虽然遮肉，但是不显瘦，还没有任何美感。想要显高显瘦，腰线万万不能
axios封装使用 Hui-1018 前端 axios
axios配置配置拦截并使用promise封装get和post请求提示：注意部分伪代码，需要根据实际场景做一些修改importaxiosfrom'axios'constservice=axios.create({baseURL:process.env.BASE_API,//api的base_urltimeout:5000//请求超时时间})//请求拦截器service.interceptors.r
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比