羞儿

【读点论文】ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks改进senet

ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks

注意力机制早在上世纪九十年代就有研究，到2014年Volodymyr的《Recurrent Models of Visual Attention》一文中将其应用在视觉领域，后来伴随着2017年Ashish Vaswani的《Attention is all you need》中Transformer结构的提出，注意力机制在NLP,CV相关问题的网络设计上被广泛应用。
“注意力机制”实际上就是想将人的感知方式、注意力的行为应用在机器上，让机器学会去感知数据中的重要和不重要的部分。
所谓的"注意力机制"也就是当机器在做一些任务，比如要识别下面这张图片是一个什么动物时，我们让机器也存在这样的一个注意力侧重，最重要该关注的地方就是图片中动物的面部特征，包括耳朵，眼睛，鼻子，嘴巴，而不用太关注背景的一些信息，核心的目的就在于希望机器能在很多的信息中注意到对当前任务更关键的信息，而对于其他的非关键信息就不需要太多的注意力侧重。
深度学习中的注意力机制通常可分为三类：软注意（全局注意）、硬注意（局部注意）和自注意（内注意）
- Soft/Global Attention(软注意机制)：对每个输入项的分配的权重为0-1之间，也就是某些部分关注的多一点，某些部分关注的少一点，因为对大部分信息都有考虑，但考虑程度不一样，所以相对来说计算量比较大。
- Hard/Local Attention(硬注意机制)：对每个输入项分配的权重非0即1，和软注意不同，硬注意机制只考虑那部分需要关注，哪部分不关注，也就是直接舍弃掉一些不相关项。优势在于可以减少一定的时间和计算成本，但有可能丢失掉一些本应该注意的信息。
- Self/Intra Attention（自注意力机制）：对每个输入项分配的权重取决于输入项之间的相互作用，即通过输入项内部的"表决"来决定应该关注哪些输入项。和前两种相比，在处理很长的输入时，具有并行计算的优势。
多头自注意力机制

下面有是一篇关于CVPR2020卷积注意机制的论文阅读记录

Abstract

最近，通道注意机制被证明在提高深度卷积神经网络（CNN）的性能方面具有很大的潜力。然而，大多数现有的方法致力于开发更复杂的注意力模块以实现更好的性能，这不可避免地增加了模型的复杂性。
为了克服性能和复杂性之间的矛盾，本文提出了一个高效通道注意（ECA）模块，它只涉及少数几个参数，同时带来明显的性能增益。通过剖析SENet中的通道注意模块，本文实证表明避免降维对学习通道注意很重要，而适当的跨通道交互可以保持性能，同时显著降低模型复杂性。
因此，本文提出了一种无需降维的局部跨通道交互策略，它可以通过一维卷积有效地实现。此外，本文开发了一种自适应选择一维卷积核大小的方法，以确定局部跨通道交互的覆盖范围。本文提出的ECA模块是高效的，例如，本文的模块与ResNet50的骨干模块相比，参数和计算量分别为80对24.37M，4.7e-4 GFLOPs对3.86 GFLOPs，在Top-1的准确性方面，性能提升超过了2%。
对本文的ECA模块进行了广泛的评估，包括图像分类、对象检测和实例分割，并以ResNets和MobileNetV2为骨干。实验结果表明，本文的模块效率更高，同时在性能上优于同类产品。
论文地址：[1910.03151] ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks (arxiv.org)
CVPR2020上对通道注意力进行改进的文章—ECANet，ECANet主要对SENet模块进行了一些改进，提出了一种不降维的局部跨信道交互策略（ECA模块）和自适应选择一维卷积核大小的方法，从而实现了性能上的提优。最近已经有很多文章在通道和空间注意力上做改进并取得了性能提升。

Introduction

深度卷积神经网络（CNN）在计算机视觉界得到了广泛的应用，并在图像分类、物体检测和语义分割等广泛的任务中取得了巨大的进展。从开创性的AlexNet开始，许多研究都在不断研究以进一步提高深度CNN的性能[VGG, GoogLenet, ResNet, DenseNe,Non-local neural networks]。
将通道注意力纳入卷积块引起了很多人的兴趣，在性能改进方面显示出巨大的潜力[Squeeze-and-excitation networks, Gather-excite, A2-Nets: Double attention networks, Dual attention network for scene segmentation, Channel locality block, Global second-order pooling convolutional networks]。
其中一个代表性的方法是挤压和激发网络（SENet），它为每个卷积块学习通道注意力，为各种深度CNN架构带来明显的性能增益。
在SENet中设置了挤压（即特征聚集）和激发（即特征重新校准）后，一些研究通过捕捉更复杂的通道间依赖关系或与额外的空间注意力相结合来改进SE块。
尽管这些方法取得了更高的精度，但它们往往带来了更高的模型复杂性，并承受着更重的计算负担。与上述以更高的模型复杂性为代价获得更好的性能的方法不同，本文反而关注一个问题。能否以一种更有效的方式学习有效的通道注意？
为了回答这个问题，本文首先重新审视SENet中的通道注意模块。具体来说，给定输入特征后，SE模块首先对每个通道独立采用全局平均池，然后用两个全连接（FC）层，用非线性和Sigmoid函数来生成通道权重。这两个FC层的设计是为了捕捉非线性的跨通道互动，这涉及到控制模型复杂性的降维。
虽然这种策略在后续的通道注意力模块中被广泛使用[CBAM]，但本文的经验研究表明，降维对通道注意力的预测带来了副作用，而且捕捉所有通道的依赖关系是低效和不必要的。
因此，本文提出了一个用于深度CNN的高效通道关注（ECA）模块，它避免了降维，并以一种有效的方式捕获跨通道的互动。如下图所示，在不降维的情况下进行通道全局平均池化后，本文的ECA通过考虑每个通道和它的k近邻来捕捉局部的跨通道互动。
- 本文的高效通道关注（ECA）模块图。鉴于通过全局平均池（GAP）获得的聚合特征，ECA通过执行大小为k的快速一维卷积来生成通道权重，其中k是通过通道维度C的映射自适应确定的。
事实证明，这种方法既能保证效率又能保证效果。请注意，本文的ECA可以通过大小为k的快速一维卷积来有效实现，其中内核大小k代表本地跨通道交互的覆盖率，即有多少个近邻参与到一个通道的关注预测中。为了避免通过交叉验证手动调整k，本文开发了一种方法来适应性地确定k，其中互动的覆盖率（即内核大小k）与通道维度成正比。
如下图，与骨干模型[ResNet]相比，带有本文的ECA模块（称为ECA-Net）的深度CNN引入了非常少的额外参数和可以忽略的计算，同时带来了显著的性能提升。例如，对于具有2437万个参数和3.86GFLOPs的ResNet-50来说，ECA-Net50的额外参数和计算量分别为80和4.7e4 GFLOPs；同时，ECA-Net50在Top-1准确度方面比ResNet-50高出2.28%。
- 使用ResNets作为骨干模型的各种注意力模块（即SENet、CBAM、A2-Nets和ECA-Net）在分类精度、网络参数和FLOPs方面的比较，用圆圈的辐射表示。请注意，本文的ECA-Net获得了更高的准确性，同时具有较低的模型复杂性。
下表总结了现有的注意力模块是否进行了通道降维（DR）、跨通道交互和轻量级模型，在这里可以看到，本文的ECA模块通过避免通道降维来学习有效的通道注意力，同时以极其轻量级的方式捕获跨通道交互。为了评估本文的方法，本文在ImageNet-1K和MS COCO上使用不同的深度CNN架构进行了各种任务的实验。
- 比较现有的注意力模块是否没有通道降维（No DR）、跨通道互动和比SE少的参数（用轻量级表示）。
本文的贡献总结如下。
- (1) 本文剖析了SE块，并通过实验证明避免降维和适当的跨通道交互对学习有效和高效的通道注意分别很重要。
- (2) 基于以上分析，本文尝试为深度CNN开发一个极其轻量级的通道注意模块，提出了高效通道注意（ECA），在带来明显改进的同时，增加了很少的模型复杂性。
- (3) 在ImageNet-1K和MS COCO上的实验结果表明，本文的方法比最先进的方法具有更低的模型复杂性，同时取得了非常有竞争力的性能。

Related Work

事实证明，注意力机制是增强深度CNN的一个潜在手段。SE-Net首次提出了一种学习通道注意力的有效机制，并取得了可喜的成绩。随后，注意力模块的发展可以大致分为两个方向：
- （1）增强特征聚合；
- （2）结合通道和空间注意力。
具体来说，CBAM采用了平均和最大池化两种方式来聚合特征。
GSoP引入了一个二阶池化，以实现更有效的特征聚合。GE探索了使用深度卷积来聚合特征的空间扩展。CBAM和scSE使用内核大小为k×k的二维卷积计算空间注意力，然后将其与通道注意力相结合。GCNet与Non-Local（NL）神经网络有着相似的理念，开发了一个简化的NL网络，并与SE块集成，形成了一个轻量级的模块来模拟长距离的依赖性。双重注意网络（A2-Nets）为图像或视频识别的NL块引入了一个新颖的关系函数。双重注意力网络（DAN）同时考虑基于NL的通道和空间注意力，用于语义分割。
然而，上述大多数基于NL的注意力模块由于其较高的模型复杂性，只能用于单个或几个卷积块。显然，上述所有的方法都侧重于开发复杂的注意力模块以获得更好的性能。与它们不同的是，本文的ECA旨在以低模型复杂度学习有效的通道注意。
本文的工作也与 efficient convolutions有关，它是为轻量级CNN设计的。两个广泛使用的高效卷积是分组卷积[Interleaved group convolutions, Aggregated residual transformations for deep neural networks, Deep roots: Improving cnn efficiency with hierarchical filter groups]和深度可分离卷积[Xception, Mobilenetv2, ShufflenetV1, V2]。
如下表所示，尽管这些高效的卷积涉及的参数较少，但它们在注意力模块中显示出的效果不大。
- 在ImageNet上使用ResNet-50作为主干模型比较各种通道注意模块。#.Param：表示频道注意模块的参数数， $\odot$ ：表示element-wise乘积；GC和C1D分别表示群卷积和1D卷积；k是C1D的内核大小。
本文的ECA模块旨在捕捉局部跨通道的交互作用，这与通道局部卷积[Improving the efficiency of convolutional neural network using channel local convolutions]和通道明智卷积[Channelnets]有一些相似之处；与它们不同的是，本文的方法研究了一个具有自适应核大小的一维卷积来取代通道注意模块中的FC层。与分组和深度可分离卷积相比，本文的方法以较低的模型复杂度实现了更好的性能。

Proposed Method

在本节中，首先重温了SENet中的通道关注模块（即SE块）。然后，通过分析降维和跨通道交互的影响，对SE模块进行实验诊断。这促使本文提出ECA模块。此外，本文开发了一种方法来自适应地确定本文的ECA参数，并最终展示了如何将其用于深度CNN。

Revisiting Channel Attention in SE Block

让一个卷积块的输出为 $X∈\Bbb R^{W×H×C}$ ，其中W、H和C是宽度、高度和通道尺寸（即滤波器的数量）。据此，SE块中的通道权重可以计算为
- $w=σ(f_{\{W_1,W_2\}}(g(\mathcal{X}))),(1)$
- 其中 $g(\mathcal{X})=\frac{1}{WH}\sum_{i=1,j=1}^{W,H}\mathcal{X}_{ij}$ 是逐通道的全局平均池化（GAP），σ是一个Sigmoid函数。
- $y=g(\mathcal{X}),f_{\{W_1,W_2\}}的形式为f_{\{W_1,W_2\}}(y)=W_2ReLU(W_1y),(2)$
- 其中ReLU表示整流线性单元。为了避免模型的高复杂性，W1和W2的大小分别被设定为 $\frac Cr)$ 和 $\frac C r )×C$ 。可以看到， $f_{\{W_1,W_2\}}$ 涉及通道注意块的所有参数。虽然公式（2）中的降维可以降低模型的复杂性，但它破坏了通道和其权重之间的直接对应关系。例如，一个单一的FC层使用所有通道的线性组合来预测每个通道的权重。但公式（2）首先将通道特征投射到一个低维空间，然后再将其映射回来，使得通道和其权重之间的对应关系是间接的。

Efficient Channel Attention (ECA) Module

在重新审视了SE块之后，本文进行了实验比较，以分析通道降维和跨通道互动对通道注意力学习的影响。根据这些分析，提出了本文的高效通道注意（ECA）模块。

A voiding Dimensionality Reduction

如上所述，公式（2）中的降维使得通道和其权重之间的对应关系是间接的。为了验证其效果，本文将原始的SE块与它的三个变体（即SE-Var1、SE-Var2和SE-Var3）进行比较，它们都不进行降维。
如上表所示，没有参数的SE-Var1仍然优于原始网络，表明通道注意力有能力提高深度CNN的性能。同时，SE-Var2独立学习每个通道的权重，在涉及较少参数的情况下，略优于SE块。这可能表明，通道和它的权重需要直接对应，而避免降维比考虑非线性通道依赖性更重要。此外，SE-Var3采用一个单一的FC层比两个FC层在SE块中的降维表现更好。
所有上述结果清楚地表明，避免降维有助于学习有效的信道注意力。因此，本文开发了没有通道降维的ECA模块。

Local Cross-Channel Interaction

鉴于聚合的特征 $y∈\Bbb R^C$ 没有降维，通道注意力可以通过以下方式学习
- $w = σ (W y) ， (3)$
- 其中W是一个C×C的参数矩阵。特别是，对于SE-Var2和SE-Var3，有
- $w =$
- 其中SE-Var2的Wvar2是一个对角矩阵，涉及C个参数；SE-Var3的Wvar3是一个全矩阵，涉及C×C个参数。如公式（4）所示，关键的区别是SE-Var3考虑了跨渠道互动，而SEVar2没有，因此SE-Var3取得了更好的性能。这一结果表明，跨频道互动有利于学习频道注意力。然而，SEVar3需要大量的参数，导致模型的复杂性很高，特别是对于大的通道数量。
SE-Var2和SE-Var3之间的一个可能的折衷办法是将Wvar2扩展为一个块状对角线矩阵，即：
- $Ωw_i=σ(\sum_{j=1}^kw_i^jy_i^j),y_i^j\inΩ_i^k,(7)$
- 其中 $Ω^k_i$ 表示yi的k个相邻通道的集合。
一个更有效的方法是使所有通道共享相同的学习参数，即：
- $Ωw_i=σ(\sum_{j=1}^kw^jy_i^j),y_i^j\inΩ_i^k,(8)$
- 请注意，这种策略可以很容易地通过内核大小为k的快速一维卷积来实现，即：
- $w=σ(C1D_k(y))，(9)$
- 其中C1D表示一维卷积。这里，公式（9）中的方法被称为高效信道关注（ECA）模块，它只涉及k个参数。本文的ECA模块在k=3的情况下取得了与SE-var3相似的结果，同时模型的复杂度要低得多，通过适当地捕捉局部跨信道的互动，保证了效率和效果。

Coverage of Local Cross-Channel Interaction

由于本文的ECA模块旨在适当地捕捉局部的跨通道交互，所以需要确定交互的覆盖范围（即1D卷积的核大小k）。对于各种CNN结构中具有不同通道数的卷积块，可以手动调整优化的交互覆盖率。然而，通过交叉验证进行手动调整将花费大量的计算资源。
组卷积已经成功地被采用来改进CNN架构，在组数固定的情况下，高维（低维）通道涉及长距离（短距离）卷积。分享类似的理念，互动的覆盖率（即一维卷积的核大小）与通道维度C成正比是合理的。换句话说，在k和C之间可能存在一个映射φ。
- $C=\phi(k),(10)$
- 最简单的映射是一个线性函数，即φ(k) = γ ∗ k - b。然而，线性函数所描述的关系太有限了。另一方面，众所周知，信道维度C（即滤波器的数量）通常被设定为2的幂。因此，本文引入一个可能的解决方案，将线性函数φ（k）=γ ∗ k - b扩展为非线性函数，即：
- $C=\phi(k)=2^{(\gamma*k-b)},(11)$
然后，给定信道维度C，内核大小k可以通过以下方式自适应确定
- $KaTeX parse error: Undefined control sequence: \var at position 4: k=\̲v̲a̲r̲ ̲$
- 其中 $t|_{odd}$ 表示为最近的奇数t个对象。在本文中，将γ和b分别设置为2和1，贯穿所有实验。显然，通过映射ψ，高维通道有较长的范围互动，而低维通道通过使用非线性映射发生较短的范围互动。

ECA Module for Deep CNNs

在使用GAP聚合卷积特征而不降维后，ECA模块首先自适应地确定核大小k，然后执行一维卷积，接着使用Sigmoid函数来学习通道注意力。为了将本文的ECA应用于深度CNN，本文按照[SEnet]中的相同配置，用本文的ECA模块取代SE块。由此产生的网络被命名为ECA-Net。下图给出了我们ECA的PyTorch代码。
- PyTorch code of our ECA module.

Experiments

在这一节中，本文分别使用ImageNet和MS COCO对所提出的方法在大规模图像分类、物体检测和实例分割上进行评估。具体来说，本文首先评估了内核大小对我们ECA模块的影响，并与ImageNet上最先进的对应模块进行比较。然后，本文使用Faster R-CNN、Mask R-CNN和RetinaNet验证本文的ECA-Net在MS COCO上的有效性。

Implementation Details

为了在ImageNet分类上评估本文的ECA-Net，本文采用了四种广泛使用的CNN作为主干模型，包括ResNet-50 、ResNet-101、ResNet-512和MobileNetV2。
对于ECA的训练结果，本文采用了[Deep residual learning for image recognition，SEnet]中完全相同的数据扩充和超参数设置。具体来说，输入图像通过随机水平翻转被随机裁剪为224×224。网络的参数通过随机梯度下降（SGD）进行优化，权重衰减为1e-4，动量为0.9，小批量大小为256。所有的模型都是在100个epoch内通过设置初始学习率为0.1，每30个epoch减少10个系数来训练的。
对于用本文的ECA训练MobileNetV2，本文遵循[MobileNetV2]中的设置，在400个epoch内用SGD训练网络，权重衰减为4e-5，动量为0.9，小批量大小为96。初始学习率被设定为0.045，并通过0.98的线性衰减率来降低。为了在验证集上进行测试，输入图像的短边首先被调整为256，并使用224×224的中心裁剪进行评估。所有的模型都是由PyTorch工具箱实现的。
本文使用Faster R-CNN、Mask R-CNN[10]和RetinaNet在MS COCO上进一步评估本文的方法，其中ResNet-50和ResNet-101以及FPN被用作骨干模型。
通过使用MMDetection工具包实现所有检测器，并采用默认设置。具体来说，输入图像的短边被调整为800，然后使用SGD优化所有模型，权重衰减为1e-4，动量为0.9，小批量大小为8（4个GPU，每个GPU有2张图像）。学习率初始化为0.01，并在8和11个epoch后分别降低10倍。
本文在COCO的train2017上训练12个epoch内的所有检测器，并在val2017上报告结果以进行比较。所有程序都在配备有四个RTX 2080Ti GPU和一个Intel® Xeon Silver 4112 [email protected] 的PC上运行。

Image Classification on ImageNet-1K

在这里，本文首先评估核大小对ECA模块的影响，并验证本文的方法自适应地确定核大小的有效性，然后使用ResNet-50、ResNet-101、ResNet-152和MobileNetV2与最先进的同行和CNN模型进行比较。

Effect of Kernel Size (k) on ECA Module

如等式(9)所示。本文的ECA模块涉及一个参数k，即1D卷积的核大小。在这一部分中，本文评估了它对ECA模块的影响，并验证了本文的方法对于自适应选择核大小的有效性。为此，本文采用ResNet-50和ResNet-101作为骨干模型，并通过将k 设置为3到9来用本文的ECA模块训练它们。结果如下图所示，从中得到了以下观察结果：
- 本文的ECA模块使用ResNet-50和ResNet-101作为主干模型，具有不同的k数。这里，本文也给出了自适应选择核大小的ECA模块的结果，并与SENet作为基线进行了比较。
首先，当k在所有卷积块中固定时，ECA模块对于ResNet-50和ResNet-101分别在k = 9和k = 5时获得最佳结果。由于ResNet101有更多控制ResNet-101性能的中间层，因此它可能更喜欢较小的内核大小。此外，这些结果表明，不同的深度细胞神经网络有不同的最佳k值，k值对ECA-Net的性能有明显的影响。
此外，ResNet-101的精度波动(∼0.5%)大于ResNet50的精度波动(∼0.15%)，本文推测这是因为较深的网络比较浅的网络对固定的核大小更敏感。此外，由等式(12)自适应确定的内核大小。通常优于固定的，同时它可以避免通过交叉验证手动调整参数k。以上结果证明了本文的自适应核大小选择在获得更好和稳定的结果方面的有效性。
最后，具有不同数量k的ECA模块始终优于SE块，验证了避免降维和局部跨通道交互对学习通道注意具有积极影响。

Comparisons Using Different Deep CNNs

ResNet-50：本文在ImageNet上使用ResNet-50将本文的ECA模块与几种最先进的注意力方法进行了比较，包括SENet、CBAM 、A2-Nets、AA-Net、GSoP-Net1和GCNet。评估指标包括效率(即，网络参数、每秒浮点运算(FLOPs)和训练/推理速度)和有效性(即，前1/前5的准确性)。
为了比较，本文复制了ResNet和SENet在[senet]中的结果，并在他们的原始论文中报告了其他比较方法的结果。为了测试各种模型的训练/推理速度，本文采用公开可用的比较CNN模型，并在相同的计算平台上运行它们。
结果如下表所示，从中可以看出，本文的ECA-Net与原始ResNet-50具有几乎相同的模型复杂性(即网络参数、FLOPs和速度),而Top-1精度提高了2.28%。与最先进的同类产品(即SENet、CBAM、A2-Nets、AA-Net、GSoP-Net1和GCNet)相比，ECA-Net获得了更好或更具竞争力的结果，同时有利于降低模型复杂性。
- ImageNet上不同注意力方法在网络参数(#.Param .)、每秒浮点运算(FLOPs)、训练或推理速度(每秒帧数，FPS)以及Top-1/Top-5准确度(以%为单位)方面的比较。†：由于A2-Net和AA-Net的源代码和模型不公开，因此不比较它们的运行时间。♦:AA-Net使用初始数据扩充和不同的学习率设置进行训练。
ResNet-101：使用ResNet-101作为主干模型，将本文的ECA-Net与SENet、CBAM 和AA-Net进行了比较。从上表中可以看到，ECA-Net在几乎相同的模型复杂度下，性能比原始的ResNet-101高1.8%。在ResNet-50上，ECA-Net也有相同的趋势，但它优于SENet和CBAM，而在模型复杂度较低的情况下，它与AA-Net非常有竞争力。注意，AA-Net是用初始数据扩充和不同的学习率设置来训练的。
ResNet-152：使用ResNet-152作为主干模型，将本文的ECA-Net与SENet进行比较。从上表中可以看出，ECA-Net在Top-1精度方面比原始ResNet-152提高了约1.3%，而模型复杂度几乎相同。与SENet相比，ECANet以较低的模型复杂度获得了0.5%的Top-1增益。关于ResNet-50、ResNet101和ResNet-152的结果证明了本文的ECA模块在广泛使用的ResNet架构上的有效性。
除了ResNet架构，本文还在轻量级CNN架构上验证了ECA模块的有效性。为此，本文采用MobileNetV2 作为主干模型，并将本文的ECA模块与SE块进行比较。特别地，本文在残差连接位于MobileNetV2的每个“瓶颈”之前在卷积层中集成SE块和ECA模块，并且SE块的参数r被设置为8。所有模型都使用完全相同的设置进行训练。上表中的结果显示，本文的ECA-Net在Top-1准确性方面分别将原始MobileNetV2和SENet提高了约0.9%和0.14%。
此外，本文的ECA-Net比SENet具有更小的模型规模和更快的训练/推理速度。以上结果再次验证了ECA模块的效率和有效性。

Comparisons with Other CNN Models

在这一部分的最后，本文将ECA-Net50和ECA-Net101与其他最先进的CNN模型进行了比较，包括ResNet-200 、Inception-v3 、ResNeXt 、DenseNet。这些CNN模型具有更深更广的架构，它们的结果都是从原始论文中复制的。如下表所示，ECA-Net101优于ResNet-200，表明本文的ECA-Net可以使用少得多的计算成本来提高深度CNN的性能。
- Comparisons with state-of-the-art CNNs on ImageNet.
同时，本文的ECA-Net101与ResNeXt-101相比非常有竞争力，而后者使用了更多的卷积滤波器和昂贵的组卷积。此外，ECA-Net50与DenseNet-264 (k=32)、DenseNet-161 (k=48)和Inception-v3相当，但其模型复杂度更低。所有上述结果表明，本文的ECA-Net性能优于最先进的CNN，同时受益于低得多的模型复杂度。请注意，本文的ECA也有很大的潜力来进一步提高比较CNN模型的性能。

Object Detection on MS COCO

在这一小节中，本文使用faster R-CNN 、Mask R-CNN 和RetinaNet来评估本文的ECA-Net在对象检测任务上的性能。本文主要将ECA-Net与ResNet和SENet进行比较。所有CNN模型都在ImageNet上进行预训练，然后通过微调转移到MS COCO。

Comparisons Using Faster R-CNN

使用faster R-CNN作为基本检测器，本文使用50和101层的ResNets以及FPN 作为主干模型。如下表所示，SE模块或ECA模块的集成可以显著提高目标检测的性能。同时，在使用ResNet-50和ResNet-101的AP方面，本文的ECA分别优于SE block 0.3%和0.7%。
- Object detection results of different methods on COCO val2017.

Comparisons Using Mask R-CNN

本文进一步利用Mask R-CNN来验证ECA-Net在目标检测任务上的有效性。如上表所示，在50层和101层的设置下，本文的ECA模块在AP方面分别优于原始ResNet 1.8%和1.9%。同时，使用ResNet50和ResNet-101作为主干模型，ECA模块分别比SE模块获得0.3%和0.6%的增益。使用ResNet-50，ECA优于一个NL ，并且与使用较低模型复杂性的GC块相当。

Comparisons Using RetinaNet

此外，本文使用一级检测器，即RetinaNet，验证了本文的ECA-Net在对象检测上的有效性。如上表所示，在50层和101层网络的AP方面，本文的ECA-Net分别比原始ResNet高出1.8%和1.4%。
同时，ECANet对ResNet-50和ResNet-101的SE-Net分别提高了0.2%和0.4%以上。总之，上表中的结果表明，本文的ECA-Net可以很好地推广到对象检测任务。具体来说，ECA模块带来了对原始ResNet的明显改进，同时使用较低的模型复杂性胜过SE块。特别是，本文的ECA模块对小物体实现了更大的增益，这些小物体通常更难被检测到。

Instance Segmentation on MS COCO

然后，在MS COCO上给出了本文的ECA模块使用Mask R-CNN的实例分割结果。如下表所示，ECA模块与原始ResNet相比获得了显著的增益，同时性能优于SE模块，且模型复杂度较低。对于作为主干的ResNet-50，模型复杂度较低的ECA优于NL，与GC block 相当。这些结果验证了ECA模块对各种任务具有良好的泛化能力。
- COCO val2017上使用Mask R-CNN的不同方法的实例分割结果。

Conclusion

在本文中，本文致力于研究低模型复杂度的深度细胞神经网络的有效通道注意。为此，本文提出了一种高效的信道注意(ECA)模块，该模块通过快速1D卷积产生信道注意，其核大小可以通过信道维度的非线性映射来自适应地确定。
实验结果表明，本文的ECA是一个极其轻量级的即插即用模块，可以提高各种深度CNN架构的性能，包括广泛使用的ResNets和轻量级MobileNetV2。此外，本文的ECA-Net在对象检测和实例分割任务中表现出良好的泛化能力。未来，本文将把ECA模块应用于更多的CNN架构(例如，ResNeXt和Inception )，并进一步研究ECA与空间注意模块的结合。

你可能感兴趣的:(论文笔记,深度学习,pytorch,人工智能,注意力机制,tricks)

AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
vllm本地部署bge-reranker-v2-m3模型API服务实战教程雷电法王大模型部署 linux python vscode language model
文章目录一、说明二、配置环境2.1安装虚拟环境2.2安装vllm2.3对应版本的pytorch安装2.4安装flash_attn2.5下载模型三、运行代码3.1启动服务3.2调用代码验证一、说明本文主要介绍vllm本地部署BAAI/bge-reranker-v2-m3模型API服务实战教程本文是在Ubuntu24.04+CUDA12.8+Python3.12环境下复现成功的二、配置环境2.1安装虚
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
NumPy-@运算符详解 GG不是gg numpy numpy
NumPy-@运算符详解一、@运算符的起源与设计目标1.从数学到代码：符号的统一2.设计目标二、@运算符的核心语法与运算规则1.基础用法：二维矩阵乘法2.一维向量的矩阵语义3.高维数组：批次矩阵运算4.广播机制：灵活的形状匹配三、@运算符与其他乘法方式的核心区别1.对比`np.dot()`2.对比元素级乘法`*`3.对比`np.matrix`的`*`运算符四、典型应用场景：从基础到高阶1.深度学习
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
NLP_知识图谱_大模型——个人学习记录 macken9999 自然语言处理知识图谱大模型自然语言处理知识图谱学习
1.自然语言处理、知识图谱、对话系统三大技术研究与应用https://github.com/lihanghang/NLP-Knowledge-Graph深度学习-自然语言处理(NLP)-知识图谱：知识图谱构建流程【本体构建、知识抽取（实体抽取、关系抽取、属性抽取）、知识表示、知识融合、知识存储】-元気森林-博客园https://www.cnblogs.com/-402/p/16529422.htm
解决 Python 包安装失败问题：以 accelerate 为例
在使用Python开发项目时，我们经常会遇到依赖包安装失败的问题。今天，我们就以accelerate包为例，详细探讨一下可能的原因以及解决方法。通过这篇文章，你将了解到Python包安装失败的常见原因、如何切换镜像源、如何手动安装包，以及一些实用的注意事项。一、问题背景在开发一个深度学习项目时，我需要安装accelerate包来优化模型的训练过程。然而，当我运行以下命令时：bash复制pipins
MCP协议：AI时代的“万能插座”如何重构IT生态与未来
MCP协议：AI时代的“万能插座”如何重构IT生态与未来在人工智能技术爆炸式发展的浪潮中，一个名为ModelContextProtocol（MCP）的技术协议正以惊人的速度重塑IT行业的底层逻辑。2024年11月由Anthropic首次发布，MCP在短短半年内获得OpenAI、谷歌、亚马逊、阿里、腾讯等全球科技巨头的支持，被业内誉为AI时代的HTTP协议或USB-C接口，正在成为连接大模型与现实世
从RNN循环神经网络到Transformer注意力机制：解析神经网络架构的华丽蜕变熊猫钓鱼>_> 神经网络 rnn transformer
1.引言在自然语言处理和序列建模领域，神经网络架构经历了显著的演变。从早期的循环神经网络（RNN）到现代的Transformer架构，这一演变代表了深度学习方法在处理序列数据方面的重大进步。本文将深入比较这两种架构，分析它们的工作原理、优缺点，并通过实验结果展示它们在实际应用中的性能差异。2.循环神经网络（RNN）2.1基本原理循环神经网络是专门为处理序列数据而设计的神经网络架构。RNN的核心思想
《算法备案全攻略：规范与流程引领数字时代新秩序》算法及大模型备案顾问刘老师算法备案深度学习 AIGC 语言模型算法人工智能
一、算法备案：开启合规新征程（一）备案规定的起源与发展2022年国家互联网信息办公室、工业和信息化部、公安部、国家市场监督管理总局联合发布《互联网信息服务算法推荐管理规定》，自2022年3月1日起施行。此后，相关规定不断完善和演进。如国家网信办于2022年8月、10月及2023年1月先后三次公布了《境内互联网信息服务算法备案清单》。同时，2022年发布的最高人民法院《关于规范和加强人工智能司法应用
pycharm无法识别conda环境（已解决） Reborker pycharm conda ide
文章目录前言研究过程解决办法前言好久不用pycharm了，打开后提示更新，更新到了2023.1版本。安装conda后在新建了一个虚拟环境pytorch，但是无论是基础环境还是虚拟环境，pycharm都识别不出conda里的python.exe(如图)。如果不想看啰嗦直接看后面的解决办法，比较闲的话可以看看我的研究过程。研究过程看了很多博客，尝试了以下解决办法：加载conda.bat文件，虽然出现了
C语言学生成绩管理系统<；自创>；(功能7有小错误,但可运行） han_xue_feng java
腾讯云加速企业和个人开发创新公开直播预告直播预告：07/18(周四)15:00-16:00随着人工智能与大模型的蓬勃发展，我们正步入一个由技微信实习第一天周五入职，早上早早来到了公司，发现好多人都没上班，到十点才陆陆续续有人来，办理完入职后，mentor中联夏令营遗憾没有入选不过hr的回复真的很好，辛苦啦#提前批简历挂麻了怎么办##机械制造投递记录#大数据开发的工作有点过于简单了吧sq大数据开发的
Python 实战人工智能数学基础：推荐系统应用 AI天才研究院 AI大模型企业级应用开发实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术文章目录1.背景介绍2.核心概念与联系2.1用户画像2.2相似性计算2.2.1基于物品的相似度2.2.2基于用户的相似度2.3协同过滤算法2.3.1基于用户的协同过滤算法2.3.2基于物品的协同过滤算法2.3.3基于上下文的协同过滤算法3.核心算法原理和具体操作步骤以及数学模型公式详细讲解3.1基于用户的协同过滤算法3.2基于物品的协同过滤算法3.3混合协同过滤算法3.
jetson agx orin 刷机、cuda、pytorch配置指南【亲测有效】
jetsonagxorin刷机指南注意事项刷机具体指南cuda环境配置指南Anconda、Pytorch配置注意事项1.使用设备自带usbtoc的传输线时，注意c口插到orin左侧的口，右侧的口不支持数据传输；2.刷机时需准备ubuntu系统，可以是虚拟机，注意安装SDKManager刷机时，JetPack版本要选对，JetPack6.0的对应ubuntu22，cuda12版本，对应pytorch
Python桌面应用开发的未来——智能化工具与大模型赋能 IronwoodStag78
开发AI智能应用，就下载InsCodeAIIDE，一键接入DeepSeek-R1满血版大模型！标题：Python桌面应用开发的未来——智能化工具与大模型赋能随着人工智能技术的飞速发展，传统软件开发模式正在被重新定义。Python作为一门功能强大且灵活的语言，在桌面应用开发领域一直占据重要地位。然而，面对日益复杂的用户需求和快速变化的技术环境，如何提升开发效率、降低开发门槛，成为开发者亟需解决的问题
如何使用Python实现交通工具识别
如何使用Python实现交通工具识别文章目录技术架构功能流程识别逻辑用户界面增强特性依赖项主要类别内容展示该系统是一个基于深度学习的交通工具识别工具，具备以下核心功能与特点：技术架构使用预训练的ResNet50卷积神经网络模型（来自ImageNet数据集）集成图像增强预处理技术（随机裁剪、旋转、翻转等）采用多数投票机制提升预测稳定性基于置信度评分的结果筛选策略功能流程用户通过GUI界面选择待识别图
Yolov5-obb(旋转目标poly_nms_cuda.cu编译bug记录及解决方案)
关于在执行pythonsetup.pydevelop#or"pipinstall-v-e."时poly_nms_cuda.cu报错问题。前面步骤严格按照install.md环境1.pytorch版本较低时（我的是1.10）：poly_nms_cuda.cu文件添加”#defineeps1e-8“，删除“constdoubleeps=1E-8;”这句2.pytorch版本较高时（我用的是1.27）h
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul