晓飞的算法工程笔记

Spiking-YOLO : 前沿性研究，脉冲神经网络在目标检测的首次尝试 | AAAI 2020

论文提出Spiking-YOLO，是脉冲神经网络在目标检测领域的首次成功尝试，实现了与卷积神经网络相当的性能，而能源消耗极低。论文内容新颖，比较前沿，推荐给大家阅读

来源：晓飞的算法工程笔记公众号

论文: Spiking-YOLO: Spiking Neural Network for Energy-Efficient Object Detection

论文地址：http://arxiv.org/abs/1903.06530

Introduction

脉冲神经网络(Spiking neural network, SNN)将脉冲神经元作为计算单元，能够模仿人类大脑的信息编码和处理过程。不同于CNN使用具体的值(continuous)进行信息传递，SNN通过脉冲序列(discrete)中每个脉冲发射时间(temporal)进行信息的传递，能够提供稀疏但强大的计算能力。脉冲神经元将输入累积到膜电压，当达到具体阈值时进行脉冲发射，能够进行事件驱动式计算。由于脉冲事件的稀疏性以及事件驱动的计算形式，SNN能提供卓越的能源利用效率，是神经形态结构的首选神经网络
尽管SNN有很多好处，但目前仅能处理相对简单的任务，由于神经元复杂的动态性以及不可导的操作，暂时没有一个可扩展的训练方法。DNN-to-SNN是近期广泛的SNN训练方法，该方法将目标DNN转化成SNN的中间DNN网络进行训练，然后转成SNN并复用其训练的参数，在小数据集分类上能达到不错的性能，但是在大数据集上分类结果不太理想
论文打算使用DNN-to-SNN转化方法将SNN应用到更复杂的目标检测领域中，图片分类只需要选择分类就好，而目标检测则需要神经网络进行高度准确的数字预测，难很多。在深入分析后，论文实现YOLO的转换主要面临以下两个问题：

常用的SNN归一化方法过于低效，导致脉冲发射频率过低。由于SNN需要设定阈值进行脉冲发射，所以要对权值进行归一化，这样有利于阈值的设定，而常用的SNN归一化方法在目标检测中显得过于低效，后面会详细阐述
在SNN领域，没有高效leaky-ReLU的实现，因为要将YOLO转换为SNN，YOLO中包含大量leaky-ReLU，这是很重要的结构，但目前还没有高效的转换方法

为此，论文使用channel-wise归一化(Channel-wise normalization)和阈值不平衡的有符号神经元(signed neuron with imbalanced threshold)来分别解决以上问题，搭建了基于SNN的目标检测模型Spiking-YOLO，论文的贡献总结如下：

深度SNN在目标检测领域的第一次尝试
channel-wise归一化，深度SNN的细粒度归一化方法，使得多个神经元更高但仍然合适的频率发射脉冲，进而让SNN信息传递更快且更准确
阈值不平衡的有符号神经元，提出leaky-ReLU在SNN领域的高效实现，在神经芯片上也能够轻量级集成

SNN神经元简述

SNN使用脉冲序列进行神经元间的信息传递，IF(integrate-and-fire)神经元累积输入 $z$ 到膜电压 $V_{mem}$

第 $l$ 层的第 $j$ 个神经元的膜电压计算如公式1， $\Theta_j^l(t)$ 为脉冲， $V_{th}$ 为临界电压， $z_k^l(t)$ 为神经元的输入

$z_k^l(t)$ 由多个输入累加， $w$ 和 $b$ 为权重和偏置

当膜电压 $V_{mem}$ 大于临界电压 $V_{th}$ 时产生脉冲 $\Theta$ ， $U$ 为单位阶跃函数(unit step function)，满足输出1，不满足则输出0。由于SNN是事件驱动的，能源利用率相当高，但难以训练是SNN在所有应用上的主要障碍

Methods

论文直接使用DNN-to-SNN转换方法将SNN应用到目标检测中，发现性能下降得十分严重，在分析性能下降原因后，得出两个主要原因：a) 大量神经元的脉冲发射频率过低 b) SNN缺少leaky-ReLU的高效实现

Channel-wise data-based normalization

Conventional normalization methods

在SNN中，根据输入的幅度产生脉冲序列进行无损的内容传递是极为重要的。但在固定时间，激活过度或激活不足的神经元内将可能导致内容损失，这和临界电压 $V_{th}$ 的设置有关。设置过高，神经元需要累积很长时间的电压才能发射脉冲，相反则会过多地发射脉冲。发射频率通常定义为 $\frac{N}{T}$ ， $N$ 为 $T$ 个timestep的脉冲发射总数，最大的发射率为100%，即每个timestep都发射脉冲

为了防止神经元的激活过度和激活不足，权值和临界电压都需要精心地选择。为此，很多研究提出了归一化的方法，比如常用的Layer-wise normalization(layer-norm)。该方法通过该层的最大化激活值来归一化层的权值，如公式4， $w$ 和 $b$ 为权重， $\lambda$ 为输出特征图最大值。经过归一化后，神经元的输出就归一到 $[0, 1]$ ，方便设定临界电压。由于最大激活值 $\lambda$ 从训练集得到的，所以测试集和训练集需要有相同的分布，但论文实验发现这种常规的归一化方法在目标检测任务上会导致明显的性能下降

Analysis of layer-norm limitation

图1展示了通过layer-norm后的各层每个channel的最大激活值，蓝色和红色的线分别为每层的平均激活值和最小激活值。可以看到每层的归一化后的激活值偏差较大，总体而言，layer-norm使得神经元的channel偏向激活不足，这在仅需选择分类的图片分类任务是不被察觉的，但对于需要预测准确值的检测任务的回归则不一样。比如传递0.7，则需要在10个timestep脉冲7次，0.007则需要在1000timestep脉冲7次。当tempstep本身就很少时，过低的发射率可能会因发射不到足够的脉冲而导致信息丢失

Proposed normalization method

论文提出更细力度的归一化方法，channel-wise normalization(channel-norm)，该方法在每层的channel维度上，使用最大激活值对权值进行归一化

channel-wise归一化方法如公式5， $i$ 和 $j$ 为维度下标， $l$ 层权值 $w$ 通过在每个channel使用最大激活值 $\lambda_j^l$ 进行归一化，该值依然是从训练集计算的。对于非首层中，归一化的激活值必须乘上 $\lambda_i^{l-1}$ 来将输入还原为上一层归一化前的值，再进行本层的归一化，不然传递的信息会越来越小

具体的逻辑如图2和算法1，channel-wise的归一化方法能够消除激活值特别小的问题，即得到更高但合适的发射频率，在短时间内也能准确地传递信息

Analysis of the improved firing rate

如图3所示，对于channel-norm，大多数的神经元能接近80%的发射率，而对于layer-norm，大多数的神经元的发射率在0到3.5%之间，这明显表明channel-norm避免了过小的激活值使得更多神经发射频率更高且合适

另外从图4可以看出，channel-norm在大多数的channel上能产生更高的发射频率，特别在channel 2

图5则随机采样了20个神经元，记录其脉冲活动，使用channel-norm使得大多数神经元能够更有规律地发射脉冲
从上面的分析可以看出，channle-norm能够避免过小的归一化激活值，从而保持较高的脉冲发射频率，使得神经元能够在短时间内准确地传递信息，是深度SNN在解决更高级的机器学习问题的一种可行解决方案

Signed neuron featuring imbalanced threshold

Limitation of leaky-ReLU implementation in SNNs

ReLU是最常用的激活函数，保留正值而去掉所有的负值，目前的DNN-to-SNN方法都专注于IF神经元与ReLU间的转换，忽略了激活函数中的负值，而在Tiny-YOLO中，负值激活占了51%。leaky-ReLU是目前最常用的激活，通过leakage项来保留负值 $f(x)=\alpha x$ ， $\alpha$ 一般为0.01，但目前还没有准确且高效的SNN实现方法。此前有研究提出负临界电压(-1)，使得可以存在正负激活，然后在这基础乘以 $\alpha$ 来转换leaky-ReLU，但这违背了生物学(脉冲是离散信号)，而在神经芯片上也需额外的模块进行浮点运算

The notion of imbalanced threshold

论文提出阈值不平衡的有符号神经元(IBT)，在负值区域使用临界电压 $V_{th,neg}=-\frac{V_{th}}{\alpha}$ ，不仅可以传递正负激活值，保持离散型，还可以高效和准确地仿照leaky-ReLU的leakage项

如图6所示，假设 $V_{th,pos}=1V$ ，在 $\alpha=0.1$ 时， $V_{th,neg}=-10V$ ，膜电压需要积累多10倍来发射负激活，类似于leaky-ReLU

Evaluation

Spiking-YOLO detection results

实验的目的是无损地将Tiny-YOLO的转移为SNN，结果如图7所示，使用channel-norm和IBT能有效地提升性能，且使用的timestep更少

论文尝试了不同的解码方式，分别为膜电压 $V_{mem}$ 和脉冲数 $V_{mem}/V_{th}$ ，由于脉冲数的余数要舍弃，这会带来误差和信息损失，所以基于膜电压进行解压会更准确

Spiking-YOLO energy efficiency

DNN主要使用相乘累积(multiply-accumulate , MAC)操作，而SNN则主要是累积操作(accumulate, AC)，因为脉冲是二值的(1或-1)，当接受到脉冲时，不用实时乘权重就可以知道结果。32-bit浮点型MAC和AC分别需要3.6pJ和0.9pJ，而32-bit整数型MAC和AC分别为3.2pJ和0.1pJ。如图9所示，不管使用哪种归一化方法，Spiking-YOLO的计算耗能仅为Tiny-YOLO的1/2000倍，能源利用十分高效

论文在实际设备上对比了Spiking-YOLO(TrueNorth chip)和Tiny-YOLO(Titan V100)，因为channel-norm的发射率较高且合适，所以使用了更少的timestep，能源消耗最少

Conclusion

论文提出Spiking-YOLO，是脉冲神经网络在目标检测领域的首次成功尝试，实现了与卷积神经网络相当的性能，而能源消耗极低。论文内容新颖，比较前沿，推荐给大家阅读

参考内容

Towards spike-based machine intelligence with neuromorphic computing (http://www.nature.com/articles/s41586-019-1677-2)
Spiking Deep Convolutional Neural Networks for Energy-Efficient Object Recognition (http://link.springer.com/article/10.1007/s11263-014-0788-3)

如果本文对你有帮助，麻烦点个赞或在看呗～
更多内容请关注微信公众号【晓飞的算法工程笔记】

你可能感兴趣的:(晓飞的算法工程笔记)

ENAS：首个权值共享的神经网络搜索方法，千倍加速 | ICML 2018 VincentTeddy
NAS是自动设计网络结构的重要方法，但需要耗费巨大的资源，导致不能广泛地应用，而论文提出的EfficientNeuralArchitectureSearch(ENAS)，在搜索时对子网的参数进行共享，相对于NAS有超过1000x倍加速，单卡搜索不到半天，而且性能并没有降低，十分值得参考来源：【晓飞的算法工程笔记】公众号论文:EfficientNeuralArchitectureSearchvia
DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020 VincentTeddy
论文针对当前anchor-free目标检测算法的问题提出了DDBNet，该算法对预测框进行更准确地评估，包括正负样本以及IoU的判断。DDBNet的创新点主要在于box分解和重组模块(D&R)和语义一致性模块，分别用于解决中心关键点的回归不准问题以及中心关键点与目标语义不一致问题。从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记
DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020 晓飞的算法工程笔记晓飞的算法工程笔记深度学习神经网络机器学习
论文针对当前anchor-free目标检测算法的问题提出了DDBNet，该算法对预测框进行更准确地评估，包括正负样本以及IoU的判断。DDBNet的创新点主要在于box分解和重组模块(D&R)和语义一致性模块，分别用于解决中心关键点的回归不准问题以及中心关键点与目标语义不一致问题。从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记
DeiT：训练ImageNet仅用4卡不到3天的平民ViT | ICML 2021 VincentTeddy
论文基于改进训练配置以及一种新颖的蒸馏方式，提出了仅用ImageNet就能训练出来的Transformer网络DeiT。在蒸馏学习时，DeiT以卷积网络作为teacher，能够结合当前主流的数据增强和训练策略来进一步提高性能。从实验结果来看，效果很不错来源：晓飞的算法工程笔记公众号论文:Trainingdata-efficientimagetransformers&distillationthro
Hybrid-PSC：基于对比学习的混合网络，解决长尾图片分类 | CVPR 2021 VincentTeddy
论文提出新颖的混合网络用于解决长尾图片分类问题，该网络由用于图像特征学习的对比学习分支和用于分类器学习的交叉熵分支组成，在训练过程逐步将训练权重调整至分类器学习，达到更好的特征得出更好的分类器的思想。另外，为了节省内存消耗，论文提出原型有监督对比学习。从实验结果来看，论文提出的方法效果还是很不错的，值得一看来源：晓飞的算法工程笔记公众号论文:ContrastiveLearningbasedHyb
CornerNet：经典keypoint-based方法，通过定位角点进行目标检测 | ECCV2018 VincentTeddy
论文提出了CornerNet，通过检测角点对的方式进行目标检测，与当前的SOTA检测模型有相当的性能。CornerNet借鉴人体姿态估计的方法，开创了目标检测领域的一个新框架，后面很多论文都基于CorerNet的研究拓展出新的角点目标检测来源：晓飞的算法工程笔记公众号论文:CornerNet:DetectingObjectsasPairedKeypoints论文地址：https://arxiv.
NASNet : Google Brain经典作，改造搜索空间，性能全面超越人工网络，继续领跑NAS领域 | CVPR 2018 VincentTeddy
论文将搜索空间从整体网络转化为卷积单元(cell)，再按照设定堆叠成新的网络家族NASNet。不仅降低了搜索的复杂度，从原来的28天缩小到4天，而且搜索出来的结构具有扩展性，在小模型和大模型场景下都能使用更少的参数量和计算量来超越人类设计的模型，达到SOTA 来源：【晓飞的算法工程笔记】公众号论文:LearningTransferableArchitecturesforScalableImageR
PNAS：渐进式神经网络搜索，准确率预测，21倍加速 | ECCV2018 VincentTeddy
论文将核心放在搜索加速方面，基于NASNet，提出渐进式的PNAS搜索策略以及通过代理函数直接预测网络的准确率，极大地优化搜索逻辑，能够在搜索到相同性能的前提下，将搜索消耗降低21倍之多来源：【晓飞的算法工程笔记】公众号论文:ProgressiveNeuralArchitectureSearch论文地址：https://arxiv.org/abs/1712.00559Introduction 目
OREPA：阿里提出训练也很快的重参数策略，内存减半，速度加倍 | CVPR 2022 VincentTeddy
论文提出了在线重参数方法OREPA，在训练阶段就能将复杂的结构重参数为单卷积层，从而降低大量训练的耗时。为了实现这一目标，论文用线性缩放层代替了训练时的BN层，保持了优化方向的多样性和特征表达能力。从实验结果来看，OREPA在各种任务上的准确率和效率都很不错来源：晓飞的算法工程笔记公众号论文:OnlineConvolutionalRe-parameterization[图片上传失败...(ima
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018 VincentTeddy
论文提出NASH方法来进行神经网络结构搜索，核心思想与之前的EAS方法类似，使用网络态射来生成一系列效果一致且继承权重的复杂子网，本文的网络态射更丰富，而且仅需要简单的爬山算法辅助就可以完成搜索，耗时0.5GPUday 来源：晓飞的算法工程笔记公众号论文:SimpleAndEfficientArchitectureSearchforConvolutionalNeuralNetworks论文地址：h
DDP：微软提出动态detection head选择，适配计算资源有限场景 | CVPR 2022 VincentTeddy
DPP能够对目标检测proposal进行非统一处理，根据proposal选择不同复杂度的算子，加速整体推理过程。从实验结果来看，效果非常不错来源：晓飞的算法工程笔记公众号论文:ShouldAllProposalsbeTreatedEquallyinObjectDetection?[图片上传失败...(image-918413-1665323159579)]论文地址：https://arxiv.or
DVT：华为提出动态级联Vision Transformer，性能杠杠的 | NeurIPS 2021 VincentTeddy
论文主要处理VisionTransformer中的性能问题，采用推理速度不同的级联模型进行速度优化，搭配层级间的特征复用和自注意力关系复用来提升准确率。从实验结果来看，性能提升不错来源：晓飞的算法工程笔记公众号论文:NotAllImagesareWorth16x16Words:DynamicTransformersforEfficientImageRecognition[图片上传失败...(ima
Swin Transformer：最佳论文，准确率和性能双佳的视觉Transformer | ICCV 2021 VincentTeddy
论文提出了经典的VisionTransormer模型SwinTransformer，能够构建层级特征提高任务准确率，而且其计算复杂度经过各种加速设计，能够与输入图片大小成线性关系。从实验结果来看，SwinTransormer在各视觉任务上都有很不错的准确率，而且性能也很高来源：晓飞的算法工程笔记公众号论文:SwinTransformer:HierarchicalVisionTransformer
DARTS：基于梯度下降的经典网络搜索方法，开启端到端的网络搜索 | ICLR 2019
DARTS是很经典的NAS方法，它的出现打破了以往的离散的网络搜索模式，能够进行end-to-end的网络搜索。由于DARTS是基于梯度进行网络更新的，所以更新的方向比较准确，搜索时间相当于之前的方法有很大的提升，CIFAR-10的搜索仅需要4GPUdays。来源：晓飞的算法工程笔记公众号论文:DARTS:DifferentiableArchitectureSearch论文地址：https://
SMASH：经典One-Shot神经网络搜索，仅需单卡 | ICLR 2018
SMASH方法使用辅助网络生成次优权重来支持网络的快速测试，从结果来看，生成的权重与正常训练的权重在准确率上存在关联性，整体搜索速度很快，仅需要单卡进行搜索，提供了一个很好的新思路。来源：晓飞的算法工程笔记公众号论文:SMASH:One-ShotModelArchitectureSearchthroughHyperNetworks论文地址：https://arxiv.org/abs/1708.0
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索，核心思想与之前的EAS方法类似，使用网络态射来生成一系列效果一致且继承权重的复杂子网，本文的网络态射更丰富，而且仅需要简单的爬山算法辅助就可以完成搜索，耗时0.5GPUday 来源：晓飞的算法工程笔记公众号论文:SimpleAndEfficientArchitectureSearchforConvolutionalNeuralNetworks论文地址：h
FBNet/FBNetV2/FBNetV3：Facebook在NAS领域的轻量级网络探索 | 轻量级网络
FBNet系列是完全基于NAS方法的轻量级网络系列，分析当前搜索方法的缺点，逐步增加创新性改进，FBNet结合了DNAS和资源约束，FBNetV2加入了channel和输入分辨率的搜索，FBNetV3则是使用准确率预测来进行快速的网络结构搜索来源：晓飞的算法工程笔记公众号FBNet论文:FBNet:Hardware-AwareEfficientConvNetDesignviaDifferenti
RelationNet：学习目标间关系来增强特征以及去除NMS | CVPR 2018
论文基于NLP的注意力机制提出了目标关系模块，通过与其它目标的比对增强当前目标的特征，而且还可以代替NMS进行端到端的重复结果去除，思想十分新颖，效果也不错来源：晓飞的算法工程笔记公众号论文:RelationNetworksforObjectDetection论文地址：https://arxiv.org/abs/1711.11575论文代码：https://github.com/msracver
CSG：清华大学提出通过分化类特定卷积核来训练可解释的卷积网络 | ECCV 2020 Oral
论文提出类特定控制门CSG来引导网络学习类特定的卷积核，并且加入正则化方法来稀疏化CSG矩阵，进一步保证类特定。从实验结果来看，CSG的稀疏性能够引导卷积核与类别的强关联，在卷积核层面产生高度类相关的特征表达，从而提升网络的性能以及可解释性来源：晓飞的算法工程笔记公众号论文:TrainingInterpretableConvolutionalNeuralNetworksbyDifferentia
YOLOF：单层特征检测也可以比FPN更出色 | CVPR 2021 VincentTeddy
论文通过分析发现FPN的成功在于divide-and-conquer策略解决了目标检测的优化问题，借此研究设计了仅用单层特征预测的高效检测网络YOLOF。YOLOF在结构上没有很多花哨的结构，却在准确率、推理速度和收敛速度上都有不错的提升，相对于眼花缭乱的FPN魔改结构，十分值得学习来源：晓飞的算法工程笔记公众号论文:YouOnlyLookOne-levelFeature[图片上传失败...(i
DeepViT：字节提出深层ViT的训练策略 | 2021 arxiv VincentTeddy
作者发现深层ViT出现的注意力崩溃问题，提出了新颖的Re-attention机制来解决，而且计算量和内存开销都很少。通过Re-attention机制，在增加ViT深度时能够保持性能不断提高来源：晓飞的算法工程笔记公众号论文:DeepViT:TowardsDeeperVisionTransformer[图片上传失败...(image-320fda-1666536099045)]论文地址：https:
ExtremeNet：通过极点进行目标检测，更细致的目标区域 | CVPR 2019 VincentTeddy
ExtremeNet检测目标的四个极点，然后以几何的方式将其组合起来进行目标检测，性能与其它传统形式的检测算法相当。ExtremeNet的检测方法十分独特，但是包含了较多的后处理方法，所以有很大的改进空间，感兴趣可以去看看论文实验中的错误分析部分来源：晓飞的算法工程笔记公众号论文:Bottom-upObjectDetectionbyGroupingExtremeandCenterPoints论文
PVT：特征金字塔在Vision Transormer的首次应用，又快又好 | ICCV 2021 VincentTeddy
论文设计了用于密集预测任务的纯Transformer主干网络PVT，包含渐进收缩的特征金字塔结构和spatial-reductionattention层，能够在有限的计算资源和内存资源下获得高分辨率和多尺度的特征图。从物体检测和语义分割的实验可以看到，PVT在相同的参数数量下比CNN主干网络更强大来源：晓飞的算法工程笔记公众号论文:PyramidVisionTransformer:AVersati
DS-Net：可落地的动态网络，实际加速1.62倍，快改造起来 | CVPR 2021 Oral VincentTeddy
论文提出能够适配硬件加速的动态网络DS-Net，通过提出的double-headed动态门控来实现动态路由。基于论文提出的高性能网络设计和IEB、SGS训练策略，仅用1/2-1/4的计算量就能达到静态SOTA网络性能，实际加速也有1.62倍来源：晓飞的算法工程笔记公众号论文:DynamicSlimmableNetwork[图片上传失败...(image-262f83-1657684119973)
DGC：真动态分组卷积，可能是解决分组特征阻塞的最好方案 | ECCV 2020 Spotlight 晓飞的算法工程笔记晓飞的算法工程笔记网络机器学习人工智能卷积深度学习
近期，动态网络在加速推理这方面有很多研究，DGC(DynamicGroupConvolution)将动态网络的思想结合到分组卷积中，使得分组卷积在轻量化的同时能够加强表达能力，整体思路直接清晰，可作为网络设计时的一个不错的选择来源：晓飞的算法工程笔记公众号论文:DynamicGroupConvolutionforAcceleratingConvolutionalNeuralNetworks论文地
AABO：自适应Anchor设置优化，性能榨取的最后一步 | ECCV 2020 Spotlight VincentTeddy
论文提出超参数优化方法AABO，该方法核心基于贝叶斯优化和Sub-Sample方法，能够自适应的搜索最优的anchor设置。从实验结果来看，AABO能够仅通过anchor设置优化，为SOTA目标检测方法带来1.4%～2.4%的性能提升来源：晓飞的算法工程笔记公众号论文:AABO:AdaptiveAnchorBoxOptimizationforObjectDetectionviaBayesianS
ESPNet/ESPNetV2：空洞卷积金字塔 | 轻量级网络晓飞的算法工程笔记晓飞的算法工程笔记卷积算法网络计算机视觉神经网络
ESPNet系列的核心在于空洞卷积金字塔，每层具有不同的dilationrate，在参数量不增加的情况下，能够融合多尺度特征，相对于深度可分离卷积，深度可分离空洞卷积金字塔性价比更高。另外，HFF的多尺度特征融合方法也很值得借鉴来源：晓飞的算法工程笔记公众号ESPNet论文:ESPNet:EfficientSpatialPyramidofDilatedConvolutionsforSemanti
GFLV2：边界框不确定性的进一步融合，提点神器 | CVPR 2021 晓飞的算法工程笔记晓飞的算法工程笔记深度学习计算机视觉目标检测
GFLV2基于GFLV1的bbox分布进行改进，将分布的统计信息融入到定位质量估计中，整体思想十分创新和完备，从实验结果来看，效果还是挺不错的来源：晓飞的算法工程笔记公众号论文:GeneralizedFocalLossV2:LearningReliableLocalizationQualityEstimationforDenseObjectDetection论文地址：https://arxiv.
SMASH：经典One-Shot神经网络搜索，仅需单卡 | ICLR 2018 晓飞的算法工程笔记晓飞的算法工程笔记算法神经网络机器学习人工智能深度学习
SMASH方法使用辅助网络生成次优权重来支持网络的快速测试，从结果来看，生成的权重与正常训练的权重在准确率上存在关联性，整体搜索速度很快，仅需要单卡进行搜索，提供了一个很好的新思路。来源：晓飞的算法工程笔记公众号论文:SMASH:One-ShotModelArchitectureSearchthroughHyperNetworks论文地址：https://arxiv.org/abs/1708.0
有关TSD论文笔记 luxuanjiangg 算法
论文地址：https://arxiv.org/abs/2003.07540晓飞的算法工程笔记前景.经典RoI-based定位算法使用siblinghead(2-fc)对proposal同时进行分类和回归进行分类任务和定位任务的目标检测学习的主要障碍：共用的特征提取器以及相同的proposal限制定位算法的根本问题在于分类分支和定位分支在空间维度上存在偏差，不是通过设计特征提取器或更好的结构能解决的
桌面上有多个球在同时运动，怎么实现球之间不交叉，即碰撞？换个号韩国红果果 html 小球碰撞
稍微想了一下，然后解决了很多bug，最后终于把它实现了。其实原理很简单。在每改变一个小球的x y坐标后，遍历整个在dom树中的其他小球，看一下它们与当前小球的距离是否小于球半径的两倍？若小于说明下一次绘制该小球（设为a）前要把他的方向变为原来相反方向（与a要碰撞的小球设为b），即假如当前小球的距离小于球半径的两倍的话，马上改变当前小球方向。那么下一次绘制也是先绘制b，再绘制a，由于a的方向已经改变
《高性能HTML5》读后整理的Web性能优化内容白糖_ html5
读后感先说说《高性能HTML5》这本书的读后感吧，个人觉得这本书前两章跟书的标题完全搭不上关系，或者说只能算是讲解了“高性能”这三个字，HTML5完全不见踪影。个人觉得作者应该首先把HTML5的大菜拿出来讲一讲，再去分析性能优化的内容，这样才会有吸引力。因为只是在线试读，没有机会看后面的内容，所以不胡乱评价了。
[JShop]Spring MVC的RequestContextHolder使用误区 dinguangx jeeshop 商城系统 jshop 电商系统
在spring mvc中，为了随时都能取到当前请求的request对象，可以通过RequestContextHolder的静态方法getRequestAttributes()获取Request相关的变量，如request, response等。在jshop中，对RequestContextHolder的
算法之时间复杂度周凡杨 java 算法时间复杂度效率
在计算机科学中，算法的时间复杂度是一个函数，它定量描述了该算法的运行时间。这是一个关于代表算法输入值的字符串的长度的函数。时间复杂度常用大O符号表述，不包括这个函数的低阶项和首项系数。使用这种方式时，时间复杂度可被称为是渐近的，它考察当输入值大小趋近无穷时的情况。这样用大写O()来体现算法时间复杂度的记法，
Java事务处理 g21121 java
一、什么是Java事务通常的观念认为，事务仅与数据库相关。事务必须服从ISO/IEC所制定的ACID原则。ACID是原子性（atomicity）、一致性（consistency）、隔离性（isolation）和持久性（durability）的缩写。事务的原子性表示事务执行过程中的任何失败都将导致事务所做的任何修改失效。一致性表示当事务执行失败时，所有被该事务影响的数据都应该恢复到事务执行前的状
Linux awk命令详解 510888780 linux
一. AWK 说明 awk是一种编程语言，用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件，或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能，是linux/unix下的一个强大编程工具。它在命令行中使用，但更多是作为脚本来使用。 awk的处理文本和数据的方式：它逐行扫描文件，从第一行到
android permission 布衣凌宇 Permission
<uses-permission android:name="android.permission.ACCESS_CHECKIN_PROPERTIES" ></uses-permission>允许读写访问"properties"表在checkin数据库中，改值可以修改上传 <uses-permission android:na
Oracle和谷歌Java Android官司将推迟 aijuans java oracle
北京时间 10 月 7 日，据国外媒体报道，Oracle 和谷歌之间一场等待已久的官司可能会推迟至 10 月 17 日以后进行，这场官司的内容是 Android 操作系统所谓的 Java 专利权之争。本案法官 William Alsup 称根据专利权专家 Florian Mueller 的预测，谷歌 Oracle 案很可能会被推迟。　　该案中的第二波辩护被安排在 10 月 17 日出庭，从目前看来
linux shell 常用命令 antlove linux shell command
grep [options] [regex] [files] /var/root # grep -n "o" * hello.c:1:/* This C source can be compiled with:
Java解析XML配置数据库连接(DOM技术连接 SAX技术连接) 百合不是茶 sax技术 Java解析xml文档 dom技术 XML配置数据库连接
XML配置数据库文件的连接其实是个很简单的问题,为什么到现在才写出来主要是昨天在网上看了别人写的,然后一直陷入其中,最后发现不能自拔所以今天决定自己完成 ,,,,现将代码与思路贴出来供大家一起学习 XML配置数据库的连接主要技术点的博客; JDBC编程 : JDBC连接数据库 DOM解析XML: DOM解析XML文件 SA
underscore.js 学习（二） bijian1013 JavaScript underscore
Array Functions 所有数组函数对参数对象一样适用。1.first _.first(array, [n]) 别名: head, take 返回array的第一个元素，设置了参数n，就
plSql介绍 bijian1013 oracle 数据库 plsql
/* * PL/SQL 程序设计学习笔记 * 学习plSql介绍.pdf * 时间：2010-10-05 */ --创建DEPT表 create table DEPT ( DEPTNO NUMBER(10), DNAME NVARCHAR2(255), LOC NVARCHAR2(255) ) delete dept; select
【Nginx一】Nginx安装与总体介绍 bit1129 nginx
启动、停止、重新加载Nginx nginx 启动Nginx服务器，不需要任何参数u nginx -s stop 快速(强制)关系Nginx服务器 nginx -s quit 优雅的关闭Nginx服务器 nginx -s reload 重新加载Nginx服务器的配置文件 nginx -s reopen 重新打开Nginx日志文件
spring mvc开发中浏览器兼容的奇怪问题 bitray jquery Ajax springMVC 浏览器上传文件
最近个人开发一个小的OA项目,属于复习阶段.使用的技术主要是spring mvc作为前端框架,mybatis作为数据库持久化技术.前台使用jquery和一些jquery的插件. 在开发到中间阶段时候发现自己好像忽略了一个小问题,整个项目一直在firefox下测试,没有在IE下测试,不确定是否会出现兼容问题.由于jquer
Lua的io库函数列表 ronin47 lua io
1、io表调用方式：使用io表，io.open将返回指定文件的描述，并且所有的操作将围绕这个文件描述　　io表同样提供三种预定义的文件描述io.stdin,io.stdout,io.stderr 　　2、文件句柄直接调用方式,即使用file:XXX()函数方式进行操作,其中file为io.open()返回的文件句柄　　多数I/O函数调用失败时返回nil加错误信息,有些函数成功时返回nil
java-26-左旋转字符串 bylijinnan java
public class LeftRotateString { /** * Q 26 左旋转字符串 * 题目：定义字符串的左旋转操作：把字符串前面的若干个字符移动到字符串的尾部。 * 如把字符串abcdef左旋转2位得到字符串cdefab。 * 请实现字符串左旋转的函数。要求时间对长度为n的字符串操作的复杂度为O(n)，辅助内存为O(1)。 */ pu
《vi中的替换艺术》-linux命令五分钟系列之十一 cfyme linux命令
vi方面的内容不知道分类到哪里好，就放到《Linux命令五分钟系列》里吧！今天编程，关于栈的一个小例子，其间我需要把”S.”替换为”S->”(替换不包括双引号)。其实这个不难，不过我觉得应该总结一下vi里的替换技术了，以备以后查阅。 1 所有替换方案都要在冒号“:”状态下书写。 2 如果想将abc替换为xyz，那么就这样 :s/abc/xyz/ 不过要特别
[轨道与计算]新的并行计算架构 comsci 并行计算
我在进行流程引擎循环反馈试验的过程中，发现一个有趣的事情。。。如果我们在流程图的每个节点中嵌入一个双向循环代码段，而整个流程中又充满着很多并行路由，每个并行路由中又包含着一些并行节点，那么当整个流程图开始循环反馈过程的时候，这个流程图的运行过程是否变成一个并行计算的架构呢？
重复执行某段代码 dai_lm android
用handler就可以了 private Handler handler = new Handler(); private Runnable runnable = new Runnable() { public void run() { update(); handler.postDelayed(this, 5000); } }; 开始计时 h
Java实现堆栈（list实现） datageek 数据结构——堆栈
public interface IStack<T> { //元素出栈，并返回出栈元素 public T pop(); //元素入栈 public void push(T element); //获取栈顶元素 public T peek(); //判断栈是否为空 public boolean isEmpty
四大备份MySql数据库方法及可能遇到的问题 dcj3sjt126com DB backup
一：通过备份王等软件进行备份前台进不去？用备份王等软件进行备份是大多老站长的选择，这种方法方便快捷，只要上传备份软件到空间一步步操作就可以，但是许多刚接触备份王软件的客用户来说还原后会出现一个问题：因为新老空间数据库用户名和密码不统一，网站文件打包过来后因没有修改连接文件，还原数据库是好了，可是前台会提示数据库连接错误，网站从而出现打不开的情况。解决方法：学会修改网站配置文件，大多是由co
github做webhooks：[1]钩子触发是否成功测试 dcj3sjt126com github git webhook
转自: http://jingyan.baidu.com/article/5d6edee228c88899ebdeec47.html github和svn一样有钩子的功能，而且更加强大。例如我做的是最常见的push操作触发的钩子操作，则每次更新之后的钩子操作记录都会在github的控制板可以看到！工具/原料 github 方法/步骤
">的作用" target="_blank">JSP中的作用蕃薯耀
JSP中<base href="<%=basePath%>">的作用 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>
linux下SAMBA服务安装与配置 hanqunfeng linux
局域网使用的文件共享服务。一.安装包： rpm -qa | grep samba samba-3.6.9-151.el6.x86_64 samba-common-3.6.9-151.el6.x86_64 samba-winbind-3.6.9-151.el6.x86_64 samba-client-3.6.9-151.el6.x86_64 samba-winbind-clients
guava cache IXHONG cache
缓存，在我们日常开发中是必不可少的一种解决性能问题的方法。简单的说，cache 就是为了提升系统性能而开辟的一块内存空间。　　缓存的主要作用是暂时在内存中保存业务系统的数据处理结果，并且等待下次访问使用。在日常开发的很多场合，由于受限于硬盘IO的性能或者我们自身业务系统的数据处理和获取可能非常费时，当我们发现我们的系统这个数据请求量很大的时候，频繁的IO和频繁的逻辑处理会导致硬盘和CPU资源的
Query的开始--全局变量,noconflict和兼容各种js的初始化方法 kvhur JavaScript jquery css
这个是整个jQuery代码的开始，里面包含了对不同环境的js进行的处理，例如普通环境，Nodejs，和requiredJs的处理方法。还有jQuery生成$, jQuery全局变量的代码和noConflict代码详解完整资源： http://www.gbtags.com/gb/share/5640.htm jQuery 源码： (
美国人的福利和中国人的储蓄 nannan408
今天看了篇文章，震动很大，说的是美国的福利。美国医院的无偿入院真的是个好措施。小小的改善，对于社会是大大的信心。小孩，税费等，政府不收反补，真的体现了人文主义。美国这么高的社会保障会不会使人变懒？答案是否定的。正因为政府解决了后顾之忧，人们才得以倾尽精力去做一些有创造力，更造福社会的事情，这竟成了美国社会思想、人
N阶行列式计算(JAVA) qiuwanchi N阶行列式计算
package gaodai; import java.util.List; /** * N阶行列式计算 * @author 邱万迟 * */ public class DeterminantCalculation { public DeterminantCalculation(List<List<Double>> determina
C语言算法之打渔晒网问题 qiufeihu c 算法
如果一个渔夫从2011年1月1日开始每三天打一次渔，两天晒一次网，编程实现当输入2011年1月1日以后任意一天，输出该渔夫是在打渔还是在晒网。代码如下： #include <stdio.h> int leap(int a) /*自定义函数leap()用来指定输入的年份是否为闰年*/ { if((a%4 == 0 && a%100 != 0
XML中DOCTYPE字段的解析 wyzuomumu xml
DTD声明始终以!DOCTYPE开头,空一格后跟着文档根元素的名称,如果是内部DTD,则再空一格出现[],在中括号中是文档类型定义的内容. 而对于外部DTD,则又分为私有DTD与公共DTD,私有DTD使用SYSTEM表示,接着是外部DTD的URL. 而公共DTD则使用PUBLIC,接着是DTD公共名称,接着是DTD的URL. 私有DTD <!DOCTYPErootSYST

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他