晓飞的算法工程笔记

AAAI 2020 | DIoU和CIoU：IoU在目标检测中的正确打开方式

论文提出了IoU-based的DIoU loss和CIoU loss，以及建议使用DIoU-NMS替换经典的NMS方法，充分地利用IoU的特性进行优化。并且方法能够简单地迁移到现有的算法中带来性能的提升，实验在YOLOv3上提升了5.91mAP，值得学习

论文:Distance-IoU Loss: Faster and Better Learning for Bounding Box Regression

论文地址：https://arxiv.org/abs/1911.08287
代码地址：https://github.com/Zzh-tju/DIoU

Introduction

IoU

IoU是目标检测里面很重要的一个指标，通过预测的框和GT间的交集与并集的比例进行计算，经常用于评价bbox的优劣。但一般对bbox的精调都采用L2范数，而一些研究表明这不是最优化IoU的方法，因此出现了IoU loss

IoU loss

IoU loss顾名思义就是直接通过IoU计算梯度进行回归，论文提到IoU loss的无法避免的缺点：当两个box无交集时，IoU=0，很近的无交集框和很远的无交集框的输出一样，这样就失去了梯度方向，无法优化。IoU loss的实现形式有很多种，除公式2外，还有UnitBox的交叉熵形式和IoUNet的Smooth-L1形式
这里论文主要讨论的类似YOLO的检测网络，按照GT是否在cell判断当前bbox是否需要回归，所以可能存在无交集的情况。而一般的two stage网络，在bbox regress的时候都会卡 $IoU\ge 0.5$ ，不会对无交集的框进行回归

GIoU loss

GIou loss在IoU loss的基础上增加一个惩罚项， $C$ 为包围预测框 $B$ 和 $B^{gt}$ 的最小区域大小，当bbox的距离越大时，惩罚项将越大

尽管GIoU解决了IoU的梯度问题，但他仍然存在几个限制：

如图1所示，在训练过程中，GIoU倾向于先增大bbox的大小来增大与GT的交集，然后通过公式3的IoU项引导最大化bbox的重叠区域

如图2中的包含情况，GIoU会退化成IoU
由于很大程度依赖IoU项，GIoU需要更多的迭代次数来收敛，特别是水平和垂直的bbox（后面会分析）。一般地，GIoU loss不能很好地收敛SOTA算法，反而造成不好的结果

DIoU

综合上面的分析，论文提出Distance-IoU(DIoU) loss，简单地在IoU loss基础上添加一个惩罚项，该惩罚项用于最小化两个bbox的中心点距离。如图1所示，DIoU收敛速度和效果都很好，而且DIoU能够用于NMS的计算中，不仅考虑了重叠区域，还考虑了中心点距离。另外，论文考虑bbox的三要素，重叠区域，中心点距离和长宽比，进一步提出了Complete IoU(CIoU) loss，收敛更快，效果更好

Analysis to IoU and GIoU Losses

为了全面地分析IoU loss和GIoU的性能，论文进行了模拟实验，模拟不同的距离、尺寸和长宽比的bbox的回归情况

Simulation Experiment

如图3所示，实验选择7个不同长宽比(1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1)的单元box(area=1)作为GT，单元框的中心点固定在(7, 7)，而实验共包含5000 x 7 x 7个bbox，且分布是均匀的：

Distance：在中心点半径3的范围内均匀分布5000中心点，每个点带上7种scales和7种长宽比
Scale：每个中心点的尺寸分别为0.5, 0.67, 0.75, 1, 1.33, 1.5, 2
Aspect ratio：每个中心点的长宽比(=为1:4, 1:3, 1:2, 1:1, 2:1, 3:1, 4:1

给定一个loss函数 $\mathcal{L}$ ，可以通过梯度下降来模拟bbox优化的过程。对于预测的bbox $B_i$ ， $B_i^t$ 为 $t$ 阶段的结果， $\triangledown B_i^{t-1}$ 为 $\mathcal{L}$ 对 $B_i^t$ 的梯度，使用 $\eta(2-IoU_i^{t-1})$ 来加速收敛。bbox的优化评价使用 $\mathcal{l}_1$ -norm，共训练200轮，error曲线如图3b所示

Limitations of IoU and GIoU Losses

论文将5000个中心点上的bbox在最后阶段的total error进行了可视化。IoU loss只对与target box有交集的bbox有效，因为无交集的bbox的 $\triangledown B$ 为0。而GIoU由于增加了惩罚函数，盆地区域明显增大，但是垂直和水平的区域依然保持着高错误率，这是由于GIoU的惩罚项经常很小甚至为0，导致训练需要更多的迭代来收敛

The Proposed Method

一般而言，IoU-based loss可以定义为公式5， $R(B,B^{gt})$ 是预测box $B$ 和 $B^{gt}$ 的惩罚项

Distance-IoU Loss

论文提出了能减少两个box中心点间的距离的惩罚项， $b$ 和 $b^{gt}$ 分别表示 $B$ 和 $B^{gt}$ 的中心点。 $\rho(\cdot)$ 是欧氏距离， $c$ 是最小包围两个bbox的框的对角线长度

DIoU loss的完全定义如公式7

DIoU loss的惩罚项能够直接最小化中心点间的距离，而GIoU loss意在减少外界包围框的面积
DIoU loss保留了IoU loss和GIoU loss的一些属性：

DIoU loss依然是尺寸无关的，不会大尺寸产生大的loss，小尺寸产生小的loss那样
类似于GIoU loss，DIoU loss能够为无交集的bbox提供梯度方向
当bbox完全重合时， $\mathcal{L}_{IoU}=\mathcal{L}_{GoU}=\mathcal{L}_{DoU}=0$ ，当bbox很远时， $\mathcal{L}_{GoU}=\mathcal{L}_{DoU}\to 2$

在模拟实验中，发现DIoU loss也有一些独有的属性：

如图1和图3所示，DIoU loss能够直接最小化bbox的中心点距离。因此，他的收敛很快
在包含的情况下，或垂直和水平的情况下，DIoU loss的收敛非常快，而GIoU loss则几乎退化成了IoU loss

Complete IoU loss

论文考虑到bbox回归三要素中的长宽比还没被考虑到计算中，因此，进一步在DIoU的基础上提出了CIoU。其惩罚项如公式8，其中 $\alpha$ 是权重函数，而 $v$ 用来度量长宽比的相似性

完整的损失函数定义如公式10

$\alpha$ 的定义如公式11，重叠区域能够控制权重的大小

最后，CIoU loss的梯度类似于DIoU loss，但还要考虑 $v$ 的梯度。在长宽在 $[0, 1]$ 的情况下， $w^2+h^2$ 的值通常很小，会导致梯度爆炸，因此在实现时将 $\frac{1}{w^2+h^2}$ 替换成1

Non-Maximum Suppression using DIoU

在原始的NMS中，IoU指标用于抑制多余的检测框，但由于仅考虑了重叠区域，经常会造成错误的抑制，特别是在bbox包含的情况下。因此，可以使用DIoU作为NMS的标准，不仅考虑重叠区域，还考虑了中心点距离

其中 $s_i$ 是分类置信度， $\epsilon$ 为NMS阈值， $\mathcal{M}$ 为最高置信度的框。DIoU-NMS倾向于中心点距离较远的box存在不同的对象，而且仅需改几行代码，DIoU-NMS就能够很简单地集成到目标检测算法中

Experimental Results

YOLO v3 on PASCAL VOC

在YOLOv3上进行实验对比，DIoU loss和CIoU的效果都很显著，mAP分别提升3.29%和5.67%，而AP75则分别提升6.40%和8.43%，而使用DIoU-NMS则能进一步提升，幅度达到5.91%和9.88%

SSD on PASCAL VOC

在SSD-FPN上进行实验对比，因为本身模型已经精度很好了，DIoU loss和CIoU的效果不是很显著，但仍有提升。mAP分别提升0.59%和0.84%，而AP75则分别提升1.77%和2.59%，而使用DIoU-NMS则能进一步提升效果

Faster R-CNN on MS COCO

在Faster R-CNN ResNet-50-FPN上，由于Faster R-CNN本身提供的bbox质量都比较高（即在图4的盆地），因此，GIoU的优化都很小，但此时DIoU和CIoU则表现了不错的优化效果。注意到，CIoU在小物体上的性能都有所下降，可能由于长宽比对小物体的检测贡献不大，因为此时中心点比长宽比重要

图7对GIoU和CIoU的结果进行了可视化，可以看到，在中大型物体检测上，CIoU的结果比GIoU要准确

Discussion on DIoU-NMS

如图8所示，DIoU-NMS能够更好地引导bbox的消除

为了进一步验证DIoU-NMS的效果，进行了对比实验。如图9所示，DIoU-NMS的整体性能都比原生的NMS效果要好

Conclusion

论文提出了两种新的IoU-based损失函数，DIoU loss和CIoU loss：DIoU loss最小化bbox间的中心点距离，从而使得函数快速收敛；CIoU loss则在DIoU loss的基础上加入长宽比的考量，能够进一步地快速收敛和提升性能。另外论文提出DIoU-NMS来代替原生的NMS，充分地利用IoU的特性进行优化，从实验结果来看，效果也是很好的

写作不易，未经允许不得转载～
更多内容请关注知乎专栏/微信公众号【晓飞的算法工程笔记】

你可能感兴趣的:(晓飞的算法工程笔记)

ENAS：首个权值共享的神经网络搜索方法，千倍加速 | ICML 2018 VincentTeddy
NAS是自动设计网络结构的重要方法，但需要耗费巨大的资源，导致不能广泛地应用，而论文提出的EfficientNeuralArchitectureSearch(ENAS)，在搜索时对子网的参数进行共享，相对于NAS有超过1000x倍加速，单卡搜索不到半天，而且性能并没有降低，十分值得参考来源：【晓飞的算法工程笔记】公众号论文:EfficientNeuralArchitectureSearchvia
DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020 VincentTeddy
论文针对当前anchor-free目标检测算法的问题提出了DDBNet，该算法对预测框进行更准确地评估，包括正负样本以及IoU的判断。DDBNet的创新点主要在于box分解和重组模块(D&R)和语义一致性模块，分别用于解决中心关键点的回归不准问题以及中心关键点与目标语义不一致问题。从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记
DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020 晓飞的算法工程笔记晓飞的算法工程笔记深度学习神经网络机器学习
论文针对当前anchor-free目标检测算法的问题提出了DDBNet，该算法对预测框进行更准确地评估，包括正负样本以及IoU的判断。DDBNet的创新点主要在于box分解和重组模块(D&R)和语义一致性模块，分别用于解决中心关键点的回归不准问题以及中心关键点与目标语义不一致问题。从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记
DeiT：训练ImageNet仅用4卡不到3天的平民ViT | ICML 2021 VincentTeddy
论文基于改进训练配置以及一种新颖的蒸馏方式，提出了仅用ImageNet就能训练出来的Transformer网络DeiT。在蒸馏学习时，DeiT以卷积网络作为teacher，能够结合当前主流的数据增强和训练策略来进一步提高性能。从实验结果来看，效果很不错来源：晓飞的算法工程笔记公众号论文:Trainingdata-efficientimagetransformers&distillationthro
Hybrid-PSC：基于对比学习的混合网络，解决长尾图片分类 | CVPR 2021 VincentTeddy
论文提出新颖的混合网络用于解决长尾图片分类问题，该网络由用于图像特征学习的对比学习分支和用于分类器学习的交叉熵分支组成，在训练过程逐步将训练权重调整至分类器学习，达到更好的特征得出更好的分类器的思想。另外，为了节省内存消耗，论文提出原型有监督对比学习。从实验结果来看，论文提出的方法效果还是很不错的，值得一看来源：晓飞的算法工程笔记公众号论文:ContrastiveLearningbasedHyb
CornerNet：经典keypoint-based方法，通过定位角点进行目标检测 | ECCV2018 VincentTeddy
论文提出了CornerNet，通过检测角点对的方式进行目标检测，与当前的SOTA检测模型有相当的性能。CornerNet借鉴人体姿态估计的方法，开创了目标检测领域的一个新框架，后面很多论文都基于CorerNet的研究拓展出新的角点目标检测来源：晓飞的算法工程笔记公众号论文:CornerNet:DetectingObjectsasPairedKeypoints论文地址：https://arxiv.
NASNet : Google Brain经典作，改造搜索空间，性能全面超越人工网络，继续领跑NAS领域 | CVPR 2018 VincentTeddy
论文将搜索空间从整体网络转化为卷积单元(cell)，再按照设定堆叠成新的网络家族NASNet。不仅降低了搜索的复杂度，从原来的28天缩小到4天，而且搜索出来的结构具有扩展性，在小模型和大模型场景下都能使用更少的参数量和计算量来超越人类设计的模型，达到SOTA 来源：【晓飞的算法工程笔记】公众号论文:LearningTransferableArchitecturesforScalableImageR
PNAS：渐进式神经网络搜索，准确率预测，21倍加速 | ECCV2018 VincentTeddy
论文将核心放在搜索加速方面，基于NASNet，提出渐进式的PNAS搜索策略以及通过代理函数直接预测网络的准确率，极大地优化搜索逻辑，能够在搜索到相同性能的前提下，将搜索消耗降低21倍之多来源：【晓飞的算法工程笔记】公众号论文:ProgressiveNeuralArchitectureSearch论文地址：https://arxiv.org/abs/1712.00559Introduction 目
OREPA：阿里提出训练也很快的重参数策略，内存减半，速度加倍 | CVPR 2022 VincentTeddy
论文提出了在线重参数方法OREPA，在训练阶段就能将复杂的结构重参数为单卷积层，从而降低大量训练的耗时。为了实现这一目标，论文用线性缩放层代替了训练时的BN层，保持了优化方向的多样性和特征表达能力。从实验结果来看，OREPA在各种任务上的准确率和效率都很不错来源：晓飞的算法工程笔记公众号论文:OnlineConvolutionalRe-parameterization[图片上传失败...(ima
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018 VincentTeddy
论文提出NASH方法来进行神经网络结构搜索，核心思想与之前的EAS方法类似，使用网络态射来生成一系列效果一致且继承权重的复杂子网，本文的网络态射更丰富，而且仅需要简单的爬山算法辅助就可以完成搜索，耗时0.5GPUday 来源：晓飞的算法工程笔记公众号论文:SimpleAndEfficientArchitectureSearchforConvolutionalNeuralNetworks论文地址：h
DDP：微软提出动态detection head选择，适配计算资源有限场景 | CVPR 2022 VincentTeddy
DPP能够对目标检测proposal进行非统一处理，根据proposal选择不同复杂度的算子，加速整体推理过程。从实验结果来看，效果非常不错来源：晓飞的算法工程笔记公众号论文:ShouldAllProposalsbeTreatedEquallyinObjectDetection?[图片上传失败...(image-918413-1665323159579)]论文地址：https://arxiv.or
DVT：华为提出动态级联Vision Transformer，性能杠杠的 | NeurIPS 2021 VincentTeddy
论文主要处理VisionTransformer中的性能问题，采用推理速度不同的级联模型进行速度优化，搭配层级间的特征复用和自注意力关系复用来提升准确率。从实验结果来看，性能提升不错来源：晓飞的算法工程笔记公众号论文:NotAllImagesareWorth16x16Words:DynamicTransformersforEfficientImageRecognition[图片上传失败...(ima
Swin Transformer：最佳论文，准确率和性能双佳的视觉Transformer | ICCV 2021 VincentTeddy
论文提出了经典的VisionTransormer模型SwinTransformer，能够构建层级特征提高任务准确率，而且其计算复杂度经过各种加速设计，能够与输入图片大小成线性关系。从实验结果来看，SwinTransormer在各视觉任务上都有很不错的准确率，而且性能也很高来源：晓飞的算法工程笔记公众号论文:SwinTransformer:HierarchicalVisionTransformer
DARTS：基于梯度下降的经典网络搜索方法，开启端到端的网络搜索 | ICLR 2019
DARTS是很经典的NAS方法，它的出现打破了以往的离散的网络搜索模式，能够进行end-to-end的网络搜索。由于DARTS是基于梯度进行网络更新的，所以更新的方向比较准确，搜索时间相当于之前的方法有很大的提升，CIFAR-10的搜索仅需要4GPUdays。来源：晓飞的算法工程笔记公众号论文:DARTS:DifferentiableArchitectureSearch论文地址：https://
SMASH：经典One-Shot神经网络搜索，仅需单卡 | ICLR 2018
SMASH方法使用辅助网络生成次优权重来支持网络的快速测试，从结果来看，生成的权重与正常训练的权重在准确率上存在关联性，整体搜索速度很快，仅需要单卡进行搜索，提供了一个很好的新思路。来源：晓飞的算法工程笔记公众号论文:SMASH:One-ShotModelArchitectureSearchthroughHyperNetworks论文地址：https://arxiv.org/abs/1708.0
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索，核心思想与之前的EAS方法类似，使用网络态射来生成一系列效果一致且继承权重的复杂子网，本文的网络态射更丰富，而且仅需要简单的爬山算法辅助就可以完成搜索，耗时0.5GPUday 来源：晓飞的算法工程笔记公众号论文:SimpleAndEfficientArchitectureSearchforConvolutionalNeuralNetworks论文地址：h
FBNet/FBNetV2/FBNetV3：Facebook在NAS领域的轻量级网络探索 | 轻量级网络
FBNet系列是完全基于NAS方法的轻量级网络系列，分析当前搜索方法的缺点，逐步增加创新性改进，FBNet结合了DNAS和资源约束，FBNetV2加入了channel和输入分辨率的搜索，FBNetV3则是使用准确率预测来进行快速的网络结构搜索来源：晓飞的算法工程笔记公众号FBNet论文:FBNet:Hardware-AwareEfficientConvNetDesignviaDifferenti
RelationNet：学习目标间关系来增强特征以及去除NMS | CVPR 2018
论文基于NLP的注意力机制提出了目标关系模块，通过与其它目标的比对增强当前目标的特征，而且还可以代替NMS进行端到端的重复结果去除，思想十分新颖，效果也不错来源：晓飞的算法工程笔记公众号论文:RelationNetworksforObjectDetection论文地址：https://arxiv.org/abs/1711.11575论文代码：https://github.com/msracver
CSG：清华大学提出通过分化类特定卷积核来训练可解释的卷积网络 | ECCV 2020 Oral
论文提出类特定控制门CSG来引导网络学习类特定的卷积核，并且加入正则化方法来稀疏化CSG矩阵，进一步保证类特定。从实验结果来看，CSG的稀疏性能够引导卷积核与类别的强关联，在卷积核层面产生高度类相关的特征表达，从而提升网络的性能以及可解释性来源：晓飞的算法工程笔记公众号论文:TrainingInterpretableConvolutionalNeuralNetworksbyDifferentia
YOLOF：单层特征检测也可以比FPN更出色 | CVPR 2021 VincentTeddy
论文通过分析发现FPN的成功在于divide-and-conquer策略解决了目标检测的优化问题，借此研究设计了仅用单层特征预测的高效检测网络YOLOF。YOLOF在结构上没有很多花哨的结构，却在准确率、推理速度和收敛速度上都有不错的提升，相对于眼花缭乱的FPN魔改结构，十分值得学习来源：晓飞的算法工程笔记公众号论文:YouOnlyLookOne-levelFeature[图片上传失败...(i
DeepViT：字节提出深层ViT的训练策略 | 2021 arxiv VincentTeddy
作者发现深层ViT出现的注意力崩溃问题，提出了新颖的Re-attention机制来解决，而且计算量和内存开销都很少。通过Re-attention机制，在增加ViT深度时能够保持性能不断提高来源：晓飞的算法工程笔记公众号论文:DeepViT:TowardsDeeperVisionTransformer[图片上传失败...(image-320fda-1666536099045)]论文地址：https:
ExtremeNet：通过极点进行目标检测，更细致的目标区域 | CVPR 2019 VincentTeddy
ExtremeNet检测目标的四个极点，然后以几何的方式将其组合起来进行目标检测，性能与其它传统形式的检测算法相当。ExtremeNet的检测方法十分独特，但是包含了较多的后处理方法，所以有很大的改进空间，感兴趣可以去看看论文实验中的错误分析部分来源：晓飞的算法工程笔记公众号论文:Bottom-upObjectDetectionbyGroupingExtremeandCenterPoints论文
PVT：特征金字塔在Vision Transormer的首次应用，又快又好 | ICCV 2021 VincentTeddy
论文设计了用于密集预测任务的纯Transformer主干网络PVT，包含渐进收缩的特征金字塔结构和spatial-reductionattention层，能够在有限的计算资源和内存资源下获得高分辨率和多尺度的特征图。从物体检测和语义分割的实验可以看到，PVT在相同的参数数量下比CNN主干网络更强大来源：晓飞的算法工程笔记公众号论文:PyramidVisionTransformer:AVersati
DS-Net：可落地的动态网络，实际加速1.62倍，快改造起来 | CVPR 2021 Oral VincentTeddy
论文提出能够适配硬件加速的动态网络DS-Net，通过提出的double-headed动态门控来实现动态路由。基于论文提出的高性能网络设计和IEB、SGS训练策略，仅用1/2-1/4的计算量就能达到静态SOTA网络性能，实际加速也有1.62倍来源：晓飞的算法工程笔记公众号论文:DynamicSlimmableNetwork[图片上传失败...(image-262f83-1657684119973)
DGC：真动态分组卷积，可能是解决分组特征阻塞的最好方案 | ECCV 2020 Spotlight 晓飞的算法工程笔记晓飞的算法工程笔记网络机器学习人工智能卷积深度学习
近期，动态网络在加速推理这方面有很多研究，DGC(DynamicGroupConvolution)将动态网络的思想结合到分组卷积中，使得分组卷积在轻量化的同时能够加强表达能力，整体思路直接清晰，可作为网络设计时的一个不错的选择来源：晓飞的算法工程笔记公众号论文:DynamicGroupConvolutionforAcceleratingConvolutionalNeuralNetworks论文地
AABO：自适应Anchor设置优化，性能榨取的最后一步 | ECCV 2020 Spotlight VincentTeddy
论文提出超参数优化方法AABO，该方法核心基于贝叶斯优化和Sub-Sample方法，能够自适应的搜索最优的anchor设置。从实验结果来看，AABO能够仅通过anchor设置优化，为SOTA目标检测方法带来1.4%～2.4%的性能提升来源：晓飞的算法工程笔记公众号论文:AABO:AdaptiveAnchorBoxOptimizationforObjectDetectionviaBayesianS
ESPNet/ESPNetV2：空洞卷积金字塔 | 轻量级网络晓飞的算法工程笔记晓飞的算法工程笔记卷积算法网络计算机视觉神经网络
ESPNet系列的核心在于空洞卷积金字塔，每层具有不同的dilationrate，在参数量不增加的情况下，能够融合多尺度特征，相对于深度可分离卷积，深度可分离空洞卷积金字塔性价比更高。另外，HFF的多尺度特征融合方法也很值得借鉴来源：晓飞的算法工程笔记公众号ESPNet论文:ESPNet:EfficientSpatialPyramidofDilatedConvolutionsforSemanti
GFLV2：边界框不确定性的进一步融合，提点神器 | CVPR 2021 晓飞的算法工程笔记晓飞的算法工程笔记深度学习计算机视觉目标检测
GFLV2基于GFLV1的bbox分布进行改进，将分布的统计信息融入到定位质量估计中，整体思想十分创新和完备，从实验结果来看，效果还是挺不错的来源：晓飞的算法工程笔记公众号论文:GeneralizedFocalLossV2:LearningReliableLocalizationQualityEstimationforDenseObjectDetection论文地址：https://arxiv.
SMASH：经典One-Shot神经网络搜索，仅需单卡 | ICLR 2018 晓飞的算法工程笔记晓飞的算法工程笔记算法神经网络机器学习人工智能深度学习
SMASH方法使用辅助网络生成次优权重来支持网络的快速测试，从结果来看，生成的权重与正常训练的权重在准确率上存在关联性，整体搜索速度很快，仅需要单卡进行搜索，提供了一个很好的新思路。来源：晓飞的算法工程笔记公众号论文:SMASH:One-ShotModelArchitectureSearchthroughHyperNetworks论文地址：https://arxiv.org/abs/1708.0
有关TSD论文笔记 luxuanjiangg 算法
论文地址：https://arxiv.org/abs/2003.07540晓飞的算法工程笔记前景.经典RoI-based定位算法使用siblinghead(2-fc)对proposal同时进行分类和回归进行分类任务和定位任务的目标检测学习的主要障碍：共用的特征提取器以及相同的proposal限制定位算法的根本问题在于分类分支和定位分支在空间维度上存在偏差，不是通过设计特征提取器或更好的结构能解决的
集合框架天子之骄 java 数据结构集合框架
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
Table Driven（表驱动）方法实例 bijian1013 java enum Table Driven 表驱动
实例一： /** * 驾驶人年龄段 * 保险行业，会对驾驶人的年龄做年龄段的区分判断 * 驾驶人年龄段：01-[18,25);02-[25,30);03-[30-35);04-[35,40);05-[40,45);06-[45,50);07-[50-55);08-[55,+∞) */ public class AgePeriodTest { //if...el
Jquery 总结 cuishikuan java jquery Ajax Web jquery方法
1.$.trim方法用于移除字符串头部和尾部多余的空格。如：$.trim(' Hello ') // Hello2.$.contains方法返回一个布尔值，表示某个DOM元素（第二个参数）是否为另一个DOM元素（第一个参数）的下级元素。如：$.contains(document.documentElement, document.body); 3.$
面向对象概念的提出麦田的设计者 java 面向对象面向过程
面向对象中，一切都是由对象展开的，组织代码，封装数据。在台湾面向对象被翻译为了面向物件编程，这充分说明了，这种编程强调实体。下面就结合编程语言的发展史，聊一聊面向过程和面向对象。 c语言由贝尔实
linux网口绑定被触发 linux
刚在一台IBM Xserver服务器上装了RedHat Linux Enterprise AS 4，为了提高网络的可靠性配置双网卡绑定。一、环境描述我的RedHat Linux Enterprise AS 4安装双口的Intel千兆网卡，通过ifconfig -a命令看到eth0和eth1两张网卡。二、双网卡绑定步骤： 2.1 修改/etc/sysconfig/network
XML基础语法肆无忌惮_ xml
一、什么是XML？ XML全称是Extensible Markup Language，可扩展标记语言。很类似HTML。XML的目的是传输数据而非显示数据。XML的标签没有被预定义，你需要自行定义标签。XML被设计为具有自我描述性。是W3C的推荐标准。二、为什么学习XML？用来解决程序间数据传输的格式问题做配置文件充当小型数据库三、XML与HTM
为网页添加自己喜欢的字体知了ing 字体秒表 css
@font-face { font-family: miaobiao;//定义字体名字 font-style: normal; font-weight: 400; src: url('font/DS-DIGI-e.eot');//字体文件 } 使用： <label style="font-size:18px;font-famil
redis范围查询应用-查找IP所在城市矮蛋蛋 redis
原文地址： http://www.tuicool.com/articles/BrURbqV 需求根据IP找到对应的城市原来的解决方案 oracle表（ip_country）：查询IP对应的城市： 1.把a.b.c.d这样格式的IP转为一个数字，例如为把210.21.224.34转为3524648994 2. select city from ip_
输入两个整数，计算百分比 alleni123 java
public static String getPercent(int x, int total){ double result=(x*1.0)/(total*1.0); System.out.println(result); DecimalFormat df1=new DecimalFormat("0.0000%");
百合——————>怎么学习计算机语言百合不是茶 java 移动开发
对于一个从没有接触过计算机语言的人来说，一上来就学面向对象，就算是心里上面接受的了，灵魂我觉得也应该是跟不上的，学不好是很正常的现象，计算机语言老师讲的再多，你在课堂上面跟着老师听的再多，我觉得你应该还是学不会的，最主要的原因是你根本没有想过该怎么来学习计算机编程语言，记得大一的时候金山网络公司在湖大招聘我们学校一个才来大学几天的被金山网络录取，一个刚到大学的就能够去和
linux下tomcat开机自启动 bijian1013 tomcat
方法一：修改Tomcat/bin/startup.sh 为: export JAVA_HOME=/home/java1.6.0_27 export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:. export PATH=$JAVA_HOME/bin:$PATH export CATALINA_H
spring aop实例 bijian1013 java spring AOP
1.AdviceMethods.java package com.bijian.study.spring.aop.schema; public class AdviceMethods { public void preGreeting() { System.out.println("--how are you!--"); } } 2.beans.x
[Gson八]GsonBuilder序列化和反序列化选项enableComplexMapKeySerialization bit1129 serialization
enableComplexMapKeySerialization配置项的含义 Gson在序列化Map时，默认情况下，是调用Key的toString方法得到它的JSON字符串的Key，对于简单类型和字符串类型，这没有问题，但是对于复杂数据对象，如果对象没有覆写toString方法，那么默认的toString方法将得到这个对象的Hash地址。 GsonBuilder用于
【Spark九十一】Spark Streaming整合Kafka一些值得关注的问题 bit1129 Stream
包括Spark Streaming在内的实时计算数据可靠性指的是三种级别： 1. At most once，数据最多只能接受一次，有可能接收不到 2. At least once, 数据至少接受一次，有可能重复接收 3. Exactly once 数据保证被处理并且只被处理一次，具体的多读几遍http://spark.apache.org/docs/lates
shell脚本批量检测端口是否被占用脚本 ronin47
#!/bin/bash cat ports |while read line do#nc -z -w 10 $line nc -z -w 2 $line 58422>/dev/null2>&1if[ $?-eq 0]then echo $line:ok else echo $line:fail fi done 这里的ports 既可以是文件
java-2.设计包含min函数的栈 bylijinnan java
具体思路参见：http://zhedahht.blog.163.com/blog/static/25411174200712895228171/ import java.util.ArrayList; import java.util.List; public class MinStack { //maybe we can use origin array rathe
Netty源码学习-ChannelHandler bylijinnan java netty
一般来说，“有状态”的ChannelHandler不应该是“共享”的，“无状态”的ChannelHandler则可“共享” 例如ObjectEncoder是“共享”的, 但 ObjectDecoder 不是因为每一次调用decode方法时，可能数据未接收完全（incomplete），它与上一次decode时接收到的数据“累计”起来才有可能是完整的数据，是“有状态”的 p
java生成随机数 cngolon java
方法一： /** * 生成随机数 * @author [email protected] * @return */ public synchronized static String getChargeSequenceNum(String pre){ StringBuffer sequenceNum = new StringBuffer(); Date dateTime = new D
POI读写海量数据 ctrain 海量数据
import java.io.FileOutputStream; import java.io.OutputStream; import org.apache.poi.xssf.streaming.SXSSFRow; import org.apache.poi.xssf.streaming.SXSSFSheet; import org.apache.poi.xssf.streaming
mysql 日期格式化date_format详细使用 daizj mysql date_format 日期格式转换日期格式化
日期转换函数的详细使用说明 DATE_FORMAT(date,format) Formats the date value according to the format string. The following specifiers may be used in the format string. The&n
一个程序员分享8年的开发经验 dcj3sjt126com 程序员
在中国有很多人都认为IT行为是吃青春饭的，如果过了30岁就很难有机会再发展下去!其实现实并不是这样子的，在下从事.NET及JAVA方面的开发的也有8年的时间了，在这里在下想凭借自己的亲身经历，与大家一起探讨一下。明确入行的目的很多人干IT这一行都冲着“收入高”这一点的，因为只要学会一点HTML, DIV+CSS，要做一个页面开发人员并不是一件难事，而且做一个页面开发人员更容
android欢迎界面淡入淡出效果 dcj3sjt126com android
很多Android应用一开始都会有一个欢迎界面，淡入淡出效果也是用得非常多的，下面来实现一下。主要代码如下： package com.myaibang.activity; import android.app.Activity;import android.content.Intent;import android.os.Bundle;import android.os.CountDown
linux 复习笔记之常见压缩命令 eksliang tar解压 linux系统常见压缩命令 linux压缩命令 tar压缩
转载请出自出处:http://eksliang.iteye.com/blog/2109693 linux中常见压缩文件的拓展名 *.gz gzip程序压缩的文件 *.bz2 bzip程序压缩的文件 *.tar tar程序打包的数据，没有经过压缩 *.tar.gz tar程序打包后，并经过gzip程序压缩 *.tar.bz2 tar程序打包后，并经过bzip程序压缩 *.zi
Android 应用程序发送shell命令 gqdy365 android
项目中需要直接在APP中通过发送shell指令来控制lcd灯，其实按理说应该是方案公司在调好lcd灯驱动之后直接通过service送接口上来给APP，APP调用就可以控制了，这是正规流程，但我们项目的方案商用的mtk方案，方案公司又没人会改，只调好了驱动，让应用程序自己实现灯的控制，这不蛋疼嘛！！！！发就发吧！一、关于shell指令：我们知道，shell指令是Linux里面带的
java 无损读取文本文件 hw1287789687 读取文件无损读取读取文本文件 charset
java 如何无损读取文本文件呢？以下是有损的 @Deprecated public static String getFullContent(File file, String charset) { BufferedReader reader = null; if (!file.exists()) { System.out.println("getFull
Firebase 相关文章索引 justjavac firebase
Awesome Firebase 最近谷歌收购Firebase的新闻又将Firebase拉入了人们的视野，于是我做了这个 github 项目。 Firebase 是一个数据同步的云服务，不同于 Dropbox 的「文件」，Firebase 同步的是「数据」，服务对象是网站开发者，帮助他们开发具有「实时」（Real-Time）特性的应用。开发者只需引用一个 API 库文件就可以使用标准 RE
C++学习重点 lx.asymmetric C++笔记
1.c++面向对象的三个特性：封装性，继承性以及多态性。 2.标识符的命名规则：由字母和下划线开头，同时由字母、数字或下划线组成；不能与系统关键字重名。 3.c++语言常量包括整型常量、浮点型常量、布尔常量、字符型常量和字符串性常量。 4.运算符按其功能开以分为六类：算术运算符、位运算符、关系运算符、逻辑运算符、赋值运算符和条件运算符。 &n
java bean和xml相互转换 q821424508 java bean xml xml和bean转换 java bean和xml转换
这几天在做微信公众号做的过程中想找个java bean转xml的工具，找了几个用着不知道是配置不好还是怎么回事，都会有一些问题，然后脑子一热谢了一个javabean和xml的转换的工具里，自己用着还行，虽然有一些约束吧，还是贴出来记录一下顺便你提一下下，这个转换工具支持属性为集合、数组和非基本属性的对象。 packag
C 语言初级位运算 1140566087 位运算 c
第十章位运算 1、位运算对象只能是整形或字符型数据，在VC6.0中int型数据占4个字节 2、位运算符：运算符作用 ~ 按位求反 << 左移 >> 右移 & 按位与 ^ 按位异或 | 按位或他们的优先级从高到低； 3、位运算符的运算功能： a、按位取反： ~01001101 = 101
14点睛Spring4.1-脚本编程 wiselyman spring4
14.1 Scripting脚本编程脚本语言和java这类静态的语言的主要区别是:脚本语言无需编译,源码直接可运行; 如果我们经常需要修改的某些代码,每一次我们至少要进行编译,打包,重新部署的操作,步骤相当麻烦; 如果我们的应用不允许重启,这在现实的情况中也是很常见的; 在spring中使用脚本编程给上述的应用场景提供了解决方案,即动态加载bean; spring支持脚本

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他