晓飞的算法工程笔记

目标检测 | 经典算法 Cascade R-CNN: Delving into High Quality Object Detection

作者从detector的overfitting at training/quality mismatch at inference问题入手，提出了基于multi-stage的Cascade R-CNN，该网络结构清晰，效果显著，并且能简单移植到其它detector中，带来2-4%的性能提升

论文: Cascade R-CNN: Delving into High Quality Object Detection

论文地址: https://arxiv.org/abs/1712.00726
代码地址: https://github.com/zhaoweicai/cascade-rcnn

Introduction

目前的目标检测算法大都使用 $u = 0.5$ 的IoU阈值来定义正负样本，这是相当宽松的阈值，导致detector产生许多干扰的bndbox。如图(a)，许多人们认为大概率是负样本的框其实IoU都大于0.5。因此，论文希望研究出学习能尽量少包含接近负样本的bndbox的detector，如图(b)

论文对不同IoU阈值的regressor和detector进行了实验。从图c可以看出，不同IoU阈值的detector对不同水平的bndbox的优化程度不同，bndbox IoU与detecor的训练阈值越接近，box regress提升越高。而在图d中，detector(u=0.5)在低IoU水平下比detector(u=0.6)表现优异，而在高IoU水平下则反之，而当u=0.7时，由于训练正样本的不足以及推理时输入的样本IoU较低，detector(u=0.7)的整体表现都降低了

综上可以得出以下结论：

训练后的detector几乎总能提升Input bndbox的质量
单IoU detector对接近其训练IoU阈值的bndbox是最优的
单纯地增加训练时的IoU的阈值并不能直接提高detector的质量

因此，论文提出了Cascade R-CNN来解决上面的问题。Cascade R-CNN是一个顺序的多阶段extension，利用前一个阶段的输出进行下一阶段的训练，阶段越往后使用更高的IoU阈值，产生更高质量的bndbox。Cascade R-CNN简单而有效，能直接添加到其它R-CNN型detector中，带来巨大的性能提升(2-4%)

Object Detection

Faster R-CNN

目前经典的two-stage架构如图3(a)。第一阶段是一个提框的子网H0，用于生成初步的bndbox。第二阶段为特定区域处理的检测子网H1，给定bndbox最终的分类分数C和bndbox坐标B

Iterative BBox at inference

有的研究者认为单次的box regress是不足以产生准确的位置信息的，因此需要进行多次迭代来精调bndbox，这就是iterative bounding box regression:

实现如图3(b)所示，所有的head都是一样的，但是这个方法忽略了两个问题：

如图1所示，detector(u=0.5)对于所有的高质量的bndbox是次优解，甚至降低了IoU大于0.85的bndbox的准确度

图2为bndbox的 $(x, y, w, h)$ 与GT间的差值分布，从图中可以看出，不同阶段的bndbox分布是显著不同的。若regressor对于初始化的分布是最优的，那对于在后面的阶段肯定是次优的

因此，iterative BBox需要大量的手工操作，如box voting，而其结果不是稳定提升的。通常来说，对bndbox进行多于两次相同的regressor是几乎没有收益的

Integral Loss

由于bndbox经常包含目标和一定的背景，因此很难去判定当前bndbox是否正样本

常用的方法是判断其与GT的IoU，当IoU大于阈值时，则赋予其对应GT的label。但是阈值的设定是十分苦难的，当阈值过高时，正样本包含很少的背景，但是会导致难以生成足够多的正样本进行训练，反之，则会导致detecor容易产生close false positives。因此，很难找到一个单独的classifier能一致地对所有IoU的bndbox是最优的

一种尝试的方法是使用一个分类器集合，如图3©所示，优化针对各种质量的bndbox的loss。 $U={0.5, 0.55, ..., 0.75}$ 是根据COCO设定IoU阈值合集，按照定义，分类器在推理时再进行组装

这种解决方法存在两个问题：

不同的classifer的正样本数量是不一样的，如图4所示，正样本的数量随着u的提高显著下降，这意味着高质量的classifiers容易过拟合
在推理时，高质量的classifers需要处理相对低质量的bndbox，而他们对这些bndbox并没有优化

因此，Integral loss在很多IoU水平难以表现出高的准确率。相对于原始的two-stage架构，Integral loss的架构收益相对较小

Cascade R-CNN

Cascaded Bounding Box Regression

由于很难训练一个能应付所有IoU水平的regressor，可以把回归任务分解成一个级联的regression问题，架构如图3(d)所示

T是级联阶段数，每个regressor $f_t$ 对于当前的级联输入都是最优的，随着阶段的深入，bndbox在不断的提升。
cascade regression与iterative BBox有以下区别：

iteravtive BBox是后处理的方法，而cascaded regression是能够改变bndbox分布的重采样过程
cascaded regression在训练和推理时是一致的，不存在区别
cascaded regression的多个regressor对于对应阶段的输入分布是最优的，而iterative BBox仅对初始分布是最优的

Bndbox在回归时，为了对scale和location有不变性，将对坐标的学习转移到对坐标差值的学习。由于坐标插值通常较小，因此将其进行归一化 $\delta'=(\delta_x-\mu_x)/\sigma$ ，以权衡定位与分类的loss。Cascade R-CNN在每一个stage结束后，都会马上进行计算这些均值/方差

Cascaded Detection

产生Cascade R-CNN的启发点主要有两个：

如图4的1st stage图所示，初始的bndbox分布大多落在低质量的区域，这对于高质量classifiers来说是无效的学习。
在图1©实验中可以看到，所有的曲线都高于对角线，即regressor都倾向于能够提升bndbox的IoU。

因此，以集合 $x_i, b_i)$ 作为开始，通过级联regress来产生高IoU的集合 $x'_i, b'_i)$ 。如图4所示，这种方法能在提升样本整体IoU水平的同时，使得样本的总数大致维持在一个水平，这会带来两个好处：

不会存在某个阈值的regressor过拟合
高阶段的detector对于高IoU阈值是最优的

从图2可以看出，随着阶段的深入，一些离群点会被过滤，这保证了特定阈值的detector的训练

在每一个阶段t，都独立一个对阈值 $u_t(u_t > u_{t-1})$ 最优的classifier $h_t$ 和regressor $f_t$ ， $b^t=f_{t-1}(x^{t-1}, b^{t-1})$ 是上一阶段的输出， $\lambda=1$ 是权重因子， $[y^t\ge1]$ 是指示函数，表示背景的 $L_{loc}$ 不加入计算。与integral loss不同，公式8保证了顺序地训练detectors来逐步提高bndbox质量。在推理时，bndbox的质量是顺序提高的，高质量的detectors只需要面对高质量的bndbox。

Experiment

Implementation Details

部分实验设置如下：

所有regressor都带分类，每一个cascade stage为相同的架构
共4个stage，一个为RPN，其余为 $U=\{0.5, 0.6, 0.7\}$ 的检测器。第一阶段检测器为正常的RPN，其余阶段使用上一阶段的输出作为输入
使用垂直翻转的数据增强手段以及单一图片输入尺寸

Quality Mismatch

图5展示了3个独立训练的detector的AP曲线，detector的IoU阈值分别为 $U={0.5, 0.6, 0.7}$ ，detector(u=0.5)在低IoU水平表现最好，detector(u=0.6)在高IoU水平表现最好，而detector(u=0.7)则整体表现较差。为了进一步解释图(a)的结果，论文添加GT到proposal集合得到了图(b)的结果，所有的detector的AP都提升，而detector(u=0.7)提升最大，且几乎全局最优。因此，可以得出以下两个结论：

$u = 0.5$ 不是一个好的选择，仅限于低质量bndbox
高质量的detector高质量的bndbox输入

此外，图5(a)对比了以Cascade R-CNN的stage输出作为输入时detector的表现。当提升了输入的bndbox质量后，detector得到了明显的提升

图6对比了各cascade detector在各stage上的表现。提高输入的质量后，各detector都得到了收益，如detector(u=0.7)从原来的AP=0.256提升为AP=0.383。此外，将图6和图5(a)对比可以得出，cascade联合训练的detector比单独训练的detector精度要高

Comparison with Iterative BBox and Integral Loss

论文对比Cascade R-CNN与iterative BBox和integral loss detector，Iterative BBox连续使用3次FPN+进行实现，而integral loss detector则使用 $U=\{0.5, 0.6, 0.7\}$ 的classification head

Localization: 如图7(a)，单检测器的降低了高IoU输入的精度，当regressor对bndbox回归次数增加时，下降越明显。相反，cascade regressor则表现越来越好，几乎全面领先iterative BBox

Integral Loss: 图7(b)展示了integral loss各classifier以及集成后的准确率(使用同一个regressor)，classifier(u=0.6)表现最好，而集成的classifier则没有任何收益

Table1展示了三种优化方法与Baseline的准确率具体数值，在低IoU水平时，Cascade R-CNN的收益较少，而在高水平时收益十分显著

Ablation Experiments

Stage-wise Comparison: Table2 总结了stage性能表现。由于multi-stage multi-task训练，1st stage性能已经有很好地提升，2rd stage和3rd stage则都维持在一个相对高的水平，集成的classifier性能最好

IoU Thresholds: Cascade R-CNN的所有head均使用u=0.5阈值进行初始化，在后面的训练中才使用对应的bndbox进行训练。从Table3的第一行看出，cascade能够提升baseline的性能，这表明使用不同的stage优化不同的输入分布的重要性。第二行表明，随着IoU阈值的提升，detector能产生更多高质量的bndbox，减少close false positive的产生

Regression Statistics: 渐进式地更新bndbox坐标差值的统计信息，从Table3可以看出，网络的训练对这些信息的统计不是十分敏感

Number of Stages: Table4总结了stage数量对性能的影响。two-stage能显著地提升baseline的效果，而加入4th stage(u=0.75)后虽然高IoU水平的性能提升了，但却令整体性能有所下降。因此，three-stage是最好的折中方案

Comparison with the state-of-the-art

Table5对比了Cascade R-CNN与主流的one-stage detector和two-stage detector的性能，从表格可以看出，Cascade R-CNN的性能提升是十分明显的，各方面都优秀

Generalization Capacity

Detection Performance: 在所有的baseline detector上，使用Cascade R-CNN均有2～4%的提升，这表明Cascade R-CNN能广泛适用于多种检测器架构中

Parameter and Timing: Cascade R-CNN的参数量增加跟stage数量有关，与baseline的detector head呈线性关系。此外，由于detector head的计算耗时相对于RPN是非常小的，Cascade R-CNN的额外计算开销比较小

Conclusion

论文提出一个高质量的多阶段目标检测架构Cascade R-CNN，这个架构解决了训练时的过拟合问题以及推理时的IoU mismatch问题。Cascade R-CNN适用于各种detector baseline，带来可观的性能提升

写作不易，未经允许不得转载～
更多内容请关注个人微信公众号【晓飞的算法工程笔记】

你可能感兴趣的:(晓飞的算法工程笔记)

ENAS：首个权值共享的神经网络搜索方法，千倍加速 | ICML 2018 VincentTeddy
NAS是自动设计网络结构的重要方法，但需要耗费巨大的资源，导致不能广泛地应用，而论文提出的EfficientNeuralArchitectureSearch(ENAS)，在搜索时对子网的参数进行共享，相对于NAS有超过1000x倍加速，单卡搜索不到半天，而且性能并没有降低，十分值得参考来源：【晓飞的算法工程笔记】公众号论文:EfficientNeuralArchitectureSearchvia
DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020 VincentTeddy
论文针对当前anchor-free目标检测算法的问题提出了DDBNet，该算法对预测框进行更准确地评估，包括正负样本以及IoU的判断。DDBNet的创新点主要在于box分解和重组模块(D&R)和语义一致性模块，分别用于解决中心关键点的回归不准问题以及中心关键点与目标语义不一致问题。从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记
DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020 晓飞的算法工程笔记晓飞的算法工程笔记深度学习神经网络机器学习
论文针对当前anchor-free目标检测算法的问题提出了DDBNet，该算法对预测框进行更准确地评估，包括正负样本以及IoU的判断。DDBNet的创新点主要在于box分解和重组模块(D&R)和语义一致性模块，分别用于解决中心关键点的回归不准问题以及中心关键点与目标语义不一致问题。从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记
DeiT：训练ImageNet仅用4卡不到3天的平民ViT | ICML 2021 VincentTeddy
论文基于改进训练配置以及一种新颖的蒸馏方式，提出了仅用ImageNet就能训练出来的Transformer网络DeiT。在蒸馏学习时，DeiT以卷积网络作为teacher，能够结合当前主流的数据增强和训练策略来进一步提高性能。从实验结果来看，效果很不错来源：晓飞的算法工程笔记公众号论文:Trainingdata-efficientimagetransformers&distillationthro
Hybrid-PSC：基于对比学习的混合网络，解决长尾图片分类 | CVPR 2021 VincentTeddy
论文提出新颖的混合网络用于解决长尾图片分类问题，该网络由用于图像特征学习的对比学习分支和用于分类器学习的交叉熵分支组成，在训练过程逐步将训练权重调整至分类器学习，达到更好的特征得出更好的分类器的思想。另外，为了节省内存消耗，论文提出原型有监督对比学习。从实验结果来看，论文提出的方法效果还是很不错的，值得一看来源：晓飞的算法工程笔记公众号论文:ContrastiveLearningbasedHyb
CornerNet：经典keypoint-based方法，通过定位角点进行目标检测 | ECCV2018 VincentTeddy
论文提出了CornerNet，通过检测角点对的方式进行目标检测，与当前的SOTA检测模型有相当的性能。CornerNet借鉴人体姿态估计的方法，开创了目标检测领域的一个新框架，后面很多论文都基于CorerNet的研究拓展出新的角点目标检测来源：晓飞的算法工程笔记公众号论文:CornerNet:DetectingObjectsasPairedKeypoints论文地址：https://arxiv.
NASNet : Google Brain经典作，改造搜索空间，性能全面超越人工网络，继续领跑NAS领域 | CVPR 2018 VincentTeddy
论文将搜索空间从整体网络转化为卷积单元(cell)，再按照设定堆叠成新的网络家族NASNet。不仅降低了搜索的复杂度，从原来的28天缩小到4天，而且搜索出来的结构具有扩展性，在小模型和大模型场景下都能使用更少的参数量和计算量来超越人类设计的模型，达到SOTA 来源：【晓飞的算法工程笔记】公众号论文:LearningTransferableArchitecturesforScalableImageR
PNAS：渐进式神经网络搜索，准确率预测，21倍加速 | ECCV2018 VincentTeddy
论文将核心放在搜索加速方面，基于NASNet，提出渐进式的PNAS搜索策略以及通过代理函数直接预测网络的准确率，极大地优化搜索逻辑，能够在搜索到相同性能的前提下，将搜索消耗降低21倍之多来源：【晓飞的算法工程笔记】公众号论文:ProgressiveNeuralArchitectureSearch论文地址：https://arxiv.org/abs/1712.00559Introduction 目
OREPA：阿里提出训练也很快的重参数策略，内存减半，速度加倍 | CVPR 2022 VincentTeddy
论文提出了在线重参数方法OREPA，在训练阶段就能将复杂的结构重参数为单卷积层，从而降低大量训练的耗时。为了实现这一目标，论文用线性缩放层代替了训练时的BN层，保持了优化方向的多样性和特征表达能力。从实验结果来看，OREPA在各种任务上的准确率和效率都很不错来源：晓飞的算法工程笔记公众号论文:OnlineConvolutionalRe-parameterization[图片上传失败...(ima
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018 VincentTeddy
论文提出NASH方法来进行神经网络结构搜索，核心思想与之前的EAS方法类似，使用网络态射来生成一系列效果一致且继承权重的复杂子网，本文的网络态射更丰富，而且仅需要简单的爬山算法辅助就可以完成搜索，耗时0.5GPUday 来源：晓飞的算法工程笔记公众号论文:SimpleAndEfficientArchitectureSearchforConvolutionalNeuralNetworks论文地址：h
DDP：微软提出动态detection head选择，适配计算资源有限场景 | CVPR 2022 VincentTeddy
DPP能够对目标检测proposal进行非统一处理，根据proposal选择不同复杂度的算子，加速整体推理过程。从实验结果来看，效果非常不错来源：晓飞的算法工程笔记公众号论文:ShouldAllProposalsbeTreatedEquallyinObjectDetection?[图片上传失败...(image-918413-1665323159579)]论文地址：https://arxiv.or
DVT：华为提出动态级联Vision Transformer，性能杠杠的 | NeurIPS 2021 VincentTeddy
论文主要处理VisionTransformer中的性能问题，采用推理速度不同的级联模型进行速度优化，搭配层级间的特征复用和自注意力关系复用来提升准确率。从实验结果来看，性能提升不错来源：晓飞的算法工程笔记公众号论文:NotAllImagesareWorth16x16Words:DynamicTransformersforEfficientImageRecognition[图片上传失败...(ima
Swin Transformer：最佳论文，准确率和性能双佳的视觉Transformer | ICCV 2021 VincentTeddy
论文提出了经典的VisionTransormer模型SwinTransformer，能够构建层级特征提高任务准确率，而且其计算复杂度经过各种加速设计，能够与输入图片大小成线性关系。从实验结果来看，SwinTransormer在各视觉任务上都有很不错的准确率，而且性能也很高来源：晓飞的算法工程笔记公众号论文:SwinTransformer:HierarchicalVisionTransformer
DARTS：基于梯度下降的经典网络搜索方法，开启端到端的网络搜索 | ICLR 2019
DARTS是很经典的NAS方法，它的出现打破了以往的离散的网络搜索模式，能够进行end-to-end的网络搜索。由于DARTS是基于梯度进行网络更新的，所以更新的方向比较准确，搜索时间相当于之前的方法有很大的提升，CIFAR-10的搜索仅需要4GPUdays。来源：晓飞的算法工程笔记公众号论文:DARTS:DifferentiableArchitectureSearch论文地址：https://
SMASH：经典One-Shot神经网络搜索，仅需单卡 | ICLR 2018
SMASH方法使用辅助网络生成次优权重来支持网络的快速测试，从结果来看，生成的权重与正常训练的权重在准确率上存在关联性，整体搜索速度很快，仅需要单卡进行搜索，提供了一个很好的新思路。来源：晓飞的算法工程笔记公众号论文:SMASH:One-ShotModelArchitectureSearchthroughHyperNetworks论文地址：https://arxiv.org/abs/1708.0
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索，核心思想与之前的EAS方法类似，使用网络态射来生成一系列效果一致且继承权重的复杂子网，本文的网络态射更丰富，而且仅需要简单的爬山算法辅助就可以完成搜索，耗时0.5GPUday 来源：晓飞的算法工程笔记公众号论文:SimpleAndEfficientArchitectureSearchforConvolutionalNeuralNetworks论文地址：h
FBNet/FBNetV2/FBNetV3：Facebook在NAS领域的轻量级网络探索 | 轻量级网络
FBNet系列是完全基于NAS方法的轻量级网络系列，分析当前搜索方法的缺点，逐步增加创新性改进，FBNet结合了DNAS和资源约束，FBNetV2加入了channel和输入分辨率的搜索，FBNetV3则是使用准确率预测来进行快速的网络结构搜索来源：晓飞的算法工程笔记公众号FBNet论文:FBNet:Hardware-AwareEfficientConvNetDesignviaDifferenti
RelationNet：学习目标间关系来增强特征以及去除NMS | CVPR 2018
论文基于NLP的注意力机制提出了目标关系模块，通过与其它目标的比对增强当前目标的特征，而且还可以代替NMS进行端到端的重复结果去除，思想十分新颖，效果也不错来源：晓飞的算法工程笔记公众号论文:RelationNetworksforObjectDetection论文地址：https://arxiv.org/abs/1711.11575论文代码：https://github.com/msracver
CSG：清华大学提出通过分化类特定卷积核来训练可解释的卷积网络 | ECCV 2020 Oral
论文提出类特定控制门CSG来引导网络学习类特定的卷积核，并且加入正则化方法来稀疏化CSG矩阵，进一步保证类特定。从实验结果来看，CSG的稀疏性能够引导卷积核与类别的强关联，在卷积核层面产生高度类相关的特征表达，从而提升网络的性能以及可解释性来源：晓飞的算法工程笔记公众号论文:TrainingInterpretableConvolutionalNeuralNetworksbyDifferentia
YOLOF：单层特征检测也可以比FPN更出色 | CVPR 2021 VincentTeddy
论文通过分析发现FPN的成功在于divide-and-conquer策略解决了目标检测的优化问题，借此研究设计了仅用单层特征预测的高效检测网络YOLOF。YOLOF在结构上没有很多花哨的结构，却在准确率、推理速度和收敛速度上都有不错的提升，相对于眼花缭乱的FPN魔改结构，十分值得学习来源：晓飞的算法工程笔记公众号论文:YouOnlyLookOne-levelFeature[图片上传失败...(i
DeepViT：字节提出深层ViT的训练策略 | 2021 arxiv VincentTeddy
作者发现深层ViT出现的注意力崩溃问题，提出了新颖的Re-attention机制来解决，而且计算量和内存开销都很少。通过Re-attention机制，在增加ViT深度时能够保持性能不断提高来源：晓飞的算法工程笔记公众号论文:DeepViT:TowardsDeeperVisionTransformer[图片上传失败...(image-320fda-1666536099045)]论文地址：https:
ExtremeNet：通过极点进行目标检测，更细致的目标区域 | CVPR 2019 VincentTeddy
ExtremeNet检测目标的四个极点，然后以几何的方式将其组合起来进行目标检测，性能与其它传统形式的检测算法相当。ExtremeNet的检测方法十分独特，但是包含了较多的后处理方法，所以有很大的改进空间，感兴趣可以去看看论文实验中的错误分析部分来源：晓飞的算法工程笔记公众号论文:Bottom-upObjectDetectionbyGroupingExtremeandCenterPoints论文
PVT：特征金字塔在Vision Transormer的首次应用，又快又好 | ICCV 2021 VincentTeddy
论文设计了用于密集预测任务的纯Transformer主干网络PVT，包含渐进收缩的特征金字塔结构和spatial-reductionattention层，能够在有限的计算资源和内存资源下获得高分辨率和多尺度的特征图。从物体检测和语义分割的实验可以看到，PVT在相同的参数数量下比CNN主干网络更强大来源：晓飞的算法工程笔记公众号论文:PyramidVisionTransformer:AVersati
DS-Net：可落地的动态网络，实际加速1.62倍，快改造起来 | CVPR 2021 Oral VincentTeddy
论文提出能够适配硬件加速的动态网络DS-Net，通过提出的double-headed动态门控来实现动态路由。基于论文提出的高性能网络设计和IEB、SGS训练策略，仅用1/2-1/4的计算量就能达到静态SOTA网络性能，实际加速也有1.62倍来源：晓飞的算法工程笔记公众号论文:DynamicSlimmableNetwork[图片上传失败...(image-262f83-1657684119973)
DGC：真动态分组卷积，可能是解决分组特征阻塞的最好方案 | ECCV 2020 Spotlight 晓飞的算法工程笔记晓飞的算法工程笔记网络机器学习人工智能卷积深度学习
近期，动态网络在加速推理这方面有很多研究，DGC(DynamicGroupConvolution)将动态网络的思想结合到分组卷积中，使得分组卷积在轻量化的同时能够加强表达能力，整体思路直接清晰，可作为网络设计时的一个不错的选择来源：晓飞的算法工程笔记公众号论文:DynamicGroupConvolutionforAcceleratingConvolutionalNeuralNetworks论文地
AABO：自适应Anchor设置优化，性能榨取的最后一步 | ECCV 2020 Spotlight VincentTeddy
论文提出超参数优化方法AABO，该方法核心基于贝叶斯优化和Sub-Sample方法，能够自适应的搜索最优的anchor设置。从实验结果来看，AABO能够仅通过anchor设置优化，为SOTA目标检测方法带来1.4%～2.4%的性能提升来源：晓飞的算法工程笔记公众号论文:AABO:AdaptiveAnchorBoxOptimizationforObjectDetectionviaBayesianS
ESPNet/ESPNetV2：空洞卷积金字塔 | 轻量级网络晓飞的算法工程笔记晓飞的算法工程笔记卷积算法网络计算机视觉神经网络
ESPNet系列的核心在于空洞卷积金字塔，每层具有不同的dilationrate，在参数量不增加的情况下，能够融合多尺度特征，相对于深度可分离卷积，深度可分离空洞卷积金字塔性价比更高。另外，HFF的多尺度特征融合方法也很值得借鉴来源：晓飞的算法工程笔记公众号ESPNet论文:ESPNet:EfficientSpatialPyramidofDilatedConvolutionsforSemanti
GFLV2：边界框不确定性的进一步融合，提点神器 | CVPR 2021 晓飞的算法工程笔记晓飞的算法工程笔记深度学习计算机视觉目标检测
GFLV2基于GFLV1的bbox分布进行改进，将分布的统计信息融入到定位质量估计中，整体思想十分创新和完备，从实验结果来看，效果还是挺不错的来源：晓飞的算法工程笔记公众号论文:GeneralizedFocalLossV2:LearningReliableLocalizationQualityEstimationforDenseObjectDetection论文地址：https://arxiv.
SMASH：经典One-Shot神经网络搜索，仅需单卡 | ICLR 2018 晓飞的算法工程笔记晓飞的算法工程笔记算法神经网络机器学习人工智能深度学习
SMASH方法使用辅助网络生成次优权重来支持网络的快速测试，从结果来看，生成的权重与正常训练的权重在准确率上存在关联性，整体搜索速度很快，仅需要单卡进行搜索，提供了一个很好的新思路。来源：晓飞的算法工程笔记公众号论文:SMASH:One-ShotModelArchitectureSearchthroughHyperNetworks论文地址：https://arxiv.org/abs/1708.0
有关TSD论文笔记 luxuanjiangg 算法
论文地址：https://arxiv.org/abs/2003.07540晓飞的算法工程笔记前景.经典RoI-based定位算法使用siblinghead(2-fc)对proposal同时进行分类和回归进行分类任务和定位任务的目标检测学习的主要障碍：共用的特征提取器以及相同的proposal限制定位算法的根本问题在于分类分支和定位分支在空间维度上存在偏差，不是通过设计特征提取器或更好的结构能解决的
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他