晓飞的算法工程笔记

CARS: 华为提出基于进化算法和权值共享的神经网络结构搜索，CIFAR-10上仅需单卡半天 | CVPR 2020

为了优化进化算法在神经网络结构搜索时候选网络训练过长的问题，参考ENAS和NSGA-III，论文提出连续进化结构搜索方法(continuous evolution architecture search, CARS)，最大化利用学习到的知识，如上一轮进化的结构和参数。首先构造用于参数共享的超网，从超网中产生子网，然后使用None-dominated排序策略来选择不同大小的优秀网络，整体耗时仅需要0.5 GPU day

来源：晓飞的算法工程笔记公众号

论文: CARS: Continuous Evolution for Efficient Neural Architecture Search

论文地址：https://arxiv.org/abs/1909.04977

Introduction

目前神经网络结构搜索的网络性能已经超越了人类设计的网络，搜索方法大致可以分为强化学习、进化算法以及梯度三种，有研究表明进化算法能比强化学习搜索到更好的模型，但其搜索耗时较多，主要在于对个体的训练验证环节费事。可以借鉴ENSA的权重共享策略进行验证加速，但如果直接应用于进化算法，超网会受到较差的搜索结构的影响，因此需要修改目前神经网络搜索算法中用到的进化算法。为了最大化上一次进化过程学习到的知识的价值，论文提出了连续进化结构搜索方法(continuous evolution architecture search, CARS)
首先初始化一个有大量cells和blocks的超网(supernet)，超网通过几个基准操作(交叉、变异等)产生进化算法中的个体(子网)，使用Non-dominated 排序策略来选取几个不同大小和准确率的优秀模型，然后训练子网并更新子网对应的超网中的cells，在下一轮的进化过程会继续基于更新后的超网以及non-dominated排序的解集进行。另外，论文提出一个保护机制来避免小模型陷阱问题

Approach

论文使用基因算法(GA)来进行结构进化，GA能提供很大的搜索空间，对于结构集 $C=\{C_1,...,C_N\}$ ， $N$ 为种群大小。在结构优化阶段，种群内的结构根据论文提出的pNSGA-III方法逐步更新。为了加速，使用一个超网 $\mathcal{N}$ 用来为不同的结构共享权重 $W$ ，能够极大地降低个体训练的计算量

Supernet of CARS

从超网 $\mathcal{N}$ 中采样不同的网络，每个网络 $\mathcal{N}_i$ 可以表示为浮点参数集合 $W_i$ 以及二值连接参数集合 $C_i$ ，其中0值表示网络不包含此连接，1值则表示使用该连接，即每个网络 $\mathcal{N}_i$ 可表示为 $W_i, C_i)$ 对
完整的浮点参数集合 $W$ 是在网络集合中共享，如果这些网络结构是固定的，最优的 $W$ 可通过标准反向传播进行优化，优化的参数 $W$ 适用于所有网络 $\mathcal{N}_i$ 以提高识别性能。在参数收敛后，通过基因算法优化二值连接 $C$ ，参数优化阶段和结构优化阶段是CARS的主要核心

Parameter Optimization

参数 $W$ 为网络中的所有参数，参数 $W_i=W\odot C_i, i\in \{1,...,N\}$ ， $\odot$ 为mask操作，只保留 $C_i=1$ 对应位置的参数。对于输入 $X$ ，网络的结果为 $P_i=\mathcal{N}_i(X,W_i)$ ， $\mathcal{N}_i$ 为 $i$ -th个网络， $W_i$ 为其参数

给定GT $Y$ ，预测的损失为 $L_i$ ，则 $W_i$ 的梯度计算如公式1

由于参数 $W$ 应该适用于所有个体，因此使用所有个体的梯度来计算 $W$ 的梯度，计算如公式2，最终配合SGD进行更新

由于已经得到大量带超网共享参数的结构，每次都集合所有网络梯度进行更新会相当耗时，可以借鉴SGD的思想进行min-batch更新。使用 $N_b < N$ 个不同的网络进行参数更新，编号为 ${n_1,...,n_b\}$ 。计算如公式3，使用小批量网络来接近所有网络的梯度，能够极大地减少优化时间，做到效果和性能间的平衡

Architecture Optimization

对于结构的优化过程，使用NSGA-III算法的non-dominated排序策略进行。标记 $\{\mathcal{N}_1,...,\mathcal{N}_N\}$ 为 $N$ 个不同的网络， $\{\mathcal{F}_1,...,\mathcal{F}_M\}$ 为希望优化的 $M$ 个指标，一般这些指标都是有冲突的，例如参数量、浮点运算量、推理时延和准确率，导致同时优化这些指标会比较难

首先定义支配(dominate)的概念，假设网络 $\mathcal{N}_i$ 的准确率大于等于网络 $\mathcal{N}_j$ ，并且有一个其它指标优于网络 $\mathcal{N}_j$ ，则称网络 $\mathcal{N}_i$ 支配网络 $\mathcal{N}_j$ ，在进化过程网络 $\mathcal{N}_j$ 可被网络 $\mathcal{N}_i$ 代替。利用这个方法，可以在种群中挑选到一系列优秀的结构，然后使用这些网络来优化超网对应部分的参数
尽管non-dominated排序能帮助选择的更好网络，但搜索过程仍可能会存在小模型陷阱现象。由于超网的参数仍在训练，所以当前轮次的模型不一定为其最优表现，如果存在一些参数少的小模型但有比较高的准确率，则会统治了整个搜索过程。因此，论文基于NSGA-III提出pNSGA-III，加入准确率提升速度作为考虑

假设优化目标为模型参数和准确率，对于NSGA-III，会根据两个不同的指标进行non-dominated排序，然后根据帕累托图进行选择。而对于pNSGA-III，额外添加考虑准确率的增长速度的non-dominated排序，最后结合两种排序进行选择。这样，准确率增长较慢的大模型也能得到保留。如图2所示，pNSGA-III很明显保留的模型大小更广，且准确率与NSGA-III相当

Continuous Evolution for CARS

CARS算法的优化包含两个步骤，分别是网络结构优化和参数优化，另外，在初期也会使用参数warmup

Parameter Warmup，由于超网的共享权重是随机初始化的，如果结构集合也是随机初始化，那么出现最多的block的训练次数会多于其它block。因此，使用均分抽样策略来初始化超网的参数，公平地覆盖所有可能的网络，每条路径都有平等地出现概率，每种层操作也是平等概率，在最初几轮使用这种策略来初始化超网的权重
Architecture Optimization，在完成超网初始化后，随机采样 $N$ 个不同的结构作为父代， $N$ 为超参数，后面pNSGA-III的筛选也使用。在进化过程中生成 $t\times N$ 个子代， $t$ 是用于控制子代数的超参，最后使用pNSGA-III从 $(t+1)\times N$ 中选取 $N$ 个网络用于参数更新
Parameter Optimization，给予网络结构合集，使用公式3进行小批量梯度更新

Search Time Analysis

CARS搜索时，将数据集分为数据集和验证集，假设单个网络的训练耗时为 $T_{tr}$ ，验证耗时 $T_{val}$ ，warmup共 $E_{warm}$ 周期，共需要 $T_{warm}=E_{warm}\times T_{tr}$ 时间来初始化超网 $\mathcal{N}$ 的参数。假设进化共 $E_{evo}$ 轮，每轮参数优化阶段对超网训练 $I_{param}$ 周期，所以每轮进化的参数优化耗时 $T_{param}=I_{param}\times T_{tr}\times N_b$ ， $N_b$ 为mini-batch大小。结构优化阶段，所有个体是并行的，所以搜索耗时为 $T_{arch}=T_{val}$ 。CARS的总耗时如公式5

Experiments

Experimental Settings

supernet Backbones

超网主干基于DARTS的设置，DARTS搜索空间包含8个不同的操作，包含4种卷积、2种池化、skip连接和无连接，搜索normal cell和reduction cell，分别用于特征提取以及下采样，搜索结束后，根据预设将cell堆叠起来

Evolution Details

在DARTS中，每个中间节点与之前的两个节点连接，因此每个节点有其独立的搜索空间，而交叉和变异在搜索空间相对应的节点中进行，占总数的比例均为0.25，其余0.5为随机生成的新结构。对于交叉操作，每个节点有0.5的概率交叉其连接，而对于变异，每个节点有0.5的概率随机赋予新操作

Experiments on CIFAR-10

Small Model Trap

图3训练了3个不同大小的模型，在训练600轮后，模型的准确率与其大小相关，从前50轮的曲线可以看出小模型陷阱的原因：

小模型准确率上升速度较快
小模型准确率的波动较大

在前50轮模型C一直处于下风，若使用NSGA算法，模型C会直接去掉了，这是需要使用pNSGA-III的第一个原因。对于模型B和C，准确率增长类似，但由于训练导致准确率波动，一旦模型A的准确率高于B，B就会被去掉，这是需要使用pNSGA-III的第二个原因

NSGA-III vs. pNSGA-III

如图2所示，使用pNSGA-III能避免小模型陷阱，保留较大的有潜力的网络

Search on CIFAR-10

将CIFAR分为25000张训练图和25000张测试图，共搜索500轮，参数warmup共50轮，之后初始化包含128个不同网络的种群，然后使用pNSGA-III逐渐进化，参数优化阶段每轮进化训练10周期，结构优化阶段根据pNSGA-III使用测试集进行结构更新

Search Time analysis

对于考量模型大小和准确率的实验，训练时间 $T_{tr}$ 为1分钟，测试时间 $T_{val}$ 为5秒，warmup阶段共50轮，大约耗费1小时。而连续进化算法共 $E_{evo}$ 轮，对于每轮结构优化阶段，并行测试时间为 $T_{arch}=T_{val}$ ，对于每轮的参数优化阶段，设定 $N_b=1$ ， $T_{param}$ 大约为10分钟， $T_{evo}$ 大约为9小时，所以 $T_{total}$ 为0.4 GPU day，考虑结构优化同时要计算时延，最终时间大约为0.5 GPU day

Evaluate on CIFAR-10

在完成CARS算法搜索后，保留128个不同的网络，进行更长时间的训练，然后测试准确率

Comparison on Searched Block

CARS-H与DARTS参数相似，但准确率更高，CARS-H的reduction block包含更多的参数，而normal block包含更少的参数，大概由于EA有更大的搜索空间，而基因操作能更有效地跳出局部最优解，这是EA的优势

Evaluate on ILSVRC2012

将在CIFAR-10上搜索到网络迁移到ILSVRC22012数据集，结果表明搜索到的结构具备迁移能力

CONCLUSION

为了优化进化算法在神经网络结构搜索时候选网络训练过长的问题，参考ENAS和NSGA-III，论文提出连续进化结构搜索方法(continuous evolution architecture search, CARS)，最大化利用学习到的知识，如上一轮进化的结构和参数。首先构造用于参数共享的超网，从超网中产生子网，然后使用None-dominated排序策略来选择不同大小的优秀网络，整体耗时仅需要0.5 GPU day

参考内容

Pareto相关理论 (https://blog.csdn.net/qq_34662278/article/details/91489077)

如果本文对你有帮助，麻烦点个赞或在看呗～
更多内容请关注微信公众号【晓飞的算法工程笔记】

ENAS：首个权值共享的神经网络搜索方法，千倍加速 | ICML 2018 VincentTeddy
NAS是自动设计网络结构的重要方法，但需要耗费巨大的资源，导致不能广泛地应用，而论文提出的EfficientNeuralArchitectureSearch(ENAS)，在搜索时对子网的参数进行共享，相对于NAS有超过1000x倍加速，单卡搜索不到半天，而且性能并没有降低，十分值得参考来源：【晓飞的算法工程笔记】公众号论文:EfficientNeuralArchitectureSearchvia
DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020 VincentTeddy
论文针对当前anchor-free目标检测算法的问题提出了DDBNet，该算法对预测框进行更准确地评估，包括正负样本以及IoU的判断。DDBNet的创新点主要在于box分解和重组模块(D&R)和语义一致性模块，分别用于解决中心关键点的回归不准问题以及中心关键点与目标语义不一致问题。从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记
DDBNet：Anchor-free新训练方法，边粒度IoU计算以及更准确的正负样本 | ECCV 2020 晓飞的算法工程笔记晓飞的算法工程笔记深度学习神经网络机器学习
论文针对当前anchor-free目标检测算法的问题提出了DDBNet，该算法对预测框进行更准确地评估，包括正负样本以及IoU的判断。DDBNet的创新点主要在于box分解和重组模块(D&R)和语义一致性模块，分别用于解决中心关键点的回归不准问题以及中心关键点与目标语义不一致问题。从实验来看，DDBNet达到了SOTA，整篇论文可圈可点，但里面的细节还需要等源码公开才知道来源：晓飞的算法工程笔记
DeiT：训练ImageNet仅用4卡不到3天的平民ViT | ICML 2021 VincentTeddy
论文基于改进训练配置以及一种新颖的蒸馏方式，提出了仅用ImageNet就能训练出来的Transformer网络DeiT。在蒸馏学习时，DeiT以卷积网络作为teacher，能够结合当前主流的数据增强和训练策略来进一步提高性能。从实验结果来看，效果很不错来源：晓飞的算法工程笔记公众号论文:Trainingdata-efficientimagetransformers&distillationthro
Hybrid-PSC：基于对比学习的混合网络，解决长尾图片分类 | CVPR 2021 VincentTeddy
论文提出新颖的混合网络用于解决长尾图片分类问题，该网络由用于图像特征学习的对比学习分支和用于分类器学习的交叉熵分支组成，在训练过程逐步将训练权重调整至分类器学习，达到更好的特征得出更好的分类器的思想。另外，为了节省内存消耗，论文提出原型有监督对比学习。从实验结果来看，论文提出的方法效果还是很不错的，值得一看来源：晓飞的算法工程笔记公众号论文:ContrastiveLearningbasedHyb
CornerNet：经典keypoint-based方法，通过定位角点进行目标检测 | ECCV2018 VincentTeddy
论文提出了CornerNet，通过检测角点对的方式进行目标检测，与当前的SOTA检测模型有相当的性能。CornerNet借鉴人体姿态估计的方法，开创了目标检测领域的一个新框架，后面很多论文都基于CorerNet的研究拓展出新的角点目标检测来源：晓飞的算法工程笔记公众号论文:CornerNet:DetectingObjectsasPairedKeypoints论文地址：https://arxiv.
NASNet : Google Brain经典作，改造搜索空间，性能全面超越人工网络，继续领跑NAS领域 | CVPR 2018 VincentTeddy
论文将搜索空间从整体网络转化为卷积单元(cell)，再按照设定堆叠成新的网络家族NASNet。不仅降低了搜索的复杂度，从原来的28天缩小到4天，而且搜索出来的结构具有扩展性，在小模型和大模型场景下都能使用更少的参数量和计算量来超越人类设计的模型，达到SOTA 来源：【晓飞的算法工程笔记】公众号论文:LearningTransferableArchitecturesforScalableImageR
PNAS：渐进式神经网络搜索，准确率预测，21倍加速 | ECCV2018 VincentTeddy
论文将核心放在搜索加速方面，基于NASNet，提出渐进式的PNAS搜索策略以及通过代理函数直接预测网络的准确率，极大地优化搜索逻辑，能够在搜索到相同性能的前提下，将搜索消耗降低21倍之多来源：【晓飞的算法工程笔记】公众号论文:ProgressiveNeuralArchitectureSearch论文地址：https://arxiv.org/abs/1712.00559Introduction 目
OREPA：阿里提出训练也很快的重参数策略，内存减半，速度加倍 | CVPR 2022 VincentTeddy
论文提出了在线重参数方法OREPA，在训练阶段就能将复杂的结构重参数为单卷积层，从而降低大量训练的耗时。为了实现这一目标，论文用线性缩放层代替了训练时的BN层，保持了优化方向的多样性和特征表达能力。从实验结果来看，OREPA在各种任务上的准确率和效率都很不错来源：晓飞的算法工程笔记公众号论文:OnlineConvolutionalRe-parameterization[图片上传失败...(ima
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018 VincentTeddy
论文提出NASH方法来进行神经网络结构搜索，核心思想与之前的EAS方法类似，使用网络态射来生成一系列效果一致且继承权重的复杂子网，本文的网络态射更丰富，而且仅需要简单的爬山算法辅助就可以完成搜索，耗时0.5GPUday 来源：晓飞的算法工程笔记公众号论文:SimpleAndEfficientArchitectureSearchforConvolutionalNeuralNetworks论文地址：h
DDP：微软提出动态detection head选择，适配计算资源有限场景 | CVPR 2022 VincentTeddy
DPP能够对目标检测proposal进行非统一处理，根据proposal选择不同复杂度的算子，加速整体推理过程。从实验结果来看，效果非常不错来源：晓飞的算法工程笔记公众号论文:ShouldAllProposalsbeTreatedEquallyinObjectDetection?[图片上传失败...(image-918413-1665323159579)]论文地址：https://arxiv.or
DVT：华为提出动态级联Vision Transformer，性能杠杠的 | NeurIPS 2021 VincentTeddy
论文主要处理VisionTransformer中的性能问题，采用推理速度不同的级联模型进行速度优化，搭配层级间的特征复用和自注意力关系复用来提升准确率。从实验结果来看，性能提升不错来源：晓飞的算法工程笔记公众号论文:NotAllImagesareWorth16x16Words:DynamicTransformersforEfficientImageRecognition[图片上传失败...(ima
Swin Transformer：最佳论文，准确率和性能双佳的视觉Transformer | ICCV 2021 VincentTeddy
论文提出了经典的VisionTransormer模型SwinTransformer，能够构建层级特征提高任务准确率，而且其计算复杂度经过各种加速设计，能够与输入图片大小成线性关系。从实验结果来看，SwinTransormer在各视觉任务上都有很不错的准确率，而且性能也很高来源：晓飞的算法工程笔记公众号论文:SwinTransformer:HierarchicalVisionTransformer
DARTS：基于梯度下降的经典网络搜索方法，开启端到端的网络搜索 | ICLR 2019
DARTS是很经典的NAS方法，它的出现打破了以往的离散的网络搜索模式，能够进行end-to-end的网络搜索。由于DARTS是基于梯度进行网络更新的，所以更新的方向比较准确，搜索时间相当于之前的方法有很大的提升，CIFAR-10的搜索仅需要4GPUdays。来源：晓飞的算法工程笔记公众号论文:DARTS:DifferentiableArchitectureSearch论文地址：https://
SMASH：经典One-Shot神经网络搜索，仅需单卡 | ICLR 2018
SMASH方法使用辅助网络生成次优权重来支持网络的快速测试，从结果来看，生成的权重与正常训练的权重在准确率上存在关联性，整体搜索速度很快，仅需要单卡进行搜索，提供了一个很好的新思路。来源：晓飞的算法工程笔记公众号论文:SMASH:One-ShotModelArchitectureSearchthroughHyperNetworks论文地址：https://arxiv.org/abs/1708.0
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索，核心思想与之前的EAS方法类似，使用网络态射来生成一系列效果一致且继承权重的复杂子网，本文的网络态射更丰富，而且仅需要简单的爬山算法辅助就可以完成搜索，耗时0.5GPUday 来源：晓飞的算法工程笔记公众号论文:SimpleAndEfficientArchitectureSearchforConvolutionalNeuralNetworks论文地址：h
FBNet/FBNetV2/FBNetV3：Facebook在NAS领域的轻量级网络探索 | 轻量级网络
FBNet系列是完全基于NAS方法的轻量级网络系列，分析当前搜索方法的缺点，逐步增加创新性改进，FBNet结合了DNAS和资源约束，FBNetV2加入了channel和输入分辨率的搜索，FBNetV3则是使用准确率预测来进行快速的网络结构搜索来源：晓飞的算法工程笔记公众号FBNet论文:FBNet:Hardware-AwareEfficientConvNetDesignviaDifferenti
RelationNet：学习目标间关系来增强特征以及去除NMS | CVPR 2018
论文基于NLP的注意力机制提出了目标关系模块，通过与其它目标的比对增强当前目标的特征，而且还可以代替NMS进行端到端的重复结果去除，思想十分新颖，效果也不错来源：晓飞的算法工程笔记公众号论文:RelationNetworksforObjectDetection论文地址：https://arxiv.org/abs/1711.11575论文代码：https://github.com/msracver
CSG：清华大学提出通过分化类特定卷积核来训练可解释的卷积网络 | ECCV 2020 Oral
论文提出类特定控制门CSG来引导网络学习类特定的卷积核，并且加入正则化方法来稀疏化CSG矩阵，进一步保证类特定。从实验结果来看，CSG的稀疏性能够引导卷积核与类别的强关联，在卷积核层面产生高度类相关的特征表达，从而提升网络的性能以及可解释性来源：晓飞的算法工程笔记公众号论文:TrainingInterpretableConvolutionalNeuralNetworksbyDifferentia
YOLOF：单层特征检测也可以比FPN更出色 | CVPR 2021 VincentTeddy
论文通过分析发现FPN的成功在于divide-and-conquer策略解决了目标检测的优化问题，借此研究设计了仅用单层特征预测的高效检测网络YOLOF。YOLOF在结构上没有很多花哨的结构，却在准确率、推理速度和收敛速度上都有不错的提升，相对于眼花缭乱的FPN魔改结构，十分值得学习来源：晓飞的算法工程笔记公众号论文:YouOnlyLookOne-levelFeature[图片上传失败...(i
DeepViT：字节提出深层ViT的训练策略 | 2021 arxiv VincentTeddy
作者发现深层ViT出现的注意力崩溃问题，提出了新颖的Re-attention机制来解决，而且计算量和内存开销都很少。通过Re-attention机制，在增加ViT深度时能够保持性能不断提高来源：晓飞的算法工程笔记公众号论文:DeepViT:TowardsDeeperVisionTransformer[图片上传失败...(image-320fda-1666536099045)]论文地址：https:
ExtremeNet：通过极点进行目标检测，更细致的目标区域 | CVPR 2019 VincentTeddy
ExtremeNet检测目标的四个极点，然后以几何的方式将其组合起来进行目标检测，性能与其它传统形式的检测算法相当。ExtremeNet的检测方法十分独特，但是包含了较多的后处理方法，所以有很大的改进空间，感兴趣可以去看看论文实验中的错误分析部分来源：晓飞的算法工程笔记公众号论文:Bottom-upObjectDetectionbyGroupingExtremeandCenterPoints论文
PVT：特征金字塔在Vision Transormer的首次应用，又快又好 | ICCV 2021 VincentTeddy
论文设计了用于密集预测任务的纯Transformer主干网络PVT，包含渐进收缩的特征金字塔结构和spatial-reductionattention层，能够在有限的计算资源和内存资源下获得高分辨率和多尺度的特征图。从物体检测和语义分割的实验可以看到，PVT在相同的参数数量下比CNN主干网络更强大来源：晓飞的算法工程笔记公众号论文:PyramidVisionTransformer:AVersati
DS-Net：可落地的动态网络，实际加速1.62倍，快改造起来 | CVPR 2021 Oral VincentTeddy
论文提出能够适配硬件加速的动态网络DS-Net，通过提出的double-headed动态门控来实现动态路由。基于论文提出的高性能网络设计和IEB、SGS训练策略，仅用1/2-1/4的计算量就能达到静态SOTA网络性能，实际加速也有1.62倍来源：晓飞的算法工程笔记公众号论文:DynamicSlimmableNetwork[图片上传失败...(image-262f83-1657684119973)
DGC：真动态分组卷积，可能是解决分组特征阻塞的最好方案 | ECCV 2020 Spotlight 晓飞的算法工程笔记晓飞的算法工程笔记网络机器学习人工智能卷积深度学习
近期，动态网络在加速推理这方面有很多研究，DGC(DynamicGroupConvolution)将动态网络的思想结合到分组卷积中，使得分组卷积在轻量化的同时能够加强表达能力，整体思路直接清晰，可作为网络设计时的一个不错的选择来源：晓飞的算法工程笔记公众号论文:DynamicGroupConvolutionforAcceleratingConvolutionalNeuralNetworks论文地
AABO：自适应Anchor设置优化，性能榨取的最后一步 | ECCV 2020 Spotlight VincentTeddy
论文提出超参数优化方法AABO，该方法核心基于贝叶斯优化和Sub-Sample方法，能够自适应的搜索最优的anchor设置。从实验结果来看，AABO能够仅通过anchor设置优化，为SOTA目标检测方法带来1.4%～2.4%的性能提升来源：晓飞的算法工程笔记公众号论文:AABO:AdaptiveAnchorBoxOptimizationforObjectDetectionviaBayesianS
ESPNet/ESPNetV2：空洞卷积金字塔 | 轻量级网络晓飞的算法工程笔记晓飞的算法工程笔记卷积算法网络计算机视觉神经网络
ESPNet系列的核心在于空洞卷积金字塔，每层具有不同的dilationrate，在参数量不增加的情况下，能够融合多尺度特征，相对于深度可分离卷积，深度可分离空洞卷积金字塔性价比更高。另外，HFF的多尺度特征融合方法也很值得借鉴来源：晓飞的算法工程笔记公众号ESPNet论文:ESPNet:EfficientSpatialPyramidofDilatedConvolutionsforSemanti
GFLV2：边界框不确定性的进一步融合，提点神器 | CVPR 2021 晓飞的算法工程笔记晓飞的算法工程笔记深度学习计算机视觉目标检测
GFLV2基于GFLV1的bbox分布进行改进，将分布的统计信息融入到定位质量估计中，整体思想十分创新和完备，从实验结果来看，效果还是挺不错的来源：晓飞的算法工程笔记公众号论文:GeneralizedFocalLossV2:LearningReliableLocalizationQualityEstimationforDenseObjectDetection论文地址：https://arxiv.
SMASH：经典One-Shot神经网络搜索，仅需单卡 | ICLR 2018 晓飞的算法工程笔记晓飞的算法工程笔记算法神经网络机器学习人工智能深度学习
SMASH方法使用辅助网络生成次优权重来支持网络的快速测试，从结果来看，生成的权重与正常训练的权重在准确率上存在关联性，整体搜索速度很快，仅需要单卡进行搜索，提供了一个很好的新思路。来源：晓飞的算法工程笔记公众号论文:SMASH:One-ShotModelArchitectureSearchthroughHyperNetworks论文地址：https://arxiv.org/abs/1708.0
有关TSD论文笔记 luxuanjiangg 算法
论文地址：https://arxiv.org/abs/2003.07540晓飞的算法工程笔记前景.经典RoI-based定位算法使用siblinghead(2-fc)对proposal同时进行分类和回归进行分类任务和定位任务的目标检测学习的主要障碍：共用的特征提取器以及相同的proposal限制定位算法的根本问题在于分类分支和定位分支在空间维度上存在偏差，不是通过设计特征提取器或更好的结构能解决的
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

CARS: 华为提出基于进化算法和权值共享的神经网络结构搜索，CIFAR-10上仅需单卡半天 | CVPR 2020

Introduction

Approach

Supernet of CARS

Parameter Optimization

Architecture Optimization

Continuous Evolution for CARS

Search Time Analysis

Experiments

Experimental Settings

supernet Backbones

Evolution Details

Experiments on CIFAR-10

Small Model Trap

NSGA-III vs. pNSGA-III

Search on CIFAR-10

Search Time analysis

Evaluate on CIFAR-10

Comparison on Searched Block

Evaluate on ILSVRC2012

CONCLUSION

参考内容

你可能感兴趣的:(晓飞的算法工程笔记)