2020年即将结束,回望这一年,有哪些亮眼的目标检测论文给你带来启发或者帮助呢?
编辑:Amusi
来源:CVer微信公众号
原文:这三篇目标检测论文刚刚开源了!AutoAssign/可变形DETR/DeFCN
注:文末附目标检测交流群
上半年的DETR掀起了基于Transformer的CV论文浪潮,不少人调侃留给Transformer攻克的CV方向不多了,比如检测、分割、深度估计、车道线检测等领域均被"染指"。同在上半年,还有YOLOv4、YOLOv5等不错的工作。
下半年的好工作也不少,比如本文介绍的刚开源的Deformable-DETR,还有近期发布的Sparse R-CNN和DeFCN等工作。
本文如果点赞的人很多,那么CVer 将尽快推出目标检测2020年度总结性论文(大盘点),看肯定是看不完的,收藏一波安慰自己也行。
这三篇目标检测论文刚刚开源了!
论文发布:2020年7月初 | 代码开源:2020年12月初
作者团队:旷视研究院
论文链接:https://arxiv.org/abs/2007.03496
项目代码链接:
https://github.com/Megvii-BaseDetection/AutoAssign
AutoAssign:用于密集目标检测的可微标签分配,模型表现SOTA!优于当时的所有一阶段检测器,如ATSS、FreeAnchor和FCOS等网络
想了解这篇论文,详情可见:被拒 ECCV 2020!AutoAssign:最强Anchor-free目标检测网络
论文发布:2020年10月初 | 代码开源:2020年12月初
作者团队:商汤研究院, 中科大, 港中文
论文链接:https://arxiv.org/abs/2010.04159
项目代码链接:
https://github.com/fundamentalvision/Deformable-DETR
DETR 存在收敛速度慢等缺陷。为了解决这些问题,本文可变形 DETR,其注意力模块仅关注于参考点附近的一小部分采样点作为注意力模块中的 key 元素。可变形 DETR 可以在比 DETR 少 9/10 的训练轮数下,达到更好的性能(尤其是在小目标上)。在 COCO 基准上的大量实验表明了该方法的有效性。
想了解这篇论文,详情可见:训练加快10倍!性能更强!商汤等提出可变形DETR目标检测网络
DeFCN
论文发布:2020年12月初 | 代码开源:2020年12月初
作者团队:旷视科技,西安交通大学
论文链接:https://arxiv.org/abs/2012.03544
项目代码链接:
https://github.com/Megvii-BaseDetection/DeFCN
本文基于FCOS,首次在dense prediction上利用全卷积结构做到E2E,即无NMS后处理。受到DETR的启发,设计了一种POTO(prediction-aware one-to-one assignment)方法。DeFCN在无NMS的情况下,在COCO上达到了与有NMS的FCOS相当的性能。
想了解这篇论文,详情可见:丢弃Transformer!旷视和西安交大提出基于FCN的端到端目标检测网络
本文如果点赞的人很多,那么CVer 将尽快推出目标检测2020年度总结性论文(大盘点),看肯定是看不完的,收藏一波安慰自己也行。
建了CVer-目标检测交流群!想要进检测学习交流群的同学,可以直接加微信号:CVer5555。加的时候备注一下:目标检测+学校+昵称,即可。然后就可以拉你进群了。
强烈推荐大家关注CVer知乎账号和CVer微信公众号,可以快速了解到最新优质的CV论文。
清华大学提出:预训练表示的Bi-tuning
综述 | 基于深度学习的单目深度估计技术:全面调研(2014-2020)
AAAI 2021 | 国科大和上海交大提出RSDet:旋转目标新网络,代码已开源!
420 FPS!LSTR:基于Transformer的端到端实时车道线检测
图像分割涨点技巧!从39个Kaggle竞赛中总结出的分割Tips和Tricks
涨点明显!港中文等提出SplitNet:通过切分网络和结合Co-Training提升CNN性能
重磅!中山大学提出行人重识别新方法和史上最大数据集SYSU-30k,已开源!
AAAI 2021 | 上海交大等提出R3Det:旋转目标检测网络,代码已开源!
北京大学等提出SR新模块!通过Squeeze Reasoning实现高效的场景理解
冠军解决方案!用于脑肿瘤分割的nnU-Net改进
刷新WIDER Face纪录!TinaFace:人脸检测新网络,代码已开源!
这个AI能帮你女朋友自拍!从照片生成3D视频,总有个角度让她满意
STTR:基于Transformers的立体深度估计网络,代码已开源!
用GAN生成70岁的你!还可以重返17岁,代码已开源!ECCV 2020 Adobe等新研究
WACV2021 | 用于小目标检测的FPN中的高效融合因子
综述 | 对比自监督学习技术:全面调研
85.4 mIOU!NVIDIA:使用多尺度注意力进行语义分割
深入研究Label Smoothing(标签平滑)
使用PyTorch时,最常见的4个错误
NeurIPS 2020 | Auto-Panoptic:用于全景分割的协作式多组件体系结构搜索
NeurIPS 20 | RelationNet++: Transformer桥接视觉表示的目标检测
利用YOLOv4和Deep SORT实现多摄像头实时目标跟踪和计数(已开源)
NeurIPS 20 | 超越EfficientNet!TinyNet:玩转网络的分辨率,深度和宽度
涨点技巧!汇集13个Kaggle图像分类项目的性能提升指南
利用知识蒸馏改进目标检测:面向准确高效的检测器
使用深度学习从视频中估计车辆的速度(已开源)
ECCV 2020 | 旷视开源LabelEnc:提升目标检测的新型中间监督方法
这9个技巧让你的PyTorch模型训练得飞快!
牛津博士论文 | 学习重建和分割3D目标(143页PDF)
谷歌刚刚发布Objectron新数据集,可完美检测3D目标,超过4百万幅图像和15K视频剪辑!
综述 | MIT提出视频理解/行为识别:全面调研(2004-2020)
综述 | 基于无人机的目标跟踪的相关滤波器:全面调研
从三个维度加速你的CNN:全面的剪枝框架
Recall Loss:用于不平衡图像分类和语义分割的召回损失
即插即用!Rotate to Attend:卷积Triplet注意力模块
旷视提出MegDetV2:目标检测/实例分割系统
综述 | 基于深度学习的医学图像分割技术:全面调研
ResNet还是DenseNet?即插即用的DS涨点神器来了!
综述 | 基于深度学习的端到端人脸识别技术:全面调研
TBC:共享Thinner Filters,实现更强的CNN!
综述 | 行人检测技术(从手工特征到深度学习):全面调研
超越EfficientNets!无需注意力,也能让你的网络更快更强!
OpenCV 4.5来了!更强的SIFT,改进RANSAC算法,新增目标跟踪网络SiamRPN++
综述 | 基于深度学习的实时语义分割方法:全面调研
涨点神器!南航提出AFF:注意力特征融合
NeurIPS 2020 | 谷歌大脑提出:重新思考预训练和自训练
NeurIPS 2020 | 用于图像复原/恢复的神经稀疏表示
NeurIPS 2020 | aLRPLoss:统一目标检测中的分类和定位的平衡损失函数
CCE:具有互补交叉熵的不平衡图像分类
谷歌地标检索2020 Kaggle 第一名解决方案
ECCV AIM 2020 真实图像超分辨率挑战赛3项冠军解决方案
LVIS 实例分割挑战赛2020的第一名解决方案:好的Box不能保证好的Mask
ETH Zurich提出DPIR:具有Denoiser先验的即插即用图像恢复
ECCV 2020 | NAS-DIP:通过NAS实现DIP(去噪/去雾/超分辨率/修复等)
综述 | 小样本学习:全面调研(Few-shot)
使用深度神经网络从Noisy Labels中学习:全面调研
剪枝filter?还是剪枝layer?这是个问题
ECCV 2020 | WeightNet:重新探索Weight网络的设计空间
ECCV 2020 | 53.5 AP!PAA:用于目标检测的IoU预测的概率Anchor分配
ECCV 2020 | 南京理工提出FPT:特征金字塔Transformer
ECCV 2020 | BMask R-CNN:边界保持的Mask R-CNN
ECCV 2020 | 即插即用!PSConv:将特征金字塔压缩到紧凑