深度学习目标检测历史发展

前言

使用深度学习的目标检测的纸质列表。我在参考这份调查报告和搜索和搜索时写了这个页面。

最后更新时间:2019/07/31

更新日志

2018/9/18 - 更新所有最近的论文,并使用深度学习制作关于物体检测历史的图表。 2018/9/26 - 更新文件代码。(官方和非官方)
2018年/ 10月 - 更新5篇论文和表现表。
2018年/ 11月 - 更新9篇论文。
2018年/ 12月 - 更新8篇论文和性能表并添加新图表(2019年版本!!)。
2019年/ 1月 - 更新4篇论文并添加常用数据集。
2019年/ 2月 - 更新3篇论文。
2019年/ 3月 - 更新图形和代码链接。
2019年/ 4月 - 删除作者姓名并更新ICLR 2019和CVPR 2019论文。
2019 /可 - 更新CVPR 2019年论文。
2019年/ 6月 - 更新CVPR 2019年论文和数据集论文。
2019年/ 7月 - 更新BMVC 2019年论文和一些ICCV 2019年论文。

 

目录

  • 2014年至今的纸质清单(2019年)
  • 性能表
  • 文件
    • 2014
    • 2015年
    • 2016
    • 2017年
    • 2018
    • 2019
  • 数据集论文

 

2014年至今的纸质清单(2019年)

用红色字符突出显示的部分意味着我认为“必读”的论文。但是,这是我个人的意见,其他论文也很重要,所以如果你有时间,我建议你阅读。

 

深度学习目标检测历史发展_第1张图片

性能表

FPS(速度)索引与硬件规格(例如CPU,GPU,RAM等)有关,因此很难进行相同的比较。解决方案是测量具有相同规格的硬件上所有型号的性能,但这非常困难且耗时。

探测器 VOC07(mAP@IoU=0.5) VOC12(mAP@IoU=0.5) COCO(mAP@IoU=0.5:0.95) 出版于
R-CNN 58.5 - - CVPR'14
SPP-网 59.2 - - ECCV'14
MR-CNN 78.2(07 + 12) 73.9(07 + 12) - ICCV'15
快速R-CNN 70.0(07 + 12) 68.4(07 ++ 12) 19.7 ICCV'15
更快的R-CNN 73.2(07 + 12) 70.4(07 ++ 12) 21.9 NIPS'15
YOLO v1 66.4(07 + 12) 57.9(07 ++ 12) - CVPR'16
G-CNN 66.8 66.4(07 + 12) - CVPR'16
AZNet 70.4 - 22.3 CVPR'16
离子 80.1 77.9 33.1 CVPR'16
HyperNet 76.3(07 + 12) 71.4(07 ++ 12) - CVPR'16
OHEM 78.9(07 + 12) 76.3(07 ++ 12) 22.4 CVPR'16
MPN - - 33.2 BMVC'16
SSD 76.8(07 + 12) 74.9(07 ++ 12) 31.2 ECCV'16
GBDNet 77.2(07 + 12) - 27.0 ECCV'16
CPF 76.4(07 + 12) 72.6(07 ++ 12) - ECCV'16
R-FCN 79.5(07 + 12) 77.6(07 ++ 12) 29.9 NIPS'16
DeepID-网 69.0 - - PAMI'16
片上网络 71.6(07 + 12) 68.8(07 + 12) 27.2 TPAMI'16
DSSD 81.5(07 + 12) 80.0(07 ++ 12) 33.2 arXiv'17
TDM - - 37.3 CVPR'17
FPN - - 36.2 CVPR'17
YOLO v2 78.6(07 + 12) 73.4(07 ++ 12) - CVPR'17
RON 77.6(07 + 12) 75.4(07 ++ 12) 27.4 CVPR'17
DeNet 77.1(07 + 12) 73.9(07 ++ 12) 33.8 ICCV'17
CoupleNet 82.7(07 + 12) 80.4(07 ++ 12) 34.4 ICCV'17
RetinaNet - - 39.1 ICCV'17
DSOD 77.7(07 + 12) 76.3(07 ++ 12) - ICCV'17
SMN 70.0 - - ICCV'17
轻头R-CNN - - 41.5 arXiv'17
YOLO v3 - - 33.0 arXiv'18
76.0(07 + 12) 73.1(07 ++ 12) 23.2 CVPR'18
STDN 80.9(07 + 12) - - CVPR'18
RefineDet 83.8(07 + 12) 83.5(07 ++ 12) 41.8 CVPR'18
SNIP - - 45.7 CVPR'18
关系网 - - 32.5 CVPR'18
级联R-CNN - - 42.8 CVPR'18
MLKP 80.6(07 + 12) 77.2(07 ++ 12) 28.6 CVPR'18
健身-NMS - - 41.8 CVPR'18
RFBNet 82.2(07 + 12) - - ECCV'18
CornerNet - - 42.1 ECCV'18
PFPNet 84.1(07 + 12) 83.7(07 ++ 12) 39.4 ECCV'18
佩利 70.9(07 + 12) - - NIPS'18
HKRM 78.8(07 + 12) - 37.8 NIPS'18
M2Det - - 44.2 AAAI'19
R-DAD 81.2(07 ++ 12) 82.0(07 ++ 12) 43.1 AAAI'19

 

2014

  • [R-CNN]丰富的特征层次结构,用于精确的对象检测和语义分割 [CVPR'14] |[pdf] [official code - caffe]

  • [OverFeat] OverFeat:使用卷积网络进行集成识别,定位和检测| [ICLR'14] |[pdf] [official code - torch]

  • [MultiBox]使用深度神经网络的可扩展对象检测| [CVPR'14] |[pdf]

  • [SPP-Net]用于视觉识别的深度卷积网络中的空间金字塔池 [ECCV'14] |[pdf] [official code - caffe] [unofficial code - keras] [unofficial code - tensorflow]

2015年

  • 利用贝叶斯优化和结构化预测改进深度卷积网络的目标检测 [CVPR'15] |[pdf] [official code - matlab]

  • [MR-CNN]通过多区域和语义分段感知的CNN模型进行对象检测 [ICCV'15] |[pdf] [official code - caffe]

  • [DeepBox] DeepBox:使用卷积网络学习对象| [ICCV'15] |[pdf] [official code - caffe]

  • [AttentionNet] AttentionNet:汇总精确物体检测的弱方向| [ICCV'15] |[pdf]

  • [快速R-CNN]快速R-CNN | [ICCV'15] |[pdf] [official code - caffe]

  • [DeepProposal] DeepProposal:通过级联深层卷积层来狩猎对象| [ICCV'15] |[pdf] [official code - matconvnet]

  • [更快的R-CNN,RPN]更快的R-CNN:利用区域提案网络进行实时物体检测 [NIPS'15] |[pdf] [official code - caffe][unofficial code - tensorflow] [unofficial code - pytorch]

2016

  • [YOLO v1]你只看一次:统一的实时物体检测| [CVPR'16] |[pdf] [official code - c]

  • [G-CNN] G-CNN:基于迭代网格的物体探测器| [CVPR'16] |[pdf]

  • [AZNet]使用邻接和缩放预测的自适应对象检测| [CVPR'16] |[pdf]

  • [ION]内外网:用跳过池和回归神经网络检测上下文中的对象 [CVPR'16] |[pdf]

  • [HyperNet] HyperNet:迈向准确的区域建议生成和联合对象检测| [CVPR'16] |[pdf]

  • [OHEM]基于在线硬实例挖掘的基于训练区域的物体探测器| [CVPR'16] |[pdf] [official code - caffe]

  • [CRAPF]来自图像的CRAFT对象| [CVPR'16] |[pdf] [official code - caffe]

  • [MPN]用于对象检测的多路径网络| [BMVC'16] |[pdf] [official code - torch]

  • [SSD] SSD:单次多盒检测器| [ECCV'16] |[pdf] [official code - caffe] [unofficial code - tensorflow][unofficial code - pytorch]

  • [GBDNet]制作用于物体检测的GBD-Net | [ECCV'16] |[pdf] [official code - caffe]

  • [CPF]快速R-CNN的上下文启动和反馈| [ECCV'16] |[pdf]

  • [MS-CNN]一种用于快速目标检测的统一多尺度深度卷积神经网络 [ECCV'16] |[pdf] [official code - caffe]

  • [R-FCN] R-FCN:基于区域的完全卷积网络的对象检测| [NIPS'16] |[pdf] [official code - caffe] [unofficial code - caffe]

  • [PVANET] PVANET:用于实时物体检测的深而轻量级的神经网络 [NIPSW'16] |[pdf] [official code - caffe]

  • [DeepID-Net] DeepID-Net:用于对象检测的可变形深度卷积神经网络| [PAMI'16] |[pdf]

  • 卷积特征映射上的[NoC]对象检测网络| [TPAMI'16] |[pdf]

2017年

  • [DSSD] DSSD:反卷积单次检测器| [arXiv'17] |[pdf] [official code - caffe]

  • [TDM]超越跳过连接:用于对象检测的自顶向下调制| [CVPR'17] |[pdf]

  • [FPN]用于对象检测的特征金字塔网络| [CVPR'17] |[pdf] [unofficial code - caffe]

  • [YOLO v2] YOLO9000:更好,更快,更强 [CVPR'17] |[pdf] [official code - c] [unofficial code - caffe][unofficial code - tensorflow] [unofficial code - tensorflow] [unofficial code - pytorch]

  • [RON] RON:与对象检测对象先验网络的反向连接| [CVPR'17] |[pdf] [official code - caffe] [unofficial code - tensorflow]

  • [RSA] CNN中对象检测的递归尺度近似 | [ICCV'17] |[pdf] [official code - caffe]

  • [DCN]可变形卷积网络| [ICCV'17] |[pdf] [official code - mxnet] [unofficial code - tensorflow] [unofficial code - pytorch]

  • [DeNet] DeNet:利用定向稀疏采样进行可扩展的实时目标检测| [ICCV'17] |[pdf] [official code - theano]

  • [CoupleNet] CoupleNet:将全局结构与本地部件耦合用于对象检测| [ICCV'17] |[pdf] [official code - caffe]

  • [RetinaNet]密集物体检测的焦点损失| [ICCV'17] |[pdf] [official code - keras] [unofficial code - pytorch][unofficial code - mxnet] [unofficial code - tensorflow]

  • [Mask R-CNN] Mask R-CNN | [ICCV'17] |[pdf] [official code - caffe2] [unofficial code - tensorflow][unofficial code - tensorflow] [unofficial code - pytorch]

  • [DSOD] DSOD:从Scratch学习深度监督的物体探测器 [ICCV'17] |[pdf] [official code - caffe] [unofficial code - pytorch]

  • [SMN]用于对象检测中的上下文推理的空间记忆| [ICCV'17] |[pdf]

  • [Light-Head R-CNN] Light-Head R-CNN:防御两级物体探测器| [arXiv'17] |[pdf] [official code - tensorflow]

  • [Soft-NMS]用一行代码改进对象检测| [ICCV'17] |[pdf] [official code - caffe]

2018

  • [YOLO v3] YOLOv3:增量改进| [arXiv'18] |[pdf] [official code - c] [unofficial code - pytorch] [unofficial code - pytorch] [unofficial code - keras] [unofficial code - tensorflow]

  • [ZIP]通过对象提案的递归训练缩小输入和输入网络| [IJCV'18] |[pdf] [official code - caffe]

  • [SIN]结构推理网:使用场景级上下文和实例级关系进行对象检测| [CVPR'18] |[pdf] [official code - tensorflow]

  • [STDN]规模可传输对象检测| [CVPR'18] |[pdf]

  • [RefineDet]用于物体检测的单次细化神经网络| [CVPR'18] |[pdf] [official code - caffe] [unofficial code - chainer] [unofficial code - pytorch]

  • [MegDet] MegDet:大型小批量物体探测器| [CVPR'18] |[pdf]

  • [DA Faster R-CNN]用于野外物体检测的域自适应更快的R-CNN | [CVPR'18] |[pdf] [official code - caffe]

  • [SNIP]对象检测中的尺度不变性分析 - SNIP | [CVPR'18] |[pdf]

  • [关系网]对象检测关系网络| [CVPR'18] |[pdf] [official code - mxnet]

  • [Cascade R-CNN]级联R-CNN:深入研究高质量物体检测| [CVPR'18] |[pdf] [official code - caffe]

  • 用生成性对抗网络寻找野外的微小面孔| [CVPR'18] |[pdf]

  • [MLKP]用于对象检测的多尺度位置感知核表示| [CVPR'18] |[pdf] [official code - caffe]

  • 通过渐进域自适应进行跨域弱监督对象检测| [CVPR'18] |[pdf] [official code - chainer]

  • [Fitness NMS]通过健身NMS和有界IoU损失改善对象本地化| [CVPR'18] |[pdf]

  • [STDnet] STDnet:用于小目标检测的ConvNet | [BMVC'18] |[pdf]

  • [RFBNet]用于准确和快速物体检测的接收场块网络 [ECCV'18] |[pdf] [official code - pytorch]

  • Web知识转移的零注释对象检测| [ECCV'18] |[pdf]

  • [CornerNet] CornerNet:将对象检测为配对关键点| [ECCV'18] |[pdf] [official code - pytorch]

  • [PFPNet]用于对象检测的并行特征金字塔网络| [ECCV'18] |[pdf]

  • [Softer-NMS] Softer-NMS:反思精确物体检测的边界框回归| [arXiv'18] |[pdf]

  • [ShapeShifter] ShapeShifter:对更快的R-CNN物体探测器进行强大的物理对抗攻击 [ECML-PKDD'18] |[pdf] [official code - tensorflow]

  • [Pelee] Pelee:移动设备上的实时对象检测系统| [NIPS'18] |[pdf] [official code - caffe]

  • [HKRM]用于大规模目标检测的混合知识路由模块| [NIPS'18] |[pdf]

  • [MetaAnchor] MetaAnchor:学习使用自定义锚点检测对象| [NIPS'18] |[pdf]

  • [SNIPER] SNIPER:高效的多规模培训| [NIPS'18] |[pdf]

2019

  • [M2Det] M2Det:基于多级特征金字塔网络的单次目标检测器| [AAAI'19] |[pdf] [official code - pytorch]

  • [R-DAD]基于区域分解和组装的目标检测 [AAAI'19] |[pdf]

  • [CAMOU] CAMOU:学习物理车辆伪装以对抗攻击野外探测器| [ICLR'19] |[pdf]

  • 用于对象检测的特征Intertwiner | [ICLR'19] |[pdf]

  • [GIoU]联合上的广义交集:边界框回归的度量和损失| [CVPR'19] |[pdf]

  • 使用自我训练自动将物体探测器调整到新的域 [CVPR'19] |[pdf]

  • [天秤座R-CNN]天秤座R-CNN:物体检测的平衡学习| [CVPR'19] |[pdf]

  • 用于单次物体检测的特征选择性无锚模块| [CVPR'19] |[pdf]

  • [ExtremeNet]通过分组极端和中心点进行自下而上的物体检测| [CVPR'19] | [pdf]|[official code - pytorch]

  • [C-MIL] C-MIL:用于弱监督对象检测的连续多实例学习| [CVPR'19] | [pdf]|[official code - torch]

  • [ScratchDet] ScratchDet:从Scratch训练单次物体探测器 [CVPR'19] |[pdf]

  • 精确物体检测的不确定边界框回归分析 [CVPR'19] | [pdf]|[official code - caffe2]

  • 活动驱动的弱监督对象检测| [CVPR'19] |[pdf]

  • 用AP损失实现精确的单级物体检测| [CVPR'19] |[pdf]

  • 自适应对象检测的强弱分布对齐| [CVPR'19] | [pdf]|[official code - pytorch]

  • [NAS-FPN] NAS-FPN:学习用于对象检测的可扩展特征金字塔结构| [CVPR'19] |[pdf]

  • [自适应NMS]自适应NMS:改进人群中的行人检测| [CVPR'19] |[pdf]

  • 指出:限制:超越人群中的人数 [CVPR'19] |[pdf]

  • 定位没有边界框的对象| [CVPR'19] |[pdf]

  • 从稀疏注释对象中进行大规模目标检测的采样技术 [CVPR'19] |[pdf]

  • 通过域注意实现通用对象检测| [CVPR'19] |[pdf]

  • 探索物体检测语境效用的界限| [CVPR'19] |[pdf]

  • 我应该使用什么物品? - 任务驱动的对象检测| [CVPR'19] |[pdf]

  • 基于相异系数的弱监督对象检测| [CVPR'19] |[pdf]

  • 通过选择性跨域对齐调整对象检测器| [CVPR'19] |[pdf]

  • 用于物体检测的全量化网络| [CVPR'19] |[pdf]

  • 具有细粒度特征模仿的蒸馏物体探测器| [CVPR'19] |[pdf]

  • 通过回收边界框注释的多任务自监督对象检测| [CVPR'19] |[pdf]

  • [推理-RCNN]推理-RCNN:将自适应全局推理统一为大规模目标检测 [CVPR'19] |[pdf]

  • 具有自适应文本区域表示的任意形状场景文本检测| [CVPR'19] |[pdf]

  • 辅助激活激活:改进物体探测器的学习技术| [CVPR'19] |[pdf]

  • 用于大规模目标检测的空间感知图关系网络 [CVPR'19] |[pdf]

  • [MaxpoolNMS] MaxpoolNMS:摆脱两阶段物体探测器中的NMS瓶颈问题 [CVPR'19] |[pdf]

  • 收获你播种的内容:为弱监督对象检测生成高精度对象建议 [CVPR'19] |[pdf]

  • 具有位置感知可变形卷积和后向注意过滤的对象检测| [CVPR'19] |[pdf]

  • 多样化和匹配:用于对象检测的域自适应表示学习范例| [CVPR'19] |[pdf]

  • [GFR]通过门控特征重用从头开始改善物体检测| [BMVC'19] | [pdf]|[official code - pytorch]

  • [Cascade RetinaNet] Cascade RetinaNet:维持单级物体检测的一致性| [BMVC'19] |[pdf]

  • 用于鲁棒物体检测的软采样| [BMVC'19] |[pdf]

  • 用于无限制对象检测的多对等Faster-RCNN | [ICCV'19] |[pdf]

  • 对抗鲁棒性对象检测| [ICCV'19] |[pdf]

  • [Cap2Det] Cap2Det:学习放大对象检测的弱字幕监控| [ICCV'19] |[pdf]

  • [Gaussian YOLOv3] Gaussian YOLOv3:一种使用定位不确定性进行自动驾驶的精确快速物体检测器 [ICCV'19] |[pdf]

 

数据集论文

常用对象检测数据集的统计。该表来自该调查报告。

挑战 对象类 图像数量 注释图像的数量
培养 瓦尔 测试 培养 瓦尔
PASCAL VOC物体检测挑战
VOC07 20 2501 2,510 4,952 6,301(7,844) 6,307(7,818)
VOC08 20 2111 2221 4,133 5,082(6,337) 5,281(6,347)
VOC09 20 3473 3,581 6,650 8,505(9,760) 8,713(9,779)
VOC10 20 4998 5,105 9637 11,577(13,339) 11,797(13,352)
VOC11 20 5,717 5,823 10994 13,609(15,774) 13,841(15,787)
VOC12 20 5,717 5,823 10991 13,609(15,774) 13,841(15,787)
ILSVRC对象检测挑战
ILSVRC13 200 395909 20121 40152 345854 55502
ILSVRC14 200 456567 20121 40152 478807 55502
ILSVRC15 200 456567 20121 51294 478807 55502
ILSVRC16 200 456567 20121 60000 478807 55502
ILSVRC17 200 456567 20121 65,500 478807 55502
MS COCO对象检测挑战
MS COCO15 80 82783 40504 81434 604907 291875
MS COCO16 80 82783 40504 81434 604907 291875
MS COCO17 80 118287 5000 40670 860001 36781
MS COCO18 80 118287 5000 40670 860001 36781
打开图像对象检测挑战
OID18 500 1743042 41620 125436 12195144 -

与主要用于物体检测的数据集有关的论文如下。

  • [PASCAL VOC] PASCAL视觉对象类(VOC)挑战| [IJCV'10] |[pdf]

  • [PASCAL VOC] PASCAL视觉对象类挑战:回顾| [IJCV'15] | [pdf]|[link]

  • [ImageNet] ImageNet:大规模分层图像数据库| [CVPR'09] |[pdf]

  • [ImageNet] ImageNet大规模视觉识别挑战| [IJCV'15] | [pdf]|[link]

  • [COCO] Microsoft COCO:上下文中的常见对象| [ECCV'14] | [pdf]|[link]

  • [打开图像]打开图像数据集V4:统一图像分类,对象检测和视觉关系检测| [arXiv'18] | [pdf]|[link]

  • [DOTA] DOTA:航空影像中物体检测的大型数据集| [CVPR'18] | [pdf]|[link]

你可能感兴趣的:(目标检测,目标检测,深度学习)