使用深度学习的目标检测的纸质列表。我在参考这份调查报告和搜索和搜索时写了这个页面。
最后更新时间:2019/07/31
更新日志
2018/9/18 - 更新所有最近的论文,并使用深度学习制作关于物体检测历史的图表。 2018/9/26 - 更新文件代码。(官方和非官方)
2018年/ 10月 - 更新5篇论文和表现表。
2018年/ 11月 - 更新9篇论文。
2018年/ 12月 - 更新8篇论文和性能表并添加新图表(2019年版本!!)。
2019年/ 1月 - 更新4篇论文并添加常用数据集。
2019年/ 2月 - 更新3篇论文。
2019年/ 3月 - 更新图形和代码链接。
2019年/ 4月 - 删除作者姓名并更新ICLR 2019和CVPR 2019论文。
2019 /可 - 更新CVPR 2019年论文。
2019年/ 6月 - 更新CVPR 2019年论文和数据集论文。
2019年/ 7月 - 更新BMVC 2019年论文和一些ICCV 2019年论文。
用红色字符突出显示的部分意味着我认为“必读”的论文。但是,这是我个人的意见,其他论文也很重要,所以如果你有时间,我建议你阅读。
FPS(速度)索引与硬件规格(例如CPU,GPU,RAM等)有关,因此很难进行相同的比较。解决方案是测量具有相同规格的硬件上所有型号的性能,但这非常困难且耗时。
探测器 | VOC07(mAP@IoU=0.5) | VOC12(mAP@IoU=0.5) | COCO(mAP@IoU=0.5:0.95) | 出版于 |
---|---|---|---|---|
R-CNN | 58.5 | - | - | CVPR'14 |
SPP-网 | 59.2 | - | - | ECCV'14 |
MR-CNN | 78.2(07 + 12) | 73.9(07 + 12) | - | ICCV'15 |
快速R-CNN | 70.0(07 + 12) | 68.4(07 ++ 12) | 19.7 | ICCV'15 |
更快的R-CNN | 73.2(07 + 12) | 70.4(07 ++ 12) | 21.9 | NIPS'15 |
YOLO v1 | 66.4(07 + 12) | 57.9(07 ++ 12) | - | CVPR'16 |
G-CNN | 66.8 | 66.4(07 + 12) | - | CVPR'16 |
AZNet | 70.4 | - | 22.3 | CVPR'16 |
离子 | 80.1 | 77.9 | 33.1 | CVPR'16 |
HyperNet | 76.3(07 + 12) | 71.4(07 ++ 12) | - | CVPR'16 |
OHEM | 78.9(07 + 12) | 76.3(07 ++ 12) | 22.4 | CVPR'16 |
MPN | - | - | 33.2 | BMVC'16 |
SSD | 76.8(07 + 12) | 74.9(07 ++ 12) | 31.2 | ECCV'16 |
GBDNet | 77.2(07 + 12) | - | 27.0 | ECCV'16 |
CPF | 76.4(07 + 12) | 72.6(07 ++ 12) | - | ECCV'16 |
R-FCN | 79.5(07 + 12) | 77.6(07 ++ 12) | 29.9 | NIPS'16 |
DeepID-网 | 69.0 | - | - | PAMI'16 |
片上网络 | 71.6(07 + 12) | 68.8(07 + 12) | 27.2 | TPAMI'16 |
DSSD | 81.5(07 + 12) | 80.0(07 ++ 12) | 33.2 | arXiv'17 |
TDM | - | - | 37.3 | CVPR'17 |
FPN | - | - | 36.2 | CVPR'17 |
YOLO v2 | 78.6(07 + 12) | 73.4(07 ++ 12) | - | CVPR'17 |
RON | 77.6(07 + 12) | 75.4(07 ++ 12) | 27.4 | CVPR'17 |
DeNet | 77.1(07 + 12) | 73.9(07 ++ 12) | 33.8 | ICCV'17 |
CoupleNet | 82.7(07 + 12) | 80.4(07 ++ 12) | 34.4 | ICCV'17 |
RetinaNet | - | - | 39.1 | ICCV'17 |
DSOD | 77.7(07 + 12) | 76.3(07 ++ 12) | - | ICCV'17 |
SMN | 70.0 | - | - | ICCV'17 |
轻头R-CNN | - | - | 41.5 | arXiv'17 |
YOLO v3 | - | - | 33.0 | arXiv'18 |
罪 | 76.0(07 + 12) | 73.1(07 ++ 12) | 23.2 | CVPR'18 |
STDN | 80.9(07 + 12) | - | - | CVPR'18 |
RefineDet | 83.8(07 + 12) | 83.5(07 ++ 12) | 41.8 | CVPR'18 |
SNIP | - | - | 45.7 | CVPR'18 |
关系网 | - | - | 32.5 | CVPR'18 |
级联R-CNN | - | - | 42.8 | CVPR'18 |
MLKP | 80.6(07 + 12) | 77.2(07 ++ 12) | 28.6 | CVPR'18 |
健身-NMS | - | - | 41.8 | CVPR'18 |
RFBNet | 82.2(07 + 12) | - | - | ECCV'18 |
CornerNet | - | - | 42.1 | ECCV'18 |
PFPNet | 84.1(07 + 12) | 83.7(07 ++ 12) | 39.4 | ECCV'18 |
佩利 | 70.9(07 + 12) | - | - | NIPS'18 |
HKRM | 78.8(07 + 12) | - | 37.8 | NIPS'18 |
M2Det | - | - | 44.2 | AAAI'19 |
R-DAD | 81.2(07 ++ 12) | 82.0(07 ++ 12) | 43.1 | AAAI'19 |
[R-CNN]丰富的特征层次结构,用于精确的对象检测和语义分割 [CVPR'14] |[pdf]
[official code - caffe]
[OverFeat] OverFeat:使用卷积网络进行集成识别,定位和检测| [ICLR'14] |[pdf]
[official code - torch]
[MultiBox]使用深度神经网络的可扩展对象检测| [CVPR'14] |[pdf]
[SPP-Net]用于视觉识别的深度卷积网络中的空间金字塔池 [ECCV'14] |[pdf]
[official code - caffe]
[unofficial code - keras]
[unofficial code - tensorflow]
利用贝叶斯优化和结构化预测改进深度卷积网络的目标检测 [CVPR'15] |[pdf]
[official code - matlab]
[MR-CNN]通过多区域和语义分段感知的CNN模型进行对象检测 [ICCV'15] |[pdf]
[official code - caffe]
[DeepBox] DeepBox:使用卷积网络学习对象| [ICCV'15] |[pdf]
[official code - caffe]
[AttentionNet] AttentionNet:汇总精确物体检测的弱方向| [ICCV'15] |[pdf]
[快速R-CNN]快速R-CNN | [ICCV'15] |[pdf]
[official code - caffe]
[DeepProposal] DeepProposal:通过级联深层卷积层来狩猎对象| [ICCV'15] |[pdf]
[official code - matconvnet]
[更快的R-CNN,RPN]更快的R-CNN:利用区域提案网络进行实时物体检测 [NIPS'15] |[pdf]
[official code - caffe]
[unofficial code - tensorflow]
[unofficial code - pytorch]
[YOLO v1]你只看一次:统一的实时物体检测| [CVPR'16] |[pdf]
[official code - c]
[G-CNN] G-CNN:基于迭代网格的物体探测器| [CVPR'16] |[pdf]
[AZNet]使用邻接和缩放预测的自适应对象检测| [CVPR'16] |[pdf]
[ION]内外网:用跳过池和回归神经网络检测上下文中的对象 [CVPR'16] |[pdf]
[HyperNet] HyperNet:迈向准确的区域建议生成和联合对象检测| [CVPR'16] |[pdf]
[OHEM]基于在线硬实例挖掘的基于训练区域的物体探测器| [CVPR'16] |[pdf]
[official code - caffe]
[CRAPF]来自图像的CRAFT对象| [CVPR'16] |[pdf]
[official code - caffe]
[MPN]用于对象检测的多路径网络| [BMVC'16] |[pdf]
[official code - torch]
[SSD] SSD:单次多盒检测器| [ECCV'16] |[pdf]
[official code - caffe]
[unofficial code - tensorflow]
[unofficial code - pytorch]
[GBDNet]制作用于物体检测的GBD-Net | [ECCV'16] |[pdf]
[official code - caffe]
[CPF]快速R-CNN的上下文启动和反馈| [ECCV'16] |[pdf]
[MS-CNN]一种用于快速目标检测的统一多尺度深度卷积神经网络 [ECCV'16] |[pdf]
[official code - caffe]
[R-FCN] R-FCN:基于区域的完全卷积网络的对象检测| [NIPS'16] |[pdf]
[official code - caffe]
[unofficial code - caffe]
[PVANET] PVANET:用于实时物体检测的深而轻量级的神经网络 [NIPSW'16] |[pdf]
[official code - caffe]
[DeepID-Net] DeepID-Net:用于对象检测的可变形深度卷积神经网络| [PAMI'16] |[pdf]
卷积特征映射上的[NoC]对象检测网络| [TPAMI'16] |[pdf]
[DSSD] DSSD:反卷积单次检测器| [arXiv'17] |[pdf]
[official code - caffe]
[TDM]超越跳过连接:用于对象检测的自顶向下调制| [CVPR'17] |[pdf]
[FPN]用于对象检测的特征金字塔网络| [CVPR'17] |[pdf]
[unofficial code - caffe]
[YOLO v2] YOLO9000:更好,更快,更强 [CVPR'17] |[pdf]
[official code - c]
[unofficial code - caffe]
[unofficial code - tensorflow]
[unofficial code - tensorflow]
[unofficial code - pytorch]
[RON] RON:与对象检测对象先验网络的反向连接| [CVPR'17] |[pdf]
[official code - caffe]
[unofficial code - tensorflow]
[RSA] CNN中对象检测的递归尺度近似 | [ICCV'17] |[pdf]
[official code - caffe]
[DCN]可变形卷积网络| [ICCV'17] |[pdf]
[official code - mxnet]
[unofficial code - tensorflow]
[unofficial code - pytorch]
[DeNet] DeNet:利用定向稀疏采样进行可扩展的实时目标检测| [ICCV'17] |[pdf]
[official code - theano]
[CoupleNet] CoupleNet:将全局结构与本地部件耦合用于对象检测| [ICCV'17] |[pdf]
[official code - caffe]
[RetinaNet]密集物体检测的焦点损失| [ICCV'17] |[pdf]
[official code - keras]
[unofficial code - pytorch]
[unofficial code - mxnet]
[unofficial code - tensorflow]
[Mask R-CNN] Mask R-CNN | [ICCV'17] |[pdf]
[official code - caffe2]
[unofficial code - tensorflow]
[unofficial code - tensorflow]
[unofficial code - pytorch]
[DSOD] DSOD:从Scratch学习深度监督的物体探测器 [ICCV'17] |[pdf]
[official code - caffe]
[unofficial code - pytorch]
[SMN]用于对象检测中的上下文推理的空间记忆| [ICCV'17] |[pdf]
[Light-Head R-CNN] Light-Head R-CNN:防御两级物体探测器| [arXiv'17] |[pdf]
[official code - tensorflow]
[Soft-NMS]用一行代码改进对象检测| [ICCV'17] |[pdf]
[official code - caffe]
[YOLO v3] YOLOv3:增量改进| [arXiv'18] |[pdf]
[official code - c]
[unofficial code - pytorch]
[unofficial code - pytorch]
[unofficial code - keras]
[unofficial code - tensorflow]
[ZIP]通过对象提案的递归训练缩小输入和输入网络| [IJCV'18] |[pdf]
[official code - caffe]
[SIN]结构推理网:使用场景级上下文和实例级关系进行对象检测| [CVPR'18] |[pdf]
[official code - tensorflow]
[STDN]规模可传输对象检测| [CVPR'18] |[pdf]
[RefineDet]用于物体检测的单次细化神经网络| [CVPR'18] |[pdf]
[official code - caffe]
[unofficial code - chainer]
[unofficial code - pytorch]
[MegDet] MegDet:大型小批量物体探测器| [CVPR'18] |[pdf]
[DA Faster R-CNN]用于野外物体检测的域自适应更快的R-CNN | [CVPR'18] |[pdf]
[official code - caffe]
[SNIP]对象检测中的尺度不变性分析 - SNIP | [CVPR'18] |[pdf]
[关系网]对象检测关系网络| [CVPR'18] |[pdf]
[official code - mxnet]
[Cascade R-CNN]级联R-CNN:深入研究高质量物体检测| [CVPR'18] |[pdf]
[official code - caffe]
用生成性对抗网络寻找野外的微小面孔| [CVPR'18] |[pdf]
[MLKP]用于对象检测的多尺度位置感知核表示| [CVPR'18] |[pdf]
[official code - caffe]
通过渐进域自适应进行跨域弱监督对象检测| [CVPR'18] |[pdf]
[official code - chainer]
[Fitness NMS]通过健身NMS和有界IoU损失改善对象本地化| [CVPR'18] |[pdf]
[STDnet] STDnet:用于小目标检测的ConvNet | [BMVC'18] |[pdf]
[RFBNet]用于准确和快速物体检测的接收场块网络 [ECCV'18] |[pdf]
[official code - pytorch]
Web知识转移的零注释对象检测| [ECCV'18] |[pdf]
[CornerNet] CornerNet:将对象检测为配对关键点| [ECCV'18] |[pdf]
[official code - pytorch]
[PFPNet]用于对象检测的并行特征金字塔网络| [ECCV'18] |[pdf]
[Softer-NMS] Softer-NMS:反思精确物体检测的边界框回归| [arXiv'18] |[pdf]
[ShapeShifter] ShapeShifter:对更快的R-CNN物体探测器进行强大的物理对抗攻击 [ECML-PKDD'18] |[pdf]
[official code - tensorflow]
[Pelee] Pelee:移动设备上的实时对象检测系统| [NIPS'18] |[pdf]
[official code - caffe]
[HKRM]用于大规模目标检测的混合知识路由模块| [NIPS'18] |[pdf]
[MetaAnchor] MetaAnchor:学习使用自定义锚点检测对象| [NIPS'18] |[pdf]
[SNIPER] SNIPER:高效的多规模培训| [NIPS'18] |[pdf]
[M2Det] M2Det:基于多级特征金字塔网络的单次目标检测器| [AAAI'19] |[pdf]
[official code - pytorch]
[R-DAD]基于区域分解和组装的目标检测 [AAAI'19] |[pdf]
[CAMOU] CAMOU:学习物理车辆伪装以对抗攻击野外探测器| [ICLR'19] |[pdf]
用于对象检测的特征Intertwiner | [ICLR'19] |[pdf]
[GIoU]联合上的广义交集:边界框回归的度量和损失| [CVPR'19] |[pdf]
使用自我训练自动将物体探测器调整到新的域 [CVPR'19] |[pdf]
[天秤座R-CNN]天秤座R-CNN:物体检测的平衡学习| [CVPR'19] |[pdf]
用于单次物体检测的特征选择性无锚模块| [CVPR'19] |[pdf]
[ExtremeNet]通过分组极端和中心点进行自下而上的物体检测| [CVPR'19] | [pdf]
|[official code - pytorch]
[C-MIL] C-MIL:用于弱监督对象检测的连续多实例学习| [CVPR'19] | [pdf]
|[official code - torch]
[ScratchDet] ScratchDet:从Scratch训练单次物体探测器 [CVPR'19] |[pdf]
精确物体检测的不确定边界框回归分析 [CVPR'19] | [pdf]
|[official code - caffe2]
活动驱动的弱监督对象检测| [CVPR'19] |[pdf]
用AP损失实现精确的单级物体检测| [CVPR'19] |[pdf]
自适应对象检测的强弱分布对齐| [CVPR'19] | [pdf]
|[official code - pytorch]
[NAS-FPN] NAS-FPN:学习用于对象检测的可扩展特征金字塔结构| [CVPR'19] |[pdf]
[自适应NMS]自适应NMS:改进人群中的行人检测| [CVPR'19] |[pdf]
指出:限制:超越人群中的人数 [CVPR'19] |[pdf]
定位没有边界框的对象| [CVPR'19] |[pdf]
从稀疏注释对象中进行大规模目标检测的采样技术 [CVPR'19] |[pdf]
通过域注意实现通用对象检测| [CVPR'19] |[pdf]
探索物体检测语境效用的界限| [CVPR'19] |[pdf]
我应该使用什么物品? - 任务驱动的对象检测| [CVPR'19] |[pdf]
基于相异系数的弱监督对象检测| [CVPR'19] |[pdf]
通过选择性跨域对齐调整对象检测器| [CVPR'19] |[pdf]
用于物体检测的全量化网络| [CVPR'19] |[pdf]
具有细粒度特征模仿的蒸馏物体探测器| [CVPR'19] |[pdf]
通过回收边界框注释的多任务自监督对象检测| [CVPR'19] |[pdf]
[推理-RCNN]推理-RCNN:将自适应全局推理统一为大规模目标检测 [CVPR'19] |[pdf]
具有自适应文本区域表示的任意形状场景文本检测| [CVPR'19] |[pdf]
辅助激活激活:改进物体探测器的学习技术| [CVPR'19] |[pdf]
用于大规模目标检测的空间感知图关系网络 [CVPR'19] |[pdf]
[MaxpoolNMS] MaxpoolNMS:摆脱两阶段物体探测器中的NMS瓶颈问题 [CVPR'19] |[pdf]
收获你播种的内容:为弱监督对象检测生成高精度对象建议 [CVPR'19] |[pdf]
具有位置感知可变形卷积和后向注意过滤的对象检测| [CVPR'19] |[pdf]
多样化和匹配:用于对象检测的域自适应表示学习范例| [CVPR'19] |[pdf]
[GFR]通过门控特征重用从头开始改善物体检测| [BMVC'19] | [pdf]
|[official code - pytorch]
[Cascade RetinaNet] Cascade RetinaNet:维持单级物体检测的一致性| [BMVC'19] |[pdf]
用于鲁棒物体检测的软采样| [BMVC'19] |[pdf]
用于无限制对象检测的多对等Faster-RCNN | [ICCV'19] |[pdf]
对抗鲁棒性对象检测| [ICCV'19] |[pdf]
[Cap2Det] Cap2Det:学习放大对象检测的弱字幕监控| [ICCV'19] |[pdf]
[Gaussian YOLOv3] Gaussian YOLOv3:一种使用定位不确定性进行自动驾驶的精确快速物体检测器 [ICCV'19] |[pdf]
常用对象检测数据集的统计。该表来自该调查报告。
挑战 | 对象类 | 图像数量 | 注释图像的数量 | |||
---|---|---|---|---|---|---|
培养 | 瓦尔 | 测试 | 培养 | 瓦尔 | ||
PASCAL VOC物体检测挑战 | ||||||
VOC07 | 20 | 2501 | 2,510 | 4,952 | 6,301(7,844) | 6,307(7,818) |
VOC08 | 20 | 2111 | 2221 | 4,133 | 5,082(6,337) | 5,281(6,347) |
VOC09 | 20 | 3473 | 3,581 | 6,650 | 8,505(9,760) | 8,713(9,779) |
VOC10 | 20 | 4998 | 5,105 | 9637 | 11,577(13,339) | 11,797(13,352) |
VOC11 | 20 | 5,717 | 5,823 | 10994 | 13,609(15,774) | 13,841(15,787) |
VOC12 | 20 | 5,717 | 5,823 | 10991 | 13,609(15,774) | 13,841(15,787) |
ILSVRC对象检测挑战 | ||||||
ILSVRC13 | 200 | 395909 | 20121 | 40152 | 345854 | 55502 |
ILSVRC14 | 200 | 456567 | 20121 | 40152 | 478807 | 55502 |
ILSVRC15 | 200 | 456567 | 20121 | 51294 | 478807 | 55502 |
ILSVRC16 | 200 | 456567 | 20121 | 60000 | 478807 | 55502 |
ILSVRC17 | 200 | 456567 | 20121 | 65,500 | 478807 | 55502 |
MS COCO对象检测挑战 | ||||||
MS COCO15 | 80 | 82783 | 40504 | 81434 | 604907 | 291875 |
MS COCO16 | 80 | 82783 | 40504 | 81434 | 604907 | 291875 |
MS COCO17 | 80 | 118287 | 5000 | 40670 | 860001 | 36781 |
MS COCO18 | 80 | 118287 | 5000 | 40670 | 860001 | 36781 |
打开图像对象检测挑战 | ||||||
OID18 | 500 | 1743042 | 41620 | 125436 | 12195144 | - |
与主要用于物体检测的数据集有关的论文如下。
[PASCAL VOC] PASCAL视觉对象类(VOC)挑战| [IJCV'10] |[pdf]
[PASCAL VOC] PASCAL视觉对象类挑战:回顾| [IJCV'15] | [pdf]
|[link]
[ImageNet] ImageNet:大规模分层图像数据库| [CVPR'09] |[pdf]
[ImageNet] ImageNet大规模视觉识别挑战| [IJCV'15] | [pdf]
|[link]
[COCO] Microsoft COCO:上下文中的常见对象| [ECCV'14] | [pdf]
|[link]
[打开图像]打开图像数据集V4:统一图像分类,对象检测和视觉关系检测| [arXiv'18] | [pdf]
|[link]
[DOTA] DOTA:航空影像中物体检测的大型数据集| [CVPR'18] | [pdf]
|[link]