目标检测算法:FasterRCNN

目标检测任务是计算机视觉领域最基础的任务之一,目前深度学习方法已经在该领域全面领先于其他技术方案。目标检测任务需要对图像中的物体进行检测,输出有两个,框的位置,以及框的类别,这里目标的个数和类别数都可能有多个,这里的框是平行于图像宽和高的矩形框。从某种意义上讲,基于深度学习的目标检测框架也可以认为是以回归与分类为目标的多任务学习框架。

FasterRCNN是首个将图像的目标检测任务使用端到端的深度学习模型实现的框架。继承了RCNN和FastRCNN的技术路线,这一套算法是一脉相承的。FasterRCNN在FastRCNN的基础上,打通了全部使用神经网络的最后一步,即提出了RPN网络批量高效的生成区域建议框,这也是这篇文章最重要的创新点。这里介绍FasterRCNN这篇开山之作,笔者认为,只要读透这一个框架,就足够掌握两阶段目标检测任务的基本脉络。

FasterRCNN使用两阶段方式实现,这里所说的阶段,指的是一次边框估计的过程,每个阶段输出的内容都有两个,边框及其对应类别,分别是回归和分类任务。但是,这两个阶段是存在差异的,第一阶段使用RPN网络对暴力穷举出来的规则的框(作者用Anchor这个单词来表达这些框,下面也用这个单词进行介绍)进行初步分类筛选,因此这是一个针对每个框的二分类任务,标记每个框中有无物体,对于被认为存在物体的边框,会给出这些Anchor与真值之间的偏差量;第一阶段获得了一些可能存在物体的框,第二阶段的任务就是将这些框进行分类预测,并且输出与第一阶段格式相同的偏差量,对第一阶段得到结果做进一步的修正。




参考资料:
目标检测算法FasterRCNN简介与pytorch实现:

你可能感兴趣的:(计算机视觉/CV,目标检测,算法,计算机视觉)