目标检测中的BackBone,Neck,Head

目标检测中的BackBone,Neck,Head

本博客只记录本人学习对目标检测的理解,如有不正确,烦请各位大佬指正。

基于深度学习的目标检测算法有三个组件:Backbone,Neck及Head。
首先,对于backbone,看文献或博客经常会有backbone,看翻译会译作主干,其实就是主干网络,主要用于特征提取,并且基本在大型数据集(ImageNet,COCO,VOC等)上完成训练,拥有预训练参数的卷积神经网络,例如:ResNet50,Darknet53等等。

然后Head,翻译为头,检测头,主要用于预测目标的种类的位置(bounding boxes)

在backbone和head之间,会添加一些用于收集不同阶段特征的网络层,简单理解为提取的特殊特征,称为Neck。

简而言之,基于深度学习的目标检测模型结构是这样的:输入–主干–脖子–头--输出。主干提取特征,脖子提取更复杂的特征,然后头部计算预测输出。

你可能感兴趣的:(深度学习,目标检测,计算机视觉,人工智能)