深度学习anchor、head、neck、backbone三个术语分别是指什么?

YOLOv5的anchor设定
0.anchor是从图片输入就开始调用的,一直带到最后的特征图上。
1.backbone:是主干网络,是提取特征的网络,这些网络经常使用的是resnet18,Darknet53等,通常不是我们自己设计的网络,因为这些网络已经证明了在分类等问题上的特征提取能力是很强的。在用这些网络作为backbone的时候,都是直接加载官方已经训练好的模型参数,后面接着我们自己的网络。让网络的这两个部分同时进行训练,因为加载的backbone模型已经具有提取特征的能力了,在我们的训练过程中,会对他进行微调,使得其更适合于我们自己的任务。

2.head:检测头,主要用于预测目标的种类和位置(bounding boxes),利用之前提取的特征,做出预测。

3.neck:是放在backbone和head之间的,是为了更好的利用backbone提取的特征

简而言之,基于深度学习的目标检测模型的结构是这样的:backbone->neck->head->输出。backbone主干网络提取特征,neck脖子提取一些更复杂的特征,然后head头部计算预测输出

参考文献:链接:https://www.jianshu.com/p/014e76d3b614

你可能感兴趣的:(深度学习,目标检测,计算机视觉,pytorch,人工智能)