目标检测中bbox回归中class-agnostic和class-specific的区别

明显是网络预测的object 类别数目不同。

class-specific 方式,很多地方也称作class-aware的检测,是早期Faster RCNN等众多算法采用的方式。它利用每一个RoI特征回归出所有类别的bbox坐标,最后根据classification 结果索引到对应类别的box输出。这种方式对于ms coco有80类前景的数据集来说,并不算效率高的做法。对于class-aware的检测器,如果向其提供图像,它将返回一组边界框,每个边界框都与内部物体(例如狗,猫,汽车)的类别相关联。 这意味着,当检测器完成检测时,它便知道检测到了哪种类型的物体。

class-agnostic 方式只回归2类bounding box,即前景和背景,结合每个box在classification 网络中对应着所有类别的得分,以及检测阈值条件,就可以得到图片中所有类别的检测结果。当然,这种方式最终不同类别的检测结果,可能包含同一个前景框,但实际对精度的影响不算很大,最重要的是大幅减少了bbox回归参数量。对于class-agnostic的检测器,它可以在不知道它们属于哪个类的情况下检测一堆对象。 简而言之,它们仅检测“前景”物体。 前景是一个广义术语,但通常它是一个包含我们要在图像中找到的所有特定类别的集合,即,前景= {猫,狗,汽车,飞机等…}。 由于它不知道所检测到的对象的类别,因此我们将其称为与类别无关。

具体细节,自己参考目前一些开源算法源码会理解的更好。

你可能感兴趣的:(无人驾驶)