(三)目标检测中的几种框【anchor,bbox,先验框,网格单元,ROI,proposal,DenseBox】

文章目录

    • bbox(bounding box/边界框)
    • anchor(先验框)
      • 怎么确定候选框中是否包含目标?
      • 怎么筛选Anchor?
    • grid cell(网格单元)
    • ROI框(感兴趣区域)

bbox(bounding box/边界框)

  Bbox是BoundingBox(边界框)的缩写,指的是目标检测中用于表示物体位置和大小的有向矩形框。通常情况下爱,对于一张图像中的每个目标物体,在训练集中都会预先标注一个对应的Bbox,即表表示该物体在图像中的位置和大小。
  在模型预测时,通过对图像中多个位置或尺度的Bbox进行检测,可以识别出图像中包含的目标物体。
  在目标检测算法中,Bbox与Anchor框紧密相关,因为Anchor框通常作为预定义的候选框用于捕获可能包含目标的区域。而在Anchor框生成的候选框中,通过进一步筛选和调整,可以得到最终的目标BBox。
  因此,Bbox通常也被称为检测框,因为它是表示目标位置和大小的一种重要方式。

anchor(先验框)

  Anchor是由Bbox筛选得到的。
  Anchor和BBox在目标检测中的作用不同。
  Anchor通常是一组预定的候选框,用来在输入图像上确定可能包含目标物体的位置。具体地说,通常在图像上生成一系列大小和长宽比不同的Anchor框,然后与目标物体进行匹配和调整,最终得到包含目标的候选框。
 更具体的说,模型通过比较Anchor和真实目标框之间的IOU(交并比)来确定哪些Anchor框包含目标,以及如何调整Anchor框来更高的拟合目标。因此Anchor框可以被视为候选框,因为它们是用来找到可能包含目标的区域的。

怎么确定候选框中是否包含目标?

  一般首先通常根据训练集中目标物体的大小和形状等信息进行预先设置。可以通过聚类技术(K-means聚类)来确定Anchor框的数量和大小。(聚类过程:可以先将训练集中所有目标物体的边界框进行聚类,得到若干个聚类中心,并将这些聚类中心作为Anchor框;)然后,在训练过程中,模型会根据Anchor框预测目标物体的位置和置信度,从而实现检测功能。
  一般来说,在检测过程中,如果一个Anchor框的置信度得到比较高(通常超过一个设定的阈值),则认为该框内包含目标物体。

怎么筛选Anchor?

  由于同一个目标物体可能会被多个Anchor框检测到,因此需要进行非极大值抑制(NMS)处理,去除重复检测结果,从而得到最终的检测结果。

grid cell(网格单元)

  在目标检测算法中,Grid cell是指将输入图像分成若干个小网格的过程中得到的每个小网格。
  YOLO算法就是通过将输入图像分成多个网格来实现目标检测的。对于每个网格,模型需要预测出该网格内是否包含目标物体,以及目标物体的位置和类别等信息。为了方便预测,通常会将一个完整的图像划分为多个网格,并在每个网格中预测目标物体的位置。
  在YOLO算法中,每个网格可以看做是一个Grid Cell。对于每个Grid cell,模型需要预测出三个边界框(Bounding box)的位置和大小,以及目标物体的类别和置信度等信息。具体来说,每个边界框包含五个属性:x, y, w, h和置信度,其中x和y表示边界框中心点相对于所在的Grid cell左上角的偏移量,w和h表示边界框的宽和高,置信度表示该边界框内是否存在目标物体。
  因此,在YOLO算法中,将输入图像分成若干个小网格,并对每个网格进行检测,是实现目标检测的关键技术之一。
  将输入图像分成多个网格可以提高模型的运行效率,减少运算量,相比于对整张图像进行检测,仅在每个小网格内进行预测会更加高效。
  在整张图像中进行目标检测时,容易出现检测到一些无关区域,导致误检率较高。而将图像划分为多个小网格后,模型只需在有可能出现目标物体的网格中进行检测,可以有效提高检测精度。

ROI框(感兴趣区域)

  在目标检测算法中,ROI(Region of Interest,感兴趣区域)是指对图像中感兴趣的区域进行选取和裁剪所得到的区域。一般情况下,目标检测算法使用ROI框来定义可能包含目标物体的区域,从而在该区域内实现目标检测和分类。
  ROI框可以通过多种方式生成,比如基于区域建议网络(RPN)生成的候选框或手动绘制。一旦得到了ROI框,在目标检测算法中可以将其作为输入图像的一个子区域来进行处理,从而能够更加准确地检测和识别目标物体。
  通常情况下,ROI框不仅包含目标物体本身,还包含一定的上下文信息,以便于算法更好地进行目标检测和分类。在目标检测算法中,使用ROI框进行检测的过程被称为“区域提取”或“区域池化”,通常使用不同的池化方法将ROI框内的信息聚合成固定大小的特征向量(Feature Vector),并输入到后续的分类器或回归器中进行分类或者位置回归等任务。

你可能感兴趣的:(找工作,目标检测,聚类,人工智能)