01-目标检测笔记

01-目标检测笔记

一、目标检测基本概念

1.1 基本概念
  • 图像分类:判断输入的图像中是否包含感兴趣的物体

  • 目标检测:需要在识别出图片中目标类别的基础上,还要精确定位到目标的具体位置,并用外接矩形框标出
    01-目标检测笔记_第1张图片

1.2 目标检测的思路

如果知道了图中某个位置存在物体,再将对应的局部区域送入到分类网络中去进行判别。即,定位+分类

  1. 如何判定物体的位置?

    滑动窗口。通过逐像素遍历,得到大量候选框,将每个框送入到分类网络分类后都会有一个得分(代表当前框中有物体的置信度),得分最高的就代表识别最准确的框,其位置就是最终要检测的目标的位置

  2. 思路:先确定众多候选框,再对候选框进行分类和微调

1.3 目标框定义方式
  • 图像任务的训练数据包括图片和真实标签信息,通常叫做GT(ground truth)

  • 图像分类中,标签信息是类别。目标检测的标签信息除了类别label外,需同时包含目标的位置信息,也就是外接矩形框bounding box。如图有两种表示方式
    01-目标检测笔记_第2张图片

1.4 交并化(IoU)

衡量两个目标框的重叠程度,表示两个目标框交集占并集的比例

01-目标检测笔记_第3张图片
计算流程

1. 首先获取两个框的坐标,红框坐标: 左上(red_x1, red_y1), 右下(red_x2, red_y2),绿框坐标: 左上(green_x1, green_y1),右下(green_x2, green_y2)
2. 计算两个框左上点的坐标最大值:(max(red_x1, green_x1), max(red_y1, green_y1)), 和右下点坐标最小值:(min(red_x2, green_x2), min(red_y2, green_y2)) 
3. 利用2算出的信息计算黄框面积:yellow_area
4. 计算红绿框的面积:red_area 和 green_area
5. iou = yellow_area / (red_area + green_area - yellow_area)

二、目标检测数据集VOC

2.1先验知识

读取pytorch自带数据集时,相当于pytorc已经下载好了数据并制作了数据标签,然后通过使用Dataset和DataLoader两个类完成数据集的构建和读取。

  1. 数据集定义参数

你可能感兴趣的:(DataWhale组队学习,目标检测)