目标检测(1)—— 基础知识和常用数据集

一、什么是目标检测

一张图片,经过网络后得到输出,检测出感兴趣目标的一个位置,比如下图的车在什么地方,狗在什么地方;还要输出相应位置的目标是什么类别的。
目标检测:位置+类别

  • 矩形框:位置
  • 矩形框:类别

eg:人脸检测
把人脸作为目标,就把人脸框起来。


eg:文字检测
把文字当作目标,就把文字框起来。

目标检测(1)—— 基础知识和常用数据集_第1张图片

重点在于:要学会判断你要做的东西的目标是什么?

主流的目标检测,都是以矩形框的形式进行输出的。一般精度不高。
更高精度的:叫做语义分割。

语义分割:用不同的颜色区分开。矩形框会包含背景,所以精度没有那么高。语义分割的训练要求更高。

目标检测(1)—— 基础知识和常用数据集_第2张图片

  • 总结:目标检测能满足大多数场景,如果需要更高的精度,选择语义分割。

二、目标检测数据集

1、常见的数据集

VOC数据集

VOC2007、VOC2012
训练集-图片:人工对训练集进行标注,需要标注想要的目标在那个位置,对应的是哪个目标
测试集-图片:测试集也有一些标注。
具体如下:(这里省略验证集)
共四种类型的图片,竞赛给参赛者前三种图片,参赛者用自己的网络模型对训练集的图片和标注进行训练,然后用训练好的模型,在测试集的图片上跑一遍,得到测试集的标注。参赛者把测试集的标注提交给比赛方,比赛方把自己的标注和参赛者的标注进行比较后排名。

目标检测(1)—— 基础知识和常用数据集_第3张图片

为什么用VOC2007、VOC2012?
05-07一个阶段,08-12一个阶段。选择数据集比较大的。

数据集的下载

第一种下载方式:在VOC官网下载。
http://host.robots.ox.ac.uk/pascal/VOC/
第二种下载方式:PyTorch自带。

目标检测(1)—— 基础知识和常用数据集_第4张图片

数据集的标注

VOC2007:

目标检测(1)—— 基础知识和常用数据集_第5张图片

  • Annotations:包含了xml文件,描述了图片的各种信息,特别是目标的位置坐标。
  • ImageSets:主要关注Main文件夹,里面的文件包含了不同类别目标的训练/验证数据集图片名称
  • JPEGImages:原图片。
  • SegmentationClass/Object:用于语义分割,不关注。

Annotations:标注
xml是一种规定的格式。

目标检测(1)—— 基础知识和常用数据集_第6张图片
打开000032.xml,xml里面包括了图片的信息。

目标检测(1)—— 基础知识和常用数据集_第7张图片
目标检测(1)—— 基础知识和常用数据集_第8张图片
目标检测(1)—— 基础知识和常用数据集_第9张图片
bndbox是核心,打开网站:图片在线查看工具

https://www.gifgit.com/image/rectangle-tool

验证xml中矩形框:

目标检测(1)—— 基础知识和常用数据集_第10张图片

ImageSets:重点关注Main

目标检测(1)—— 基础知识和常用数据集_第11张图片

aeroplane_train:aeroplane代表是飞机这一类,train代表是训练集,剩下的同。

目标检测(1)—— 基础知识和常用数据集_第12张图片

000032.jpg是飞机,打开aeroplane_train.txt

目标检测(1)—— 基础知识和常用数据集_第13张图片

该图片在飞机这一类。只要图片中有飞机(不是有一个飞机),就是1,为正样本;-1代表图片中没有飞机。

目标检测(1)—— 基础知识和常用数据集_第14张图片

JPEGImages:原图。

目标检测(1)—— 基础知识和常用数据集_第15张图片
例如:000031.jpg

目标检测(1)—— 基础知识和常用数据集_第16张图片

针对目标检测,2012没有包含2007,从2008开头的;针对图像分割,就包含了2007。

COCO数据集

官网:https://cocodataset.org/#home

目标检测(1)—— 基础知识和常用数据集_第17张图片
常用COCO2017,下载2017的val和它的标注,看一下是怎么标注的。(所以就下个小的,和18G的目录一样)

目标检测(1)—— 基础知识和常用数据集_第18张图片
val2017:里面是图片。

目标检测(1)—— 基础知识和常用数据集_第19张图片
目标检测(1)—— 基础知识和常用数据集_第20张图片
打开任意的一个instance的json文件,发现很大,这里用一小部分举例子(只有两张图片)。

图片中没有群体的情况:


目标检测(1)—— 基础知识和常用数据集_第21张图片
目标检测(1)—— 基础知识和常用数据集_第22张图片

图片中有群体的情况:



segmentation中的counts表述方式为:

目标检测(1)—— 基础知识和常用数据集_第23张图片
目标检测(1)—— 基础知识和常用数据集_第24张图片

你可能感兴趣的:(目标检测,目标检测,深度学习,计算机视觉)