COCO_01 数据集介绍 COCO目标检测分割数据集格式

文章目录

  • 1 COCO数据集介绍
  • 2 COCO数据集目标检测和分割格式
    • 2.1 images
    • 2.2 categories
    • 2.3 annotations
  • 参考

1 COCO数据集介绍

COCO数据集是常用的目标检测和分割数据集,可以用于分类、目标检测、分割以及人体关键点检测等任务,这里我们重点关注目标检测与分割

其中

  • 目标类别object categories 80个(不包括背景)
  • 物体类别stuff categories91(包括背景,背景也被分为不同的物体类)
  • 情景描述captions per image每张图片5段情景描述
  • 人体关键点people with keypoints25w个人进行关键点标注

**NOTE: **
stuff categoryobject category的区别:stuff类别中包含没有明确边界的对象,即包括不同背景;也可以说object category 80stuff category 91的子类

COCO数据集格式官网:https://cocodataset.org/#format-data
Arxiv论文:https://arxiv.org/pdf/1405.0312.pdf

2 COCO数据集目标检测和分割格式

annotation.json文件内容有:info, licenses, images, annotations, categories

制作自己的COCO格式主要内容有:images, annotations, categories

具体细节

2.1 images

images中是一个图片信息列表,列表中每一个元素为数据集中一个图片的基本信息,包括:图片文件的名称图片的高与宽图片ID, 对应的json格式为:

"images": [
	{
		"file_name": 'P1_1_IMG002_frame021.png'"height": 100,
		"width": 100,
		"id": 1021        // 1021第一个1表示术后
		
	}, ...
]

2.2 categories

categories为类别信息的列表,主要有类别ID类别名称,其对应的json格式为:


"categories": [
	{
		"di": 2,
		"name": "stent"
	}, ...
]

2.3 annotations

annotations为标注文件的列表,列表中的元素为一个对象的标注注意:一张图片可能有多张标注,因此这里并不是一张图片的标注,一个对象的标注信息包括目标框bbox、目标分割segmentation、目标的面积area、目标类别ID category_id、所属图片的ID image_id以及标注ID,是否为拥挤目标 iscrowd(根据情况设定),其json的格式为:

"Annotations"[
	{
		"segmentation": [[1.0, 2.0, ...],...],   // polygon多边形  
		"area": 100.1,       // 目标面积  
		"iscrowd": 0,            
		"image_id": 1021,      
		"bbox": [10, 20, 5, 6],      //[x, y, w, h] 左上角xy坐标+宽和高   
		"category_id": 1    // 1是内腔, 2是支架       
		"id":  1,    // 标注的ID,可以是标注顺序生成    

	}, ...
]

NOTE:

  • 分割的格式是一个点的二维数组,一般情况是只有一个数组元素,因为一般目标被标记为一个完整的连通区域;如果有多个,则表示一个目标是分开的;数组中的元素是点坐标,其格式为:[x1, y1, x2, y2, ...]
  • 目标框的格式为x, y. width, height,x, y为图片的左上角坐标
  • 标注通过image_id与原图进行关联,通过category_id与类别进行关联,id为获取一个图片标注提供依据

参考

COCO数据集介绍:https://blog.csdn.net/qq_37541097/article/details/113247318

你可能感兴趣的:(DeepLearning,目标检测,计算机视觉,深度学习)