信鸟

目标检测系列(preface) 数据集DataSets

目标检测系列(Preface) — 数据集

公开数据集（PASCAL VOC // COCO）介绍

一、PASCAL VOC格式数据集官网标注工具

1、数据集一般格式

VOC2007
- Annotations
  - 所有xml标签文件
- JPEGImages
  - 所有jpg图片文件
- ImageSets
  - Main
    - train.txt (所有训练集图片的文件名)
    - val.txt (所有验证集图片的文件名)
    - test.txt (所有测试集图片的文件名)
    - trainval.txt (训练+验证集文件名，一般训练用此集合)
    - …
VOC2012

2、xml标注文件一般格式及读取

<annotation>
	<folder>VOC2007folder>
	<filename>000001.jpgfilename>
	<source>
		<database>The VOC2007 Databasedatabase>
		<annotation>PASCAL VOC2007annotation>
		<image>flickrimage>
		<flickrid>341012865flickrid>
	source>
	<owner>
		<flickrid>Fried Camelsflickrid>
		<name>Jinky the Fruit Batname>
	owner>
	<size>
		<width>353width>
		<height>500height>
		<depth>3depth>
	size>
	<segmented>0segmented>
	<object>
		<name>dogname>
		<pose>Leftpose>
		<truncated>1truncated>
		<difficult>0difficult>
		<bndbox>
			<xmin>48xmin>
			<ymin>240ymin>
			<xmax>195xmax>
			<ymax>371ymax>
		bndbox>
	object>
	<object>
		<name>personname>
		<pose>Leftpose>
		<truncated>1truncated>
		<difficult>0difficult>
		<bndbox>
			<xmin>8xmin>
			<ymin>12ymin>
			<xmax>352xmax>
			<ymax>498ymax>
		bndbox>
	object>
annotation>

一个xml文档须有第一行声明及其文档元素的描述信息（xml详解）。以上标注文本中的第一行和最后一行组成一个标签对，是xml文档里唯一的根元素；xml元素可以进行嵌套，所有元素都必须要有结束标签，如，标签对之间的内容VOC2007 为此元素的内容；

在标注文件中主要需要获取和之间的内容。

import xml.etree.ElementTree as ET
anno = ET.parse(annotation_path).getroot()
boxes = []
classes = []
for obj in anno.iter("object"):  # 定位到 
    difficult = int(obj.find("difficult").text) == 1
    if not self.use_difficult and difficult:
        continue
        _box = obj.find("bndbox")  # 定位到此