voc2007数据集_windows中使用目标检测边界框标记工具LabelImg,人工手动制作VOC格式图片数据集...

LabelImg可以制作PascalVOC、YOLO格式的图片数据集。

记录本人使用目标检测边界框标记工具LabelImg的过程。

参考 https://my.oschina.net/u/876354/blog/1927351?tdsourcetag=s_pcqq_aiomsg

VOC数据集的目录格式如下图所示

voc2007数据集_windows中使用目标检测边界框标记工具LabelImg,人工手动制作VOC格式图片数据集..._第1张图片

其中目录JPEGImages是原始的图片。

目录Annotations是标注后的xml文件,每个图片对应一个xml文件。

ImageSets是划分后的训练集、测试集、验证集。

本文介绍如何用LabelImg来制作生成Annotations、ImageSets中的文件,

并转换tfrecord文件格式。

一、按照VOC数据集的要求,创建以下文件夹

Annotations:用于存放标注后的xml文件

ImageSets/Main:用于存放训练集、测试集、验收集的文件列表

JPEGImages:用于存放原始图像

二、打开LabelImg

1 下载LabelImg源码 。

https://github.com/tzutalin/labelImg

2 在Anaconda中新建一个虚拟环境,我的是env_LabelImg_20200112

conda create -n env_LabelImg_20200112  python=3.6
conda activate env_LabelImg_20200112
pip install PyQt5  lxml -i https://pypi.tuna.tsinghua.edu.cn/simple

# i 后面的参数表示设置国内源

3 进入源码文件并执行 pyrcc5 -o libs/resources.py resources.qrc

cd labelImg-master
pyrcc5 -o libs/resources.py resources.qrc

4 在Anaconda中安装 labelimg

 pip install labelimg -i https://pypi.tuna.tsinghua.edu.cn/simple

安装完成后,在虚拟环境中的命令行输入labelimg即可进入图形界面

labelimg

8e3b4d91ec4b0ab2e63dcb22d4cf692c.png

第二种进入编辑界面方法,是直接运行源码

cd labelImg-master
python labelImg.py

voc2007数据集_windows中使用目标检测边界框标记工具LabelImg,人工手动制作VOC格式图片数据集..._第2张图片

三、标注方法

然后可以打开不同进行标记,选择PascalVOC格式

voc2007数据集_windows中使用目标检测边界框标记工具LabelImg,人工手动制作VOC格式图片数据集..._第3张图片

在图片中鼠标右键,同一个图片可以有多个目标。

voc2007数据集_windows中使用目标检测边界框标记工具LabelImg,人工手动制作VOC格式图片数据集..._第4张图片

标记后的结果在 目录Annotations中,其内容如下图所示

voc2007数据集_windows中使用目标检测边界框标记工具LabelImg,人工手动制作VOC格式图片数据集..._第5张图片

其中每一个xml文件对应一个图片,如果同一个图片中标注了多个目标,则会在xml文件中对应有多个object节点,如下图所示

voc2007数据集_windows中使用目标检测边界框标记工具LabelImg,人工手动制作VOC格式图片数据集..._第6张图片

四、划分成训练集、测试集、验证集

标记完成后,再划分成训练集、测试集、验证集。

下载make_main_txt.py代码 https://github.com/EddyGao/make_VOC2007/blob/master/make_main_txt.py

执行python脚本文件make_main_txt.py。
命令 :python make_main_txt.py

划分成训练集、测试集、验证集在目录ImageSetsMain中,其内容如下图所示

voc2007数据集_windows中使用目标检测边界框标记工具LabelImg,人工手动制作VOC格式图片数据集..._第7张图片

全部目录如下图所示:JPEGImages是原始图片,

08dbecd6a61a5050c3c7e1d109e188e0.png

五、转换tfrecord文件格式

如果需要转换为tfrecord文件格式,需要SSD-Tensorflow-master/tf_convert_data.py ,下载网址 hengmuling/SSD-Tensorflow-master

python SSD-Tensorflow-master/tf_convert_data.py --dataset_name=pascalvoc --dataset_dir=SourceJPGImages --output_name=voc_2007_train --output_dir=piaofuwu_tfrecord

参考:

VOC官网 : http://host.robots.ox.ac.uk/pascal/VOC/

教程:用TensorFlow自制Taylor Swift识别器 https://zhuanlan.zhihu.com/p/33074882

你可能感兴趣的:(voc2007数据集,voc数据集,web返回的数据集格式,xml文件格式验证工具)