使用labelImg制作VOC数据集用于SSD训练

1.准备好自己用于训练的数据集
为了保持一致性避免后续麻烦,创建与VOC一致的文件夹,VOC2007,子文件夹Annotations、JPEGImages和ImageSets,(当然也可以自定义,源码再做适当的修改)
在这里插入图片描述
图片名字最好重命名为6位数字组成的格式,例如 000001.jpg
重命名Python代码为:

import os
import sys
sys.path.append('.')
path = ".\VOC2007\JPEGImages"
filelist = os.listdir(path) #该文件夹下所有的文件(包括文件夹)
count=1
for file in filelist:
    print(file)
for file in filelist:   #遍历所有文件
    Olddir=os.path.join(path,file)   #原来的文件路径
    if os.path.isdir(Olddir):   #如果是文件夹则跳过
        continue
    filename=os.path.splitext(file)[0]   #文件名
    filetype=os.path.splitext(file)[1]   #文件扩展名
    Newdir=os.path.join(path,str(count).zfill(6)+filetype)  #用字符串函数zfill 以0补全所需位数
    os.rename(Olddir,Newdir)#重命名
    count+=1

2.我使用的标注工具是labelImg
标注工具地址:https://github.com/tzutalin/labelImg
2.1标注工具的安装,参考 https://blog.csdn.net/baidu_36669549/article/details/79753303
我是使用的windows7 系统,之前安装的Anaconda2不支持labelImage,配置了好久都不行,只要卸载又安装的Anaconda3-4.2.0这个版本,对应的python版本是3.5.2的。
2.2一般来说安装好了Anaconda之后,lxml和qt就已经安装好了,可以运行conda list查看是否存在。
2.3未安装成功的可以使用pip命令进行安装:
pip install PyQt5
pip install pyqt5-tools
3.进入https://github.com/tzutalin/labelImg下载labelImg的压缩文件,然后解压,然后cd 到目标文件夹执行命令:
pyrcc5 -o resources.py resources.qrc
python labelImg.py
就开始标注了:使用labelImg制作VOC数据集用于SSD训练_第1张图片
open dir:打开需要标注的数据集文件夹 (/JPEGImages)
change save dir:修改标注文件的存放位置 (/Annotations)
next image:下一张标注文件
prev image:上一张标注文件
快捷键:d:下一张图片
crtl+s:保存
w:打开标注工具画笔

你可能感兴趣的:(数据集处理)