建立自己的voc数据集_将自己数据集转化成voc数据集格式并用mmdetection训练

一、准备自己的数据

拿nwpu数据集来举例,nwpu数据集文件夹中的内容是:

images文件夹:存放数据图片

labelTxt文件夹:存放标注信息,images文件夹中每张图片都对应一个txt文件存放在此文件夹中,图片与标注文件的名称相同

test.txt和train.txt:记录训练集和测试集中的图片名称

二、转换成voc格式数据集

转换过程提供了两个脚本以简化操作,将create_dir.py与creat_annotations.py拷贝至希望存放voc数据集的目录(VOCdevkit)下,之后:

1、创建目录

在根目录(.../VOCdevkit)下输入命令行命令python create_dir.py

会创建出以下样式的目录结构:

└── VOCdevkit #根目录

└── VOC2007

├── Annotations #存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等

├── ImageSets

│ ├── Action

│ ├── Layout

│ ├── Main

│ └── Segmentation

├── JPEGImages #存放源图片

├── SegmentationClass #存放的是图片,语义分割相关

└── SegmentationObject #存放的是图片,实例分割相关

2、拷贝图片

将图片全部拷贝至JPEGImages中

或者,创建软连接到JPEGImages

总之,使得点击JPEGImages文件夹后的内容就是数据集的图片

3、生成Annotations文件夹中xml文件

在根目录(.../VOCdevkit)下输入命令行命令$ python create_annotations.py

PS:需要先修改下文件内容的四处(已在代码行后标注)

import os, sys

import glob

from PIL import Image

label_lists = []

img_lists = []

src_label_dir = '/mnt/B/nwpu/labelTxt/' ###指向自己数据集的labelTxt文件夹

src_img_dir = '/mnt/B/nwpu/images/' ###指向自己数据集的images文件夹

out_xml_dir = '/mnt/D/yuangan/datasets/nwpu/VOC2007/Annotations/' ###指向voc数据集的Annotations文件夹

# write in xml file

# os.mknod(src_xml_dir + '/' + img + '.xml')

xml_file = open((out_xml_dir + '/' + name + '.xml'), 'w')

xml_file.write('\n')

xml_file.write(' VOC2007\n')

xml_file.write(' ' + str(name) + '.png' + '\n') ###若准备的图片为jpg格式则将png替换为jpg

xml_file.write(' \n')

xml_file.write(' ' + str(width) + '\n')

xml_file.write(' ' + str(height) + '\n')

xml_file.write(' 3\n')

xml_file.write(' \n')

xml_file.close()

for label_item in label_lists:

4、确定voc数据集的训练集与测试集

将自己数据集中的test.txt和train.txt拷贝到/ImageSets/Main下,并将test.txt改名成testval.txt

至此,数据集格式转化完成

二、用mmdetection训练faster_rcnn和ssd网络

以下操作均在进入mmdetection项目目录(.../mmdetection)里完成

1、修改配置文件

1.1、配置检测类别

打开mmdet/datasets/voc.py

将红框内容修改成数据集中的类别

1.2、配置图片格式

打开mmdet/datasets/xml_style.py

红框内容按照图片是jpg格式还是png格式修改

2、训练方法

训练很简单,利用官方给出的命令:

python tools/train.py ${CONFIG_FILE}

{CONFIG_FILE}文件存放在configs/pascal_voc中

比如用faster_rcnn网络训练:

python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py

用ssd训练:

python tools/train.py configs/pascal_voc/ssd512_voc.py

3、更改训练好的模型的存放目录

训练好的网络存放地址默认在mmdetection/work_dir,若要指定存放目录则在命令后加入--work_dir ${YOUR_WORK_DIR}

如:

python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py --work_dir /home/jokery/project/mmdetection/work_dirs/dota_faster_rcnn/

你可能感兴趣的:(建立自己的voc数据集)