将自己数据集转化成voc数据集格式并用mmdetection训练

一、准备自己的数据

拿nwpu数据集来举例,nwpu数据集文件夹中的内容是:



images文件夹:存放数据图片
labelTxt文件夹:存放标注信息,images文件夹中每张图片都对应一个txt文件存放在此文件夹中,图片与标注文件的名称相同
test.txt和train.txt:记录训练集和测试集中的图片名称

二、转换成voc格式数据集

转换过程提供了两个脚本以简化操作,将create_dir.pycreat_annotations.py拷贝至希望存放voc数据集的目录(VOCdevkit)下,之后:

1、创建目录

在根目录(.../VOCdevkit)下输入命令行命令python create_dir.py
会创建出以下样式的目录结构:

└── VOCdevkit     #根目录
    └── VOC2007   
        ├── Annotations        #存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等
        ├── ImageSets          
        │   ├── Action
        │   ├── Layout
        │   ├── Main
        │   └── Segmentation
        ├── JPEGImages         #存放源图片
        ├── SegmentationClass  #存放的是图片,语义分割相关
        └── SegmentationObject #存放的是图片,实例分割相关

2、拷贝图片

将图片全部拷贝至JPEGImages中
或者,创建软连接到JPEGImages
总之,使得点击JPEGImages文件夹后的内容就是数据集的图片

3、生成Annotations文件夹中xml文件

在根目录(.../VOCdevkit)下输入命令行命令$ python create_annotations.py
PS:需要先修改下文件内容的四处(已在代码行后标注)

import os, sys
import glob
from PIL import Image

label_lists = []
img_lists = []
src_label_dir = '/mnt/B/nwpu/labelTxt/'                           ###指向自己数据集的labelTxt文件夹
src_img_dir = '/mnt/B/nwpu/images/'                              ###指向自己数据集的images文件夹
out_xml_dir = '/mnt/D/yuangan/datasets/nwpu/VOC2007/Annotations/'  ###指向voc数据集的Annotations文件夹



    # write in xml file
    # os.mknod(src_xml_dir + '/' + img + '.xml')
    xml_file = open((out_xml_dir + '/' + name + '.xml'), 'w')
    xml_file.write('\n')
    xml_file.write('    VOC2007\n')
    xml_file.write('    ' + str(name) + '.png' + '\n')    ###若准备的图片为jpg格式则将png替换为jpg
    xml_file.write('    \n')
    xml_file.write('        ' + str(width) + '\n')
    xml_file.write('        ' + str(height) + '\n')
    xml_file.write('        3\n')
    xml_file.write('    \n')
    xml_file.close()

for label_item in label_lists:

4、确定voc数据集的训练集与测试集

将自己数据集中的test.txt和train.txt拷贝到/ImageSets/Main下,并将test.txt改名成testval.txt
至此,数据集格式转化完成

二、用mmdetection训练faster_rcnn和ssd网络

以下操作均在进入mmdetection项目目录(.../mmdetection)里完成

1、修改配置文件

1.1、配置检测类别

打开mmdet/datasets/voc.py



将红框内容修改成数据集中的类别

1.2、配置图片格式

打开mmdet/datasets/xml_style.py



红框内容按照图片是jpg格式还是png格式修改

2、训练方法

训练很简单,利用官方给出的命令:
python tools/train.py ${CONFIG_FILE}
{CONFIG_FILE}文件存放在configs/pascal_voc中

比如用faster_rcnn网络训练:
python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py
用ssd训练:
python tools/train.py configs/pascal_voc/ssd512_voc.py

3、更改训练好的模型的存放目录

训练好的网络存放地址默认在mmdetection/work_dir,若要指定存放目录则在命令后加入--work_dir ${YOUR_WORK_DIR}
如:
python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py --work_dir /home/jokery/project/mmdetection/work_dirs/dota_faster_rcnn/

你可能感兴趣的:(将自己数据集转化成voc数据集格式并用mmdetection训练)