此部分参考并整理了自动驾驶数据集BDD训练mobileNet-SSD,感谢博主的无私奉献!
首先,我们需要两个辅助脚本:parseJson.py
(用来解析json里面的对象检测部分的数据)和pascal_voc_io.py
(创建VOC格式的xml,并把json文件的数据填充到xml)。
parseJson.py
#!/usr/bin/env python
# -*- coding: utf8 -*-
#parse json,input json filename,output info needed by voc
import json
#这里是我需要的10个类别
categorys = ['car', 'bus', 'person', 'bike', 'truck', 'motor', 'train', 'rider', 'traffic sign', 'traffic light']
def parseJson(jsonFile):
'''
params:
jsonFile -- BDD00K数据集的一个json标签文件
return:
返回一个列表的列表,存储了一个json文件里面的方框坐标及其所属的类,
形如:[[325, 342, 376, 384, 'car'], [245, 333, 336, 389, 'car']]
'''
objs = []
obj = []
f = open(jsonFile)
info = json.load(f)
objects = info['frames'][0]['objects']
for i in objects:
if(i['category'] in categorys):
obj.append(int(i['box2d']['x1']))
obj.append(int(i['box2d']['y1']))
obj.append(int(i['box2d']['x2']))
obj.append(int(i['box2d']['y2']))
obj.append(i['category'])
objs.append(obj)
obj = []
#print("objs",objs)
return objs
#test
#result = parseJson("/media/xavier/SSD256/global_datasets/BDD00K/bdd100k/labels/100k/val/b1c9c847-3bda4659.json")
#print(len(result))
#print(result)
pascal_voc_io.py
#!/usr/bin/env python
# -*- coding: utf8 -*-
import sys
import os
from xml.etree import ElementTree
from xml.etree.ElementTree import Element, SubElement
from lxml import etree
from xml.dom.minidom import parseString
class PascalVocWriter:
def __init__(self, foldername, filename, imgSize, databaseSrc='Unknown', localImgPath=None):
'''
params:
foldername -- 要存储的xml文件的父目录
filename -- xml文件的文件名
imgSize -- 图片的尺寸
databaseSrc -- 数据库名,这里不需要,默认为Unknown
localImaPath -- xml文件里面的 标签的内容
'''
self.foldername = foldername
self.filename = filename
self.databaseSrc = databaseSrc
self.imgSize = imgSize
self.boxlist = []
self.localImgPath = localImgPath
def prettify(self, elem):
"""
params:
elem -- xml的根标签,以开始
return:
返回一个美观输出的xml(用到minidom),本质是一个str
"""
xml = ElementTree.tostring(elem)
dom = parseString(xml)
# print(dom.toprettyxml(' '))
prettifyResult = dom.toprettyxml(' ')
return prettifyResult
def genXML(self):
"""
return:
生成一个VOC格式的xml,返回一个xml的根标签,以开始
"""
# Check conditions
if self.filename is None or \
self.foldername is None or \
self.imgSize is None or \
len(self.boxlist) <= 0:
return None
top = Element('annotation') # 创建一个根标签
folder = SubElement(top, 'folder') # 在根标签下创建一个子标签
folder.text = self.foldername # 用self.foldername的数据填充子标签
filename = SubElement(top, 'filename') # 在根标签下创建一个子标签
filename.text = self.filename # 用self.filename的数据填充子标签
localImgPath = SubElement(top, 'path') # 在根标签下创建一个子标签
localImgPath.text = self.localImgPath # 用self.localImgPath的数据填充子标签
source = SubElement(top, 'source') # 在根标签下创建一个子标签
其次,我们创建一个脚本bdd2voc.py
将两个辅助脚本整合起来。
bdd2voc.py
# -*- coding: utf8 -*-
import os
import pascal_voc_io
import parseJson
def main(srcDir, dstDir):
i = 1
# os.walk()
# dirName是你所要遍历的目录的地址, 返回的是一个三元组(root,dirs,files)
# root所指的是当前正在遍历的这个文件夹的本身的地址
# dirs是一个 list ,内容是该文件夹中所有的目录的名字(不包括子目录)
# files 同样是 list , 内容是该文件夹中所有的文件(不包括子目录)
for dirpath, dirnames, filenames in os.walk(srcDir):
# print(dirpath, dirnames, filenames)
for filepath in filenames:
fileName = os.path.join(dirpath,filepath)
print(fileName)
print("processing: {}, {}".format(i, fileName))
i = i + 1
xmlFileName = filepath[:-5] # remove ".json" 5 character
# 解析该json文件,返回一个列表的列表,存储了一个json文件里面的所有方框坐标及其所属的类
objs = parseJson.parseJson(str(fileName))
# 如果存在检测对象,创建一个与该json文件具有相同名的VOC格式的xml文件
if len(objs):
tmp = pascal_voc_io.PascalVocWriter(dstDir, xmlFileName, (720,1280,3), fileName)
for obj in objs:
tmp.addBndBox(obj[0],obj[1],obj[2],obj[3],obj[4])
tmp.save()
else:
print(fileName)
if __name__ == '__main__':
# test
# these paths should be your own path
# srcDir = '/media/xavier/SSD256/global_datasets/BDD00K/bdd100k/labels/100k/val'
# dstDir = '/media/xavier/SSD256/global_datasets/BDD00K/bdd100k/Annotations/val'
srcDir = '/media/xavier/SSD256/global_datasets/BDD00K/bdd100k/labels/100k/train'
dstDir = '/media/xavier/SSD256/global_datasets/BDD00K/bdd100k/Annotations/train'
main(srcDir, dstDir)
将这三个脚本文件放在我的前一篇博客(一)使用YOLOv3训练BDD100K数据集之数据集下载
中提高的bdd100k文件夹的同一目录下,我这里是/media/xavier/SSD256/global_datasets/BDD00K
,里面存放的文件如下图:
我们这里只需要用到bdd100k文件夹
和三个脚本文件
。根据bdd2voc.py
,我们还需要在bdd100k文件夹内创建Annotations文件夹,在Annotations文件夹内创建train文件夹和val文件夹,用来存储转换后的xml文件
。
最后,打开终端,进入到/media/xavier/SSD256/global_datasets/BDD00K
目录下,运行脚本bdd2voc.py
cd /media/xavier/SSD256/global_datasets/BDD00K
python bdd2voc.py
最终在/media/xavier/SSD256/global_datasets/BDD00K/bdd100k/Annotations下生成了train和val的xml标签
,接下来我们还需要将xml转换为darknet中YOLOv3需要的txt格式。
此部分只需要模仿并稍微修改YOLOv3训练KITTI数据集中的第3部分即可。
首先,创建一个脚本xml_to_yolo_txt.py
,用于把刚刚生成的xml文件转换为darknet需要的txt格式的文件。
xml_to_yolo_txt.py
import glob
import xml.etree.ElementTree as ET
# 类名
class_names = ['car', 'bus', 'person', 'bike', 'truck', 'motor', 'train', 'rider', 'traffic sign', 'traffic light']
# 转换一个xml文件为txt
def single_xml_to_txt(xml_file):
tree = ET.parse(xml_file)
root = tree.getroot()
# 保存的txt文件路径
txt_file = xml_file.split('.')[0]+'.txt'
with open(txt_file, 'w') as txt_file:
for member in root.findall('object'):
#filename = root.find('filename').text
picture_width = int(root.find('size')[0].text)
picture_height = int(root.find('size')[1].text)
class_name = member[0].text
# 类名对应的index
class_num = class_names.index(class_name)
box_x_min = int(member[4][0].text) # 左上角横坐标
box_y_min = int(member[4][1].text) # 左上角纵坐标
box_x_max = int(member[4][2].text) # 右下角横坐标
box_y_max = int(member[4][3].text) # 右下角纵坐标
# 转成相对位置和宽高
x_center = (box_x_min + box_x_max) / (2 * picture_width)
y_center = (box_y_min + box_y_max) / (2 * picture_height)
width = (box_x_max - box_x_min) / (2 * picture_width)
height = (box_y_max - box_y_min) / (2 * picture_height)
print(class_num, x_center, y_center, width, height)
txt_file.write(str(class_num) + ' ' + str(x_center) + ' ' + str(y_center) + ' ' + str(width) + ' ' + str(height) + '\n')
# 转换文件夹下的所有xml文件为txt
def dir_xml_to_txt(path):
i=1
for xml_file in glob.glob(path + '*.xml'):
print("processing {}, {}".format(i, xml_file+'.xml'))
single_xml_to_txt(xml_file)
i += 1
def main(path):
dir_xml_to_txt(path)
if __name__ == '__main__':
# xml文件路径
path = '/media/xavier/SSD256/global_datasets/BDD00K/bdd100k/Annotations/train/'
#path = '/media/xavier/SSD256/global_datasets/BDD00K/bdd100k/Annotations/val/'
main(path)
运行该脚本python xml_to_yolo_txt.py
,会在原来xml所在目录生成相同名的txt文件
。为了使用darknet,我们在darknet安装目录下创建一个bdd100k_data文件夹,并在该文件夹内创建val_labels文件夹和train_labels文件夹,在终端中运行命令,将生成的txt文件剪切到darknet目录下的对应文件夹内
(当然也可以在脚本中直接修改txt保存的路径,这样就节省了这个步骤):
# 移动验证集标签
mv /media/xavier/SSD256/global_datasets/BDD00K/bdd100k/labels/100k/val/*txt /media/xavier/SSD256/darknet/bdd100k_data/val_labels/
# 移动训练集标签
mv /media/xavier/SSD256/global_datasets/BDD00K/bdd100k/labels/100k/train/*txt /media/xavier/SSD256/darknet/bdd100k_data/train_labels/
此部分只需要模仿并稍微修改YOLOv3训练KITTI数据集中的第4部分即可。
train.txt和val.txt包含了训练集和验证集的所有图片的路径
,这里我们需要先把BDD100K数据集的训练集和验证集图片的文件夹创建一个软链接,并把此软链接放在darknet/bdd100k_data/目录下
,运行命令:
# ln -s 源地址 目标地址
ln -s /media/xavier/SSD256/global_datasets/BDD00K/bdd100k/images/100k/train /media/xavier/SSD256/darknet/bdd100k_data/train_images
ln -s /media/xavier/SSD256/global_datasets/BDD00K/bdd100k/images/100k/val /media/xavier/SSD256/darknet/bdd100k_data/val_images
在darknet安装目录下创建一个bdd100k_train_val.py文件
,代码如下:
#此代码位于darknet根目录下
import glob
def generate_train_and_val(image_path, txt_file):
with open(txt_file, 'w') as tf:
i=1
for jpg_file in glob.glob(image_path + '*.jpg'):
print("processing {}".format(i))
tf.write(jpg_file + '\n')
i += 1
def main(path, dstpath):
generate_train_and_val(path, dstpath)
if __name__ == '__main__':
#srcpath = 'bbdd100k_data/val_images/'
#dstpath = 'bbdd100k_data/val.txt'
srcpath = 'bbdd100k_data/train_images/'
dstpath = 'bbdd100k_data/train.txt'
main(srcpath, dstpath)
打开终端,切换加粗样式到darknet目录下,运行脚本:
cd /media/xavier/SSD256/darknet
python bdd100k_train_val.py
运行结束后,会在/media/xavier/SSD256/darknet/bdd100k_data/
目录下生成tran.txt和val.txt。