使用ptyhon3.7版本
yolov5最新版本需要pytorch1.6版本以上,使用以下代码进行环境的安装:
pip install torch==1.7.0+cu101 torchvision==0.8.1+cu101 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html
源码地址:https://github.com/ultralytics/yolov5
在anaconda中进入项目的路径
cd 目录
然后安装项目所依赖的库
pip install -r requirements.txt
由于YOLOv5对于标签只识别txt的文件,所以在使用labelimg进行标注时需要把生成的xml文件转换为txt文件。有的标注工具标签是json格式的,需要先把json转换成xml再转换成txt文件才可以
自己先创建一个VOCCDATA文件夹里,里面包含images、Annotations和ImageSets子文件夹,再在ImageSets里创建main文件夹,main文件夹里包含train.txt和test.txt文件(txt文件都是空的)。
先对数据集的划分
import os
import random
trainval_percent = 0.2 #可自行进行调节
train_percent = 1
xmlfilepath = 'VOCCData/Annotations' #自己的路径
txtsavepath = 'VOCCData/ImageSets/Main' #自己的路径
total_xml = os.listdir(xmlfilepath)
num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)
#ftrainval = open('VOCCData/ImageSets/Main/trainval.txt', 'w')
ftest = open('VOCCData/ImageSets/Main/test.txt', 'w') #自己的路径
ftrain = open('VOCCData/ImageSets/Main/train.txt', 'w') #自己的路径
#fval = open('VOCCData/ImageSets/Main/val.txt', 'w')
for i in list:
name = total_xml[i][:-4] + '\n'
if i in trainval:
#ftrainval.write(name)
if i in train:
ftest.write(name)
#else:
#fval.write(name)
else:
ftrain.write(name)
#ftrainval.close()
ftrain.close()
#fval.close()
ftest.close()
这样,train.txt和test.txt里就会有我们划分好的数据
接下来把xml文件转换为txt文件
import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join
sets = ['train', 'test']
classes = ['bird','cat'] #自己训练的类别,引号之间用逗号隔开
def convert(size, box):
dw = 1. / size[0]
dh = 1. / size[1]
x = (box[0] + box[1]) / 2.0
y = (box[2] + box[3]) / 2.0
w = box[1] - box[0]
h = box[3] - box[2]
x = x * dw
w = w * dw
y = y * dh
h = h * dh
return (x, y, w, h)
def convert_annotation(image_id):
in_file = open('VOCCData/Annotations/%s.xml' % (image_id)) #自己的路径
out_file = open('VOCCData/labels/%s.txt' % (image_id), 'w') #自己的路径
tree = ET.parse(in_file)
root = tree.getroot()
size = root.find('size')
w = int(size.find('width').text)
h = int(size.find('height').text)
for obj in root.iter('object'):
difficult = obj.find('difficult').text
cls = obj.find('name').text
if cls not in classes or int(difficult) == 1:
continue
cls_id = classes.index(cls)
xmlbox = obj.find('bndbox')
b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
float(xmlbox.find('ymax').text))
bb = convert((w, h), b)
out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')
wd = getcwd()
for image_set in sets:
if not os.path.exists('VOCCData/labels/'): #自己的路径
os.makedirs('VOCCData/labels/') #自己的路径
image_ids = open('VOCCData/ImageSets/Main/%s.txt' % (image_set)).read().strip().split() #自己的路径
list_file = open('VOCCData/%s.txt' % (image_set), 'w') #自己的路径
for image_id in image_ids:
list_file.write('VOCCData/images/%s.jpg\n' % (image_id)) #自己的路径
convert_annotation(image_id)
list_file.close()
在data文件夹下创建myvoc.yaml文件:
myvoc.yaml内容如下:
train: VOCCData/train.txt
val: VOCCData/val.txt
#number of classes
nc: 2
#class names
names: ["bird", "cat"]
网址为:
github.com/ultralytics/yolov5/releases
有多个与训练模型,找自己合适的
修改model文件夹中对应的与训练模型的yaml文件中的类别数
修改number of classes改为你自己的类别数
使用以下命令开始训练
python train.py --img 640 --batch 4 --epoch 300 --data ./data/myvoc.yaml --cfg ./models/yolov5m.yaml --weights weights/yolov5m.pt --workers 0