YOLO(v1)用自己的数据集训练模型

说明:

(1)本文用到的darknet代码下载时间为2016-11-09

(2)由于之前博文做的数据集是参考VOC2007格式,并且YOLO可以将VOC2007和VOC2012数据集转换成YOLO所需要的格式,所以这里我们也是一样,将参考VOC2007做的数据集转换成YOLO所需的训练格式。做VOC2007数据集过程参考:http://blog.csdn.net/sinat_30071459/article/details/50723212

(3)本文主要参考YOLO官网:http://pjreddie.com/darknet/yolo/


1、配置Darknet

darknet v1代码下载地址:Darknet v1

主要参考darknet的官网,上面写得很详细,网址:Installing Darknet

在配置Darknet过程中,主要是在nvcc处出错,所以修改Makefile的NVCC为绝对路径,一般为:

NVCC=/usr/local/cuda-7.5/bin/nvcc
(按自己的系统路径修改,本人是Ubuntu14.04,CUDA为7.5).

其他需要注意的地方参考官网就行。

如果make没有出错,那么可以下载作者训练的模型测试一下:

(1)下载yolo.weights:

wget http://pjreddie.com/media/files/yolo.weights

(2)执行:

./darknet yolo test cfg/yolo.cfg yolo.weights data/dog.jpg


2.将VOC数据集转成YOLO格式

由于前面的文章有写到做VOC2007格式的数据集,所以,我们和作者一样,将VOC数据集转成YOLO训练所需格式,转换过程很简单,因为作者提供了转换的python代码:
darknet\scripts\voc_label.py

(1)将数据集拷贝到darknet\scripts下
(2)我们打开voc_label.py并修改该代码:
sets=[('2007', 'train'), ('2007', 'val'), ('2007', 'test')]
classes = ["head","top","bag","down","shoes"]

classes根据你的数据集类别改。还有需要注意的是,代码里写的文件夹是VOCdevkit,我们的可能是VOCdevkit2007,修改成VOCdevkit即可。
然后,终端进入darknet\scripts,执行:
python voc_label.py

此后可以看到,VOCdevkit\VOC2007里多了一个labels文件夹(如下),里面有每张图片的标注文件(文件内容形如0 0.488888888889 0.289256198347 0.977777777778 0.429752066116;其中前面的0表示head,1表示top,即前面你写的classes的顺序,以此类推。后面为包围框信息,作了转换)。


darknet\scripts下多了2007_train.txt、2007_val.txt和2007_test.txt三个文件(如下),这三个文件是数据集中图片的路径。由于yolo训练只需要一个txt文件,文件中包含所有你想要训练的图片的路径,因此,我们可以用2007_train.txt、2007_val.txt和2007_test.txt包含的图片均用来训练,因此执行:
cat 2007_* > train.txt
现在,我们已经将数据集中的训练集和验证集全都放在一个txt文件中,这些图片用来作为YOLO的训练图片。
YOLO(v1)用自己的数据集训练模型_第1张图片

3.修改代码

(1)修改darknet\src\yolo.c
char *voc_names[] = {"head","top","bag","down","shoes"}
改成你的数据集类别;

char *train_images = "/home/luj/darknet/scripts/train.txt";
char *backup_directory = "/home//luj/darknet/backup/";
train_images应该指向我们刚得到的train.txt;backup_directory指向的路径是训练过程中生成的weights文件保存的路径(可以在darknet下新建文件夹backup然后指向它)。这两个路径按自己系统修改即可。

draw_detections(im, l.side*l.side*l.n, thresh, boxes, probs, voc_names, alphabet, 5);
else if(0==strcmp(argv[2], "demo")) demo(cfg, weights, thresh, cam_index, filename, voc_names, 5, frame_skip, prefix);
类别数改为你的数据集类别数(例如我的有5类)。

(2)修改darknet\src\yolo_kernels.cu
draw_detections(det, l.side*l.side*l.n, demo_thresh, boxes, probs, voc_names, voc_labels, 5);
最后的参数改为你的数据集类别数(同上)。


(3)修改darknet\cfg\tiny-yolo.cfg
本文以训练tiny模型为例,因此修改的是tiny-yolo.cfg文件,其他模型修改类似。

output= 735  // 该值为side*side*(num*5+类别数)
activation=linear

[detection]
classes= 5 //数据集类别
coords=4
rescore=1
side=7 /
num=2
softmax=0
sqrt=1
jitter=.2
主要修改两个地方。也可以修改side和num,side表示网格数,可修改成9*9等;num也可修改;output=side*side*(num*5+classes)
其他的一些参数可以按自己需求修改,比如学习率、max_batches等。

4.下载预训练模型:

(在该模型参数的基础上微调)
下载地址: http://download.csdn.net/detail/sinat_30071459/9677797
该文件放在darknet下即可。

PS:经过以上的修改,记得重新make一下darknet!!!

5.训练

在dartnet下执行:
./darknet yolo train cfg/tiny-yolo.cfg darknet.conv.weights

一切正常的话,就开始训练了。

6.测试和结果

执行:
./darknet yolo test cfg/tiny-yolo.cfg backup/tiny-yolo_final.weights
然后输入一张测试图片。
结果:
YOLO(v1)用自己的数据集训练模型_第2张图片

你可能感兴趣的:(yolo,darknet,目标检测)