Yolov3训练自己的数据

yolo3是现在比较常用的一个算法,为了满足工程需要,我们需要使用自己的数据集去训练,最近重温了一下yolo3,为了防止遗忘,现在将我的步骤做一个总结如下,也便他人参考,如有错误请指正。
1.安装显卡,cuda,cudnn,opencv等(在我的另一篇文章有介绍),如果是NVIDIA的tx2板子刷机后应该会自带这些
2.下载darknet
本次我要识别的是一个雀巢咖啡的马克杯

3准备数据集

3.1录制视频并切成图片
我是用摄像头录制了一段视频,并且将视频流每30帧保存成一张图片,依次命名image1 image2 …

3.2使用lableImg工具对图片进行标注
Yolov3训练自己的数据_第1张图片
用create\nRectBox对目标物体框选,并加一个标签,生成对应的xml文件,与原照片放在同一个目录下。
3.3 调用creat.py将xml中的信息转变成txt文件
打开creat.py后,更改class类别的数量和名称,要和之前标注的对应。
再往下走还会有两个地方叫在这之前还需要有两个idtxt的位置后面需要写成自己对应的图片名称的列表,分别是testImageId.txt和trainImageId.txt,读取文件夹下的jpg文件并保存到txt。
create.py里面的两个pathtxt是用来存放这些图片的路径的,不用自己写内容。
做好以上准备后,在终端执行python create.py就可以。

3.4修改name文件
在data文件夹下,修改或者创建一个.name文件,里面从上到下写自己所有标注的class名称
 Yolov3训练自己的数据_第2张图片
3.5修改data文件
在cfg文件夹下,data文件也可以自己创建,按自己的文件夹改好。
3.6修改cfg文件
我使用的是yolov3-tiny.cfg,所以将其中的如下修改:
1)batch和subdivisions,前者是每次喂入网络的数量,后者是每次分几批喂入。
2)width和height是送入网络的图片resize后的大小。
3)learning_rate等其他的就不多说了
4)max_batch是最大训练轮数
5)每个[yolo]块的上面最后一个块里的fliter要写成你的3*(class数+5),我的是2类所以我写21

4训练命令

在darknet文件夹下:
./darknet detector train xxx.data xxx.cfg(有预训练模型的话可给后面加上与训练weights文件)
就会进入训练界面,只需要静静等待。
Yolov3训练自己的数据_第3张图片
终端界面会出现这些,其中比较重要的有:
1)obj越接近1越好
2).5R反映了在当前subdivision内的图片检出的正样本与实际正样本的比值

测试

在backup文件夹中得到了训练的结果,就可以进行测试了。
指令./darknet detector demo xxx.data cfg/xxx.cfg backup/xxx.weightsYolov3训练自己的数据_第4张图片

参考文献:
感谢郑师哥!
[1]yolo训练自己的数据https://blog.csdn.net/langxing1992/article/details/72084315
[2]yolo官网  https://pjreddie.com/darknet/yolo/
[3]OpenCV+python3将视频分解成图片 https://blog.csdn.net/wwq114/article/details/90580525
[4]TX2上yolov3精度和速度优化方向 https://blog.csdn.net/weixin_33853794/article/details/93186637

你可能感兴趣的:(Yolov3训练自己的数据)