目录
前言
一、下载数据集DOTA和源码,下载YOLOv5模型,切割图片并转化label为YOLO格式
2、DOTA数据集的label格式不能在YOLO模型 里直接使用,需要转化
3、需要做成coco数据集的文件结构,包括文件夹名称。
二、修改YOLO参数,跑
1、要运行生成图片路径的脚本:utf-8.py
2.修改coco.yaml和yolov5s.yaml
3、修改train.py里的参数
总结
这是我跑通的第一个真正意义上的网络模型,写个博客总结/纪念一下,模型用的yolov5s,数据集是遥感卫星图像DOTA数据集。总体步骤分为以下几步:
1、数据集下载,下载YOLOv5模型,切割图片,转化labels格式,按照要求的文件结构放在服务器里
2、修改YOLO参数,跑
ps:中间出了无数问题,有的是我个人脑残能力不够,有的是莫名其妙的问题。见下文
需要库的安装我不赘述了,在requirement.txt文件里
数据集链接在这里 DOTA
YOLO的源码是这个GitHub - ultralytics/yolov5: YOLOv5 in PyTorch > ONNX > CoreML > TFLite
数据集有三个版本,我用了最简单的一个。
下载好以后,麻烦的才来了,主要分为以下几点:
1、图片过大,无法直接训练,需要切割为640X640格式的图片;
切割图片,采用这个脚本 ImgSplit_multi_process.py
这个程序是用来切割图片,并且把分割后的图片也打好标签
改一下图片,标签路径,分割好的图片、标签路径,还有就是gap(重合区域),subsize(也就是图片大小),跑就完事了
用的的脚本是:YOLO_Transform.py,其中调用了另外一个脚本dota_utils.py
在dota_utils.py里,需要改一下标签名称,我感觉我这一部分还有问题,但是还没来得及查验
在YOLO_Transform.py里,改一下路径,前两个路径是切割好以后图片和标签的路径,最后一个是yolo格式的标签。
在这里回顾一下YOLO格式的标签和DOTA格式的标签
前者:第一个是类的名称,后四个数字分别是:
x,y是目标的中心坐标,width,height是目标的宽和高。这些坐标是通过归一化的,其中x,width是使用原图的width进行归一化;而y,height是使用原图的height进行归一化。
DOTA数据集的label格式如下:
前八个数字为框的坐标:x1,y1,x2,y2.......x4,y4;x1,y1为左上角坐标,采用顺时针旋转,第九个为classname,最后一个为识别难易程度,0简单1困难(不知道为什么分割完以后会出现2)
images
val
labels
DOTA
images
train
labels
ps:别改子文件夹的ID,可能会报错
老套路,改一下路径,val和train都要做一遍
coco.yaml和其他教程不同之处:其他人的没有path要修改,我就放了数据集的路径,不知道对错,但是能跑
改一下两个txt文件的路径,还有nc,以及classname(也就是worldname)
修改yolov5.yaml,改一下nc=15即可
第一行:初始权重文件的path
第二行:yolov5s.yaml的path
第三行:coco.yaml的path
类推
后边就是显卡,epoch,bs等等不赘述了
花了将近一个星期才搞定,唉,走了很多莫名其妙的弯路,现在对这个流程基本上搞明白了,继续努力吧!!!