记录使用yolov5进行旋转目标的检测

由于实习公司需要使用到旋转目标的检测,所以这几天学习了相关知识,并找了许多资料,饶了许多的弯路。下面记录下项目的整个实现过程。

我参考的是以下几位博主:

DOTAv2遥感图像旋转目标检测竞赛经验分享(Swin Transformer + Anchor free/based方案) - 知乎

小鸡炖技术的个人空间_哔哩哔哩_Bilibili

首先,先为该项目创建一个虚拟环境

VS2015

pytorch 1.6.0(其他版本也可以进行尝试)

torchvision 0.7.0(其他版本也可以进行尝试)

其中这个VS2015,17,19版本都可以,但是pytorch和torchvision必须是要求的版本 ,不然可能会出错 这里试了torch1.8.1和torchvision0.9.1是可以用的。建议安装pytorch和torchvision时采用离线安装包安装,比较稳定。地址,

https://download.pytorch.org/whl/torch_stable.html

接着打开Anaconda prompt创建项目的虚拟环境

conda create -n royolov5 python=3.8
conda activate yolov5

进入创建的虚拟环境之后cd进入下载好pytorch和torchvision的文件夹。然后执行

pip install torch-1.6.0+cu101-cp38-cp38-win_amd64.whl

pip install torchvision-0.7.0+cu101-cp38-cp38-win_amd64.whl

这里注意后缀名.whl不要忘了。

到这里,就将pytorch框架搭好了。

接着,下载我发的压缩包,解压后,同样cd进入YOLOv5_DOTA_OBB-master项目文件的主目录

执行 pip install -r requirements.txt 安装相关的包。

再,添加E:\PytorchPro\YOLOv5_DOTA_OBB-master\swigwin-4.0.2到path里面,这里要进行系统环境的刷新,可以选择重启,也可以进入cmd,输入set path=c 进行刷新

再,在Anaconda prompt中的royolov5环境下cd进入utils分别运行

swig -c++ -python polyiou.i

python setup.py build_ext --inplace

再,将E:\ProgramData\Anaconda3\envs\royolov5\Lib\site-packages\shapely\DLLs所有dll复制到E:\ProgramData\Anaconda3\envs\royolov5\Library\bin

到这一步,训练环境基本准备好了,下面开始准备旋转目标所需的数据集

首先要使用到rolabelimg旋转目标标注工具,具体怎么使用自行百度。下载地址

https://github.com/cgvict/roLabelImg

标注图像后得到的是xml格式,这里需要对数据格式进行转换,符合yolov5的txt格式

首先,运行roxml_to_data.py,转换到Dota的8点数据格式

再将图像数据依次放在以下文件夹

记录使用yolov5进行旋转目标的检测_第1张图片

其中images里存放原图像,labelTxt中存放上一步转化的8点格式txt文件(注意要和images中的图像文件对应) 

再,进入DOTA_devkit_YOLO-master,修改DOTA_devkit_YOLO-master\dota_utils.py中的classnames_v1_5,修改为你标注数据的种类

再,分别运行PaddingPIC.py和YOLO_Transform.py

其中,PaddingPIC.py的作用是将图片扩展到高宽相同,便于数据处理。YOLO_Transform.py的作用是将dota的数据格式转换为yolov5的数据格式。

转换后的txt文件会存放再yolo_labels文件夹中

再,将yolov5训练所需的原图像和上一步操作得到的txt文件分别放入DOTA_demo_view文件夹里的images和labels中

再修改data\DOTA_ROTATED.yaml中nc和names,或者自己写个yaml文件

可以再修改下网络模型的yaml文件,不会的话用官方的yaml文件就行

最后别忘了下载权重文件,这里要注意,因为这个项目是基于v5-3.1版本的,所以,下载的权重文件不能下载最新的pt文件,不然会报错。

最后,开始训练就可以了。

你可能感兴趣的:(计算机视觉,人工智能,目标检测)