最近有旋转目标检测的需求了,在寻找旋转目标检测算法的过程中,发现已经有人提前测评了各类旋转目标检测框架了,结果是mmrorate效果最好。本次记录一下mmrorate的实验过程。
将持续更新实验记录!
主要参考:
1.测评参考:
https://blog.csdn.net/FL1623863129/article/details/123408354?utm_medium=distribute.pc_relevant.none-task-blog-2defaultbaidujs_title~default-4-123408354-blog-124335060.pc_relevant_multi_platform_whitelistv1&spm=1001.2101.3001.4242.3&utm_relevant_index=7
2.实现过程参考
https://blog.csdn.net/Sylvia_Lan/article/details/124008837
https://github.com/open-mmlab/mmrotate
https://sxj731533730.blog.csdn.net/article/details/124107625?spm=1001.2101.3001.6650.4&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-4-124107625-blog-124008837.pc_relevant_default&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-4-124107625-blog-124008837.pc_relevant_default&utm_relevant_index=6
https://blog.csdn.net/qq_43581224/article/details/123838415
1.目前电脑已有环境
(1)Ubuntu20.04
(2)Cuda==11.2+cudnn
2.下载代码建立虚拟环境
(1)下载代码
https://github.com/open-mmlab/mmrotate
(2)建立虚拟环境
用pycharm打开该代码文件夹,并添加虚拟环境
(3)安装pytorch
进入pytorch官网,找到适合自己的版本,进行下载安装。
注:如果有小伙伴和我一样安装的是Cuda11.2,在pytorch官网上,无法找到对应版本时,可是试着安装cuda11.3对应的pytorch==1.11.0版本。
(4)安装mmrorate
pip install openmim
mim install mmrotate
1.下载权重
权重模型集合
https://download.openmmlab.com/mmrotate/v0.1.0/kfiou/r3det_kfiou_ln_r50_fpn_1x_dota_oc/r3det_kfiou_ln_r50_fpn_1x_dota_oc-8e7f049d.pth
下载后,在mmrorate文件夹下,新建model文件夹,并放入model文件夹中。
2.运行demo
运行指令格式:
python demo/image_demo.py \
${IMG_ROOT} \
${CONFIG_FILE} \
${CHECKPOINT_FILE}
IMG_ROOT:为待检测图像
CONFIG_FILE:为配置文件
CHECKPOINT_FILE:为训练好的权重。
pycharm终端cd道demo文件夹,输入
python3 image_demo.py demo.jpg ../configs/kfiou/r3det_kfiou_ln_r50_fpn_1x_dota_oc.py ../model/r3det_kfiou_ln_r50_fpn_1x_dota_oc-8e7f049d.pth
至此,可以确定整体环境没问题了。
3.调试demo
不怎么喜欢用命令执行代码,因此修改image_demo.py文件。
注意:img、config和checkpoint前面需要加上"–",否则无法正常加载参数。
1.安装rolabelimg标注工具
参考:
https://blog.csdn.net/qq_41672428/article/details/107690102
在win下进行安装会比较容易。
遇到的问题
1.pyrcc5 -o resources.py resources.qrc ‘pyrcc5’ 不是内部或外部命令,也不是可运行的程序或批处理文件。
解决方法:
cmd中输入:
python
import sys
print(sys.path)
找到python安装路径,进入该目录下,寻找pyrcc5.exe文件,或者直接文件夹上面寻找pyrcc5.exe文件,找到后,复制到labelImg文件夹中。
2.格式转换
参考:
https://blog.csdn.net/qq_43581224/article/details/123838415
1.配置train.py
主要配置–config和–work-dir两个。其中–config为训练配置文件,–work-dir为模型和日志保存文件夹。
2.修改配置文件
这里我选用的是r3det_r50_fpn_1x_dota_oc.py,实际应用中,根据你选择的去修改。
1)r3det_r50_fpn_1x_dota_oc.py
这里修改为你自己的类别数量,我的是1,num_classes=1。
2)mmrotate/mmrotate/datasets/dota.py
修改类别名字,注意后面的逗号需要保留。
3)mmrotate/configs/base/datasets/dotav1.py
第一步修改:data_root = 'data/split_1024_dota1_0/'为自己的文件夹。该文件夹需要包括train、trainval、test三个文件夹,三个文件夹内部再新建annfiles和images文件夹,并放入之前生成的数据。
# dataset settings
dataset_type = 'DOTADataset'
data_root = '/home/cj/work/code/python/mmrotate/mydata/'
img_norm_cfg = dict(
mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
train_pipeline = [
dict(type='LoadImageFromFile'),
dict(type='LoadAnnotations', with_bbox=True),
dict(type='RResize', img_scale=(1024, 1024)),
dict(type='RRandomFlip', flip_ratio=0.5),
dict(type='Normalize', **img_norm_cfg),
dict(type='Pad', size_divisor=32),
dict(type='DefaultFormatBundle'),
dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels'])
]
test_pipeline = [
dict(type='LoadImageFromFile'),
dict(
type='MultiScaleFlipAug',
img_scale=(1024, 1024),
flip=False,
transforms=[
dict(type='RResize'),
dict(type='Normalize', **img_norm_cfg),
dict(type='Pad', size_divisor=32),
dict(type='DefaultFormatBundle'),
dict(type='Collect', keys=['img'])
])
]
data = dict(
samples_per_gpu=2,
workers_per_gpu=2,
train=dict(
type=dataset_type,
ann_file=data_root + 'train/annfiles/',
img_prefix=data_root + 'train/images/',
pipeline=train_pipeline),
val=dict(
type=dataset_type,
ann_file=data_root + 'trainval/annfiles/',
img_prefix=data_root + 'trainval/images/',
pipeline=test_pipeline),
test=dict(
type=dataset_type,
ann_file=data_root + 'test/annfiles/',
img_prefix=data_root + 'test/images/',
pipeline=test_pipeline))
此时已经可以训练了,但还可以修改其他的训练参数。
4)configs/base/schedules/schedule_1x.py
# evaluation
evaluation = dict(interval=5, metric='mAP') # 训练多少轮评估一次
# optimizer
optimizer = dict(type='SGD', lr=0.0025, momentum=0.9, weight_decay=0.0001)
optimizer_config = dict(grad_clip=dict(max_norm=35, norm_type=2))
# learning policy
lr_config = dict(
policy='step',
warmup='linear',
warmup_iters=500,
warmup_ratio=1.0 / 3,
step=[8, 11])
runner = dict(type='EpochBasedRunner', max_epochs=100) # 训练的总次数
checkpoint_config = dict(interval=10) # 训练多少次后保存模型
5)configs/base/default_runtime.py
# yapf:disable
log_config = dict(
interval=50, # 训练多少iter后打印输出训练日志
hooks=[
dict(type='TextLoggerHook'),
# dict(type='TensorboardLoggerHook')
])