若该文为原创文章,转载请注明原文出处。
基于Yolov8的训练及部署,参考鲁班猫的手册训练自己的数据集部署到RK3568,用的是正点的板子。
conda create -n yolov8 python=3.8
conda activate yolov8
根据pytorch自行安装
方法有两种,个人使用的是第二种方法:
方法一:
通过pip安装
pip install ultralytics -i https://mirror.baidu.com/pypi/simple
方法二:
通过拉取仓库然后安装
git clone https://github.com/ultralytics/ultralytics
cd ultralytics
pip install -e .
# 安装成功后,使用命令 yolo 简单看下版本
(yolov8) llh@anhao:/$ yolo version
8.0.206
下载权重文件
wget https://github.com/ultralytics/assets/releases/download/v0.0.0/yolov8n.pt
*获取测试图片,可以下面位置获取,可能会失败,也可以从配套例程获取
wget https://ultralytics.com/images/bus.jpg
使用 yolo 命令进行测试
yolo detect predict model=./yolov8n.pt source=./bus.jpg
# 预测图片结果保存在当前 runs 目录下,具体路径是./runs/detect/predict/bus.jpg
参数说明: # 第一个参数是指任务 [detect, segment, classify], 这里测试目标检测是 detect,该参数 是可选的; # 第二个参数 model,设置模型,该参数必须指定; # 其他参数,source 指定要预测的图片路径,imgsz 指定图像尺寸等等,更多参数具体参考下: https://docs.ultralytics.com/usage/cfg/
以COCO128为例,训练测试
yolo detect train data=coco128.yaml model=yolov8n.pt epochs=300 imgsz=640
测试
yolo detect predict model=./runs/detect/train/weights/best.pt source=./bus.jpg
6、模型导出
使用 airockchip/ultralytics_yolov8 可以直接导出适配 rknpu 的模型,在 npu 上获得更高的推理效率。
该仓库对模型进行了优化:
• dfl 结构在 NPU 处理上性能不佳,移至模型外部。
• 假设有 6000 个候选框,原模型将 dfl 结构放置于’’框置信度过滤”前,则 6000 个候选框
都需要计算经过 dfl 计算;而将 dfl 结构放置于’’框置信度过滤”后,假设过滤后剩 100 个
候选框,则 dfl 部分计算量减少至 100 个,大幅减少了计算资源、带宽资源的占用。
假设有 6000 个候选框,检测类别是 80 类,则阈值检索操作需要重复 6000* 80 ~= 4.8*10^5 次,占据
了较多耗时。故导出模型时,在模型中额外新增了对 80 类检测目标进行求和操作,用于快速过滤
置信度。
(该结构在部分情况下有效,与模型的训练结果有关) 可以在./ultralytics/nn/modules/head.py
52 行 ~54 行的位置,注释掉这部分优化,对应的代码是:
cls_sum = torch.clamp(y[-1].sum(1, keepdim=True), 0, 1)
y.append(cls_sum)
具体参考下 RKOPT_README.md 。
导出torchscript模型
# 拉取 airockchip/ultralytics_yolov8
git clone https://github.com/airockchip/ultralytics_yolov8.git
cd ultralytics_yolov8
# 复制训练的模型 yolov8n.pt 到 ultralytics_yolov8 目录下
# 然后修改./ultralytics/cfg/default.yaml 文件,主要是设置下 model,为自己训练的模型
路径:
model: ./yolov8n.pt # (str, optional) path to model file, i.e. yolov8n.pt, yolov8n.yaml
data: # (str, optional) path to data file, i.e. coco128.yaml
epochs: 100 # (int) number of epochs to train for
# 导出模型:
python ./ultralytics/engine/exporter.py
#导出的模型,保存在当前目录下的 yolov8n_rknnopt.torchscript
导出ONNX模型
yolo export model=path/to/best.pt format=onnx # export custom trained model
模型转换是通过tooolkit2转成rknn模型的,需要先安装toolkit2,具体安装参考正点原子的。
这是使用的是 rknn_model_zoo 仓库 的程序,直接转换模型,
# 拉取 rknn_model_zoo,(注意教程测试时 rknn_model_zoo 的 SHA 是
22462182b91c7d856b59a8ec3e4a25bba8813d17)
git clone https://github.com/airockchip/rknn_model_zoo.git
# 然后切换到 models/CV/object_detection/yolo/RKNN_model_convert 目录下
cd rknn_model_zoo/models/CV/object_detection/yolo/RKNN_model_convert
在录前目录下创建yolov8_rk3568.yml文件,内容如下:
# model_framework: onnx
model_framework: pytorch
model_file_path: /mnt/f/wsl_file/wsl_ai/yolov8/ultralytics_yolov8/yolov8n_rknnopt.torchscript
RK_device_platform: rk3568
# RK_device_id: simulator
dataset: ../../../../../datasets/COCO/coco_subset_10.txt
quantize: True
# pre_compile: online
graph:
in_0:
shape: 1,3,640,640
mean_values: 0
std_values: 255
img_type: RGB
configs:
quantized_dtype: asymmetric_quantized-8
quantized_algorithm: normal
optimization_level: 3
# force_builtin_perm: True
注意三个地方:
1、model_framework可以使用onnx也可以是pytorch 2、model_file_path:模型路径 3、RK_device_platform: 平台
使用命令或者创建脚本执行模型转换等操作
# 使用 rknn_convert.py,转换模型
python ../../../../../common/rknn_converter/rknn_convert.py --yml_path ./yolov8_rk3568.yml
转换的模型保存在当前目录 model_cvt/RK3568/下,模型文件是 yolov8n_rknnopt_RK3568_i8.rknn。
使用 rknn_model_zoo 仓库 提供的 RKNN_C_demo,在板端部署
# 拉取 rknn_model_zoo 仓库源码,注意教程测试的 rknn_model_zoo 仓库版本是
22462182b91c7d856b59a8ec3e4a25bba8813d17
git clone https://github.com/airockchip/rknn_model_zoo.git
# 切换到~/rknn_model_zoo/libs/rklibs 目录,然后拉取相关库,包括 rknpu2 和 librga
cd ~/rknn_model_zoo/libs/rklibs
git clone https://github.com/rockchip-linux/rknpu2
git clone https://github.com/airockchip/librga
# 然后切换到~/rknn_model_zoo/models/CV/object_detection/yolo/RKNN_C_demo/RKNN_toolkit_2/rknn_yolo_demo 目录
cd rknn_model_zoo/models/CV/object_detection/yolo/RKNN_C_→demo/RKNN_toolkit_2/rknn_yolo_demo
# 运行 build-linux_RK3568.sh 脚本,编译工程(使用系统默认的编译器),最后生成的文件安装
在 build/目录下
./build-linux_RK3568.sh
执行命令进行模型推理:
# 切换到 install/rk3568/Linux/rknn_yolo_demo 目录下,复制前面转换出的 yolov8n_→rknnopt_RK3568_i8.rknn 模型文件到目录下, # 然后把文件拷贝到开发板上执行下面命令:
./rknn_yolo_demo␣yolov8 q8 ./yolov8n_rknnopt_RK3588_i8.rknn ./model/bus640.jpg
#运行后会在目录下生成out.jpg
参考链接
Quickstart - Ultralytics YOLOv8 Docs
GitHub - ultralytics/ultralytics: NEW - YOLOv8 in PyTorch > ONNX > OpenVINO > CoreML > TFLite
GitHub - airockchip/ultralytics_yolov8: NEW - YOLOv8 in PyTorch > ONNX > CoreML > TFLite
GitHub - airockchip/rknn_model_zoo
如有侵权,或需要完整代码,请及时联系博主。