官网提供的yolov5代码中已经能实现pt转onnx,但为了在android端使用 需要将onnx转ncnn,由于yolov5的部分网络层并没有在ncnn代码库中封装,直接使用ncnn中的onnx2ncnn会存在一些不支持的问题。该博客就是借他人经验,将实现的过程重新整理了一遍。便于向我一样的新手在初次使用时快速上手。
1, 安装onnx-simplifier
1.1: pip install onnx-simplifier (具体该工具的作用自行百度)
1.2: python -m onnxsim ./yolov5.onnx ./yolo5-sim.onnx (简化转换得到的onnx)
2. ncnn代码库
2.1ncnn代码库的编译
// An highlighted block
git clone https://github.com/Tencent/ncnn.git
cd ncnn
mkdir build
cd build
cmake ..
make -j4
2.2 模型转换
// An highlighted block
cd tools/onnx
./onnx2ncnn your-yolov5s-path/yolov5-sim.onnx the-path-to-save/yolov5-sim.param the-path-to-save/yolov5-sim.bin
运行到该步骤时会出现下面的问题,问题出现的原因时下图中的split和crop网络层高在ncnn中没有定义的缘故,我们需要做的是将这个网络层消除:
// An highlighted block
Unsupported slice step !
Unsupported slice step !
Unsupported slice step !
Unsupported slice step !
Unsupported slice step !
Unsupported slice step !
Unsupported slice step !
Unsupported slice step !
3 ncnn格式模型修改
3.1 去掉不支持的网络层
打开转换得到的yolov5-sim.param文件
前几行的内容如下,我们需要删除的是标红的部分。
修改结果如下,其中180是由于之前的189网络层我们删除了10行,并用YoloV5Focus网络层代替,剩180个,而YoloV5Focus网络层中的images代表该层的输入,199代表输出名,这个可以根据我标红的位置填写。
3.2 修改网络的输出shape
当我们基于修改后的网络使用ncnn/examples/yolov5测试时发现图片中会出现一堆乱框,该情况下需要修改网络的输出部分
首先,在yolov5-sim.param中找到网络的输出接口:
图中绿框部分就是最终的网络输出层(由于网络层数设置的区别,不同的网络所在的位置不一样),该层中红框选中的部分就是网络的输出名(要保证yolov5.cpp中调用的输出名和网络的一致性,yolov5.cpp中的调用方式如下C代码)。在并保证输出名一致的情况下,修改黄色框中区域为0=-1,使得最终的输出shape不固定。结果见图
本地测试:ncnn/examples/yolov5.cpp中修改如下部分
yolov5.load_param("yolov5-sim.param");
yolov5.load_model("yolov5-sim.bin");
const int target_size = your-size;
const float prob_threshold = 0.55f;
const float nms_threshold = 0.35f;
修改输出接口及对应的anchors.
// stride 8
{
ncnn::Mat out;
ex.extract("output", out);
ncnn::Mat anchors(6);
anchors[0] = 8.f;
anchors[1] = 6.f;
anchors[2] = 12.f;
anchors[3] = 16.f;
anchors[4] = 21.f;
anchors[5] = 10.f;
std::vector<Object> objects8;
generate_proposals(anchors, 8, in_pad, out, prob_threshold, objects8);
proposals.insert(proposals.end(), objects8.begin(), objects8.end());
}
// stride 16
{
ncnn::Mat out;
ex.extract("725", out);
ncnn::Mat anchors(6);
anchors[0] = 18.f;
anchors[1] = 26.f;
anchors[2] = 34.f;
anchors[3] = 21.f;
anchors[4] = 27.f;
anchors[5] = 39.f;
std::vector<Object> objects16;
generate_proposals(anchors, 16, in_pad, out, prob_threshold, objects16);
proposals.insert(proposals.end(), objects16.begin(), objects16.end());
}
// stride 32
{
ncnn::Mat out;
ex.extract("745", out);
ncnn::Mat anchors(6);
anchors[0] = 89.f;
anchors[1] = 34.f;
anchors[2] = 62.f;
anchors[3] = 87.f;
anchors[4] = 167.f;
anchors[5] = 86.f;
std::vector<Object> objects32;
generate_proposals(anchors, 32, in_pad, out, prob_threshold, objects32);
proposals.insert(proposals.end(), objects32.begin(), objects32.end());
}
编译,并将yolov5-sim.param 、yolov5-sim.bin模型copy到ncnn/build/examples/位置,运行下面命令
./yolov5 image-path
就会出现正确的检测结果。
4.量化or压缩
以半浮点压缩为例
./ncnnoptimize yolov5-sim.param yolov5-sim.bin yolov5-sim-opt.param yolov5-sim-opt.bin 65536
onnx转换成ncnn模型后,直接使用上述的命令转换会出现下面的问题:
由于YoloV5Focus不涉及参数的计算,故我们只需将.param中的YoloV5Focus名字换成其他已知的,且不参与运行的网络层,如Exp
然后运行命令即可(后面再进行网络输出相关问题的修改即可,至于二者的顺序是否可以改变请自行测试)。
转换完成后再将yolov5-sim-opt.param中的Exp名字改为YoloV5Focus即可。
转换时命令行会出现如下问题
已测试该问题并不影响网络的调用。
以上。
参考链接详细记录u版YOLOv5目标检测ncnn实现
以上!