目录
Android实现佩戴安全帽检测和识别(含Android源码)
1. 前言
2. 佩戴安全帽检测和识别的方法
(1)基于目标检测的佩戴安全帽识别方法
(2)基于头部检测+佩戴安全帽分类识别方法
3. 佩戴安全帽数据集说明
(1)佩戴安全帽数据集
(2)自定义数据集
4. 基于YOLOv5的佩戴安全帽模型训练
5.佩戴安全帽检测模型Android部署
(1) 将Pytorch模型转换ONNX模型
(2) 将ONNX模型转换为TNN模型
(3) Android端上部署模型
(4) 一些异常错误解决方法
6. 佩戴安全帽检测效果
7.项目源码下载
本篇博客是《YOLOv5实现佩戴安全帽检测和识别(含佩戴安全帽数据集+训练代码)_》续作Android篇,主要分享将Python训练后的YOLOv5佩戴安全帽检测模型移植到Android平台。我们将开发一个简易的佩戴安全帽检测和识别的Android Demo。
考虑到原始YOLOv5的模型计算量比较大,鄙人在YOLOv5s基础上,开发了一个非常轻量级的的佩戴安全帽识别模型yolov5s05_320。从效果来看,Android佩戴安全帽的检测效果还是可以的,高精度版本YOLOv5s平均精度平均值mAP_0.5=0.93,mAP_0.5:0.95=0.63,而轻量化版本yolov5s05_320平均精度平均值mAP_0.5=0.84左右。APP在普通Android手机上可以达到实时的检测识别效果,CPU(4线程)约30ms左右,GPU约25ms左右 ,基本满足业务的性能需求。
先展示一下Android Demo效果:
【Android APP体验】https://download.csdn.net/download/guyuealian/86768318
【项目源码下载】 Android实现佩戴安全帽检测和识别(含Android源码)
【尊重原创,转载请注明出处】https://blog.csdn.net/guyuealian/article/details/127345231
基于目标检测的佩戴安全帽识别方法,一步到位,把佩戴安全帽类别直接当成多个目标检测的类别进行训练。
- 该方案采用one-stage的方法,直接端到端训练,任务简单,速度较快;
- 新增类别或者数据,需要人工拉框标注佩戴安全帽的框,成本较大
- 部署简单
该方法,先训练一个通用的头部检测模型(不区分是否佩戴安全帽),然后外扩检测框并裁剪头部区域,再训练一个佩戴安全帽分类器,完成对佩戴安全帽的分类识别。当然一个更加简单的方法是,可以将人脸检测器当做头部检测器,即将人脸检测框外扩2倍左右,作为头部检测框的区域。只是这样做,若人背向,人脸检测器一般效果比较差,无法识别是否佩戴了安全帽。
- 该方案采用two-stage方法,可针对性分别提高检测模型和分类模型的性能
- 头部检测模型不区分是否佩戴安全帽,只检测头部检测框,检测精度较高,
- 佩戴安全帽分类模型可以做到很轻量
- 由于采用two-stage方法进行检测-识别,因此速度相对较慢
考虑到佩戴安全帽检测和识别的任务比较简单,因此本博客将采用“基于目标检测的佩戴安全帽识别方法”。目标检测的的方法较多,比如Faster-RCNN,YOLO系列,SSD等均可以采用,本博客将采用YOLOv5进行佩戴安全帽目标检测模型训练。
目前收集了2W+的佩戴安全帽数据集:
- Helmet-Asian亚洲人佩戴安全帽数据集:总共有19000+图片,VOC的XML数据格式,可直接用于目标检测模型训练。
- Helmet-Europe欧洲人佩戴安全帽数据集:总共有3000+图片,VOC的XML数据格式,可直接用于目标检测模型训练。
关于佩戴安全帽数据集说明,详见另一篇博客说明:佩戴安全帽数据集使用说明和下载_PKing666666的博客-CSDN博客
如果需要增/删类别数据进行训练,或者需要自定数据集进行训练,可参考如下步骤:
- 采集图片,建议不少于200张图片
- 使用Labelme等标注工具,对目标进行拉框标注:labelme工具:GitHub - wkentaro/labelme: Image Polygonal Annotation with Python (polygon, rectangle, circle, line, point and image-level flag annotation).
- 将标注格式转换为VOC数据格式,参考工具:labelme/labelme2voc.py at main · wkentaro/labelme · GitHub
- 生成训练集train.txt和验证集val.txt文件列表
- 修改engine/configs/voc_local.yaml的train和val的数据路径
- 重新开始训练
官方YOLOv5给出了YOLOv5l,YOLOv5m,YOLOv5s等模型。考虑到手机端CPU/GPU性能比较弱鸡,直接部署yolov5s运行速度十分慢。所以本人在yolov5s基础上进行模型轻量化处理,即将yolov5s的模型的channels通道数全部都减少一半,并且模型输入由原来的640×640降低到416×416或者320×320,该轻量化的模型我称之为yolov5s05。从性能来看,yolov5s05比yolov5s快5多倍,而mAP下降了9%(0.93→0.84),对于手机端,这精度勉强可以接受。
官方YOLOv5: https://github.com/ultralytics/yolov5
下面是yolov5s05和yolov5s的参数量和计算量对比:
模型 | input-size | params(M) | GFLOPs | mAP0.5 |
yolov5s | 640×640 | 7.2 | 16.5 | 0.93067 |
yolov5s05 | 416×416 | 1.7 | 1.8 | 0.87051 |
yolov5s05 | 320×320 | 1.7 | 1.1 | 0.84477 |
yolov5s05和yolov5s训练过程完全一直,仅仅是配置文件不一样而已;碍于篇幅,本篇博客不在赘述,详细训练过程请参考:YOLOv5实现佩戴安全帽检测和识别(含佩戴安全帽数据集+训练代码)_PKing666666的博客-CSDN博客
训练好yolov5s05或者yolov5s模型后,你需要将模型转换为ONNX模型,并使用onnx-simplifier简化网络结构
# 转换yolov5s05模型
python export.py --weights "runs/yolov5s05_320/weights/best.pt" --img-size 320 320
# 转换yolov5s模型
python export.py --weights "runs/yolov5s_640/weights/best.pt" --img-size 640 640
GitHub: https://github.com/daquexian/onnx-simplifier
Install: pip3 install onnx-simplifier
目前CNN模型有多种部署方式,可以采用TNN,MNN,NCNN,以及TensorRT等部署工具,鄙人采用TNN进行Android端上部署:
TNN转换工具:
- (1)将ONNX模型转换为TNN模型,请参考TNN官方说明:TNN/onnx2tnn.md at master · Tencent/TNN · GitHub
- (2)一键转换,懒人必备:一键转换 Caffe, ONNX, TensorFlow 到 NCNN, MNN, Tengine (可能存在版本问题,这个工具转换的TNN模型可能不兼容,建议还是自己build源码进行转换,2022年9约25日测试可用)
项目实现了Android版本的佩戴安全帽检测Demo,部署框架采用TNN,支持多线程CPU和GPU加速推理,在普通手机上可以实时处理。Android源码核心算法均采用C++实现,上层通过JNI接口调用.
如果你想在这个Android Demo部署你自己训练的模型,你可将训练好的Pytorch模型转换ONNX ,再转换成TNN模型,然后把TNN模型代替你模型即可。
package com.cv.tnn.model;
import android.graphics.Bitmap;
public class Detector {
static {
System.loadLibrary("tnn_wrapper");
}
/***
* 初始化模型
* @param model: TNN *.tnnmodel文件文件名(含后缀名)
* @param root:模型文件的根目录,放在assets文件夹下
* @param model_type:模型类型
* @param num_thread:开启线程数
* @param useGPU:关键点的置信度,小于值的坐标会置-1
*/
public static native void init(String model, String root, int model_type, int num_thread, boolean useGPU);
/***
* 检测
* @param bitmap 图像(bitmap),ARGB_8888格式
* @param score_thresh:置信度阈值
* @param iou_thresh: IOU阈值
* @return
*/
public static native FrameInfo[] detect(Bitmap bitmap, float score_thresh, float iou_thresh);
}
TNN推理时出现:Permute param got wrong size
官方YOLOv5: GitHub - ultralytics/yolov5: YOLOv5 in PyTorch > ONNX > CoreML > TFLite
如果你是直接使用官方YOLOv5代码转换TNN模型,部署TNN时会出现这个错误Permute param got wrong size,这是因为TNN最多支持4个维度计算,而YOLOv5在输出时采用了5个维度。你需要修改model/yolo.py文件
export.py文件设置model.model[-1].export = True:
.....
# Exports
if 'torchscript' in include:
export_torchscript(model, img, file, optimize)
if 'onnx' in include:
model.model[-1].export = True # TNN不支持5个维度,修改输出格式
export_onnx(model, img, file, opset, train, dynamic, simplify=simplify)
if 'coreml' in include:
export_coreml(model, img, file)
# Finish
print(f'\nExport complete ({time.time() - t:.2f}s)'
f"\nResults saved to {colorstr('bold', file.parent.resolve())}"
f'\nVisualize with https://netron.app')
.....
这个问题,大部分是模型参数设置错误,需要根据自己的模型,修改C++推理代码YOLOv5Param模型参数。
struct YOLOv5Param {
ModelType model_type; // 模型类型,MODEL_TYPE_TNN,MODEL_TYPE_NCNN等
int input_width; // 模型输入宽度,单位:像素
int input_height; // 模型输入高度,单位:像素
bool use_rgb; // 是否使用RGB作为模型输入(PS:接口固定输入BGR,use_rgb=ture时,预处理将BGR转换为RGB)
bool padding;
int num_landmarks; // 关键点个数
NetNodes InputNodes; // 输入节点名称
NetNodes OutputNodes; // 输出节点名称
vector anchors;
vector class_names; // 类别集合
};
input_width和input_height是模型的输入大小;vector
anchors:
- [10,13, 16,30, 33,23] # P3/8
- [30,61, 62,45, 59,119] # P4/16
- [116,90, 156,198, 373,326] # P5/32
而yolov5s05由于input size由原来640变成320,anchor也需要做对应调整:
anchors:
- [ 5,6, 8,15 , 16,11 ]
- [ 15,30, 31,22, 29,59 ]
- [ 58,45 , 78,99, 186,163 ]
因此C++版本的yolov5s和yolov5s05的模型参数YOLOv5Param如下设置
//YOLOv5s模型参数
static YOLOv5Param YOLOv5s_HELMET_640 = {MODEL_TYPE_TNN,
640,
640,
true,
true,
0,
{{{"images", nullptr}}}, //InputNodes
{{{"boxes", nullptr}, //OutputNodes
{"scores", nullptr}}},
{
{"434", 32,
{{116, 90}, {156, 198}, {373, 326}}},
{"415", 16, {{30, 61}, {62, 45}, {59, 119}}},
{"output", 8,
{{10, 13}, {16, 30}, {33, 23}}}, //
},
HELMET_NAME};
//YOLOv5s05模型参数
static YOLOv5Param YOLOv5s05_HELMET_ANCHOR_416 = {MODEL_TYPE_TNN,
416,
416,
true,
true,
0,
{{{"images", nullptr}}}, //InputNodes
{{{"boxes", nullptr}, //OutputNodes
{"scores", nullptr}}},
{
{"434", 32,
{{75, 58}, {101, 128}, {242, 211}}},
{"415", 16,
{{19, 39}, {40, 29}, {38, 77}}},
{"output", 8,
{{6, 8}, {10, 19}, {21, 14}}}, //
},
HELMET_NAME};
//YOLOv5s05模型参数
static YOLOv5Param YOLOv5s05_HELMET_ANCHOR_320 = {MODEL_TYPE_TNN,
320,
320,
true,
true,
0,
{{{"images", nullptr}}}, //InputNodes
{{{"boxes", nullptr}, //OutputNodes
{"scores", nullptr}}},
{
{"434", 32,
{{58, 45}, {78, 99}, {186, 163}}},
{"415", 16,
{{15, 30}, {31, 22}, {29, 59}}},
{"output", 8,
{{5, 6}, {8, 15}, {16, 11}}}, //
},
HELMET_NAME};
参考解决方法:解决dlopen failed: library “libomp.so“ not found_PKing666666的博客-CSDN博客_dlopen failed
Android APP体验 : https://download.csdn.net/download/guyuealian/86768318
APP在普通Android手机上可以达到实时的佩戴安全帽检测效果,CPU(4线程)约30ms左右,GPU约25ms左右 ,基本满足业务的性能需求。
| | |
整套项目源码内容包含:
【项目源码下载】Android实现佩戴安全帽检测和识别(含Android源码)
(1)佩戴安全帽检测和识别Android APP源码
- 提供快速版yolov5s05佩戴安全帽检测模型,在普通手机可实时检测识别,CPU(4线程)约30ms左右,GPU约25ms左右
- 提供高精度版本yolov5s佩戴安全帽检测模型,CPU(4线程)约250ms左右,GPU约100ms左右
- Android Demo支持图片,视频,摄像头测试
如果你需要佩戴安全帽的数据集:佩戴安全帽数据集使用说明和下载
如果你需要佩戴安全帽的训练代码:YOLOv5实现佩戴安全帽检测和识别(含佩戴安全帽数据集+训练代码)