本文对YOLOv5模型的detect.py文件的参数进行了详细阐述,笔者以后会定期讲解关于模型的其他的模块与相关技术,笔者也建立了一个关于目标检测的交流群:781334731,大家也可扫描最下面图片加入qq群,欢迎大家踊跃加入,一起学习鸭
源码地址:https://github.com/ultralytics/yolov5
打开网址后,点击master可选取不同版本的分支,本文对Yolov5最新版本v6.1解析
在配置Conda环境后就可以进入项目了,可以通过作者提供的requirements.txt文件进行快速安装
即在终端中键入如下指令:pip install -r requirements.txt
如上是官方给出的代码运行方式,我们可利用Yolov5模型预测图像、视频、摄像头、网站视频、RTSP流文件等,模型会自动下载权重文件(yolov5s.pt、yolov5m.pt、yolov5l.pt等),预测后的结果会自动保存到runs/detect/exp目录下,下次运行结果会保存在runs/detect/exp1目录下,依次类推;下图给出yolov5模型的权重和尺寸,更具体信息请参考:https://github.com/ultralytics/yolov5/releases
首先我们可以利用PyTorch Hub工具加载Yolov5模型(如果没下载,会自动下载模型权重到根目录下),之后加载需要检测的图片,最后利用封装好的模型推理检测结果,下图给出具体的实现步骤。
我们可以直接运行detect.py文件试试效果,运行后系统会把检测结果保存在runs\detect\exp3路径下(之前自己跑过)
下图就是检测结果:
这个就是指定网络权重的路径,默认是“yolov5s.pt”(default是默认的参数,即使我们在运行时不指定具体参数,那么系统也会执行默认的值);官方提供了很多的版本,需要更换时直接按照替换成对应Model的名字就可以了(当然使用自己训练的模型也是可以的),他会自动的下载对应的权重(如果下载太慢或者失败只能去官网下载了,下载好了直接放到根目录下就可以);下图给出对应模型及其实验结果
这个参数是指定网络输入的路径,默认指定的是文件夹,也可以指定具体的文件或者扩展名等,具体参数可参考上节模型推理
这个就是配置文件的一个路径,配置文件里面包含了下载路径和一些数据集基本信息(在训练时如果不自己指定数据集,系统会自己下载coco128数据集)
这个参数是模型在检测图片前会把图片resize成640的尺寸,然后再送进网络中(并不是说会把们最终得到的结果resize成640)
这个参数是置信度的阈值,置信度通俗来说就是网络对检测目标相信的程度,通常如果设置太小会产生较多的检测框,如果设置过高则可能会过滤掉正确的预测框(因此需要实际根据自己的数据集设置相当的值)
这个参数是调节IoU的阈值,在NMS(非极大值抑制)后处理用到,NMS具体步骤如下
这个参数是最大检测目标数量,默认是最多检测1000个目标(按照检测置信分排序给出)
这个类型的参数和之前的默认有很大区别,其相当于一个“开关”,当我们运行程序的时候如果指定了带有action='store_true’类型的参数,那么就相当于启动这个参数所对应的功能,反之则不
这个参数是检测时是否实时的把检测结果显示出来,因为是action='store_true’类型的参数,如果需要在检测时实时显示结果即在终端中输入以下指令 :python detect.py --view-img
这个参数是是否把检测结果保存成一个txt格式的文件,如果需要保存检测结果即在终端中输入以下指令 :python detect.py --save-txt
在文件输出目录runs/detect/exp目录下会生成labels文件夹,这个文件夹下会生成对应图像名的txt文件,里面保存了一些类别信息和边框的位置信息
这个参数是是否以txt格式的文件保存目标的置信度得分,如果单独指定这个命令是没有效果的,需要必须和–save-txt配合使用,即在终端中输入以下指令: python detect.py --save-txt --save-conf
这个参数是是否把模型检测的物体裁剪下来,如果开启了这个参数会在runs/detect/exp/crops文件夹下看到几个以类别命名的文件夹,里面保存的都是裁剪下来的图片
这个参数是不保存预测的结果,但是还会生成runs/detect/exp文件夹,只不过是一个空的exp
这里又出现一个新的参数nargs,它的意思就是我们可以给变量指定多个赋值,也就是说我们可以把0赋值给classes,也可以把0、1、2都赋值给classes
这个参数是只检测给定类别的目标,使用方式是在终端输入:python detect.py --classes 0
这个参数是是否使用增强版的nms,一个trick(笔记使用与不使用这个参数效果相差不大)
这个参数是在推理时是否使用数据增强方法(对于特定效果会有很好的效果)
这个参数是是否把特征图可视化出来,如果开启了这个参数可以看到runs/detect/exp文件夹下又多了一些文件,其中.npy格式的文件就是保存的模型文件,可以使用numpy读写.png就是图片文件
这个参数是对模型进行strip_optimizer操作,去除pt文件中的优化器等信息
这个参数是预测结果保存的文件夹名字,默认是exp(第一次是exp,下一次就是exp1),与上面联系起来保存文件路径就是runs/detect/exp
这个参数是每次预测模型的结果是否保存在原来的文件夹,如果指定了这个参数的话,那么本次预测的结果还是保存在上一次保存的文件夹里;如果不指定就是每次预测结果保存一个新的文件夹下
这个参数是是否使用 FP16 半精度推理;在训练阶段,梯度的更新往往是很微小的,需要相对较高的精度,一般要用到FP32以上;在推理的时候,精度要求没有那么高,一般F16(半精度)就可以,甚至可以用INT8(8位整型),精度影响不会很大;同时低精度的模型占用空间更小了,有利于部署在嵌入式模型里面
这个参数是是否使用 OpenCV DNN(Deep Neural Networks)进行 ONNX 推理
源码地址:https://github.com/ultralytics/yolov5/tree/master
本文对YOLOv5模型的detect.py文件的参数进行了详细阐述,笔者以后会定期讲解关于模型的其他的模块与相关技术,笔者也建立了一个关于目标检测的交流群:781334731,大家也可扫描下面这张图片加入,欢迎大家踊跃加入,一起学习鸭!