目录
一、前期理论学习
二、使用YOLO(复现yolov5)
1、环境搭建
2、认识YOLO代码中的文件并简单运行(detect.py)
3、模型训练(train.py)
一、前期理论学习
绘制思维导图
手把手教你搭建自己的yolov5目标检测平台
大白讲AI_讲解YoloV3和V4
二、使用YOLO(复现yolov5)
创新的基础是搞清楚,跑通现有的代码
1、环境搭建
搞清楚Anaconda和pyCharm是干嘛用的,并安装下载(可视化的anaconda好香!!我好爱!!)安装教程见下:(这个视频系列全学完)Python+Anaconda+PyCharm的安装和基本使用【适合完全零基础】不只是教你如何安装,还告诉你为什么这么安装
在pyCharm中选择Python解释器,添加虚拟环境(13min47s开始):
Python学习中Anaconda和Pycharm的正确打开方式
2、认识YOLO代码中的文件并简单运行(detect.py)
跟着YOLO代码的视频讲解:(只是跟着这个视频学习训脸和使用代码)
yolov5安装识别训练
(这个视频从6分13s开始学,可视化的anaconda可以直接在可视化界面里面点击来实现6分29s之前的这些命令行代码,好适合我这种小小小白555555555555 )
原始yolov5下载位置:
https://github.com/ultralytics/yolov5
安装需要的库
pip install -r requirements.txt
这个时候utile爆红,解决方法如下:
【WARNING:Ignore distutils configs in setup.cfg due to encoding errors】完美解决
yolov5踩坑记录(1)No module named ‘utils‘
pycharm中将文件目录标记为sources root和sys.path.append()效果一样
如果缺失权重文件,从这里找:
这些都是可下载的权重文件,可以对照着上面的各种使用效果进行下载。
运行detect.py
运行完成,结果放在如下位置:
(对动漫人物识别效果不是很好,不过不重要,至少代码跑通了的,下面就是找数据集训练自己的模型文件)
3、模型训练(train.py)
数据集下载:
【数据集】计算机视觉,深度学习,数据挖掘数据集整理
AI领域八大项目刚需数据集(yolov5口罩检测-火灾监测-手势识别-行人摔倒检测-车道线检测-钢铁缺陷检测-眼疾识别数
NUS Hand Posture Dataset II下载地址(这是手势识别很多论文中都用到的数据集,目前还在找下载资源):NUS 手部姿势数据集 II
目前训练用的数据集为:YOLOV5手势识别数据集+代码+模型 2000张标注好的数据+教学视频
正在进行训练,现在先浅训练50轮,但是暂时还没有跑完数据,可能明天早上就可以跑完出结果了
跑完啦,粗了一些BUG:
解决办法:cuda与torch的安装匹配 第一次这个爆红说占用空间是因为我打开了图形化的Anaconda界面,没有关就开始运行指令了,关上就解决啦! Yolov5(最新版)环境配置教程 如何查看pytorch是否安装成功 检验是否安装成功pytorch Pytorch环境配置——cuda、、cudnn、torch、torchvision对应版本(最全)及安装方法 怎么检查cuda是否安装成功(以及查看cuda的安装位置) CUDA11.3以及PyTorch-GPU版本安装(笔记) 【CUDA安装】如何在Win10下轻松安装CUDA和Cudnn 手把手教学 5min https://blog.csdn.net/qq_38500228/article/details/123870113 Anaconda 更改 cpu 版本的 pytorch 为gpu版本 怎么知道自己电脑cuda和cuDNN安装成功了? 出错提示:No metadata found in c:\users\dell\appdata\local\packages\pythonsoftwarefoundation.python.3.9_qbz5n2kfra8p0\localcache\local-packages\python39\site-packages 翻译: 没有发现元数据在c: users\dell\appdata\local\packages\pythonsoftwarefoundation.python.3.9_qbz5n2kfra8p0\localcache\local-packages\python39\site-packages 由于此系统未启用Windows长路径支持,因此可能已发生此错误。您可以在https://pip.pypa.io/warnings/enable-long-paths上找到关于如何启用该功能的信息 解决办法: Windows 启用长路径(文件名过长,路径过长) 以后可能会用到的: 基于深度学习的动态手势数据集及论文整理 【Yolov5】1.认真总结6000字Yolov5保姆级教程 上次听讲座的时候听到MindSpore里面也有与YOLO相关的信息,简单搜索了一些资料信息,想着等数据跑完之后在其基础上进行训练创新: mindspore(二)-yolov5的训练、改进及MindConverter的使用 还有就是看了一些YOLO最新消息,美团出了YOLOv6,他的速度很快很快, 1、其引入了 RepVGG style 结构,对网络起到了很大的提升效果,我们基于以上 Rep 算子设计了一个高效的Backbone,替换掉了 YOLOv5 采用的 CSP-Backbone,够高效利用硬件(如 GPU)算力的同时,还具有较强的表征能力。同时对整体 Neck 中的算子进行了调整,在硬件上达到高效推理的同时,保持较好的多尺度特征融合能力,我感觉这些网络改进都很棒,但是目前我还并不会用一个网络去改进另一个网络的代码实现,我也正在看相应的关于Rep的内容。 2、为进一步提升检测精度,我们吸收借鉴了学术界和业界其他检测框架的先进研究进展:Anchor-free 无锚范式 、SimOTA 标签分配策略以及 SIoU 边界框回归损失。(这些我都不懂,还在学) 还有就是看了哈工大卢迪老师的一篇文章,是:基于改进YOLOv4-tiny算法的手势识别,在这篇文章中有提到YOLOv4-tiny算法更加适用于移动端,说这种算法有更快的检测速度,我也想晚点跑一下,看看它和YOLOv6谁更好一些,这篇文章中有提到,做以下改进也可以提升运算的速度: 1、K-means++聚类算法(版,K-means++算法逐个选取k个簇中心,离其他簇中心越远的样本点越有可能成为下一个簇中心,然后计算目标与簇中心的距离,并把它们分配给最近的簇中心成为k个簇中心,重复计算更新簇中心,直到簇中心不再改变,得到最终的聚类结果)对手势数据集NUS-II进行重新聚类,得到更适合检测手势的先验框。 2、使用ncnn框架进行模型部署。腾讯优图实验室的ncnn是一个为手机端极致优化的高性能神经网络计算框架。(MIndspore也说是可以部署到手机端的框架,不知道他俩谁好一点,得试)百度了下 好像是pytorch版本和显卡CUDA版本不匹配:Error: Exception ignored in:
This error might have occurred since this system does not have Windows Long Path support enabled. You can find information on how to enable this at https://pip.pypa.io/warnings/enable-long-paths