【tph-yolov5】tph-Yolov5的Pytorch环境配置和运行错误记录

Tph-Yolov5代码运行记录

1、代码下载地址:

guihub下载连接

2、按照read.md说明进行操作

2.1 cuda版本匹配错误

运行val.py文件,提示错误:在这里插入图片描述
可见自动安装的pytorch版本和cuda不匹配,此处根据服务器讲pytorch由1.11.0改为pytorch1.8.0版本,具体可参看以下博文:
版本匹配问题
上面博文连接安装pytorch时是从官网下载的,速度比较慢,在实际操作时可改用国内镜像安装,此处提供一个镜像安装的说明和版本查找说明:
镜像安装参考
对应版本查找参考

2.2 val.py运行错误

在这里插入图片描述此错误在官方代码的issue中已经有人提出,对照修改即可。
修改参考连接

之后即可运行成功!!!

可是我发现运行速度很慢?????一脸问号,因为之前运行成功过此代码,val总时长不超过十分钟,仔细一看居然在用cpu跑,很不理解????
【tph-yolov5】tph-Yolov5的Pytorch环境配置和运行错误记录_第1张图片

所以在代码中指定使用第一块显卡运行程序,结果显示设备不存在???
OK,重新安装一遍。环境问题真的好烦。。。。
此时改用下面版本:yolov5运行环境
最后显示设备可用:
【tph-yolov5】tph-Yolov5的Pytorch环境配置和运行错误记录_第2张图片此时可看到运行速度明显提升,使用的运行设备是第一块GPU:
在这里插入图片描述
最后总结一下我的电脑配置和安装版本:
GPU RTX3080 算力8.6
CUDA 11.5
conda 4.11.0
python 3.7.0

>>>import torch
>>> torch.__version__
'1.7.1+cu110'
>>> import torchvision
>>> torchvision.__version__
'0.8.2+cu110'

终于全部安装成功,记录一下免得下次忘记了。

本来想单独写一个train.py运行文章的,结果发现运行很成功,不需要单独开一篇,所以在这里追加一下遇到的两个问题。

问题一:

 TypeError: meshgrid() got an unexpected keyword argument 'indexing' #20 

这是因为pytorch版本支持的问题,看来其他人的博客说是pytorch的最新版本(1.9.0以上)不支持这个参数了。但我安装的是1.7.1版本,不知道为什么页不支持。
但是还是进行了修改,找到报错行,删除indexing="ij"即可。

问题二是很常见的内存不足的问题,是因为我的显卡内存不够大,因为我目的是使用此模型跑自己的数据集,前期只需要跑通模型即可,所以我直接调小了batch=1。查看了一下运行结果。
在这里插入图片描述
到此就源代码运行记录就全部结束了,下面开始苦逼的打标签和训练道路。

你可能感兴趣的:(Yolov5,pytorch,深度学习)