AutoDL云服务器运行yolov5

文章目录

  • 前言
  • 一、租用服务器
  • 二、上传数据
  • 三、配置yolov5环境
  • 四、yolov5代码测试
  • 五、yolov5训练
  • 六、小结:

前言

因为课题需要,深度学习也接触了一段时间,但是由于没有条件,一直使用的笔记本进行学习,每次跑代码需要很久有一次跑了三天,什么都做不了,然后就尝试了解服务器,第一次使用服务器走了很多弯路,最后终于配置好了,就先记录下来,第一次写也希望能帮到大家。

一、租用服务器

当我们需要一个比较好的GPU而我们的预算又不足的时,可以租用一个服务器用来临时跑自己的深度学习模型。现在有很多服务器出租,看了好久决定选择Auto DL,价格对于贫穷的我来说还能接受,新用户注册还送10元代金券和1个月会员,可以更好的学习这个平台怎么用(开心哈哈哈),下来记录一下我是如何做的
(1)按照Auto DL要求,注册并登录:链接如下:
https://www.autodl.com/register?code=897c04bf-2598-427b-8987-058b3f39ebd2
(2)浏览帮助文档,了解如何使用(第一次接触,帮助文档有的也还是不理解为什么要这样)
a.点击快速开始会告诉我如何创建实例很详细,先选择一个合适的服务器,按照创建要求创建自己的实例。
AutoDL云服务器运行yolov5_第1张图片
例如:选择南京新手区,第一个TITAN XP 点击1卡可租进入后选择合适的主机,下拉选择想要的框架及版本,我选择的如下图所示,点击立即创建。 AutoDL云服务器运行yolov5_第2张图片
b.点击<我的实例>,可以查看租用的新实例。到此服务器租用完成。

二、上传数据

1.AutoDL上也有数据集但是我需要上传自己的数据集,利用xshell上传数据,Auto帮助文档介绍的很详细https://www.autodl.com/docs/xshell/
踩坑:上传自己的数据花了很长时间,按照帮助文档下载并安装Xshell 7和xftp 7,上传数据报错,说不是最新版本,查找了很多博客最终找到方法(https://blog.csdn.net/baidu_41614347/article/details/121951302)我选择最简单的一种,直接修改电脑日期到2016年,数据上传成功。
2.下载yolov5源码(2种方法)
a.可以在window上下载后通过上述方法利用Xshell进行上传
b.直接终端输入命令进行下载:git clone https://github.com/ultralytics/yolov5

三、配置yolov5环境

开机后,平台内置的镜像都安装了Miniconda,安装路径为/root/miniconda3/。里面已经默认安装了torch和python,但是我在使用时他告诉我版本不匹配,没有办法我重新建了虚拟环境,主要步骤如下:
1.新建名为my-env的虚拟环境,并且python版本3.7
conda create -n my-env python=3.7
2.进入虚拟环境:conda activate my-env
3.验证python是否安装成功:python
4.安装torch,我选择的如下,在链接里也可以查找自己需要的版本进行安装(https://pytorch.org/get-started/previous-versions/):conda install pytorch1.7.1 torchvision0.8.2 torchaudio==0.7.2 cudatoolkit=11.0 -c pytorch
5.查看虚拟环境安装的包:conda list
6.安装yolov5依赖包(2种方法)
(1)终端输入命令(cd yolov5)进入yolov5文件夹,然后直接输入如下指令一键安装所需依赖包:
pip install -r requirements.txt
(2)打开requirements.txt查看虚拟环境需要哪个安装包,输入如下命令进行安装。
conda install 安装包的名字
踩坑:在安装opencv-python报错如下,可以换为命令pip install opencv-python:AutoDL云服务器运行yolov5_第3张图片

四、yolov5代码测试

终端输入命令:

cd yolov5
python detect.py --source data/images --weights yolov5s.pt --conf 0.25

AutoDL云服务器运行yolov5_第4张图片

五、yolov5训练

接下来就可以愉快的训练了:

python yolov5/train.py --data data/data.yaml --cfg yolov5/models/yolov5s.yaml --weights yolov5/yolov5s.pt --epochs 10 --batch-size 16

但是没想到又报错,换了torch版本也不对,最后根据路径按照提示找到activation.py的438行删掉self.inplace:
AutoDL云服务器运行yolov5_第5张图片
重新测试成功。
AutoDL云服务器运行yolov5_第6张图片

六、小结:

从刚开始租服务器到最后测试成功,中间遇到了很多问题,看了大神写的东西也试了不同的方法,怎么说呢这样也让自己更加熟悉这个过程,第一次写东西,写的不对的地方也希望大家指出来,互相交流一起进步。

你可能感兴趣的:(笔记,深度学习)