ubuntu 从刷机到yolov5环境搭建训练记录

ubuntu 从刷机到yolov5环境搭建训练记录

这两天需要一个模型检测一些摄像头内容,使用yolov5训练了一个模型,记录一下。

1. 刷机

具体步骤不描述,网上很多。

刷机时遇到一个问题,原有系统为centos7,1.刷机时选择格式化硬盘后,点击继续无反应,或者跳回上一步 2.选择自定义分区,安装过程中报错,无法控制硬盘;应该是因为centos7系统占用磁盘缘故,需进入ubuntu试用系统将磁盘格式化后再进行安装

2. 设置环境

设置root密码

sudo passwd root

更换源

cp /etc/apt/sources.list /etc/apt/sources.list.bak
vim /etc/apt/sources.list

替换里面的内容为

# source && source code
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute-updates main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute-updates main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute-backports main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute-backports main restricted universe multiverse
deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute-security main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute-security main restricted universe multiverse
# Advance distribution source, Not recommended
# deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute-proposed main restricted universe multiverse
# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ hirsute-proposed main restricted universe multiverse

# source && source code
deb http://mirrors.aliyun.com/ubuntu hirsute main restricted
deb http://mirrors.aliyun.com/ubuntu hirsute-updates main restricted
deb http://mirrors.aliyun.com/ubuntu hirsute universe
deb http://mirrors.aliyun.com/ubuntu hirsute-updates universe
deb http://mirrors.aliyun.com/ubuntu hirsute multiverse
deb http://mirrors.aliyun.com/ubuntu hirsute-updates multiverse
deb http://mirrors.aliyun.com/ubuntu hirsute-backports main restricted universe multiverse
deb http://mirrors.aliyun.com/ubuntu hirsute-security main restricted
deb http://cn.archive.ubuntu.com/ubuntu hirsute-security universe
deb http://cn.archive.ubuntu.com/ubuntu hirsute-security multiverse
3. NVIDIA显卡驱动安装

3.1 在终端输入:ubuntu-drivers devices可以看到显卡型号和推荐的显卡驱动

3.2 sudo apt update 升级一下apt

3.3 sudo apt install nvidia-driver-510

3.4 nvidia-smi查看网卡使用情况

过程中遇到三个问题

  • 使用一篇文章推荐的sudo ubuntu-drivers autoinstall会吃网卡驱动,需要重新装网卡驱动或者刷机
  • 推荐的版本是470的版本,但是安装完成后输入nvidia-smi,提示NVIDIA-SMI hai failed because it couldn't com...,上网搜可以找到一些解决方案,安装akms之类的
  • 安装akms或者nvidia-driver-510会提示无法修正错误,因为您要求某些软件包保持现状,更改软件更新里的subscribed to为Security and ...
4.yolov5环境准备

4.1 python/pip/git安装,pip换源,具体步骤不描述。

4.2 安装conda

wget -P /tmp https://repo.anaconda.com/archive/Anaconda3-2020.02-Linux-x86_64.sh
bash /tmp/Anaconda3-2020.02-Linux-x86_64.sh
source ~/.bashrc
conda update --all

如果提示conda命令不存在需要配置conda环境变量

4.3 下载yolov5代码并测试

git clone https://github.com/ultralytics/YOLOv5
conda create --name yolotest python=3.9
source activate yolotest
pip install -r requirement.txt

4.4 安装cuda

这里使用conda安装,安装命令查询

conda install pytorch torchvision torchaudio cudatoolkit=10.2 -c pytorch

4.5 测试

在虚拟环境中输入python detect.py,等待执行完成,在yolov5/runs下查看结果表示成功

5.数据集准备

这里使用pip安装labelImg,pip install labelImg在python/Scripts底下就直接有对应的可执行文件,运行就行了,至于怎么标注,[查看链接]((10条消息) 目标检测使用LabelImg标注VOC数据格式和YOLO数据格式——LabelImg使用详细教程_点亮~黑夜的博客-CSDN博客_labelimg yolo格式)

6.训练

打开train.py文件,更改几个常用的地方

parser.add_argument('--weights', type=str, default='', help='initial weights path')
parser.add_argument('--cfg', type=str, default='./models/loading.yaml', help='model.yaml path')
parser.add_argument('--data', type=str, default='data/loading.yaml', help='data.yaml path')
parser.add_argument('--epochs', type=int, default=300)

然后python train.py就开始训练了

训练过程中可以输入命令tensorboard --logdir=runs,启动网页查看实时结果,也可以使用nvidia或者top命令查看GUP/CPU使用情况

你可能感兴趣的:(pytorch,python)