目录
一、安装Nvidia Docker
二、安装显卡驱动
1、安装驱动
2、检查显卡驱动版本
3、查询驱动版本和显卡相关信息
三、Docker hub安装pytorch和对应版本cuda
1、在Docker hub中查询对应版本镜像
编辑2、查询pytorch/pytorch的镜像
3、devel版本和runtime版本的区别
4、拉取对应版本镜像
5、查看拉取完成的镜像
6、生成容器
四、进入容器并查询相关信息
1、进入容器
2、打印环境变量
3、查询本地安装的软件和程序
4、显示NVIDIA CUDA 编译器(nvcc)的版本信息
前期因为要安装东西需要cuda10+的环境,查了部分资料发现对这方面的介绍不是很详细,所以结合前期整理的笔记,写一个比较详细的纯小白教程。
还要特别注意的是:此版本为Ubuntu20.04,默认的python版本为3.10。
可以直接参考另一篇教程Ubuntu20.04 Nvidia Docker 安装-CSDN博客,写的很详细。
注意安装完毕后再进行下一步。
sudo apt list nvidia-driver*
lspci -k | grep -A 2 -i "VGA"
将输出当前主机的显卡驱动版本和驱动程序的详细版本。
nvidia-smi
提示当前系统中的信息:
显卡信息:显示系统中安装的 NVIDIA 显卡的详细信息,包括显卡型号、设备ID、总线ID等。
驱动程序版本:显示当前系统中所使用的 NVIDIA 显卡驱动程序的版本号。
GPU使用情况:显示每个显卡的使用情况,包括GPU利用率、显存使用情况、温度、风扇转速等。
进程信息:显示正在使用显卡资源的进程列表,包括进程ID、进程名称、GPU使用情况等。
其他相关信息:还会显示一些其他的诊断信息,如显卡电源状态、PCIe链接状态等。
显卡驱动安装成功后:
选择需要的版本
总结:
Devel版本适用于开发者构建和扩展PyTorch,它包含了开发工具和依赖项,以及用于调试和错误排查的工具。Runtime版本适用于在生产环境中运行PyTorch应用程序,它只包含必要的运行时依赖项,不包含开发工具和符号表。【所以建议直接用devel版本的】
我用的是pytorch:2.0.1-cuda11.7-cudnn8的devel版本,直接复制上述后面的命令行。
docker pull pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel
输出表明你已成功下载了pytorch/pytorch
镜像的特定版本2.0.1-cuda11.7-cudnn8-devel
到本地。可以使用该镜像来创建和运行基于PyTorch的容器。
Pulling from pytorch/pytorch
:表示正在从pytorch/pytorch
镜像仓库中拉取镜像。Pull complete
:表示已成功下载一个镜像层。Digest
:表示镜像的摘要,用于唯一标识镜像的内容。Status: Downloaded newer image for pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel
:表示已成功下载标签为2.0.1-cuda11.7-cudnn8-devel
的pytorch/pytorch
镜像。docker images
nvidia-docker run --gpus all -itd --name=alpa_test pytorch/pytorch:2.0.1-cuda11.7-cudnn8-devel
其中是命名叫alpa_test,可以使用容器ID或容器名称直接进入容器。
截止到这一步就可以直接使用带有cuda+pytorch的容器了。
docker exec -it alpa_test bash
echo $LD_LIBRARY_PATH
ls /usr/local/
nvcc -V