这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
这部分很重要,不然后面会出错,一定要选择好自己的gcc、kernel版本
# 查看当前系统的gcc版本
$ gcc --version
# 若没有安装gcc,则执行以下命令
$ apt install gcc
# 查看系统正在运行的Kernel Header
$ uname -r
# 执行系统更新后,为了确保Kernel Header和正在运行的Kernel相匹配,需要执行以下命令
$ sudo apt-get install linux-headers-$(uname -r)
# 查看显卡信息,有显卡是安装cuda的前提
lspci | grep -i nvidia
# 查看你可以使用的驱动
ubuntu-drivers devices
# 卸载Nouveau 在安装前,Nouveau可能已经启动,所以无法安装Nvidia成功
#---open a terminal---
sudo apt-get remove nvidia*
sudo apt autoremove
sudo apt-get install dkms build-essential linux-headers-generic
sudo vim /etc/modprobe.d/blacklist.conf
#---save the following info into file blacklist.conf---
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
#---end of the info saved----
#---go back to the terminal---
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
sudo update-initramfs -u
reboot
去NVDIA driver search page搜索显卡需要的驱动型号并下载、安装
# 查看NVIDIA版本检验是否安装完成
nvidia-smi
其他版本:https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/cuda-downloads
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.runsudo sh cuda_11.7.1_515.65.01_linux.run
选择continue
输入accept
不要选Driver,会覆盖之前安装的显卡
添加配置文件
vim ~/.bashrc
添加如下配置
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
# 指定gpu序列号,看自己情况
export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6,7
刷新配置
source ~/.bashrc
查看版本
nvcc -V
测试cuda安装是否成功
/usr/local/cuda/extras/demo_suite/deviceQuery
如果没有第一步的环境准备中kernel,会出现下面错误
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 999
Result = FAIL
https://developer.nvidia.com/rdp/cudnn-download
https://developer.nvidia.com/compute/cudnn/secure/8.4.0/local_installers/11.6/cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive.tar.xz
解压
tar -xvf cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive.tar.xz
将下载好的.h文件和lib文件放到cuda文件夹目录下
sudo cp cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp -p cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
https://pytorch.org/get-started/previous-versions
conda install pytorch==1.11.0 torchvision==0.12.0 torchaudio==0.11.0 cudatoolkit=11.3 -c pytorch