cuda的卸载及安装和nvidia-smi has failed问题处理方案

1、卸载cuda

cd /usr/local/cuda-11.1/bin
sudo ./cuda-uninstaller
sudo rm -rf /usr/local/cuda-11.1

从https://developer.nvidia.com/cuda-toolkit-archive下载对应版本的cuda
如果你之前执行过sudo apt-get install nvidia-cuda-toolkit,需要卸载:sudo apt-get autoremove nvidia-cuda-toolkit

sudo  apt-get install nvidia-cuda-toolkit
# 卸载
sudo apt-get autoremove nvidia-cuda-toolkit

在终端输入

nvcc -V

没有cuda版本信息,则卸载成功

2、安装cuda

在下载的安装包处打开终端,执行如下命令,安装cuda

sudo sh cuda_11.2.1_460.32.03_linux.run

选择continue
accept

cuda的卸载及安装和nvidia-smi has failed问题处理方案_第1张图片配置环境

gedit ~/.bashrc

在打开的文件中添加

export CUDA_HOME=/usr/local/cuda-11.1
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}

验证cuda是否可用:出现True即可

cuda的卸载及安装和nvidia-smi has failed问题处理方案_第2张图片

3、安装cudnn

下载地址:https://developer.nvidia.com/rdp/cudnn-archive
解压下载的文件,可以看到cuda文件夹,在当前目录打开终端,执行如下命令:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
 
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
 
sudo chmod a+r /usr/local/cuda/include/cudnn.h
 
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

出现nvidia-smi has failed,可能是ubuntu内核更新造成的,按如下安装显卡驱动步骤即可

方案一安装显卡驱动

1、禁用ubuntu自动更新功能(一定要禁用,太坑了,这次就是内核更新导致我显卡驱动不能用)
cuda的卸载及安装和nvidia-smi has failed问题处理方案_第3张图片
cuda的卸载及安装和nvidia-smi has failed问题处理方案_第4张图片
2、卸载所有NVIDIA驱动:

sudo apt-get remove --purge nvidia* 

3、安装GPU驱动

sudo ubuntu-drivers autoinstall

如出现以下情况则安装成功
cuda的卸载及安装和nvidia-smi has failed问题处理方案_第5张图片

方案二降低内核版本

参考https://www.freesion.com/article/24221104444/

你可能感兴趣的:(笔记,深度学习,pytorch)