ubuntu全版本安装CUDA任意版本和cudnn任意版本,以及随意卸载

在这之前要先按我这个处理一下
这个往往是安装失败的罪魁祸首。

1. 安装显卡驱动

检查一下你有没有驱动

nvidia-smi

如果没有,那就去安装一下。
显卡安装教程

2. 安装cuda

我的版本是cuda_10.0.130_410.48_linux.run
切换到该文件目录下

# 先更改权限以免报错
chmod a+x cuda_10.0.130_410.48_linux.run
# 再进行安装
sudo bash ./cuda_10.0.130_410.48_linux.run

2.1 cuda10.0以及更低

## 下面是输出是我设定的安装结果。
Do you accept the previously read EULA?
accept/decline/quit: accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
(y)es/(n)o/(q)uit: no

Install the CUDA 10.0 Toolkit?
(y)es/(n)o/(q)uit: yes

Enter Toolkit Location
 [ default is /usr/local/cuda-10.0 ]: 

# 这个很有用,是构建一个软连接,对于多cuda环境很有帮助
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: yes

Install the CUDA 10.0 Samples?
(y)es/(n)o/(q)uit: no 

# 输出
Please see CUDA_Installation_Guide_Linux.pdf in /usr/local/cuda-9.0/doc/pdf for detailed information on setting up CUDA.

***WARNING: Incomplete installation! This installation did not install the CUDA Driver. A driver of version at least 384.00 is required for CUDA 9.0 functionality to work.
To install the driver using this installer, run the following command, replacing <CudaInstaller> with the name of this run file:
    sudo <CudaInstaller>.run -silent -driver

Logfile is /tmp/cuda_install_12169.log

2.2 cuda10.1版本以及更高

CUDA Installer
- [ ] Driver  # 这个问你是否安装驱动
	- [ ] 418.87.00 # 这个是内置显卡驱动版本号 
- [X] CUDA Toolkit 10.1
- [ ] CUDA Samples 10.1  # 样例,装不装无所谓
- [X] CUDA Demo Suite 10.1 # 套件,可能有用,装了
- [X] CUDA Documentation 10.1 # 解释文档,毕装啊
  Options
  Install   # <--上面有X的就是选中的意思

这就代表安装完毕了。

3. 配置CUDA

# 没有安装oh-my-zsh的
sudo gedit ~/.bashrc

## 文件最后加上
## 这是直接连接cuda9.0的库
export PATH=/usr/local/cuda-10.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
## 这是链接cuda软连接。
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

# 激活
source ~/.bashrc
检查一下
$ cat /proc/driver/nvidia/version
# 输出显示版本是435.21,GCC版本是5.4.0
NVRM version: NVIDIA UNIX x86_64 Kernel Module  435.21  Sun Aug 25 08:17:57 CDT 2019
GCC version:  gcc version 5.4.0 20160609 (Ubuntu 5.4.0-6ubuntu1~16.04.11) 

## 查看一下cuda版本
$ nvcc -V
# 这代表你装上了,版本是9.0
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2017 NVIDIA Corporation
Built on Fri_Sep__1_21:08:03_CDT_2017
Cuda compilation tools, release 9.0, V9.0.176

4. 安装cudnn

下载的是cudnn-10.1-linux-x64-v7.6.5.64.tgz,下载选择cuDNN Library for Linux;理论上7.0版本的cudnn都是可以的。

# 1. 解压
tar -zxvf cudnn-10.0-linux-x64-v7.6.0.64.tgz

# 2. 拷贝,注意星号别丢了
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/

# 3. 转移时候要设置权限大小,不然pycharm用不了Anaconda的虚拟环境
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*

# 4. 软链接,可用可不用;我没有采用,有时候报错会使用
cd /usr/local/cuda/lib64
sudo chmod +r libcudnn.so.7.6.1
sudo ln -sf libcudnn.so.7.6.1 libcudnn.so.7  
sudo ln -sf libcudnn.so.7 libcudnn.so  
sudo ldconfig  

5. 卸载cuda

这是10.1以及新版本

# 打开卸载目录
$ cd /usr/local/cuda/bin
# 运行卸载
$ sudo ./cuda-uninstaller

会弹出来很多选项,我说过X就是选中,选中全删,点Done即可
然后再删除文档

## 1.打开
$ cd /usr/local/
## 2.删除:-r是循环删除文件夹,-f是不可逆转
$ sudo rm -rf cuda-10.1

cuda10.0及以前版本

$ cd /usr/local/cuda/bin
$ sudo uninstall_cuda_10.0.pl

同理,也要删除文件夹。

PS:对于/.basha的环境配置是否删除,如果你是用软链接,其实都可以不用删,下次安装其他版本再用即可。

Other

  1. 安装tensorflow-1.14
  2. 如果需要anaconda安装环境:anaconda创建虚拟环境及操作
  3. 如果使用tensorflow报错
    输入:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -U numpy==1.16

你可能感兴趣的:(ubuntu,TensorFlow)