CUDA安装文件下载
CUDA9.0下载链接:https://developer.nvidia.com/cuda-toolkit-archive,根据平台配置选择下载即可。
这里下载完毕之后需要自己把文件重命名为cuda_9.0.176_384.81_linux.run
#先执行下面的命令安装相关依赖,否则会出现Missing recommended library错误
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
#开始安装
sudo sh cuda_9.0.176_384.81_linux.run
#一堆协议说明
#直接按q退出协议说明
#接受协议
Do you accept the previously read EULA?
accept/decline/quit: accept
#不支持配置提醒,可以忽略
You are attempting to install on an unsupported configuration. Do you wish to continue?
(y)es/(n)o [ default is no ]: y
#是否安装显卡驱动包,这里注意由于我已经安装了新版显卡驱动,所以选择n,如果你是首次安装选择y
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?
y)es/(n)o/(q)uit: n
# 安装CUDA 9.0 Toolkit工具包
Install the CUDA 9.0 Toolkit?
(y)es/(n)o/(q)uit: y
#工具包安装地址,默认回车即可
Enter Toolkit Location
[ default is /usr/local/cuda-9.0 ]:
#添加symbolic link链接 **注意这个连接,如果你之前安装过另一个版本的cuda,除非你确定想要用这个新版本的cuda,否则为了不影响目前服务器系统环境这里就选no。因为指定该链接后,服务器系统将会把默认使用的cuda指向这个新安装的版本** 如果你是首次安装可以选择yes。由于我这里安装过cuda版本,所以选择no
Do you want to install a symbolic link at /usr/local/cuda?
(y)es/(n)o/(q)uit: n
#安装样例
Install the CUDA 9.0 Samples?
(y)es/(n)o/(q)uit: y
#样例安装地址,这里选择与安装cuda toolkit工具包的地址保持一致
Enter CUDA Samples Location
[ default is /root ]: /usr/local/cuda-9.0
#输入样例安装地址回车之后报错,别担心我们慢慢分析,根据错误提示信息可知,运行安装文件时可以使用--override参数来解决。
#加上--override参数之后重新安装
# CUDA安装完成
注意!!!如果安装运行时加上了--override之后报如下错误
Installing the CUDA Toolkit in /usr/local/cuda-9.0 ...
Warning: cannot find Toolkit in /usr/local/cuda-9.0. Use --toolkitpath to specify the toolkit location.
Installing the CUDA Samples in /home/user ...
sh: 1: /usr/local/cuda-9.0/bin/cuda-install-samples-9.0.sh: not found
chown: cannot access '/usr/local/cuda-9.0/NVIDIA_CUDA-9.0_Samples': No such file or directory
===========
= Summary =
===========
Driver: Not Selected
Toolkit: Installation Failed
Samples: Installation Failed
解决方案可以参照博客:https://blog.csdn.net/songer93/article/details/95645513
#编译并测试设备 deviceQuery:
user@cernet2:~$ cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
user@cernet2:/usr/local/cuda-9.0/samples/1_Utilities/deviceQuery$ sudo make
user@cernet2:/usr/local/cuda-9.0/samples/1_Utilities/deviceQuery$ ./deviceQuery
Result = PASS 代表设备测试通过
cuDNN安装库下载
cuDNN7下载链接:https://developer.nvidia.com/rdp/cudnn-archive,选择相应的版本下载即可,注意下载过程中需要登录NVIDIA的账号,根据提示操作即可。
下载完成之后得到的文件是cudnn-9.0-linux-x64-v7.6.5.32.solitairetheme8,然后重命名为cudnn-9.0-linux-x64-v7.6.5.32.tar,然后再解压cudnn-9.0-linux-x64-v7.6.5.32.tar文件会得到cuda文件夹,该文件夹包含两个文件夹include、lib64。
相关文件复制
#切换到刚刚解压出来的文件夹路径
user@cernet2:~$ cd cuda/
#复制include里的头文件到/usr/local/cuda-9.0/include/中
user@cernet2:~/cuda$ cd include/
user@cernet2:~/cuda/include$ sudo cp cudnn.h /usr/local/cuda-9.0/include/
#复制lib64下的所有lib开头的文件到cuda-9.0安装路径下的lib64文件夹下
user@cernet2:~/cuda/include$ cd ../lib64/
user@cernet2:~/cuda/lib64$ sudo cp lib* /usr/local/cuda-9.0/lib64/
更新软链接
#切换到cuda-9.0安装路径下的lib64文件夹下
user@cernet2:~/cuda/lib64$ cd /usr/local/cuda-9.0/lib64/
#删除原有动态文件,版本号注意变化,可在上述cudnn-9.0-linux-x64-v7.6.5.32.tar文件解压得到的文件夹cuda中的lib64文件夹中查看
user@cernet2:~/usr/local/cuda-9.0/lib64$ sudo rm -rf libcudnn.so libcudnn.so.7
#生成软链接,版本号注意变化,同样可在上述cudnn-9.0-linux-x64-v7.6.5.32.tar文件解压得到的文件夹cuda中的lib64文件夹中查看
user@cernet2:~/usr/local/cuda-9.0/lib64$ sudo ln -s libcudnn.so.7.6.5 libcudnn.so.7
user@cernet2:~/usr/local/cuda-9.0/lib64$ sudo ln -s libcudnn.so.7 libcudnn.so
#立刻生效
user@cernet2:~/usr/local/cuda-9.0/lib64$ sudo ldconfig -v
下载CUDA版本切换脚本:https://github.com/phohenecker/switch-cuda,将switch-cuda.sh脚本下载到自己账户上,执行以下操作来进行自由切换。
#查看服务器上所有的CUDA版本
lyj@cernet2:~$ source switch-cuda.sh
#任意切换CUDA版本
lyj@cernet2:~$ source switch-cuda.sh 9.0