配置环境:Ubuntu16.04 + cuda9.0 + cudnn7.0
上nvidia官网下载对应版本的cuda,在 https://developer.nvidia.com/cuda-toolkit 中找到对应的cuda版本,一般默认的是当前最新的版本,所以这里需要注意下载对应的版本。这里吐槽一下,cuda下载的地址真的不好找,若在主页中则需要通过: Home->ComputeWorks->CUDA Toolkit找到下载链接。我这里下载的是:cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
1.1 关闭与nvidia内核不兼容的nouveau
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
1.2 该文件打开后是空的,在文件中写入:
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
1.3 然后依次执行一下命令
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
sudo update-initramfs -u
sudo reboot
1.4 安装cuda
cd到cuda.deb所在的位置(下载的cuda文件,比如我这里下载的是:cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb)
sudo dpkg -i cuda-repo-ubuntu1604-9-0-local_9.0.176-1_amd64.deb
sudo apt-key add /var/cuda-repo-9-0-local/7f2af80.pub
sudo apt-get update
sudo apt-get install cuda
1.5 环境变量配置
在~/.bashrc文件中写入环境变量
export PATH=$PATH:/usr/local/cuda/bin
export LD_LIBRARY_PATH=:/usr/local/cuda/lib64
添加完环境变量之后,执行source ~/.bashrc 使其生效
1.6 验证cuda是否安装成功
cd /sur/local/cuda/samples/1_utilities/deviceQuery
sudo make
sudo ./deviceQuery
启动deviceQuery后,若能查到GPU等相关信息,则表明安装成功。若提示找不到cuda的so库,有可能是环境变量没有加载成功,可以先退出终端,然后重新进入终端并执行sudo ldconfig使其生效,最终重新执行1.6步。
下载cudnn需要先在nvidia官网注册开发账号:https://developer.nvidia.com/cudnn, 在当前主页则搜索路径为:Home -> Deep Learning -> Deep Learning Software -> NVIDIA cuDNN,在列表中找到与cuda版本对应的cudnn即可,一般有多个cudnn版本都支持同一版本的cuda,看自己需求下载其中一个即可,我这里下载的是: cudnn-9.0-linux-x64-v7.4.1.5.tgz
cd 到cudnn-9.0-linux-x64-v7.4.1.5.tgz所在的目录,一次执行:
tar -zxf cudnn-9.0-linux-x64-v7.4.1.5.tgz
cd cuda
sudo cp lib64/* /usr/local/cuda/lib64/
sudo cp include/cudnn.h /usr/local/cuda/include/
解压tgz文件时,可能会报错,此时可以忽略,只需要能把lib64/*、cudnn.h 文件解压出来就可以。
我按上述的说明安装一遍搞定,也祝大家安装一切顺利哈。