适用机型:intel和nvidia双显卡机型。
本文根据nvidia官方教程CUDA_Installation_Guide_Linux.pdf和cuDNN-Installation-Guide.pdf来操作。
由于目前tensorflow1.6版只支持到cuda9.0,还没支持到9.1,故安装9.0版。
安装nvidia驱动,有两种方式,分别为run文件安装和apt安装。
这里我们选择run文件安装方式(官网链接,选择最合适的驱动,我这里是390.25),因为apt方式会附带装上opengl导致黑屏及循环重启等问题。
【1】、屏蔽nouveau驱动:在/etc/modprobe.d/下新建一个文件blacklist-nouveau.conf,即:
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
在里面写入:
blacklist nouveau
options nouveau modeset=0
更新:
sudo update-initramfs -u
【2】、(此条可略过)如果源里有ppa:graphics-drivers,先移除该ppa(因为即使装上去,也会造成依赖不足而提醒你,看着不舒服)。
sudo add-apt-repository -rppa:graphics-drivers
同时进入 /etc/apt/sources.list.d 目录,将相应 ppa 源的保存文件删除。
最后更新一下:sudo apt-get update
sudo service lightdm stop
sudo chmod a+x NVIDIA-Linux-x86_64-390.25.run
sudo sh NVIDIA-Linux-x86_64-390.25.run –no-x-check –no-nouveau-check –no-opengl-files
–no-x-check安装驱动时关闭X服务
–no-nouveau-check安装驱动时禁用nouveau
–no-opengl-files只安装驱动文件,不安装OpenGL文件
接下来会有些报错信息:
(1):报错the distribution-providedpre-install script failed!不必理会,继续安装。
(2):提示32位兼容问题,不用理会。
(3):安装时选择不启用Xorg.conf服务
sudo service lightdm start
若是跳出下图这样,即安装成功,这个时候Intel集成显卡用于显示,nvidia显卡用于GPU计算:
输入安装命令:
sudo sh cuda_9.0.176_384.81_linux.run
(1)按q键跳过安装须知,输入accept接受。
(2)问你驱动装不装,输入n,选择不装,上面装过了。
(3)问你CUDA装不装,输入y,选择安装。回车键安装在默认位置(也可以自己选择位置安装)。
(4)问你要不要创建链接,输入y,选择创建。
(5)问你sample装不装,因为我们只是调用CUDA,不去写CUDA程序,输入n,选择不安装。
稍等片刻,就安装好了。
结果大概长这样:
(1)打开bashrc:
sudo vim ~/.bashrc
(2)添加路径,可以加注释以便识别:
# 随便写点啥表示你自己写的不是电脑加的,删除的时候好识别
export PATH="/usr/local/cuda-9.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-9.0/lib64:$LD_LIBRARY_PATH"
(3)使之生效:
source .bashrc
(4)可以用命令:echo $PATH 和 echo $LD_LIBRARY_PATH 查询是否添加成功。
(5)像cuda9.0和cuda9.1都是有补丁的,打补丁很快(和安装cuda一样,不过简化很多):
sudo sh cuda_9.0.176.1_linux.run
sudo sh cuda_9.0.176.2_linux.run
tar -xzvf cudnn-9.0-linux-x64-v7.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
到此,全部安装结束,接下来就可以安装tensorflow,caffe等深度学习框架了。
这里说下怎么删除,cudnn的话,直接remove掉就可以了。
cuda的话,输入以下命令即可:
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
nvidia驱动则输入:
nvidia-uninstall 或者 利用安装文件
sudo sh NVIDIA-Linux-x86_64-390.25.run –uninstall