(黑屏警告)ubuntu18.04+cuda10.1+cudnn7.5的血汗泪——桌面版nvidia驱动兼容问题导致黑屏

标签: 黑屏 ubuntu18.04 cuda10.1 gdm3 nvidia


前言

    本文用于记录作者在 ubuntu18.04 安装 GPU(nvidia显卡)深度学习环境 cuda10.1 的血汗史。
    本文都是个人部署的经验,直接记录成功的方法,中间很多坑就不加以描述了。

开发环境一览

  • CPU:Intel® Core™ i7-8700 CPU @ 3.20GHz
  • GPU:Quadro P1000/PCIe/SSE2
  • OS: UBUNTU 18.04.1LTS 64位

驱动选型

PS:
安装cuda的话,是无需安装nvidia的驱动的,cuda会自带驱动。
ubuntu18.04只支持cuda10以上的版本(2019/4/17)

下载地址:
https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=runfilelocal

禁用nouveau

1. 打开blacklist.conf(这是一个开源驱动不支持深度学习)
sudo vim /etc/modprobe.d/blacklist.conf

2. 在最后添加
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

3. 禁用nouveau内核模块
echo options nouveau modeset=0
sudo update-initramfs -u

4. 重启
reboot

5. 如果运行如下指令没用打印出任何内容, 恭喜你, 禁用nouveau成功了.
lsmod | grep nouveau

安装驱动

首先一个问题:ubuntu18.04自带的gdm3界面管理器是与nvidia的驱动冲突的,直接安装的后果是在登陆界面进入用户界面时会卡死。

解决方案:(没有开始卡住的同学请自行忽略)
如果已经安装了的朋友已经卡死了没关系,只要重启,在登陆界面使用Ctrl+Alt+F1+F2就可以进到tui命令行界面,再输入账户密码登陆后按Ctrl+Alt+F1


终极解决方案
更换gdm3lightdm是的!就是16.04的用户界面(有经验的同学可以下载xdm自己挑)

sudo apt-get install lightdm (xdm)
sudo dpkg-reconfigure lightdm (不一定需要这个,但是使用就会进入界面)

接下来安装就很简单了,只要按照提示全选就可以了。

如果提示查看失败,查看log,大概是驱动的问题
1.禁用nouveau没有成功
2.其他版本的驱动有残留,可尝试
sudo apt-get remove --purge nvidia*

搞定就用经典命令nvidia-smi试试吧

安装cudnn7.5

cuda10.01只支持cudnn7.5,进到页面需要登陆一下才能下载
https://developer.nvidia.com/rdp/cudnn-download

下载四个包:

  • cudnn-10.1-linux-x64-v7.5.0.56.tgz
  • libcudnn7_7.5.0.56-1+cuda10.1_amd64.deb
  • libcudnn7-dev_7.5.0.56-1+cuda10.1_amd64.deb
  • libcudnn7-doc_7.5.0.56-1+cuda10.1_amd64.deb

然后解压tgz包, 复制文件到cuda环境, 接着安装deb包.

tar -zxvf cudnn-10.1-linux-x64-v7.5.0.56.tgz
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

sudo dpkg -i libcudnn7_7.5.0.56-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-dev_7.5.0.56-1+cuda10.1_amd64.deb
sudo dpkg -i libcudnn7-doc_7.5.0.56-1+cuda10.1_amd64.deb

这样就完成安装了, 用个小栗子来测试下吧

cp -r /usr/src/cudnn_samples_v7/ ~
cd ~/cudnn_samples_v7/mnistCUDNN
make clean && make
./mnistCUDNN

输出 test passed! 就大功告成了


2019年4月29日更新 !!!千万不要升级内核!!!!

一旦更新内核就完蛋了!!!!
先是画屏,重启就黑屏无输出
谨慎谨慎!!!!!

参考文章

  1. 《Ubuntu 18.04: gdm3 does not switch to graphics after update》
    https://bugs.launchpad.net/ubuntu/+source/gdm3/+bug/1779476

  2. 《Ubuntu18.04LTS下cuda10.0+cudnn7.5+TensorFlow1.13环境搭建》
    https://juejin.im/post/5c83abb4f265da2da67c6173

  3. 《ubuntu18.04+Pytorch+cuda10.1+cuDNN配置踩坑记》
    https://www.jianshu.com/p/3d56adca6829

你可能感兴趣的:((黑屏警告)ubuntu18.04+cuda10.1+cudnn7.5的血汗泪——桌面版nvidia驱动兼容问题导致黑屏)