Ubuntu18.04 CUDA10.0 Tensorflow 2.0 键盘鼠标无响应问题解决

最近换了笔记本,配置了Windows和Ubuntu双系统,前面还简单记录了遇到的小问题:

https://blog.csdn.net/u012911347/article/details/103050857

这里安装cuda和tensorflow也遇到了新问题,和上一篇一样,不做太多详细记录,因为都是做了很多次的,只对新问题做一些简单记录。我之前对cuda和tensorflow的安装做过详细记录,地址如下:

http://www.beavermagic.com/doc/%E5%9B%BE%E5%83%8F%E9%A3%8E%E6%A0%BC%E5%8C%96%E5%88%9D%E6%8E%A2.pdf

下面开始记录这次遇到的问题。

tensorflow要求10.0的cuda,我一开始强迫症非要装最新的10.1的cuda,tensorflow跑起来找不到链接库,所以只能统统删除后再安装10.0。删除就是apt purge nvidia*以及cuda*,然后dpkg -l | grep -i cuda,将出现的都用dpkg --purge删除,同样对nvidia的也操作一遍。之后我又到/etc/apt/,将cuda有关的源也删除。再接着,到/usr/local下把有关cuda文件也删除。

接着还是按照官网的命令执行:

# Add NVIDIA package repositories
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/7fa2af80.pub
sudo apt-get update
wget http://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt install ./nvidia-machine-learning-repo-ubuntu1804_1.0.0-1_amd64.deb
sudo apt-get update

# Install NVIDIA driver
sudo apt-get install --no-install-recommends nvidia-driver-418
# Reboot. Check that GPUs are visible using the command: nvidia-smi

# Install development and runtime libraries (~4GB)
sudo apt-get install --no-install-recommends \
    cuda-10-0 \
    libcudnn7=7.6.2.24-1+cuda10.0  \
    libcudnn7-dev=7.6.2.24-1+cuda10.0


# Install TensorRT. Requires that libcudnn7 is installed above.
sudo apt-get install -y --no-install-recommends libnvinfer5=5.1.5-1+cuda10.0 \
    libnvinfer-dev=5.1.5-1+cuda10.0

cuda是10.0.130的,但是nvidia-drive我又忍不住装了435这个最高版本。实际上cuda安装说明上有版本要求,比如cuda10最低要求驱动版本不能低于多少,所以高一点无所谓,我就装最新的。cudnn版本没有装最新的,还是按照官方命令中的版本安装的,不过与实际最新版本基本没差别。

安装驱动重启后继续安装cuda等内容,之后重启开看到nvidia-smi了,然后nvidia-settings报错,就是网上那种无法加载的错误。因为我是ssh过去的,所以我回到笔记本屏幕前发现键盘鼠标无反应。有人提到键盘鼠标无反应是显卡驱动没装好,为此又来回装了两次cuda和驱动。

实际上,最大的问题就是,cuda和驱动都是好的,屏幕是有输出的,没崩溃,python写的tensorflow也可以用gpu运行。这就导致我思路走歪了,一直在修复cuda和驱动。在后来的搜索中,一个命令解决了该问题:

sudo apt install xserver-xorg-input-all

就是说安装和删除的操作中可能导致该组件被破坏,所以键盘鼠标无响应。幸亏我安装好系统后就设置了ssh,这种情况只能用ssh连接过去敲命令,重启,解决了该问题。

另外一点,修好了该问题,发现nvidia-settings在ssh(开了X11)的机器上还是同样的报错,以为没弄好。实际上,该命令不在ssh的机器上执行,完全没问题。所以有时候许多问题在ssh和本地执行的区别上,需要注意这一点。

你可能感兴趣的:(TensorFlow)