ubuntu18.04显卡驱动安装+cuda+cudnn+TensorFlow

Ubuntu18.04环境服务器配置显卡驱动+cuda+cudnn+TensorFlow

近日实验室新来了一台服务器,两个TITAN RTX用来跑深度学习,其中配置环境的苦差事交给了我。

系统重装

  • 创建一个linux系统启动盘,用来重装系统,Unetbootin和Uiso都可以,我用的是Unetbootin,把想要安装的镜像按照要求写入U盘即可。
    注意: 格式化的时候我一开始随便格式化的结果用不了,后面格式化的时候选择Fat32就可以使用了。
  • 插上U盘,选择启动顺序进入U盘启动然后按着步骤走就行了。

显卡驱动安装

建议先装上SSH服务!!!

  • 这个时候我们已经得到了一个全新的Linux系统,但是现在我们还没有安装我们的显卡驱动,所以我们还无法使用我们的独立显卡。

  • 那么首先我们需要知道我们的显卡型号然后现在对应的驱动,如果你知道你可以直接下载,如果不知道可以用以下命令下载

lspci | grep VGA

然后我们就可以得到如下图所示的一些信息
显卡信息
这个时候我们可以看到上图显示出来了两块独立显卡的信息,但是都只是显卡的编号,这个时候我们需要借助一些网站帮助我们获得显卡的具体信息。
显卡信息查询网站(http://pci-ids.ucw.cz/mods/PC/10de?action=help?help=pci)
通过上述网站我们可以将得到的十六进制的编号输入得到我们的显卡信息
接来下就是按照博客进行操作了
Linux显卡驱动安装的正确姿势(https://blog.csdn.net/wf19930209/article/details/81877822)

但是在安装的过程中遇到了一些问题

  • 按照上述操作进行安装,我选择了455的驱动进行安装,nvidia-smi能够正常显示显卡信息,就像博客中所示的一样,这个时候reboot重启出现了黑屏的情况,于是我参照下面博客的方式进行了解决
    重启黑屏解决方式(https://blog.csdn.net/qq_26564783/article/details/92839472)

我更惨的是中途有一段时间鼠标和键盘都失灵了,先重装系统都不行。最后的解决方式是重新插拔鼠标键盘,后面鼠标键盘就能用了。

这里还有一种解决方式是通过ssh远程连接到你的服务器,删除刚刚下载的驱动,然后进行重启,这样也可以解决黑屏问题。

  • 尽管解决了黑屏的问题但是我的显卡驱动还是一直没装上,我尝试过440,450,455的驱动版本,但是只有一次450的版本下重启成功了,但是这个服务器变得特别的卡顿,并且nvidia-settings出现问题,因此我还是选择了卸载。

版本答案

通过一系列操作我已经放弃了手动安装驱动的打算,准备尝试其他看起来不那么好用的驱动安装,结果没想到真香。
首先我们通过

ubuntu-drivers devices

命令查看系统推荐的驱动,然后我们打开软件和更新,里面有一个附加驱动。我发现正好有系统推荐的驱动,就点击了应用此驱动,然后就安装成功了。nvidia-smi正常,重启正常。真香!谁说自带的不好用的。
ubuntu18.04显卡驱动安装+cuda+cudnn+TensorFlow_第1张图片

cuda+cudnn+tensorflow安装

  • 这里我是下载了Anaconda,创建了TensorFlow的虚拟环境然后直接conda install 把这些东西打包安装的,因为conda会自动检测各个包所需要的依赖,然后把他们都下下来。其中有一些网络不好下不下来的包可以通过清华镜像源下载下来然后通过conda进行一个线下的安装。

至此就把所有的环境给搭配好了,然后把机械硬盘给挂载上去,就欧克了。

  • 其中硬盘大小超过了2T就不能使用fdisk进行操作,而需要使用parted

PS:想请教上图所示的450-server和我自己下载的显卡驱动450有区别吗,为什么下载的装不上???

以上

你可能感兴趣的:(linux,ubuntu,深度学习)