NVIDIA 2080Ti + NVIDIA Titan V 深度学习服务器安装配置过程

原有服务器状态:

  1. NVIDIA Titan V显卡
  2. 390版本的驱动
  3. cuda9.0
  4. 与cuda9.0对应的cudnn
  5. chainer 框架
  6. pytorch框架

安装过程:

驱动安装

1.下载2080Ti 驱动(本文所用430版本)
2.关闭进入字符终端(ctr+alt+F1),关闭显示服务,命令如下:

sudo service lightdm stop

3.进入驱动文件所在目录,更改权限,使其拥有运行权限:

sudo chmod u+x NVIDIA-Linux-x86_64-430.26.run

4.安装驱动:命令如下:

sudo ./NVIDIA-Linux-x86_64-430.26.run -no-opengl-files

注意,末尾命令必须加“–no-opengl-files”,否则会在登录时进入死循环
5.重启,此时会发现两个卡都可检测到,但是cuda版本必须为10.1,所以必须升级cuda到10.1版本

cuda10.1安装

1.到官网下载cuda10.1的linux系统的runfile文件。
2.进入字符终端(ctr+alt+F1),然后关掉显示程序

sudo service lightdm stop

3.进入到runfile文件所在目录,执行runfile:

sudo sh run_file_name.run

4.Do you accept the previously read EULA ?
accept/decline/quit :accept
Install NVIDIA Accelerated Graphics Driver for linux-x86-64 375.26?
写入accept
5.选中install 回车
6.重启
7.添加环境变量:sudo gedit /etc/profile在文件中末尾加入如下:
export PATH=/usr/local/cuda-10.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-10.1/lib64:$LD_LIBRARY_PAT
8.重启

cudnn安装

可参考文献

pytorch 安装

删除原先版本的,可在官网安装cuda10.0版本的

chainer 安装

首先删除原先版本的cupy,安装cupy-cuda10.1

你可能感兴趣的:(编程工具)