RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置

RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置

  • 一、驱动及cuda、cudnn的安装
  • 二、pytorch的安装
    • 1. 源码编译安装
    • 2. pip方式安装
  • 三、TensorFlow的安装
    • ※ nvidia-tensorflow==1.15.4+nv20.10版本的安装
      • 1. 安装 TensorFlow wheel的索引
      • 2. 安装TensorFlow
      • 3. 安装nvidia-TensorFlow对应的依赖包
      • 4. TensorFlow测试
  • 四、后记
  • 参考

有幸公司给购买了RTX3080,可以上手试试,但是发现环境的配置是个头大的问题,且由于项目的关系,至今TensorFlow的版本至今仍是1.x的版本,所以得考虑TensorFlow的具体版本对应,还有pytorch的适配。最终经过各方资料的查找与尝试,终于安装完成,安装好的驱动及各版本如下。
Ubuntu:18.04.5
cuda:11.1
cudnn:8.0.4.30
TensorFlow:1.15.4
pytorch:1.7.0

首先分享安装所有库的网盘链接:
网址:https://pan.baidu.com/s/1j6XSG8oyBX6lzHzka7xr3Q;
提取密码:5tgm

一、驱动及cuda、cudnn的安装

RTX3080采用了新的Ampere架构GA102-200,那么显卡驱动也必然是需要最新的,可以参考cuda与驱动对应的关系:
RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第1张图片

我们安装的是455.23.04版本,CUDA是11.1版本,cudnn是8.0.4.30版本,具体的安装方法可参考一下网址。
ubuntu16.04系统run方式安装nvidia显卡驱动
Ubuntu16.04下cuda和cudnn的卸载和升级
方法都是大同小异,最后输入nvidia-smi确认驱动是否安装好,nvcc --version确认是否安装好cuda。
RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第2张图片
RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第3张图片

二、pytorch的安装

1. 源码编译安装

pytorch的安装相对简单一些,可以选择源码编译安装,也可以选择直接pip的方式安装。由于我的网络实在不好,每次在拉源码的时候都会报错,就放弃了。。依赖库真的太难下载了。具体的源码编译方式可参考下面的方法。
RTX3080/RTX3090驱动安装CUDA11.1+CUDNN8.0.4.30+pytorch源码编译
Pytorch源码编译简明指南

2. pip方式安装

进入pytorch官网,可以看到下载方式,命令:

pip install torch==1.7.0+cu110 torchvision==0.8.1+cu110 torchaudio===0.7.0 -f https://download.pytorch.org/whl/torch_stable.html

RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第4张图片
也可以进入下载的网站,直接点击下载,然后再通过安装whl的方式进行安装pytorch。
RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第5张图片
安装完的结果如下图。
在这里插入图片描述

安装完再进行测试,版本以及cuda是否可用。
RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第6张图片

三、TensorFlow的安装

如果没有版本的硬性要求,甚至可以直接通过安装tf-nightly的版本,那就很方便了,直接通过命令:

pip install tf-nightly-gpu

就可以安装好了,对应版本是2.4+。

※ nvidia-tensorflow==1.15.4+nv20.10版本的安装

经过大量资料的查找,得知TensorFlow官方是已经放弃了1.x的版本更新,那么还有没有还在更新的TensorFlow1.x版本呢?答案是有,终于被我们找到了,参考Accelerating TensorFlow on NVIDIA A100 GPUs。这是nvdia官方对也是安培架构的A100 GPU进行编译的TensorFlow 1.15版本,进行了简单介绍以及安装方法,这对同样是安培架构的3080也是通用的。

具体安装方法简介如下:

1. 安装 TensorFlow wheel的索引

 pip install nvidia-pyindex

2. 安装TensorFlow

pip install nvidia-tensorflow

大概率是会安装报错,有许多个依赖包,且有些包比较大,如果是不能科学上网的话,很难一次性安装成功。那么优先安装依赖包。

3. 安装nvidia-TensorFlow对应的依赖包

具体依赖包有下:

nvidia-cublas           11.2.1.74
nvidia-cuda-cupti       11.1.69
nvidia-cuda-nvcc        11.1.74
nvidia-cuda-nvrtc       11.1.74
nvidia-cuda-runtime     11.1.74
nvidia-cudnn            8.0.4.30
nvidia-cufft            10.3.0.74
nvidia-curand           10.2.2.74
nvidia-cusolver         11.0.0.74
nvidia-cusparse         11.2.0.275
nvidia-dali-cuda110     0.26.0
nvidia-dali-nvtf-plugin 0.26.0+nv20.10
nvidia-nccl             2.7.8
nvidia-pyindex          1.0.5
nvidia-tensorboard      1.15.0+nv20.10
nvidia-tensorrt         7.2.1.4
tensorflow-estimator    1.15.1

且依赖包的版本也需要严格对应(以上版本都是对应TensorFlow1.15.4+nv20.10的),否则会报错无法安装。最后安装nvidia-tensorflow,可以得到版本是1.15.4+nv20.10。安装结果如下图。
RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第7张图片

考虑到大家都不容易下载,我已经把依赖包下载下来并传到网盘了,大家可以自行下载。依赖包下载地址(提取密码5tgm)。有一些包有安装的先后顺序,大家在尝试之后就知道了,就不详细叙述了(也忘记了0.0)。

4. TensorFlow测试

最后安装完了TensorFlow,尝试一下是否可用。
RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第8张图片
RTX3080+Ubuntu18.04+cuda11.1+cudnn8.0.4+TensorFlow1.15.4+PyTorch1.7.0环境配置_第9张图片
可以看到TensorFlow已经安装成功,且可以识别到显卡并调用cudnn了。

四、后记

后面尝试训练并推理使用,发现显卡已经是可用的状态了,且性能真的可以比得上rtx2080ti,在训练crnn时发现训练速度甚至能提升20%,推理时与2080ti速度差不多,但价格便宜近一半,确实是性价比很高的卡。

参考

【1】: NVIDIA CUDA Toolkit Release Notes
【2】: RTX3080/RTX3090驱动安装CUDA11.1+CUDNN8.0.4.30+pytorch源码编译
【3】: 手起刀落 RTX 3080 - ResNet50 Benchmark Test
【4】: cuDNN Release 8.x.x
【5】: Accelerating TensorFlow on NVIDIA A100 GPUs

你可能感兴趣的:(深度学习,深度学习,tensorflow,pytorch,cuda)