【TensorFlow安装踩坑记录】

TensorFlow安装踩坑记录

  • 第一步,切换服务器cuda版本
  • 第二步,conda安装tensorflow

记录一下最近安装Tensorflow v1时遇到的问题和解决办法

第一步,切换服务器cuda版本

首先我想安装tensorflow 1.13.1,兼容的cuda版本是10.0,但我服务器上的cuda版本是11,所以研究了一下,参考以下两篇博文,切换了服务器上cuda runtime版本,同时继续保持cuda driver版本为11。
https://www.jianshu.com/p/eb5335708f2a
https://cloud.tencent.com/developer/article/2000757
这一步做完后,我可以正常import tensorflow并创建placeholder, variable了。

第二步,conda安装tensorflow

但是在运行模型的时候,tensorflow报错,

Failed to get convolution algorithm. This is probably because cuDNN failed to initialize,

按照以下这篇排查后,最后还是版本兼容问题
https://stackoverflow.com/questions/53698035/failed-to-get-convolution-algorithm-this-is-probably-because-cudnn-failed-to-in

tensorflow查了一下,cuDNN需要7.4版本,而我安装的cuda 10.0对应的cuDNN是7.3
https://www.tensorflow.org/install/source#tested_build_configurations
【TensorFlow安装踩坑记录】_第1张图片

不想再重新花费时间去安装cuda,又搜了一下,找到一个比较简单的解决方法,就是使用conda安装tensorflow,conda会自动配置对应版本号的cuda和cudnn

conda install tensorflow-gpu=1.13.1

查看安装结果,cudnn版本7.6,至此,模型终于正常跑起来了
在这里插入图片描述

你可能感兴趣的:(tensorflow,tensorflow,python,深度学习)