Linux Anaconda虚拟环境安装tensorflow-gpu

遇见的Bug

  • 网络连接错误,断网了

Linux Anaconda虚拟环境安装tensorflow-gpu_第1张图片

  • 运行nvidia-smi报错:failed to initialize nvml driver/library version mismatch ubuntu
    解决方法:在cuda正常安装的前提下,重启电脑。
  • 检查当前cuda版本
    -在这里插入图片描述
  • 安装指定版本的tensorflow-gpu:
    pip install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu #手动指定源
    #若要指定版本 将 tensorflow-gpu 改为 tensorflow-gpu ==1.11
  • 安装不同版本的tensorflow_gpu可能会需要指定版本的CUDA,我在使用tensorflow-gpu 1.10版本时,安装的cuda版本是10.0。这时import tensorflow总是会报错:cudnnso.9 file cannot find。此时应该是安装的cuda版本和tensorflow-gpu不对应。
    转载:CUDA、tensorflow与cuDNN的版本匹配问题
  • 解决Driver/library version mismatch
    NVIDIA驱动问题解决方案:Failed to initialize NVML: driver/library version mismatch
    如果cuda和cudnn是安装完成,且正常使用的。请重启电脑,再试一次。
  • ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
    问题:找不到cuda9.0的版本
    出现该错误的主要原因:cuda未安装或者cuda的版本有问题
    本机安装的tensorflow-gpu的版本和cuda或者cudnn无法对应
    查看cuda版本的命令: cat /usr/local/cuda/version.txt
    查看cudnn 版本的命令:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
  • Process finished with exit code 137 (interrupted by signal 9: SIGKILL)
    问题:发生了内存不足的问题,如果是在tensorflow中,可以选择小的batch_size,或者不要把一整个大的文件一次性读到内存里。
    查看GPU使用情况:nvidia-smi

参考链接:

  • Tensorflow-gpu前人基础上继续踩坑
  • Tensorflow GPU install on ubuntu 16.04

你可能感兴趣的:(Linux深度学习,深度学习,Linux,anaconda,tensorflow-gpu)