深度学习入门配置

目的:

        入门深度学习,配置环境

参考教程:

【包教包会】Anaconda+Cuda+Cudnn+TensorFlow+Pytorch+Pycharm+Win10深度学习环境配置与卸载,看这一个就够了_哔哩哔哩_bilibiliw

 问题:

        按照上述教程配置,遇到了一些问题,解决如下:

        a) CUDA默认版本问题。在系统安装了多个CUDA版本的情况下,在cmd中用nvcc -V查询到CUDA版本是最后安装的版本。(经过测试,发现新安装的程序环境变量放在path最前)。本次安装直接删除了系统环境变量path中的CUDA6.5路径后,nvcc -V查询到的版本变成了9.2(由于其他原因,后重新安装了10.1)。不太确定nvcc -V查询到结果和TensorFlow调用的版本是否一致,也许不需要修改?

        深度学习入门配置_第1张图片

        b) pip install tensorflow_gpu==2.1.0 -i https://pypi.douban.com/simple --trusted-host pypi.douban.com   提示找不到源,换成2.2.0执行成功。和下面一样,也是版本不匹配的问题

        c) 在CUDA9.2,Python3.8下,安装TensorFlow GPU 2.2.0成功后,运行测试程序,报错,提示缺少“cudart64_101.dll”等库,查资料发现,2.2.0版本的TensorFlow需要10.1的CUDA支持。首先想到:安装低级版本的TensorFlow,尝试切换的1.8.0(网上有人用TensorFlow1.8.0+CUDA9.2成功过),失败,提示找不到相关的源。查TensorFlow官网,发现TensorFlow、CUDA、Python以及cudnn库,这几个的版本都有比较严格的版本匹配要求,若是安装了3.8的Python,CUDA只能是10.1以上。所以,问题解决方式:(1) 降低Python版本,具体操作方法这里不展开;(2) 升级CUDA以及可能需要重新下载cuDNN库。本次配置选择了升级CUDA到10.1。(安装CUDA10.1的时候,只需要安装关键部分)。

        TensorFlow官网给出的版本信息:

使用 pip 安装 TensorFlow

深度学习入门配置_第2张图片

深度学习入门配置_第3张图片

        d) 测试,CUDA驱动与CUDA运行库不匹配。

        解决:CUDA驱动与库版本问题,官网有说:

Release Notes :: CUDA Toolkit Documentation

深度学习入门配置_第4张图片

原来的376.51明显不行

深度学习入门配置_第5张图片

升级到:

 问题解决。

成功运行测试程序:

import tensorflow as tf
import os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'  # 不显示等级2以下的提示信息

print('GPU', tf.test.is_gpu_available())

a = tf.constant(8.0)
b = tf.constant(4.0)
print(a + b)

 深度学习入门配置_第6张图片

 

总结:

        a) 找一个比较新的、靠谱的、点击率和播放搞的教程;

        b) 遇到问题时,不着急,一个一个解决,最重要的是,在解决的过程中,思考为什么,总结经验。

        c) 搞清楚各个软件/工具/驱动版本之间的功能依赖、版本依赖关系。例如,所配置版本的TensorFlow的需要哪个版本的CUDA、cuDNN支持,又应该需要哪个版本的Python。另外注意CUDA运行库和驱动的版本对应关系。

        d) 懂得一定的硬件知识。

你可能感兴趣的:(深度学习,深度学习,python,cuda,tensorflow)