RTX3070深度学习环境配置

RTX3070深度学习环境配置

  • 话不多说,我们开始了
    • cuda和cudnn版本
    • tensorflow-gpu和keras
    • 测试tensorflow-gpu是否安装成功
    • 遇到的一些问题
    • 最后附上代码运行图:

话不多说,我们开始了

ps:(深度学习环境配置真的很闹心)

cuda和cudnn版本

首先附上两张图,第一张图是控制面板的cuda版本,第二张图是命令的cuda版本。(两者会存在不一样的情况,可能你装过其他的cuda版本,一搬命令行为准。)
RTX3070深度学习环境配置_第1张图片
RTX3070深度学习环境配置_第2张图片

当然万恶的NVIDIA有时候会有千奇百怪的错误。比如:nvcc不是什么内部或者外部指令什么的。这个一般情况下是在"我的电脑"里的系统环境变量少或出错原因。(这里推荐在装cuda时采用精简的装法,可以省去很多步骤)这里自行查找环境是否有少或者错误的。
这是nvcc错误
说完了cuda,接着附上cudnn的下载链接,关于cudnn11的下载需要账户,这里方便大家下载。cudnn的和cuda的配置不用多说了,就是把cudnn里的文件一一复制到cuda对应的文件夹中。
链接:https://pan.baidu.com/s/16C0dcpVPC5Lub8m8Bet16A
提取码:0115

tensorflow-gpu和keras

首先附上一下我的环境配置。这里下载tensorflow-gpu=2.4.1要找镜像比较快,不然会显示timeout。
关于yaml的文件在这里:链接:https://pan.baidu.com/s/1Xd94wd1V_BIpBj4jgKx0tw
提取码:0115
RTX3070深度学习环境配置_第3张图片

测试tensorflow-gpu是否安装成功

import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'  
print('GPU', tf.test.is_gpu_available())
a = tf.constant(2.0)
b = tf.constant(4.0)
print(a + b)
#如果成功会显示如下:
>>>GPU True
>>>tf.Tensor(6.0, shape=(), dtype=float32)

遇到的一些问题

如果上述没有成功,哈哈恭喜你要继续阅读啦~要自行根据自身的错误进行解决,本人遇到的几个问题已经解决。
问题一: Could not find ‘cusolver64_10.dll‘ ,测试tensorflow-gpu,显示GPU False。
(链接:https://pan.baidu.com/s/1uTHJYKSoigExv0NUkuThpg 提取码:0115) 将这里的下载到对应的cusolver64_10dll放入C:\Windows\System32

问题二:错误
尝试了将C:\Program Files\NVIDIA GPU ComputingToolkit\CUDA\v11.1\extras\CUPTI\lib64中的cupti64_2020.2.0.dll复制到C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\bin。但是还是没有解决,有人说直接将cupti64_2020.2.0.dll改名字为cupti64_110.dll,虽然确实不报错,但是有点其他问题,训练几张图就卡住了。

问题三:tensorflow显存不足报错CUBLAS_STATUS_ALLOC_FAILED

#---------------------------------------------------#
#   防止报failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED
#---------------------------------------------------#
config = tf.compat.v1.ConfigProto() #tensorflow 1.x采用tf.ConfigProto()
config.gpu_options.allow_growth = True 
session = tf.compat.v1.Session(config=config) #tensorflow 1.x采用tf.Session()

问题四:关于tensorflow1.x的代码在tensorflow2.x环境下的报错:
tf.log----->tf.math.log
tf.to_init32(x)------>tf.cast(x,dtype=tf.int32)

最后附上代码运行图:

在这里插入图片描述
如有大佬已经解决了我的问题二或者有其他错误,请大家在留言区分享,大家共同进步!

你可能感兴趣的:(深度学习)