Win10 RTX3070 安装tensorflow1.15失败经历

Win10 RTX3070 安装tensorflow1.15失败经历

    • 安装tf1.15的原因
    • 使用cuda10
    • 使用cuda11.1
    • 下载tf1.15之前先安装cudatoolkit11
    • 进一步的打算

安装tf1.15的原因

NLP小白,意外的了解到全球人工智能技术创新大赛想要学习一些新的知识,比赛中有大佬开源的baseline使用的环境是tensorflow1.15,因此我就开始了曲折的环境配置之路。

使用cuda10

首先意识到的是tensorflow1.15需要的是cuda10,因此我安装了cuda10。全部安装完成调用tf也不会报错,看似十分完美,但是在真正跑代码时会出现无法从CUP–GUP这样的错误(忘记截屏了)。

使用cuda11.1

在意识到30系显卡只支持cuda11.0以上版本时,又安装了cuda11.1,但是这时还是不能使用GUP跑代码。因为前面下载tf1.15的时候使用conda install tensorflow-gup=1.15下载的时候里面已经包括cudatoolkit10了。

下载tf1.15之前先安装cudatoolkit11

经过一段时间的百度搜索,我查到是可以先安装cudatoolkit11,然后在安装tf1.15

conda install cudatoolkit=11

然后使用

pip install tensorflow-gup==1.15

安装完了之后开始报另一种错误cudart64_100.dll等dll文件不存在。然后查到可以把cudart64_10.dll等之类的文件名直接改成cudart64_100.dll之类的文件。
然后使用

import tensorflow as tf
print(tf.test.is_gpu_available())

查看tf是否可用,确实可以返回true。但是在运行大佬的baseline时又会出现另一种错误:
Win10 RTX3070 安装tensorflow1.15失败经历_第1张图片继续查有大佬说是显存不够,,虽然我的显存只有8G但是应该不至于不够吧(模型是bert-base)。
这里我没有查到合适的解决办法,我也有试过用CPU跑,但是真的太慢了。

进一步的打算

准备装Ubuntu18.04试试,看到有大佬用Ubuntu好像成功使用RTX30系列了。

可能最后真的是我的显存不够,我写的可能也有很多的错误,我十分希望有大佬可以指出我的错误,这样我就不用去折腾Ubuntu了。

参考比较多,给出部分链接:

[1]:https://blog.csdn.net/wu496963386/article/details/109583045
[2]:https://blog.csdn.net/weixin_43896241/article/details/108979744?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-3.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-3.control

你可能感兴趣的:(环境配置问题,深度学习,tensorflow,cuda)