GPU配置

之前下载的显卡驱动自带cuda,当时选择了比较新的版本cuda10.2,然而当我3月8日下载对应cudnn时发现cudnn只更新到了10.1。3月8日晚上更新了cudnn10.2.。。。。。。
所以我重新下载了cuda10.1和cudnn10.1
但是对于TensorFlow-gpu来说cuda10.1也太新了**(我在配置环境变量的时候少配置了CUDA\bin,这导致我在安装多款kuda时都出现了TensorFlow找不到库的情况)**(cuda10.1要匹配TensorFlow-gpu2,这个的api发生了很大变动,不适合初学者,(参考资料少))
我在网上搜到的全是对应cuda10.0的TensorFlow下载。我找不到对应cuda10.1的TensorFlow版本

现在要么重新下载cuda10.0和cuda10.0
要么寻找对应cuda10.1的TensorFlow版本
而我并没有看到这样的版本
后来我看到了TensorFlow-gpu2.1.0这个版本应该能和cuda10.1匹配可惜的是这个TensorFlow-gpu2.1.0由于太新可能和别的python库不匹配,所以爆出了很多奇奇怪怪的错误。。。。。
所以现在我尝试安装一个cuda10.0和cudnn10.0
由于卸载TensorFlow不知道会不会有什么残留,我卸载了之前安装的GPUpython环境,
由于不会安装多个cuda环境管理,所以卸载了CUDA10.1和cudnn10.1,清空注册表和残留文件。https://blog.csdn.net/u013066730/article/details/85054164
我又重新创建了Gpu的python环境。
在我重新安装CUDA的时候出现了Could not create file "C:\User\dell\AppData\local\Temp\CUDA\GFExperience\chrome_elf.dll的错误,我尝试用管理员权限运行,尝试重新下载驱动,发现NVIDA官网只提供最新驱动,真坑。。。。。
后来我把360关了。。。。。Could not create file "C:\User\dell\AppData\local\Temp\CUDA\GFExperience\chrome_elf.dll问题解决了
。。。。我已经够不容易了360你还给我添堵。。。。。以后出了什么问题一定要想想360关没有,还有实在不行重启试试,唉,说多了都是泪啊。。。

测试cuda有无安装成功用nvcc -V命令
需要设置相应的环境变量 ,这个设置之后要重启电脑才可以在任意路径下执行nvcc -V,否则要在C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\libnvvp 路径下执行nvcc -V

测试TensorFlow-gpu有无安装成功
GPU配置_第1张图片
GPU配置_第2张图片下载对应的TensorFlow-gpu
并不是所有源都有所有的库
我使用的是pip install tensorflow-gpu==2.0.0-alpha0 -i https://pypi.tuna.tsinghua.edu.cn/simple
有时候安装一次不成功需要多安装几次,原因可能是网络不稳定。
注意你的话是用不了清华镜像的,可能他觉得你不安全。。。。。。
安装10次都因网速慢中断了,我连的是WIFI,于是我换上了网线连接,网速虽然快联但是还是会连接超时

每次pip安装python包时,有些都很慢,改用国内源快了很多

一下国内源地址:

清华:https://pypi.tuna.tsinghua.edu.cn/simple

阿里云:http://mirrors.aliyun.com/pypi/simple/

中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/

华中理工大学:http://pypi.hustunique.com/

山东理工大学:http://pypi.sdutlinux.org/

豆瓣:http://pypi.douban.com/simple/

方式一:

pip install -i http:pypi.douban.com/simple/ django 

pypi 使用非 https 的镜像地址后无法使用,提示每次要加 --trusted-host url 来解决

pip install django -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

显卡-cuda-cudnn-TensorFlow要一一对应,否则将出问题
一个电脑可以安装多个cuda版本

因为网太慢所以我选择了自己下轮子安装,pip install 轮子
pip install的时候报错
GPU配置_第3张图片
解决办法:

找到“*******python3.6\Lib\site-packages\pip\compat”路径根据自己按照的python路径而定,打开“init.py”文件,修改第75行代码
GPU配置_第4张图片安装成功后测试tensorflow-gpu是否支持gpu
import tensorflow as tf
tf.test.is_gpu_available()这个命令处理起来特别慢,差不多10分钟没动,我强行退出后又执行了一遍
可以了
GPU配置_第5张图片
keras和TensorFlow对应关系
这个连接是版本对应出处!!!
https://docs.floydhub.com/guides/environments/
GPU配置_第6张图片我的TensorFlow已经安装成功,但是更大的问题紧随而来。TensorFlow的api变了很多,导致以前的 很多例子都不能用需要重写。
我找到了一个官方教程,新产品出来只能去学官方教程https://tensorflow.google.cn/tutorials/quickstart/beginner

这时候出来了另外一个问题,我在Gpu环境下打开jupyter notebook不能找到对应的库。
而在命令行下可以,用pycharm也可以(指定好环境的python.exe)。
估计是jupyter notebook需要另行设置。
几番周折之后发现是因为jupyter notebook是anaconda自带的,安装TensorFlow-gpu后需要在他的环境下再下载一个
jupyter notebook
命令:conda install ipython
conda install jupyter

导入包的时候又出现了一个新的问题

ImportError: Could not find 'cudart64_100.dll'. TensorFlow requires that this DLL be installed in a directory that is named in your %PATH% environment variable. Download and install CUDA 10.0 from this URL: https://developer.nvidia.com/cuda-90-download-archive

我看了看环境变量中少了C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin

你可能感兴趣的:(工具,GPU)