记录一些在配置tensorflow,pytorch踩过的坑

安装条件为2080Ti,win10,安装cuda,cudnn的过程,和相关资源,基本按照原文链接一文中的安装版本进行安装,即安装Cuda10.0.130,cudnn7.4.1,但是没有装VS,因为作者本人比较懒。。。目前还没有发现存在什么错误。
tf的安装完全按照上面链接中安装,没有发生错误
但是在使用conda命令安装torch的过程中,测试torch是否安装成功时,出现了“from torch._C import * ImportError: DLL load failed: 找不到指定的模块”,尝试了各种解决方法都无效,作者本人尝试过的方法如下:

  1. python降级成3.6. 5
  2. 升级numpy
  3. conda install numpy pyyaml mkl cmake cffi
  4. conda install python==3.6.7
  5. 将库文件torch的lib路径包括到系统变量中
  6. 将两个dll文件包含在环境变量中
    综上所述,更换python版本,和添加环境变量,升级numpy版本都没有解决问题。因而最好使用本地安装的方式。
    解决方法:
    使用本地安装的方法
    下载torch下载链接链接里的torch版本,然后使用离线安装。
# 切换到whl路径
pip install torch-1.0.0-cp36-cp36m-win_amd64.whl
pip install torchvision

#进入ipython验证
import torch
torch.__version
# '1.0.0'

安装时要带上路径。
原文链接

CUDA安装失败问题

首先安装CUDA过程中,遇到了CUDA安装失败的坑。
主要原因是电脑上没有VS,也懒得装,所以在安装CUDA时,直接选择不安装visual sudio的插件,解决方法在下面链接
原文链接
记录一些在配置tensorflow,pytorch踩过的坑_第1张图片

cudnn下载过慢

使用VPN下载

从手机传大文件到电脑

使用的手机下载cudnn,使用qq传输到我的电脑功能,点击选择文件按钮,在左下方有选择iPhone 文件选项,点击选择下载的cudnn,即可传输文件。

新建环境的问题

使用直接创建虚拟环境命令,会使生成的虚拟环境缺少base环境下的安装包,比如numpy scikit-image,sklearn
等可以使用克隆命令,直接复制base环境,再安装缺少的包。
复制方法:
原文链接

python版本与tf,torch兼容问题

在anaconda5.3版本中,python默认版本为3.8,这样会使安装的torch和tf版本过高。出现与cuda,cudnn不匹配的问题

torch,tf安装成功测试

tensorflow:



#初始化一个Tensorflow的常量:Hello Google Tensorflow! 字符串,并命名为greeting作为一个计算模块
greeting = tf.constant('Hello Google Tensorflow!')
#启动一个会话
sess = tf.Session()
#使用会话执行greeting计算模块
result = sess.run(greeting)
print(result)
sess.close()

原文

torch:

b'Hello Google Tensorflow!'

安装成功

import torch
import torchvision
print(torch.cuda.is_available())
True

安装成功
原文链接
2.0版本gpu安装成功测试:

import tensorflow as tf
import os

os.environ['TF_CPP_MIN_LOG_LEVEL']='2'

a = tf.constant(1.)
b = tf.constant(2.)
print(a+b)

print('GPU:', tf.test.is_gpu_available())436

原文

你可能感兴趣的:(深度学习环境配置,python,tensorflow,pytorch,深度学习)