ubuntu16.04+GTX1660深度学习相关配置

1.前情提要

  • 本文使用cuda10.1,cuda8不行,cuda9没试过
  • cudnn要使用显卡以后发布的版本,GTX1660发布于20190222
  • 考虑到官网总是挂,可以在此下载cuda10.1,cudnn
  • cudnn的developer版本安装失败,runtime版本缺少头文件,所以安装runtime版本,使用developer版本是头文件,注意头文件的命名

2.编译caffe遇到的问题

  • 1、Check failed: error == cudaSuccess (8 vs. 0) invalid device function
    • 计算能力不匹配(如果驱动和软件匹配可能不会遇到这个问题)
    • 修改Makefile.config中的CUDA_ARCH,重新编译
    • -gencode arch=compute_62,code=[sm_62,compute_62]尚未试验的方法
    • 20210301更新:code=compute_70是关键,亲测60也行
    CUDA_ARCH := -gencode arch=compute_30,code=sm_30 \
               -gencode arch=compute_35,code=sm_35 \
               -gencode arch=compute_50,code=sm_50 \
               -gencode arch=compute_52,code=sm_52 \
               -gencode arch=compute_53,code=sm_53 \
               -gencode arch=compute_61,code=sm_61 \
               -gencode arch=compute_70,code=compute_70
    
  • 2、Check failed: status == CUDNN_STATUS_SUCCESS (4 vs. 0) CUDNN_STATUS_INTERNA
    • rm -rf ~/.nv
    • 驱动和软件不匹配
    • 显存不足,可以减小batch_size

3.知识点

  • 1、计算能力

CUDA SDK 8.0 support for compute capability 2.0 – 6.x (Fermi, Kepler, Maxwell, Pascal), last version with support for Compute Capability 2.x (Fermi)
CUDA SDK 7.5 support for compute capability 2.0 – 5.x (Fermi, Kepler, Maxwell)

你可能感兴趣的:(环境配置,updating,deeplearning)