ubuntu18.04上搭建nvidia的digits(深度学习工作流)

环境

  • ubuntu18.04
  • 显卡gtx960m

搭建步骤

  • 安装显卡驱动
  • 安装对应cuda
  • 安装常规docker
  • 安装nvidia-docker(已经支持18.04)github仓库

    • github上讲述了安装流程,我自己做了镜像加速,这个流程可能会覆盖配置文件
    • 在流程中遇到了一个问题,nvidia-docker2有依赖于18.03的dockerce,而之前图省事使用简单的docker.io一次到位,但从ubuntu仓库中拉取的版本较低。教程 ps:现在stable版本已经出来了!


    下列软件包有未满足的依赖关系:
    nvidia-docker2 : 依赖: docker-ce (= 18.03.1~ce~3-0~ubuntu) 但无法安装它 或
    docker-ee (= 18.03.1~ee~3-0~ubuntu) 但无法安装它
    E: 无法修正错误,因为您要求某些软件包保持现状,就是它们破坏了软件包间的依赖关系。

  • 下载深度学习框架镜像(tensorflow、caffe等)

  • docker镜像

    cuda:https://store.docker.com/community/images/nvidia/cuda
    caffe:https://store.docker.com/community/images/bvlc/caffe
    tensorflow: https://store.docker.com/community/images/tensorflow/tensorflow
    图形化管理界面:https://store.docker.com/community/images/portainer/portainer
    参考文章中有提到,现在caffe和tensorflow的gpu版本的容器中都含有cuda toolkit

    使用步骤

    • 启动镜像的时候要使用nvidia-docker 替换原有docker这个词语来执行命令。例如:nvidia-docker pull
    • 未完待续

    参考文献

    • https://blog.skyaid-service.org/2017/11/16/nvidia-docker/
    • https://blog.csdn.net/zziahgf/article/details/72578273

    你可能感兴趣的:(深度学习,nvidia,环境搭建)