ubuntu16.04安装cuda和pytorch时需要注意的坑

在ubuntu16.04上安装cuda和pytorch时,一不小心就会出现意想不到的问题,比如屏幕分辨率突然变的很小且不可调、在登录界面一直循环登录不了、pytorch调用cuda失败等问题。具体解决方案已经整理发布,这篇文章再来总结一下需要考虑的细节。

问题总结:

  1. 显卡与驱动的版本要匹配,切忌根据nvidia-smi命令所显示的信息来判断所需的cuda版本
    ubuntu16.04安装cuda和pytorch时需要注意的坑_第1张图片
    得到图片中的信息后,我立马下载安装了cuda11.2,结果出现了屏幕分辨率降低、在登录界面循环的问题。
    问题关键:
    cuda11.2与nvidia460.73.01驱动不匹配,导致无法正常登录。
    解决方法
    (1)先根据显卡型号找到相应的驱动,具体步骤可参考这篇博客:https://blog.csdn.net/j_l_sheng/article/details/123504431?spm=1001.2014.3001.5502。
    https://blog.csdn.net/j_l_sheng/article/details/123481467
    (2)卸载原有驱动,安装合适版本的驱动。具体步骤可参考这篇博客:https://blog.csdn.net/j_l_sheng/article/details/123481467
    我的pytorch版本是1.9.1

  2. cuda与驱动版本要匹配
    第一步已经安装了驱动,接下来就要安装cuda,一定要选择合适版本的cuda,可参考下图:
    ubuntu16.04安装cuda和pytorch时需要注意的坑_第2张图片
    图片来自该网页:https://docs.nvidia.com/#nvidia-cuda-toolkit

  3. 显卡与cuda版本要匹配,切忌安装任意版本的cuda
    我安装cuda10.2了后报错:
    ubuntu16.04安装cuda和pytorch时需要注意的坑_第3张图片
    上网搜索才发现是显卡和cuda版本不匹配,
    我的显卡信息:
    在这里插入图片描述
    问题关键
    RTX 3090的算力是8.6,但是当前的PyTorch依赖的CUDA版本支持的算力只有3.7、5.0、6.0、7.0。算力7.0的显卡可以在支持最高算力7.5的CUDA版本下运行,但是算力7.5的显卡不可以在支持最高算力7.0的CUDA版本下运行。也就是说,当前的cuda不能支持3090的算力,所以升级成更高版本的cuda以及相应的pytorch即可。
    原文链接
    https://blog.csdn.net/Paramagnetism/article/details/115221478
    解决方法
    在安装cuda之前,需找到能够支持当前算力的cuda再安装。cuda具体的安装步骤可参考:https://blog.csdn.net/j_l_sheng/article/details/123504819

  4. pytorch和cuda的版本要匹配
    (1)pytorch和cuda版本的对应可以参考pytorch官网:https://pytorch.org/get-started/previous-versions/
    我选择的安装命令截图:
    在这里插入图片描述
    (2)pytorch1.9.1和cuda10.2报错:
    在这里插入图片描述
    查看之后才发现安装的pytorch是cpu版本的
    在这里插入图片描述
    解决方法
    安装完cuda后,卸载重新安装GPU版本的pytorch,pytorch的安装过程可以参考这篇博客:https://blog.csdn.net/j_l_sheng/article/details/123505938安装完成后一定要检查pytorch是CPU版本的还是GPU版本的。
    最终版本:
    GPU版本的pytorch1.9.0
    ubuntu16.04安装cuda和pytorch时需要注意的坑_第4张图片
    cuda11.1
    在这里插入图片描述
    GPU版本的pytorch 1.9.0+cuda11.1
    在这里插入图片描述

你可能感兴趣的:(pytorch,深度学习,人工智能)