win11动手学深度学习安装过程(GPU版)( CUDA Anaconda Mxnet )

win11,动手学深度学习安装过程(GPU版)( CUDA / Anaconda / Mxnet )(备忘)


一、检查及安装CUDA

首先检查显卡支持的cuda:

win11动手学深度学习安装过程(GPU版)( CUDA Anaconda Mxnet )_第1张图片

直接搜索NVIDIA,选择NVIDIA控制中心,

win11动手学深度学习安装过程(GPU版)( CUDA Anaconda Mxnet )_第2张图片

win11动手学深度学习安装过程(GPU版)( CUDA Anaconda Mxnet )_第3张图片

可以看到NVIDIA支持的最高CUDA

然后是安装

https://developer.nvidia.com/cuda-toolkit-archive

选择需要的版本,我这里选择的是v10.1

注:

我的显卡是GeForce RTX3060,查找后支持的Cuda最高版本是cuda11.4

因为网上能找到的大部分教程都是cuda10.0或cuda10.1,所以这里下载了cuda10.1

在多次对mxnet、pytorch等安装的尝试中经常会出现的一个问题就是版本的问题,由此导致的办错也是千变万化,所以作为初学者,我现在很少尝试安装最新版的各种驱动和程序,参考最近的文章和教程选择使用率更高的一个可能更为稳妥。

二*、复制Nvidia-smi文件

网址放在下方:

https://download.csdn.net/download/qq_41185868/41982058

放进

C:\Program Files\NVIDIA Corporation

这个地址下面就行,大部分人应该是有NVSIM这个文件夹的,我这里没有,不知道是win11的问题还是什么原因。

三、安装Anaconda

首先是网址:

Index of / (anaconda.com)

win11动手学深度学习安装过程(GPU版)( CUDA Anaconda Mxnet )_第4张图片

64位windows系统对应的python3.6的anaconda是这个。

注意最好直接安装到D:/python,至少也要记下来安装地址。

注:

安装Anaconda3 5.2.0,对应的是python3.6!

尝试过使用Anaconda最新版,对应的是python3.9,之后安装mxnet的过程中numpy报错的一塌糊涂,最后放弃寻找错误原因改用了Anaconda3 5.2.0,一切顺利,不太了解是什么原因,具体遇到过的报错内容我会贴在附录里,希望有一点借鉴价值。

然后配置环境变量,一般来说安装Anaconda后会直接配置好环境变量。

直接搜索环境变量
win11动手学深度学习安装过程(GPU版)( CUDA Anaconda Mxnet )_第5张图片

看看系统里有没有,没有的话新建,把地址复制进去


:安装多个python环境(初次安装不要看)*

在上述步骤中,我没有删除之前安装的python3.9版本的Anaconda而是在磁盘的另一位置安装了另一个python3.6的Anaconda

个人认为可能存在的问题和日后使用python时的注意事项:

  1. 以后在面对特定需求的python工作的时候尽量建立一个对应的环境,否则很可能pip install xxx之后只有上帝知道我安装到哪去了
  2. 环境变量中存在相似的两条路径,用指令,如python --version检查python版本时只能查找到第一个安装的3.9版本,类似的检查info是=时不准确的情况还会多次出现。

四、检查前面步骤&pip下载换源

  1. 检查python安装

    打开刚才下载的Anaconda的命令框
    在这里插入图片描述

    输入

    python --version

​ [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9Pf4dXuc-1646121022810)(C:\Users\贾玮钰\AppData\Roaming\Typora\typora-user-images\image-20220301140355505.png)]

​ 可以检查安装的python版本

  1. 检查cuda

    输入

    nvidia-smi

    可以检查nvidia信息(这里的CUDA version不是你刚才安装的版本)

  2. 换源

    https://blog.csdn.net/weixin_39956356/article/details/106491107?spm=1001.2101.3001.6650.3&utm_medium=distribute.pc_relevant.none-task-blog-2defaultCTRLISTRate-3.pc_relevant_antiscan&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2defaultCTRLISTRate-3.pc_relevant_antiscan&utm_relevant_index=6

    参考了这位作者的方法:

    “最痛苦的是pip速度很慢,包又比较大,你会发现一个没有输出的状态,那就是在下载文件。我真想说,求求你下载快点啊,下面给出怎么解决的”
    “继续在终端输入,注意这里不用清华源,因为安装过程中会出错,虽然它很快,我找到了用阿里的,速度飞起,不会出错。”

    换源指令:

    pip config set global.index-url https://mirrors.aliyun.com/pypi/simple

五、导入d2l-zh文件

从官网下载d2l-zh文件,打开文件夹。

文件中有environment.yml,用代码编辑器或者笔记本打开它。


python=3.6

修改成对应的python版本,这里建议就安装3.6版本的python


mxnet-cu101==1.5.0

GPU安装的这样修改


mxnet==1.5.0

CPU安装的这样修改


理论上environment文件和逐步输入指令应该效果是一样的,可以先尝试运行

conda env create -f environment.yml

但我第一次指令没有成功,后来明白原理了就手动打指令了,这样哪里有问题处理哪里,比较直接。

这里参照的是:

获取和运行本书代码 讨论区 - 课程讨论 - MXNet / Gluon 论坛

21年11月noki的步骤,比较直接稳妥。

win11动手学深度学习安装过程(GPU版)( CUDA Anaconda Mxnet )_第6张图片

代码如下:

conda create -n gluon python=3.6
conda activate gluon

pip install mxnet-cu101==1.5.0–GPU

pip install mxnet==1.5.0–CPU

pip install matplotlib==2.2.2
pip install jupyter==1.0.0
pip install pandas==0.23.4
pip install d2lzh==1.0.0

六、遇到的问题及处理

  • FutureWarning: Conversion of the second argument of issubdtype from float to np.floating is deprecate.

    h5py版本太低,升级

    pip install --upgrade h5py


  • WARNING: Ignoring invalid distribution

    这一串字符后面跟随的位置下有无效文件夹

    找到报错位置,删掉~开头的文件夹


  • You are using pip version 10.0.1, however version 21.0.1 is available

    (19条消息) pip更新:You are using pip version 10.0.1, however version 21.0.1 is available的解决方案_阅读修身-CSDN博客


  • consider using the ‘–user’ option or check the permissions错误

    首先使用administrator账户

    cd到C:\Windows\System32下再执行

    其次使用:

    pip install --user [包名]


  • 安装mxnet时报错Running setup.py install for numpy … error ERROR: Command exit status 1:

    在安装了python3.9后 pip install mxnet-cu101 出现的问题,红红的一大片,很吓人

    (20条消息) 安装mxnet时报错Running setup.py install for numpy … error ERROR: Command e_Jason36912的博客-CSDN博客_mxnet numpy报错

    用以上方法虽然确实可以解决,但是实际上安装的是低版本的mxnet,后期有些要求可能无法满足,也无法安装GPU版本,多次尝试和寻找原因无果,看了很多文章,可能是和Anaconda版本、适配性等有关,希望大神指教。。。

    降版本,用Anaconda3-5.2.0,也就是python3.6


  • Bad file descriptor

    创建用户名不要用中文!!!

    (20条消息) jupyter notebook运行出现Bad file descriptor (bundled\zeromq\src\epoll.cpp:100)错误,避坑指南_筱白Sec的博客-CSDN博客

    也有可能是pyzmq版本问题

    (20条消息) jupyter notebook报错:Bad file descriptor(C:\ci\zeromq_1602704446950\work\src\epoll.cpp:100)_python_bigniu的博客-CSDN博客


  • ModuleNotFoundError: No module named 'xxx’可能的解决方案大全

    原因很多,常见问题,需要根据情况分析


常用指令

  • 创建一个名为gluon的环境

    conda create --name gluon python=3.6

  • 查看当前拥有的所有的环境

    conda info -e

  • 环境切换,切换到名为gluon的环境

    activate gluon

    onda activate gluon

(第一个命令无效时使用)

  • 删除一个名为gluon的环境

    conda remove --name gluon --all

  • 安装python包

    conda install 包名
    conda install -n 环境名 包名

    如果不用-n指定环境名称,则被安装在当前活跃环境
    也可以通过-c指定通过某个channel安装

  • 查看当前环境下已安装的包

    conda list

  • 查看某个指定环境的已安装包
    conda list -n 环境名

  • 查找包信息
    conda search 包名

  • 更新package
    conda update -n 环境名 包名

  • 删除package
    conda remove -n 环境名 包名

  • 更新conda,保持conda最新
    conda update conda

  • 更新anaconda
    conda update anaconda

  • 退出当前base环境
    conda deactivate

  • 删除package
    conda remove -n 环境名 包名

  • 更新conda,保持conda最新
    conda update conda

  • 更新anaconda
    conda update anaconda

  • 退出当前base环境
    conda deactivate

    ————————————————
    这部分内容(常用指令)为CSDN博主「liqiang12689」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
    原文链接:https://blog.csdn.net/liqiang12689/article/details/104097616

你可能感兴趣的:(深度学习,mxnet,python)