apex安装、解决ModuleNotFoundError: No module named ‘amp_C‘报错

目录

一、apex安装

1. 官网的Quick Start,但是安装在第三步会报错:

2. 知乎,第四步也会报错:

3. 然后卸载apex(第三步不同)按照以下方式重新安装成功:

二、解决ModuleNotFoundError: No module named 'amp_C'报错


一、apex安装

1. 官网的Quick Start,但是安装在第三步会报错:

官网:GitHub - NVIDIA/apex: A PyTorch Extension: Tools for easy mixed precision and distributed training in Pytorch

git clone https://github.com/NVIDIA/apex
cd apex
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./
 
报错是因为基础环境有误,参考
https://blog.csdn.net/justforacm/article/details/115428583

2. 知乎,第四步也会报错:

git clone https://github.com/NVIDIA/apex
cd apex
python3 setup.py install
python setup.py install --cuda_ext --cpp_ext

3. 然后卸载apex(第三步不同)按照以下方式重新安装成功:

pip uninstall apex
git clone https://www.github.com/nvidia/apex
cd apex
python setup.py install

二、解决ModuleNotFoundError: No module named 'amp_C'报错

之后开始运行如下代码训练UNet+++的时候:

python train.py -g 0 -u v3 -e 200 -b 1 -l 0.1 -s 0.5 -v 15.0

会报错amp_C,刚开始是认为没有amp_C 这个模块,pip install也没有,上网找了好久也没搞定。

后面发现这个没太大关系,我的报错只是因为torch版本和GPU不匹配,但是注释掉最后报错的行之后,代码就能跑通了:

apex安装、解决ModuleNotFoundError: No module named ‘amp_C‘报错_第1张图片

 

你可能感兴趣的:(深度学习,pytorch,python,深度学习)