某nlp模型训练实验环境配置(Pytorch安装)

尝试训练某古早nlp相关模型,在pytorch下需要Allen-nlp0.8.4版本的环境,踩了好多坑才配置成功(主要是pytorch安装太离谱了)于是记录一下

conda 创建虚拟环境

参考:https://zhuanlan.zhihu.com/p/376030379

ubuntu下,进入conda base 环境

source activate

windows下,打开 Anaconda Prompt 也可

创建环境

声明名称为 my_env_name 版本为py3.8

conda create -n my_env_name python=3.8

激活环境

conda activate my_env_name

回到base环境

conda deactivate

删除环境

conda remove -n my_env_name --all

查看现有虚拟环境

conda info -e

安装Pytorch

需要手动下载文件,本地安装!!!

需要手动下载文件,本地安装!!!

需要手动下载文件,本地安装!!!

直接使用 conda 或 pip 下载安装的后果:①下载到CPU版本、②安装后检测不到显卡、③安装后执行训练段错误……

(大部分是由于 Pytorch 和 CUDA 版本不匹配造成的)

官网下载地址:https://pytorch.org/get-started/locally/

输入

nvcc -V

查看CUDA版本

某nlp模型训练实验环境配置(Pytorch安装)_第1张图片

可以看到本地CUDA版本为 11.6

下载老版本的pytorch可以进入官网下载界面-选择pip下载-复制命令最后的链接

某nlp模型训练实验环境配置(Pytorch安装)_第2张图片

选择torch进入历史版本的下载页面

Ctrl+F 搜索输入你的CUDA版本,如 CUDA11.6 就查找cu116, CUDA11.3 就查找cu113,可以看到该版本下可以下载的pytorch版本

某nlp模型训练实验环境配置(Pytorch安装)_第3张图片

选择对应的pytorch和操作系统下载 .whl 文件

使用pip安装,进入下载路径,执行:

pip install 下载的文件名.whl

在这里插入图片描述

测试torcgh是否能够正常运行

命令行输入

python

进入python环境后,逐行运行

import torch
print(torch.__version__)
print(torch.cuda.is_available())
print(torch.cuda.device_count())
print(torch.zeros(1).cuda())

某nlp模型训练实验环境配置(Pytorch安装)_第4张图片

(这里torch版本是+cu113是因为换了台机器)
print(torch.cuda.is_available()) 显示为True , 最后对torch的操作可以正常执行就一般没问题

参考:https://blog.csdn.net/weixin_41529093/article/details/109399393

安装allen-nlp

pip install allennlp -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com

指定版本

pip install allennlp==0.8.4

训练时问题

代码年代久远,训练时使用的函数可能新版本不再支持,可能会报以下错误,将相应工具包降回老版本即可

ArrayField.empty_field: return type None is not a allennlp.data.fields.field.Field.

pip install overrides==4.1.2

ModuleNotFoundError: No module named ‘sklearn.utils.linear_assignment_’

pip3 install scikit-learn==0.19.2

你可能感兴趣的:(NLP,python,深度学习,pytorch)