[机器学习]自然语言处理:GPT-2模型训练finetunning

GPT-2模型主要用于根据上下文,预测下一个最有可能的词汇。
基于开源的Transformers库,用GPT-2模型以无监督学习的方式训练文本:

  • ①下载开源库:transformers
  • ②根据要求安装tensorflow2.0、Pytorch1.0+等依赖的训练工具;
  • ③如果需要使用GPU训练,还需要安装CUDA10.0、CUDNN7.x等组件;
  • ④训练:transformers提供了方便的训练API接口,直接调用finetunning.py文件,选择所需要训练的模型、指定训练数据集、预测数据集即可开始训练;
  • ⑤【注意】GPT-2模型训练的效果较好,但参数也较多,通常需要有GPU算力支持的电脑进行训练,另外在训练开始前需要联网下载GPT-2的预训练的参数文件;

你可能感兴趣的:(平台(PLATFORM),工具(TOOL))