【ChatGLM2-6B】P-Tuning训练微调

机器配置

  • 阿里云GPU规格ecs.gn6i-c4g1.xlarge
  • NVIDIA T4显卡*1
  • GPU显存16G*1

准备训练数据

  • 进入/ChatGLM-6B/ptuning
  • mkdir AdvertiseGen
  • cd AdvertiseGen
  • 上传 dev.jsontrain.json
  • 内容都是
{"content": "你是谁", "summary": "你好,我是V校人工智能,江湖人称V-Chat。"}
{"content": "V校", "summary": "全宇宙最牛的智慧校园产品"}

安装依赖

  • pip install fastapi uvicorn datasets jieba rouge_chinese nltk cpm_kernels

修改train.sh

  • 修改模型参数文件位置: --model_name_or_path ../THUDM/chatglm2-6b
  • 修改后的train.sh
PRE_SEQ_LEN=128
LR=2e-2
NUM_GPUS=1

torchrun --standalone --nnodes=1 --nproc-per-node=$NUM_GPUS main.py \
    --do_train \
    --train_file AdvertiseGen/train.json \
    --validation_file AdvertiseGen/dev.json \
    --preprocessing_num_workers 10 \
    --prompt_column content \
    --response_column summary \
    --overwrite_cache \
    --model_name_or_path ../THUDM/chatglm2-6b \
    --output_dir output/adgen-chatglm2-6b-pt-$PRE_SEQ_LEN-$LR \
    --overwrite_output_dir \
    --max_source_length 64 \
    --max_target_length 128 \
    --per_device_train_batch_size 1 \
    --per_device_eval_batch_size 1 \
    --gradient_accumulation_steps 16 \
    --predict_with_generate \
    --max_steps 3000 \
    --logging_steps 10 \
    --save_steps 1000 \
    --learning_rate $LR \
    --pre_seq_len $PRE_SEQ_LEN \
    --quantization_bit 4

开始训练

  • bash train.sh

训练进度

  • 查看GPU使用: watch -n 0.5 nvidia-smi
    【ChatGLM2-6B】P-Tuning训练微调_第1张图片

推理

  • 修改evaluate.sh
  • 修改模型参数文件位置: --model_name_or_path ../THUDM/chatglm2-6b
  • 修改后的evaluate.sh
PRE_SEQ_LEN=128
CHECKPOINT=adgen-chatglm2-6b-pt-128-2e-2
STEP=3000
NUM_GPUS=1

torchrun --standalone --nnodes=1 --nproc-per-node=$NUM_GPUS main.py \
    --do_predict \
    --validation_file AdvertiseGen/dev.json \
    --test_file AdvertiseGen/dev.json \
    --overwrite_cache \
    --prompt_column content \
    --response_column summary \
    --model_name_or_path ../THUDM/chatglm2-6b \
    --ptuning_checkpoint ./output/$CHECKPOINT/checkpoint-$STEP \
    --output_dir ./output/$CHECKPOINT \
    --overwrite_output_dir \
    --max_source_length 64 \
    --max_target_length 64 \
    --per_device_eval_batch_size 1 \
    --predict_with_generate \
    --pre_seq_len $PRE_SEQ_LEN \
    --quantization_bit 4
  • 开始推理: sh evaluate.sh【ChatGLM2-6B】P-Tuning训练微调_第2张图片

在这里插入图片描述

评测指标为中文 Rouge score 和 BLEU-4。生成的结果保存在 ./output/adgen-chatglm2-6b-pt-128-2e-2/generated_predictions.txt

运行

  • 修改web_demo.sh
  • 修改模型参数文件位置: --model_name_or_path ../THUDM/chatglm2-6b
  • 修改后的web_demo.sh
PRE_SEQ_LEN=128

CUDA_VISIBLE_DEVICES=0 python3 web_demo.py \
    --model_name_or_path ../THUDM/chatglm2-6b \
    --ptuning_checkpoint output/adgen-chatglm2-6b-pt-128-2e-2/checkpoint-3000 \
    --pre_seq_len $PRE_SEQ_LEN
  • 修改web_demo.sh
    在末尾的位置修改如下
#demo.queue().launch(share=False, inbrowser=True)
demo.queue().launch(share=True, inbrowser=True, server_name = '0.0.0.0', server_port=7860)
  • 启动: sh web_demo.sh
  • 浏览器访问: http://xx.xx.xx.xx:7860

Finetune全参数训练

  • 安装依赖: pip install deepspeed
    【ChatGLM2-6B】P-Tuning训练微调_第3张图片

  • 通过DeepSpeed环境报告验证安装并查看计算机与哪些扩展/操作兼容: ds_report
    【ChatGLM2-6B】P-Tuning训练微调_第4张图片

[WARNING]  async_io: please install the libaio-devel package with yum

根据上面这个提示,安装libaio-devel
yum install libaio-devel
  • 安装cudnn

    • 下载地址: https://developer.nvidia.com/rdp/cudnn-download
    tar zxvf cudnn-11.2-linux-aarch64sbsa-v8.1.1.33.tgz
    sudo cp cuda/include/* /usr/local/cudn/include/
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
    sudo chmod a+r /usr/local/include/cudnn.h
    sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
    
    • 查看安装情况: cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
  • 开始训练: bash ds_train_finetune.sh

你可能感兴趣的:(人工智能,ChatGLM2,chatglm2-6b,大语言模型,P-Tuning,训练,微调,train)