大模型微调技术

全量微调


部分参数微调

Adaper-Tuning

大模型微调技术_第1张图片

降维的意义

  • 计算和存储成本
  • 去除冗余和噪声—特定任务训练数据有限
  • 减少模型复杂度避免过拟合风险
  • 适应任务需求

过拟合

  • 是指模型在训练数据上表现得很好,但在新的未见过的数据上表现较差的现象
  • 模型过于复杂,训练数据量不足等因素引起的 

LORA 

大模型微调技术_第2张图片

1. 预训练一个大型语言模型,例如BERT或GPT-2。

2. 为特定的下游任务或领域创建一个小型的LoRA模块,该模块包括一个低秩矩阵A和一个低秩矩阵B。

3. 将预训练模型的权重与矩阵A和B相乘,得到一个适应于特定任务的模型。

4. 对适应后的模型进行微调,以进一步提高性能。

你可能感兴趣的:(大模型,算法)