[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning

Prompt-Learning and Delta-Tunning

背景和概览

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第1张图片
但是从T5开始,大模型越来越大了。
微调很难了。
[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第2张图片

模型的趋势

Model Scaling:模型越来越大
Difficult Tuning:微调越来越难

Prompt-Learning

基本组成与流程介绍

预训练和fine-tuning有一定的gap。毕竟是不同的任务。
[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第3张图片
通过额外增加模版。
映射到标签的过程称为verbalizer。
这样就使用了mask任务。弥补了不同之间的gap。
[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第4张图片

流程举例

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第5张图片

如何考虑PLM,Template,Verbalizer

PLM

Auto-regressive有更好的生成能力,mask往往放最后
MaskLM有更好的理解能力,mask往往放中间
Encoder-Decoder,mask位置可以随意
[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第6张图片

Template

人工构造

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第7张图片
[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第8张图片
人为加入规则

结构化的Template

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第9张图片

多个template整合

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第10张图片

自动template

最终的template可能没有含义,但是work
[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第11张图片

Verblizer

把标签映射成标签词的过程。
本质上是如何用模型预测得到的分布,用它完成分类或者生成。
[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第12张图片

人为构造

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第13张图片

训练新范式

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第14张图片

应用

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第15张图片

总结

[学习笔记]刘知远团队大模型技术与交叉应用L4-Prompt-learning & Delta-learning_第16张图片

Delta-Learning

背景与介绍

你可能感兴趣的:(深度学习,学习,笔记,prompt)