UI Grounding 学习笔记

学习资料

【OpenMMLab社区开放麦讲座】《颠覆性创新:多模态对话与精准区域分割 - VPGTrans & NExT-Chat》

1. 学术关键字

LLM Detection

2. 相关论文

  • InstructBLIP:指令微调
  • RT-DETR
  • VPGTrans: Transfer Visual Prompt Generator across LLMs (NeurIPS 2023):模态对齐预训练,针对类BLIP-2架构
  • Phi:小语言模型(SLMs)

3. 常见概念

3.1 Vicuna

【知乎-陈城南】​:Vicuna(小羊驼、骆马)是LLaMA的指令微调版本模型,来自UC伯克利,代表模型为Vicuna-13B。

你可能感兴趣的:(学习,笔记)