本期为TechBeat人工智能社区第502期线上Talk!
北京时间06月01日(周四)20:00,新加坡国立大学在读博士生 — 张傲的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “10%成本定制类 GPT-4 多模态大模型 ”,届时将介绍新一代多模态大模型概述与VPGTrans重点实验解析。
主题:10%成本定制类 GPT-4 多模态大模型
嘉宾:新加坡国立大学在读博士生 — 张傲
时间:北京时间 06月01日(周四)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
长按识别二维码,一键预约TALK!
最近的多模态(对话)大模型将大语言模型的强大能力扩展到多模态输入,实现了强大的多模态语义理解,比如最近的GPT-4、BLIP-2、Flamingo等。但训练一个多模态对话模型往往需要成百上千的GPU时长和上亿数据。于是我们探究如何通过视觉模块迁移的方法来实现低成本(如10%成本)的新模型构建。
1、新一代多模态大模型概述
2、类 GPT4 多模态模型高效构建框架 VPGTrans
3、VPGTrans重点实验解析
4、VL-LLaMA 和 VL-Vicuna 模型的训练及开源
paper链接:
https://arxiv.org/abs/2305.01278
项目主页:
https://vpgtrans.github.io/
代码:
https://github.com/VPGTrans/VPGTrans
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
张傲
新加坡国立大学在读博士生
新加坡国立大学二年级博士生,研究方向为多模态学习,导师为Chua Tat-Seng。曾在ICCV, ECCV, EMNLP等顶会发表多篇论文。代表工作有超大规模场景图生成方法IETrans (ECCV 2022 Oral),多模态提示学习方法colorful prompt tuning (CPT)。
个人主页:
https://waxnkw.github.io/
长按识别二维码,一键预约TALK!
-The End-