Talk | ICCV‘23清华大学博士生诸子钰:3D-VisTA通用统一的3D视觉语言预训练模型

 ​​​​​​

Talk | ICCV‘23清华大学博士生诸子钰:3D-VisTA通用统一的3D视觉语言预训练模型_第1张图片

本期为TechBeat人工智能社区529线上Talk!

北京时间9月7(周四)20:00 清华大学博士生—诸子钰的Talk已准时在TechBeat人工智能社区开播!

他与大家分享的主题是: 3D-VisTA通用统一的3D视觉语言预训练模型,他聚焦于3D视觉语言领域,介绍了3D视觉语言的相关任务,以及他们团队的最新工作3D-VisTA是如何设计通用统一的视觉语言模型的。

Talk·信息

主题:3D-VisTA通用统一的3D视觉语言预训练模型

嘉宾:清华大学博士生—诸子钰

时间:北京时间 9月7日(周四)20:00

地点:TechBeat人工智能社区

点击下方链接,即可观看视频!

TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。icon-default.png?t=N7T8https://www.techbeat.net/talk-info?id=807

Talk·介绍

在大语言模型时代,对齐3D的物理世界和自然语言是实现通用具身智能十分重要的一步。本次讲座我们聚焦于3D视觉语言领域,介绍3D视觉语言的相关任务,以及我们的最新工作3D-VisTA是如何设计通用统一的视觉语言模型,用简洁的方式来解决这些任务的。

Talk大纲

1. 3D视觉语言领域介绍和相关任务。

2. 通用模型和任务特定模型的区别。

3. 3D-VisTA在通用3D视觉语言学习的探索。

Talk·预习资料

Talk | ICCV‘23清华大学博士生诸子钰:3D-VisTA通用统一的3D视觉语言预训练模型_第2张图片

论文链接:

https://arxiv.org/pdf/2308.04352.pdf

Talk | ICCV‘23清华大学博士生诸子钰:3D-VisTA通用统一的3D视觉语言预训练模型_第3张图片

论文链接:

https://arxiv.org/pdf/2108.07258.pdf

项目代码:

https://language3dscenes.github.io

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

Talk | ICCV‘23清华大学博士生诸子钰:3D-VisTA通用统一的3D视觉语言预训练模型_第4张图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

Talk | ICCV‘23清华大学博士生诸子钰:3D-VisTA通用统一的3D视觉语言预训练模型_第5张图片

诸子钰

清华大学博士生

诸子钰,清华大学计算机系二年级博士生。研究方向为3D视觉语言学习,生成式模型,在AAAI,ICML,TMM, ICCV等顶级会议和期刊发表多篇论文。

个人主页: 

https://www.techbeat.net/grzytrkj?id=8463


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

你可能感兴趣的:(每周Talk上架,计算机视觉,语言模型)