本期为TechBeat人工智能社区第529期线上Talk!
北京时间9月7日(周四)20:00, 清华大学博士生—诸子钰的Talk已准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “3D-VisTA通用统一的3D视觉语言预训练模型”,他聚焦于3D视觉语言领域,介绍了3D视觉语言的相关任务,以及他们团队的最新工作3D-VisTA是如何设计通用统一的视觉语言模型的。
主题:3D-VisTA通用统一的3D视觉语言预训练模型
嘉宾:清华大学博士生—诸子钰
时间:北京时间 9月7日(周四)20:00
地点:TechBeat人工智能社区
点击下方链接,即可观看视频!
TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=807
在大语言模型时代,对齐3D的物理世界和自然语言是实现通用具身智能十分重要的一步。本次讲座我们聚焦于3D视觉语言领域,介绍3D视觉语言的相关任务,以及我们的最新工作3D-VisTA是如何设计通用统一的视觉语言模型,用简洁的方式来解决这些任务的。
1. 3D视觉语言领域介绍和相关任务。
2. 通用模型和任务特定模型的区别。
3. 3D-VisTA在通用3D视觉语言学习的探索。
论文链接:
https://arxiv.org/pdf/2308.04352.pdf
论文链接:
https://arxiv.org/pdf/2108.07258.pdf
项目代码:
https://language3dscenes.github.io
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
诸子钰
清华大学博士生
诸子钰,清华大学计算机系二年级博士生。研究方向为3D视觉语言学习,生成式模型,在AAAI,ICML,TMM, ICCV等顶级会议和期刊发表多篇论文。
个人主页:
https://www.techbeat.net/grzytrkj?id=8463
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区