本期为TechBeat人工智能社区第530期线上Talk!
北京时间9月13日(周三)20:00,北京通用人工智能研究院研究科学家—黄思远的Talk已准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “让通用智能体理解三维世界”,他分享了现有的视觉研究在三维世界和世界模型构建上的不足,并介绍了他的团队在智能体理解三维世界并进行推理和交互的三项成果。
主题:让通用智能体理解三维世界
嘉宾:北京通用人工智能研究院研究科学家 黄思远
时间:北京时间 9月13日(周三)20:00
地点:TechBeat人工智能社区
点击下方链接,即可观看视频!
TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=808
创造通用智能体是人工智能研究的终极目标,目前的绝大多数智能体缺乏理解三维世界并构建世界模型的能力。如何让智能体理解三维世界并进行推理和交互是未来要解决的重要问题,也是通向通用人工智能的一个重大瓶颈。这次的分享将主要介绍我们在这个问题里面最近的几项研究工作。
1、第一部分分析了现有的视觉研究在三维世界和世界模型构建上的不足,以及通用智能体在相关能力方面的缺乏。
2、第二部分介绍了SceneDiffuser模型,用于3D场景理解,提供了一个统一的模型来解决场景条件生成、优化和规划相关问题。
3、第三部分提出了一个新的场景理解任务 SQA3D,用于评估具有具身特性的智能体的场景理解能力。
4、第四部分提出了具身机器人学习的基准模型ARNOLD,评估了语言指导任务学习的性能。
论文链接:
https://arxiv.org/pdf/2301.06015.pdf
论文链接:
https://arxiv.org/pdf/2210.07474.pdf
论文链接:
https://arxiv.org/pdf/2304.04321.pdf
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
黄思远
北京通用人工智能研究院研究科学家
黄思远博士现为北京通用人工智能研究院研究科学家、通用视觉实验室负责人。博士毕业于美国加州大学洛杉矶分校(UCLA)统计系。研究领域包括计算机视觉、机器学习、认知和机器人学,主要侧重于三维场景理解与具身视觉。研究旨在开发模型以帮助机器学习三维表征,感知三维世界,并基于图像或视频与三维环境交互;远期致力于建造具备类人思考和行为能力的通用智能体。部分研究亦涵盖物理和社交场景理解、神经符号人工智能系统。发表顶级会议论文三十余篇。组织过多个CVPR三维场景理解研讨会,曾获UCLA优秀毕业论文,ICML神经符号研讨会最佳论文。
个人主页:
https://www.techbeat.net/grzytrkj?id=34090
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区