本期为TechBeat人工智能社区第518期线上Talk!
北京时间8月2日(周三)20:00, 新加坡国立大学博士生—施宇钧的Talk已准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “DragDiffusion-基于扩散模型的关键点拖拽图片编辑”,他为大家介绍了DragDiffusion算法背景、动机、意义并对该工作的一些技术细节进行了详细的分析。
主题:DragDiffusion-基于扩散模型的关键点拖拽图片编辑
嘉宾:新加坡国立大学博士生—施宇钧
时间:北京时间 8月2日(周三)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
点击下方链接,一键预约TALK!
TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=796
对图片灵活而精准的编辑是一个富有挑战性的课题。最近的一篇工作DragGAN提出了一个优雅的图片编辑框架:基于关键点拖拽的图片编辑。虽然DragGAN展示了极为惊艳的结果,但受限于GAN的表达能力,其可用范围受到了极大的约束。
为尝试解决这一问题,我们提出了一个名为DragDiffusion算法,将“Drag”编辑拓展到扩散模型上。借助大规模预训练的扩散模型,我们大大提高了这种编辑框架的实用性。同时,我也将对该工作的一些技术细节进行详细的分析。
1、研究课题背景
2、研究课题动机及意义
3、方法效果展示与分析
4、方法介绍
5、方法技术细节的讨论与分析
DragDiffusion技术报告链接:
https://arxiv.org/abs/2306.14435
论文链接:
https://arxiv.org/pdf/2305.10973.pdf
DragDiffusion代码链接:
https://github.com/Yujun-Shi/DragDiffusion
DragGAN Talk链接:
https://www.techbeat.net/talk-info?id=788
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
施宇钧
新加坡国立大学博士生
施宇钧目前是新加坡国立大学三年级博士生,受陈延福(Vincent Y. F. Tan)老师指导。他本科毕业于南开大学计算机系,目前的科研方向集中于生成式模型及其在图片与视频中的应用。在此之前,他的科研课题主要集中于机器学习中的数据分布偏移(包括持续学习,联邦学习)。他的工作曾发表于ICLR,CVPR,NeurIPS,ICCV等机器学习与计算机视觉顶会。
个人主页:
https://www.techbeat.net/grzytrkj?id=33412
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区