本期为TechBeat人工智能社区第552期线上Talk。
北京时间11月30日(周四)20:00,华为诺亚方舟实验室·AI研究员—谢恩泽的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “PixArt-Alpha, 基于Transformer的高质量文本到图像生成的扩散模型的快速训练”,介绍了他们团队在基于Transformer的T2I扩散模型PIXART-α的一系列研究成果。
主题:PixArt-α, 基于Transformer的高质量文本到图像生成扩散模型的快速训练
嘉宾:华为诺亚方舟实验室AI研究员 谢恩泽
时间:北京时间 11月30日(周四)20:00
地点:TechBeat人工智能社区
点击下方链接,即可观看视频!
TechBeatTechBeat是荟聚全球华人AI精英的成长社区,每周上新来自顶尖大厂、明星创业公司、国际顶级高校相关专业在读博士的最新研究工作。我们希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。https://www.techbeat.net/talk-info?id=830
最先进的文本到图像(T2I)模型需要大量的训练成本(例如数百万个 GPU 小时),严重阻碍了 AIGC 社区的根本创新,同时增加了二氧化碳排放。本文介绍了PIXART-α,一种基于Transformer的T2I扩散模型,其图像生成质量可与最先进的图像生成器(例如Imagen、SDXL甚至Midjourney)竞争,达到接近商业应用的标准。我们希望 PIXART-α 能为 AIGC 社区和初创公司提供新的见解,以加速从头开始构建自己的高质量且低成本的生成模型。
1、背景: Diffusion Model和文生图的发展。
2、动机与问题: 现有的文生图模型训练成本非常高,如何高效训练文生图模型。
3、解决方案: 介绍PixArt-Alpha训练流程,实验结果等。
4、总结, 讨论FAQ。
项目链接:
https://pixart-alpha.github.io/
Demo链接:
https://huggingface.co/spaces/PixArt-alpha/PixArt-alpha
代码链接:
https://github.com/PixArt-alpha/PixArt-alpha
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
谢恩泽
华为诺亚方舟实验室·AI研究员
谢恩泽,现华为诺亚方舟实验室(香港) AI Theory Lab的研究员,2022年毕业于香港大学MMLab,导师为罗平教授和王文平教授。目前研究方向主要是: (1)AIGC, e.g. Diffusion model for 2D/3D/video generation; (2)大语言模型(LLM), e.g. LLM长链条推理、AI4Math定理证明。
担任TPAMI, IJCV, CVPR, NeurIPS等多个国际会议/期刊审稿人。发表过20+篇顶级会议/期刊论文,如TPAMI, CVPR, ICCV, ICML, ICLR, NeurIPS, ACL等。其中8篇第一作者。其谷歌学术引用超过9000次,其中2篇论文单篇引用超过1500次。有4篇论文入选CVPR2020, ICCV2021, NeurIPS2021, ECCV2022的十大最具影响力论文。代表作SegFormer在英伟达GTC大会上介绍,被英伟达官方评价为一项富有远见的研究,研究成果广泛应用于国内外各大公司产品中(自动驾驶,医疗AI等)。
曾获2022年英伟达奖学金Finalist Award(全球15人),世界人工智能大会WAIC2023优秀论文奖(全球10篇)。
个人主页:
TecBeat
关于TechBeat人工智能社区
▼
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区