#今日论文推荐#清华提出CogVideo:最大的文本生成视频模型

#今日论文推荐#清华提出CogVideo:最大的文本生成视频模型

一周不到,AI画师又“进阶”了,还是一个大跨步——
直接1句话生成视频的那种。
输入“一个下午在海滩上奔跑的女人”,立刻就蹦出一个4秒32帧的小片段:又或是输入“一颗燃烧的心”,就能看见一只被火焰包裹的心:这个最新的文本-视频生成AI,是清华&智源研究院出品的模型CogVideo

论文题目:CogVideo: Large-scale Pretraining for Text-to-Video Generation via Transformers
详细解读:https://www.aminer.cn/research_report/62a164d07cb68b460fcdf89a?download=falseicon-default.png?t=M4ADhttps://www.aminer.cn/research_report/62a164d07cb68b460fcdf89a?download=false
AMiner链接:https://www.aminer.cn/?f=cs

你可能感兴趣的:(深度学习,transformer,深度学习,计算机视觉)