openAI Video generation models as world simulators 视频生成模型作为世界模拟器 文本生成视频模型Sora 通用的视觉数据模型
来源:https://openai.com/research/video-generation-models-as-world-simulatorsSora是一种通用的视觉数据模型,它可以生成跨越不同持续时间、纵横比和分辨率的视频和图像,最多可生成一分钟的高清视频。我们探索了在视频数据上大规模训练生成模型。具体来说,我们在可变持续时间、分辨率和纵横比的视频和图像上联合训练文本条件扩散模型。我们利用