Sora技术报告——Video generation models as world simulators
文章目录1.视频生成模型,可以视为一个世界模拟器2.技术内容2.1将可视数据转换成patches2.2视频压缩网络2.3SpacetimeLatentPatches2.4Scalingtransformers用于视频生成2.5可变的持续时间,分辨率,宽高比2.6抽样的灵活性2.7改进框架和构图2.8为视频生成字幕,作为训练集3.应用3.1动画DALL·E图像(输入图片输出视频)3.2扩展生成视频3