【AIGC核心技术剖析】用于 3D 生成的多视图扩散模型

【AIGC核心技术剖析】用于 3D 生成的多视图扩散模型_第1张图片

MVDream是一种多视图扩散模型,能够从给定的文本提示生成一致的多视图图像。多视图扩散模型从二维和三维数据中学习,可以实现二维扩散模型的泛化和三维渲染的一致性。我们证明了这样的多视图先验可以作为可推广的 2D 先验,与 3D 表示无关。它可以通过分数蒸馏取样应用于 2D 生成,显着增强现有 3D 提升方法的一致性和稳定性。它还可以从一些3D示例中学习新概念,类似于DreamBooth,但用于3D生成。

【AIGC核心技术剖析】用于 3D 生成的多视图扩散模型_第2张图片
【AIGC核心技术剖析】用于 3D 生成的多视图扩散模型_第3张图片
【AIGC核心技术剖析】用于 3D 生成的多视图扩散模型_第4张图片
【AIGC核心技术剖析】用于 3D 生成的多视图扩散模型_第5张图片

论文 + 源码

https://arxiv.org/pdf/2308.16512.pdf
https://github.com/bytedance/MVDream

你可能感兴趣的:(AIGC核心技术剖析,AIGC)