解读DreamPose:基于Diffusion Models的模特视频生成

Diffusion Models视频生成-博客汇总

前言:谷歌研究院联合英伟达提出了DreamPose,通过修改起点噪声融入姿态信息,并微调VAE-CLIP adapter注入图片信息,做到pose&image-to-video的效果。是少数扩散模型中image-to-video的工作,这篇博客详细解读一下这篇论文《DreamPose: Fashion Image-to-Video Synthesis via Stable Diffusion》。

目录

贡献概述

方法详解

整体结构

你可能感兴趣的:(Diffusion,Models与深度学习,人工智能,视频生成,扩散模型,stable,diffusion,计算机视觉)