第十三周周报

学习目标:

一、论文:Vector Quantized Diffusion Model for Text-to-Image Synthesis

二、修改VITGAN代码

学习内容:

论文

学习时间:

11.28-12.2

学习产出:

一、VQ-Difussion Model

第十三周周报_第1张图片

1、VQ-VAE

第十三周周报_第2张图片
给定图像x,经过编码器Encoder得到空间特征Zij,Zij通过空间量化器映射codebook中最近的条目,计算得到图像token即Zq的集合,Zq通过解码器Decoder重建重新得到图像。因此,图像合成相当于从隐分布中采样图像token,减少transformer的计算量。

2、VQ-Diffusion

第十三周周报_第3张图片
第十三周周报_第4张图片
第十三周周报_第5张图片

你可能感兴趣的:(周报,人工智能,深度学习,计算机视觉)