VQ-VAE(Neural Discrete Representation Learning)论文解读及实现
pytorch实现git地址论文地址:NeuralDiscreteRepresentationLearning1论文核心知识点encoder将图片通过encoder得到图片点表征如输入shape[32,3,32,32]通过encoder后输出[32,64,8,8](其中64位输出维度)量化码本先随机构建一个码本,维度与encoder保持一致这里定义512个离散特征,码本shape为[512,64]