2018.7.5【泛读】Nonparametric Variational Auto-encoders for Hierarchical Representation Learning

这篇文章指出vae模型使用简单的高斯分布作为先验,先验中没有灵活的参数,导致模型不够灵活。因此,以一个狄利克雷过程(本文是中国餐馆过程CRP)作为vae的先验,以此来增强隐变量的能力。在本文中,训练过程是交替的,即先用vae对encoder和decoder进行训练,然后使用变分推断对CRP进行推断,作者认为这是一种统一的训练。同时,作者认为,VAE中,先验部分和decoder部分可以视为数据的生成模型,而encoder视为推断网络。以下是本文的模型图:


2.png

以下是本文的图模型


1.png

你可能感兴趣的:(2018.7.5【泛读】Nonparametric Variational Auto-encoders for Hierarchical Representation Learning)