stylegan的理解

把图片X的特征进行分解,分解了过后把特征分布到隐变量上去。首先它学到的是产生一个分布,而隐变量的意义是采样,假设在隐变量的分布上随机取一个值,
这就相当于在特征上取一个值,然后这个值经过这个网络和其他的隐变量共同组合生成了这幅图片。
简单来说就是在每个特征维度上取一个值,把所有这些取值融合起来就形成一副图片了。

假设一个隐变量就是一个高斯分布,然后我要把一个图片X的特征映射到一个高斯分布上来,假如我们给一个隐变量比如说有10个维度,这10个维度中的每一个值
都是从一个高斯分布中取的,我们希望隐变量的每一个元素代表一个特征,但实际上不是一个元素来表示一个特征的,而是几个变量来表示的,也就是一个特征
并不是分布在一个格子里面而与多个格子都有关系。
产生这个问题的主要原因是这个隐变量不一定是正态分布的,比如眼睛大小、头发长短不一定是一个正态分布,但我给的随机值又是一个正态分布的,
如何用它来表示一个正态分布呢?多个正态分布可以拟合成一个任意的分布,这就产生了特征纠缠。
理想状况是只用一个数字就表示一个特征。
我们假设每个格子是一个高斯分布,但实际上它又不是一个高斯分布,那我们怎么样来表达这个特征呢,就是一个特征用几个格子才能表达,而每个格子又是一个高斯分布。(把本来连续的特征数据强行分组变成离散数据再组合到一起)
它是多个正态分布的加权平均。

一幅图片是从多个分布中采样并将这些特征进行组合得到的,而每一个特征服从的分布又是由多个正态分布加权平均得到的。

P是一个分布

stylegan的理解_第1张图片

你可能感兴趣的:(人工智能,深度学习,计算机视觉)