论文阅读:Pixel Recurrent Neural Networks

Introduction

  PixelRNN和PixelCNN都没有做独立性假设。
  通过一层256维的softmax层来将像素值当做离散分布来建模。

Math Model

generating an image pixel by pixel

  输入图像是n×n个pixels的x,x可以视为一个长为 n2 的序列,序列是由x按行读取形成的。为了评估该序列的联合概率分布 p(x) ,文章将该联合概率表现为 n2 个条件概率的乘积:这里写图片描述
  而每一个 xi 的值又是由RGB三个通道的值联合决定的。所以将 p(xi|x<i) 改写成以下形式:
这里写图片描述
这样每一个通道的值既取决于之前的像素值又取决于其他通道的值。
  值得注意的是,在训练和评估模型时,像素值分布的计算可以是parallel的,而在实际生成图像时则是sequential的。

搞不懂了!告辞!

你可能感兴趣的:(论文阅读)