A Neural Algorithm of Artistic Style 阅读(三)

五、实验结果分析

上图是对于同一张街景图下,多个风格的转换。可以看到这篇文章的一个致命缺点,就是速度很慢。因为是对输入图像就进行调整,所以没生成一张图像就要重新进行训练,虽然现在可以多个GPU训练,但是也不可能在几秒中之内得到结果。所以之后会不断地出现文章在速度方面的追求。很直观的理解就是训练好网络以后,通过前馈神经网络直接生成图片。

上图是在不同参数情况下的结果。

从左到右,α/β的比值逐渐增大,从损失函数中可以看出,content loss的权重逐渐增大,而style loss的权重逐渐减小,在生成图像的过程中,会更倾向于保持content image的内容,所以可以看到,每一行的最后一张的原图信息最为明显。

从竖直方向看,风格误差包含较高的卷积层如CONV5_1反而会有更好的视觉效果,更加平滑。我个人人为的原因是,若使用低层次的卷积层提取纹理信息,style image的细节会很突出,边缘等的变化也会非常明显,会给人的视觉上造成较为突出的感觉,自然会感觉不够舒服、不够真实。

最终达到的效果如下图:

A Neural Algorithm of Artistic Style 阅读(三)_第1张图片

 

六、总结

总体而言,文章很厉害,能够敏锐的发觉到这个领域,开山之作。但是还是有不足之处。在arxiv上的文章前半篇都不太有干货,一直在讲虚的东西,稍微也有一些夸大文章的作用。而速度太慢也是这篇文章的一个致命缺点,所以接下来,会对另一篇real-time的文章进行学习。

你可能感兴趣的:(创新实训)